Skip to main content
۰۸ اکتبر, ۲۰۲۲
# Topics
Follow Us

معماری ARM چیست؟ چه تفاوتی با x86 اینتل دارد؟

۰۸ اکتبر, ۲۰۲۲

امروزه هر جا صحبت از تلفن هوشمند یا تبلت به میان می‌آید، حتما نام ARM نیز به گوش می‌رسد. پردازنده اکثر تبلت و تلفن‌های هوشمند بازار مبتنی بر معماری ARM است. اما ARM به چه معناست؟ معماری ARM چیست؟ چه تفاوتی با x86 اینتل می‌‌کند؟ چرا این معماری تا به این اندازه محبوب شده و دنیای موبایل را تحت کنترل خود قرار داده است؟ در ادامه مطلب برای رسیدن به پاسخ این پرسش‌ها با ما همراه باشید.

در این مقاله به معرفی ARM، تاریخچه آن و بررسی کلی نسل‌های مختلف CPUهای ARM می‌پردازیم اما در آینده نسل‌های پردازنده‌های ARM را با یکدیگر مقایسه نموده و توضیحات کاملی در مورد هر نسل ارائه خواهیم کرد.

تاریخچه ARM

ARM نوعی از معماری پردازنده‌های کامپیوتری است که بر طبق طراحی RISC CPU و توسط کمپانی بریتانیایی ARM Holding طراحی شده است. معماری ARM که دستورالعمل‌های ۳۲ بیتی را پردازش می‌کند از دهه ۱۹۸۰ تا به امروز در حال توسعه است.

ARM مخفف Advanced RISC Machine است و از آنجایی که این معماری براساس طراحی RISC بنا شده، هسته اصلی CPU نیاز به ۳۵ هزار ترانزیستور دارد این در حالی است که پردازنده‌های معمولی رایج x86 که براساس CISC طراحی شده‌اند حداقل نیاز به میلیون‌ها ترانزیستور دارند. مهمترین دلیل مصرف بسیار پایین انرژی در پردازنده‌های مبتنی بر ARM که باعث استفاده گسترده آنها در ابزارهای پرتابل مانند تلفن هوشمند یا تبلت شده نیز همین موضوع است.

جالب است بدانید که شرکت ARM Holding خود تولیدکننده پردازنده نیست و در عوض گواهی استفاده از معماری ARM را به دیگر تولیدکنندگان نیمه هادی می‌فروشد. کمپانی‌ها نیز به راحتی تراشه‌های خود را براساس معماری ARM تولید می‌کنند. از جمله کمپانی‌هایی که پردازنده خود را براساس معماری ARM طراحی می‌کنند می‌توان به اپل در تراشه‌های Ax، سامسونگ در پردازنده‌های Exynos، انویدیا در تگرا و کوالکام در پردازنده‌های Snpdragon اشاره کرد.

در سال ۲۰۱۱ مشتریان ARM توانستند ۷.۹ میلیارد ابزار مبتنی بر این معماری را وارد بازار کنند. شاید تصور می‌کنید که پردازنده‌های مبتنی بر ARM تنها در تبلت و تلفن‌های هوشمند بکار گرفته می‌شوند، اما جالب است بدانید که در همین سال بیش از ۹۵ درصد تلفن‌های هوشمند دنیا، ۹۰ درصد دیسک‌های سخت (HDD)، حدود ۴۰ درصد تلویزیون‌های دیجیتال و ست‌تاپ‌باکس‌ها، ۱۵ درصد میکروکنترلرها و ۲۰ درصد کامپیوترهای موبایل مجهز به پردازنده‌های مبتنی بر معماری ARM بوده‌اند. بدون شک این آمار در سال ۲۰۱۲ رشد فوق‌العاده چشم گیری را تجربه کرده است، چون بازار تلفن‌های هوشمند و تبلت‌های در سال جاری پیشرفت قابل ملاحظه‌ای داشته‌اند.

تا اینجای کار معماری ARM تنها برروی پلتفرم ۳۲ بیتی با عرض حافظه ۱ بایت کار می‌کرد. اما با معرفی ARMv8 این معماری پشتیبانی از دستورات ۶۴ بیتی را نیز آغاز کرد که البته هنوز در سیستم-روی-یک-چیپ‌ها بکار گرفته نشده است. در سال ۲۰۱۲ مایکروسافت نیز نسخه ویندوز سازگار با معماری ARM را به همراه تبلت سرفیس RT معرفی کرد. AMD نیز اعلام نموده که قصد دارد در سال ۲۰۱۴ سرورهای مبتنی بر معماری ۶۴ بیتی ARM را روانه بازار کند.

همانطور که پیش‌تر اشاره کردیم، ARM گواهی استفاده از معماری خود را به شرکت‌های دیگر می‌دهد، کمپانی‌هایی که در حال حاضر گواهی استفاده از ARM را دارند عبارتند از: AMD, آلکاتل, اپل, AppliedMicro, Atmel, Broadcom, Cirrus Logic, CSR plc, Digital Equipment Corporation, Ember, Energy Micro, Freescale, فوجیتسو, Fuzhou Rockchip, هواوی, اینتل توسط شرکت‌های زیر شاخه, ال جی, Marvell Technology Group, Microsemi, مایکروسافت, NEC, نینتندو, Nuvoton, انویدیا, NXP (formerly Philips Semiconductor), Oki, ON Semiconductor, پاناسونیک, کوالکام, Renesas, Research In Motion, سامسونگ, شارپ, Silicon Labs, سونی, اریکسون, STMicroelectronics, Symbios Logic, Texas Instruments, توشیبا, یاماها  و ZiiLABS

RISC و CISC یا ARM در مقابل x86

RISC که مخفف Reduced instruction Set Computing یا مجموعه دستورات ساده شده است در واقع نوعی از طراحی CPU است که پایه و اساس آن، ساده سازی دستورات است که منجر به بازده بالا و سرعت بخشیدن به اجرای دستورات می‌شود. پردازده‌ای که براساس این طراحی ساخته می‌شود را RISC (بخوانید ریسک) می‌نامند. مهمترین و معروفترین معماری که براساس RISC طراحی شده، ARM است. درست نقطه مقابل ریسک، طراحی دیگری با نام CISC وجود دارد که مخفف Complex Instruction Set Computing یا مجموعه دستورات پیچیده است که معماری x86 اینتل براساس آن طراحی شده و پردازنده کامپیوترهای رومیزی و لپ تاپ‌ها و بسیاری از ابزارهای دیگر از آن بهره می‌برند.

ایده اصلی RISC اولین بار توسط جان کوکی از IBM و در سال ۱۹۷۴ شکل گرفت، نظریه او به این موضوع اشاره داشت که یک کامپیوتر تنها از ۲۰ درصد از دستورات نیاز دارد و ۸۰ درصد دیگر، دستورات غیرضروری هستند. پردازنده‌های ساخته شده براساس این طراحی از دستورات کمی پشتیبانی می‌کنند به این ترتیب به ترانزیستور کمتری نیز نیاز دارند و ساخت آنها نیز کم هزینه است. با کاهش تعداد ترانزیستورها و اجرای دستورات کمتر، پردازنده در زمان کمتری دستورات را پردازش می‌کند. کمی بعد اصطلاح RISC توسط یک استاد دانشگاه کالیفورنیا به نام دیوید پترسون ایجاد شد.

هر دو طراحی RISC و CISC به مراتب در انواع و اقسام ابزارها بکار گرفته می‌شوند، اما مفهوم کلی RISC در واقع سیستمی است که در آن به پردازش دستورات کوچک و به شدت بهینه شده پرداخته می‌شود، درست برخلاف CISC که در آن دستورات پیچیده ارسال می‌شوند. یکی از تفاوت‌های عمده بین RISC و CISC نیز در نحوه دسترسی به حافظه و ذخیره و اجرای اطلاعات برروی آن است. در ریسک دسترسی به حافظه تنها از طریق دستورالعمل‌های خاصلی قابل انجام است و به عنوان مثال نمی‌توان از بخشی از دستور add به حافظه دسترسی داشت.

علاوه بر ARM شرکت‌های بسیار دیگری از جمله Intel i860, AMD 29k, ARC و غیره از طراحی RISC برای ساخت پردازنده استفاده می‌کنند، اما به لطف گسترش تلفن و تبلت‌ها، معماری ARM به عنوان برجسته‌ترین معماری مبتنی بر RISC شناخته می‌شود.

CISC

در سیسک اوضاع دقیقا برعکس ریسک است و پردازنده قادر به پردازش دستورات پیچیده است به همین دلیل نیاز به تعداد بیشتر ترانزیستور و همچنین طراحی پیچیده‌تر و پردازنده‌های گران قیمت‌تر دارد. ایده اصلی پشت این طراحی این است که برنامه نویسان ساده‌تر بتوانند نرم افزارهای خود را تولید کنند و دستورات را ساده‌تر به CPU ارجاع دهند. به لطف پشتیبانی اینتل و تولیدکنندگان نرم افزار، CISC به شدت محبوب شد و تمام کامپیوترها از پردازنده مبتنی بر این طراحی بهره بردند.

برخی تصور می‌کنند که ریسک قادر به اجرای دستورات زیاد نیست اما در حقیقت ریسک به اندازه سیسک می‌تواند دستورات مختلف را اجرا کند اما مهمترین تفاوت این دو در این است که در RISC تمام دستورات با یک فرمت، دقیقا یک فرمت صادر می‌شوند و پردازش تمام دستورات یک زمان مشخص طول می‌کشد، معمولا در ریسک در هر سیکل، پردازنده یک دستور را اجرا می‌کند.

اما در CISC مجموعه‌ای از دستورات بصورت فشرده و با آدرس دهی مختلف به یکباره پردازش می‌شوند، مثل اعداد اعشاری یا تقسیم که در طراحی RISC وجود ندارند. از آنجایی که دستورات در RISC ساده‌تر هستند پس سریعتر اجرا می‌شوند و نیاز به ترانزیستور کمتری دارند، ترانزیستور کمتر هم به معنی دمای کمتر، مصرف پایین‌تر و فضای کمتر است که آن را برای ابزارهای موبایل مناسب می‌کند.

معماری پردازنده‌های مبتنی بر طراحی RISC طی‌ سال‌های گذشته پیشرفت چشم‌گیری داشته و اجرای دستورات پیچیده را نیز میسر کرده است و تولیدکنندگان نرم افزاری نیز به سمت ساخت نرم‌افزارهای مبتنی بر این معماری گرایش پیدا کرده‌اند. لازم است بدانید که کامپیوترهای اولیه مک نیز از پردازنده مبتنی بر RISC بهره می‌بردند.

اما در واقع پردازنده‌های CISC بسیار سریعتر و پرقدرت‌تر از RISCها هستند و قادر به پردازش امور سنگین می‌باشند اما در عوض گران‌قیمت‌تر، پرمصرف‌تر بوده و دمای بیشتری نیز تولید می‌کنند. در CISC تمرکز برروی سخت‌افزار است و در RISC برروی نرم‌افزار، در CISC دستورات بصورت پیچیده به پردازنده ارسال می‌شوند ولی در RISC نرم‌افزار دستورات را ساده‌ کرده و به عنوان مثال یک عملیات پیچیده را در قالب چندین دستور ساده به پردازنده ارسال می‌کند و پردازنده دستورات ساده را به سرعت پردازش نموده و نتیجه را باز می‌گرداند. پس کدهای نرم‌افزارهای سازگار با RISC طولانی تر ولی کدهای مربوط به نرم‌افزارهای CISC کوتاه‌تر و پیچیده‌تر هستند. البته این بدین معنا نیست که مثلا اگر قرار است برای اندروید یا iOS برنامه بنویسید باید چند هزار خط بیشتر از معادل کامپیوتر ویندوزی آن کد نویسی کنید، در واقع کامپایلرها کدها را به دستورات کوچک زیاد تبدیل می‌کنند و برنامه نویس به سختی متوجه نوع پردازش دستورات می‌شود.

اگر بخواهیم در مورد این دو طراحی صحبت کنیم بحث پیچیده و کسل کننده خواهد شد پس به همین جا بسنده می‌کنیم اما اگر تمایل دارید تا در مورد این طراحی‌ها بیشتر بدانید به این دو لینک مراجعه کنید: CISC و RISC

سیستم-روی-یک-چیپ‌ها و معماری ARM

چندین نوع مختلف از معماری برای پردازنده‌های ARM وجود دارد که از آن جمله می‌توان به ARM V2 ،ARMv3 Arm v7 و …اشاره کرد. کمپانی‌ها برای استفاده از هر کدام از این طراحی‌ها باید گواهی مربوط به آن را از ARM Holder دریافت کنند.  کمپانی‌ها از این معماری در ساخت پردازنده های مورد نظر خود بهره برده و در نهایت یا یکپارچه سازی آن  با واحد پردازش گرفیک (GPU)، حافظه رم و قسمت کنترلر باند رادیویی (در تلفن‌های هوشمند) سیستم -روی-یک-چیپ خود را می سازند .

سیستم-روی-یک-چیپ (System on a Chip) که آن را به اختصار SoC می‌نامند در واقع یک تراشه است که در آن پردازنده اصلی (CPU)، پردازنده گرافیک (GPU)، حافظه رم، کنترلرهای ورودی و خروجی و بعضا کنترلر باند رادیویی قرار دارند. پس لازم است بدانید که کل SoC براساس معماری ARM تولید نمی‌شود و تنها بخش CPU آن بر مبنای معماری ARM طراحی و تولید می‌گردد. پس این باور که فلان SoC براساس معماری ARM ساخته شده، اشتباه است و بخش پردازنده اصلی اکثر SoCها براساس یکی از طراح‌های معماری ARM ساخته می‌شوند.

از جمله سیستم-روی-یک-چیپ‌هایی که هسته اصلی آن‌ها براساس معماری ARM طراحی شده‌اند می‌توان به ۳ نسل اول تگرا انویدیا، Quatro شرکت CSRT، نوا شرکت اریکسون، OMAP شرکت تکزاس، Exynos شرکت سامسونگ و Ax شرکت اپل اشاره کرد. این شرکت ها از معماری ARM و همچنین معماری یکی از هسته‌های طراحی شده توسط این شرکت بهره برده‌اند.

اما شرکت‌ها می‌توانند گواهی استفاده از معماری ARM را تهیه کرده و سپس بر اساس آن هسته سفارشی مورد نظرشان را طراحی کنند یعنی به جای اینکه هسته CPU را براساس Cortex-A9 یا Cortex-A15 یا دیگر هسته‌های ARM بسازنند، خودشان براساس معماری یکی از خانواده‌های ARM، هسته خاص خود را طراحی کنند. به عنوان مثال سیستم-روی-یک-چیپ A6 اپل، X-Gene ،Krait کوالکام، StrongARM شرکت DEC ،XScale شرکت Marvell اینتل یا Project Denver شرکت انویدیا اینگونه هستند و اگر چه بخش CPU از سیستم-روی-یک-چیپ‌ آنها براساس معماری ARM طراحی شده‌اند، اما طراحی هسته‌ها با آنچه ARM پیشنهاد کرده متفاوت هستند.

انواع مختلف هسته‌های مبتنی بر ARM

همانطور که پیش‌تر اشاره کردیم، شرکت ARM Holding خود نسبت به طراحی هسته براساس معماری ARM اقدام می‌کند و هسته‌های متفاوتی را براساس نسل‌های مختلف این معماری عرضه کرده است، جدیدترین معماری این شرکت ARM v8 است که از دستورات ۶۴ بیتی پشتیبانی می‌کند و دو هسته Cortex A53 و Cortex A57 نیز براساس همین معماری طراحی و پیشنهاد شده‌اند. انتظار می‌رودی SoCهای سال آینده از این معماری بهره مند شوند، در جدول زیر کل هسته‌های طراحی شده توسط ARMرا مشاهده خواهید کرد:

ARM FamilyARM ArchitectureARM CoreFeatureCache (I/D), MMUTypical MIPS @ MHz
ARM1ARMv1ARM1First implementationNone 
ARM2ARMv2ARM2ARMv2 added the MUL (multiply) instructionNone۴ MIPS @ 8 MHz
۰.۳۳ DMIPS/MHz
ARMv2aARM250Integrated MEMC (MMU), Graphics and IO processor. ARMv2a added the SWP and SWPB (swap) instructions.None, MEMC1a۷ MIPS @ 12 MHz
ARM3ARMv2aARM3First integrated memory cache.۴ KB unified۱۲ MIPS @ 25 MHz
۰.۵۰ DMIPS/MHz
ARM6ARMv3ARM60ARMv3 first to support 32-bit memory address space (previously 26-bit)None۱۰ MIPS @ 12 MHz
ARM600As ARM60, cache and coprocessor bus (for FPA10 floating-point unit).۴ KB unified۲۸ MIPS @ 33 MHz
ARM610As ARM60, cache, no coprocessor bus.۴ KB unified۱۷ MIPS @ 20 MHz
۰.۶۵ DMIPS/MHz
ARM7ARMv3ARM700 ۸ KB unified۴۰ MHz
ARM710As ARM700, no coprocessor bus.۸ KB unified۴۰ MHz
ARM710aAs ARM710۸ KB unified۴۰ MHz
۰.۶۸ DMIPS/MHz
ARM7TDMIARMv4TARM7TDMI(-S)۳-stage pipeline, Thumbnone۱۵ MIPS @ 16.8 MHz
۶۳ DMIPS @ 70 MHz
ARM710TAs ARM7TDMI, cache۸ KB unified, MMU۳۶ MIPS @ 40 MHz
ARM720TAs ARM7TDMI, cache۸ KB unified, MMU with Fast Context Switch Extension۶۰ MIPS @ 59.8 MHz
ARM740TAs ARM7TDMI, cacheMPU 
ARM7EJARMv5TEJARM7EJ-S۵-stage pipeline, Thumb, Jazelle DBX, Enhanced DSP instructionsnone 
ARM8ARMv4ARM810[۴][۵]۵-stage pipeline, static branch prediction, double-bandwidth memory۸ KB unified, MMU۸۴ MIPS @ 72 MHz
۱.۱۶ DMIPS/MHz
ARM9TDMIARMv4TARM9TDMI۵-stage pipeline, Thumbnone 
ARM920TAs ARM9TDMI, cache۱۶ KB/16 KB, MMU with FCSE (Fast Context Switch Extension)[۶]۲۰۰ MIPS @ 180 MHz
ARM922TAs ARM9TDMI, caches۸ KB/8 KB, MMU 
ARM940TAs ARM9TDMI, caches۴ KB/4 KB, MPU 
ARM9EARMv5TEARM946E-SThumb, Enhanced DSP instructions, cachesvariable, tightly coupled memories, MPU 
ARM966E-SThumb, Enhanced DSP instructionsno cache, TCMs 
ARM968E-SAs ARM966E-Sno cache, TCMs 
ARMv5TEJARM926EJ-SThumb, Jazelle DBX, Enhanced DSP instructionsvariable, TCMs, MMU۲۲۰ MIPS @ 200 MHz
ARMv5TEARM996HSClockless processor, as ARM966E-Sno caches, TCMs, MPU 
ARM10EARMv5TEARM1020E۶-stage pipeline, Thumb, Enhanced DSP instructions, (VFP)۳۲ KB/32 KB, MMU 
ARM1022EAs ARM1020E۱۶ KB/16 KB, MMU 
ARMv5TEJARM1026EJ-SThumb, Jazelle DBX, Enhanced DSP instructions, (VFP)variable, MMU or MPU 
ARM11ARMv6ARM1136J(F)-S[۷]۸-stage pipeline, SIMD, Thumb, Jazelle DBX, (VFP), Enhanced DSP instructionsvariable, MMU۷۴۰ @ ۵۳۲–۶۶۵ MHz (i.MX31 SoC), 400–۵۲۸ MHz
ARMv6T2ARM1156T2(F)-S۸-stage pipeline, SIMD, Thumb-2, (VFP), Enhanced DSP instructionsvariable, MPU 
ARMv6ZARM1176JZ(F)-SAs ARM1136EJ(F)-Svariable, MMU + TrustZone۹۶۵ DMIPS @ 772 MHz, up to 2 600 DMIPS with four processors[۸]
ARMv6KARM11 MPCoreAs ARM1136EJ(F)-S, 1–۴ core SMPvariable, MMU 
SecureCoreARMv6-MSC000  ۰.۹ DMIPS/MHz
ARMv4TSC100   
ARMv7-MSC300  ۱.۲۵ DMIPS/MHz
Cortex-MARMv6-MCortex-M0 [۹]Microcontroller profile, Thumb + Thumb-2 subset (BL, MRS, MSR, ISB, DSB, DMB),[۱۰] hardware multiply instruction (optional small), optional system timer, optional bit-banding memoryNo cache, No TCM, No MPU۰.۸۴ DMIPS/MHz
Cortex-M0+ [۱۱]Microcontroller profile, Thumb + Thumb-2 subset (BL, MRS, MSR, ISB, DSB, DMB),[۱۰] hardware multiply instruction (optional small), optional system timer, optional bit-banding memoryNo cache, No TCM, optional MPU with 8 regions۰.۹۳ DMIPS/MHz
Cortex-M1 [۱۲]Microcontroller profile, Thumb + Thumb-2 subset (BL, MRS, MSR, ISB, DSB, DMB),[۱۰] hardware multiply instruction (optional small), OS option adds SVC / banked stack pointer, optional system timer, no bit-banding memoryNo cache, 0-1024 KB I-TCM, 0-1024 KB D-TCM, No MPU۱۳۶ DMIPS @ 170 MHz,[۱۳] (0.8 DMIPS/MHz FPGA-dependent)[۱۴]
ARMv7-MCortex-M3 [۱۵]Microcontroller profile, Thumb / Thumb-2, hardware multiply and divide instructions, optional bit-banding memoryNo cache, No TCM, optional MPU with 8 regions۱.۲۵ DMIPS/MHz
ARMv7E-MCortex-M4 [۱۶]Microcontroller profile, Thumb / Thumb-2 / DSP / optional FPv4 single-precision FPU, hardware multiply and divide instructions, optional bit-banding memoryNo cache, No TCM, optional MPU with 8 regions۱.۲۵ DMIPS/MHz
Cortex-RARMv7-RCortex-R4 [۱۷]Real-time profile, Thumb / Thumb-2 / DSP / optional VFPv3 FPU, hardware multiply and optional divide instructions, optional parity & ECC for internal buses / cache / TCM, 8-stage pipeline dual-core running lockstep with fault logic۰-۶۴ KB / 0-64 KB, 0-2 of 0-8 MB TCM, opt MPU with 8/12 regions 
Cortex-R5 (MPCore) [۱۸]Real-time profile, Thumb / Thumb-2 / DSP / optional VFPv3 FPU and precision, hardware multiply and optional divide instructions, optional parity & ECC for internal buses / cache / TCM, 8-stage pipeline dual-core running lock-step with fault logic / optional as 2 independent cores, low-latency peripheral port (LLPP), accelerator coherency port (ACP) [۱۹]۰-۶۴ KB / 0-64 KB, 0-2 of 0-8 MB TCM, opt MPU with 12/16 regions 
Cortex-R7 (MPCore) [۲۰]Real-time profile, Thumb / Thumb-2 / DSP / optional VFPv3 FPU and precision, hardware multiply and optional divide instructions, optional parity & ECC for internal buses / cache / TCM, 11-stage pipeline dual-core running lock-step with fault logic / out-of-order execution / dynamic register renaming / optional as 2 independent cores, low-latency peripheral port (LLPP), ACP [۱۹]۰-۶۴ KB / 0-64 KB, ? of 0-128 KB TCM, opt MPU with 16 regions 
Cortex-AARMv7-ACortex-A5 [۲۱]Application profile, ARM / Thumb / Thumb-2 / DSP / SIMD / Optional VFPv4-D16 FPU / Optional NEON / Jazelle RCT and DBX, 1–۴ cores / optional MPCore, snoop control unit (SCU), generic interrupt controller (GIC), accelerator coherence port (ACP)۴-۶۴ KB / 4-64 KB L1, MMU + TrustZone۱.۵۷ DMIPS / MHz per core
Cortex-A7 MPCore [۲۲]Application profile, ARM / Thumb / Thumb-2 / DSP / VFPv4-D16 FPU / NEON / Jazelle RCT and DBX / Hardware virtualization, in-order execution, superscalar, 1–۴ SMP cores, Large Physical Address Extensions (LPAE), snoop control unit (SCU), generic interrupt controller (GIC), ACP, architecture and feature set are identical to A15, 8-10 stage pipeline, low-power design[۲۳]۳۲ KB / 32 KB L1, 0-4 MB L2, L1 & L2 have Parity & ECC, MMU + TrustZone۱.۹ DMIPS / MHz per core
Cortex-A8 [۲۴]Application profile, ARM / Thumb / Thumb-2 / VFPv3 FPU / Optional NEON / Jazelle RCT and DAC, 13-stage superscalar pipeline۱۶-۳۲ KB / 16-32 KB L1, 0-1 MB L2 opt ECC, MMU + TrustZoneup to 2000 (2.0 DMIPS/MHz in speed from 600 MHz to greater than 1 GHz)
Cortex-A9 MPCore [۲۵]Application profile, ARM / Thumb / Thumb-2 / DSP / Optional VFPv3 FPU / Optional NEON / Jazelle RCT and DBX, out-of-order speculative issue superscalar, 1–۴ SMP cores, snoop control unit (SCU), generic interrupt controller (GIC), accelerator coherence port (ACP)۱۶-۶۴ KB / 16-64 KB L1, 0-8 MB L2 opt Parity, MMU + TrustZone۲.۵ DMIPS/MHz per core, 10,000 DMIPS @ 2 GHz on Performance Optimized TSMC 40G (dual core)
Cortex-A15 MPCore [۲۶]Application profile, ARM / Thumb / Thumb-2 / DSP / VFPv4 FPU / NEON / Jazelle RCT / Hardware virtualization, out-of-order speculative issue superscalar, 1–۴ SMP cores, Large Physical Address Extensions (LPAE), snoop control unit (SCU), generic interrupt controller (GIC), ACP, 15-24 stage pipeline[۲۳]۳۲ KB / 32 KB L1, 0-4 MB L2, L1 & L2 have Parity & ECC, MMU + TrustZoneAt least 3.5 DMIPS/MHz per core (Up to 4.01 DMIPS/MHz depending on implementation).[۲۷]
ARMv8-ACortex-A53[۲۸]Application profile, AArch32 and AArch64, 1-4 SMP cores, Trustzone, NEON advanced SIMD, VFPv4, hardware virtualization, dual issue, in-order pipeline۸~۶۴ KB/8~64 KB L1 per core, 128 KB~2 MB L2 shared, 40-bit physical addresses۲.۳ DMIPS/MHz
Cortex-A57[۲۹]Application profile, AArch32 and AArch64, 1-4 SMP cores, Trustzone, NEON advanced SIMD, VFPv4, hardware virtualization, multi-issue, deeply out-of-order pipeline۴۸ KB/32 KB L1 per core, 512 KB~2 MB L2 shared, 44-bit physical addressesAt least 4.1 DMIPS/MHz per core (Up to 4.76 DMIPS/MHz depending on implementation).
ARM FamilyARM ArchitectureARM CoreFeatureCache (I/D), MMUTypical MIPS @ MHz

اما برخی از تولیدکنندگان مانند کوالکام، انویدیا یا اپل، طراح‌های شرکت ARM Holding را قبول ندارند و خود نسبت به طراحی هسته سفارشی بر مبنای معماری ARM اقدام می‌کنند. در جدول زیر هسته‌های طراحی شده توسط شرکت‌های دیگر که البته بر مبنای معماری یکی از خانوده‌های ARM هستند را مشاهده می‌کنید:

FamilyARM ArchitectureCoreFeatureCache (I/D), MMUTypical MIPS @ MHz
StrongARMARMv4SA-1۵-stage pipeline۱۶ KB/8–۱۶ KB, MMU۲۰۳–۲۰۶ MHz
۱.۰ DMIPS/MHz
XScaleARMv5TEXScale۷-stage pipeline, Thumb, Enhanced DSP instructions۳۲ KB/32 KB, MMU۱۳۳–۴۰۰ MHz
BulverdeWireless MMX, Wireless SpeedStep added۳۲ KB/32 KB, MMU۳۱۲–۶۲۴ MHz
Monahans
Wireless MMX2 added۳۲ KB/32 KB (L1), optional L2 cache up to 512 KB, MMUup to 1.25 GHz
SnapdragonARMv7-AScorpion
Used by some members of the Snapdragon S1, S2, and S3 families. 1 or 2 cores. ARM / Thumb / Thumb-2 / DSP / SIMD / VFPv3 FPU / NEON (128-bit wide)۲۵۶ KB L2 per core۲.۱ DMIPS / MHz per core
Krait 
Used by some members of the Snapdragon S4 family. 1, 2, or 4 cores. ARM / Thumb / Thumb-2 / DSP / SIMD / VFPv4 FPU / NEON (128-bit wide)۴ KB / 4 KB L0, 16 KB / 16 KB L1, 512 KB L2 per core۳.۳ DMIPS / MHz per core
Apple AxARMv7-AApple Swift [32]
Custom ARM core used in the Apple A6 and Apple A6X. 2 cores. ARM / Thumb / Thumb-2 / DSP / SIMD / VFPv4 FPU / NEONL1: 32 kB instruction + 32 kB data, L2: 1 MB۳.۵ DMIPS / MHz Per Core
FamilyARM ArchitectureCoreFeatureCache (I/D), MMUTypical MIPS @ MHz

ARMv8 و پلتفرم ۶۴ بیتی

در سال ۲۰۱۱ نسل جدید ARMv8 رسما معرفی شد و پشتیبانی از معماری ۶۴ بیتی به آن اضافه گردید. در ARMv8 دستورات ۳۲ بیتی برروی سیستم‌عامل ۶۴ بیتی قابل اجرا هستند و در آن سیستم‌عامل‌های ۳۲ بیتی نیز از طریق مجازی سازی ۶۴ بیتی اجرا می‌شوند. شرکت‌های AMD, Micro, Brodom, Calxeda, Hisilicon, Samsung و ST Microelectronics گواهی استفاده از معماری ARMv8 را دریافت کرده‌اند و اعلام نموده‌اند SoCهای مبتنی بر این معماری را تولید خواهند کرد. خود ARM نیز دو طراحی Cortex-A53 و Cortex-A57 را در ۳۰ اکتبر ۲۰۱۲ معرفی کرد که هر دو مبتنی بر معماری ARMv8 هستند.

لینوکس که هسته اندروید نیز است به تازگی هسته اصلی سیستم‌عامل (Kernel) خود را بروز کرده تا از ARMv8 پشتیبانی کند. انتظار می‌رود در سال ۲۰۱۳ بسیاری از سیستم‌-روی-یک-چیپ‌های دنیا از معماری ARMv8 بهره ببرند.

چه سیستم‌عامل‌هایی از ARM پشتیبانی می‌کنند؟

سیستم‌های Acorn: اولین کامپیوتر مبتنی بر معماری ARM، کامپیوتر شخصی Acorn بود که از سیستم‌عاملی به نام Arthur بهره می‌برد. سیستم‌عاملی مبتنی بر RISC OS که از معماری ARM پشتیانی می‌کرد و Acorn و برخی دیگر از تولیدکنندگان از آن استفاده می‌کردند.

سیستم‌عامل‌های توکار: معماری ARM از طیف وسیعی از سیستم‌عامل‌های توکار مانند Windows CEWindows RTSymbian, ChibiOS/RT, FreeRTOS, eCos, Integrity, Nucleus PLUS, MicroC/OS-II, QNX, RTEMS, CoOS, BRTOS, RTXC Quadros, ThreadX, Unison Operating System, uTasker, VxWorks, MQX و OSE پشتیبانی می‌کند.

یونیکس: یونیکس و برخی از سیستم‌عامل‌های مبتنی بر یونیکس مانند: Inferno, Plan 9, QNX و Solaris از ARM پشتیبانی می‌کنند.

لینوکس: بسیاری از توزیع‌های لینوکس از ARM پشتیبانی می‌کنند از آن جمله می‌توان به اندروید و کروم گوگل، Arch Linux، بادا سامسونگ، Debian، Fedora،OpenSuse، Ubuntu و WebOS اشاره کرد.

BSD: برخی از مشتقات BSD مانند OpenBSD و iOS و OS X اپل نیز از ARM پشتیبانی می‌کند.

ویندوز: معماری‌های ARMv 5, 6 و ۷ از ویندوز CE که در ابزارهای صنعتی و PDAها استفاده می‌شود، پشتیبانی می‌کند. ویندوز RT و ویندوز فون نیز از معماری ARMv7 پشتیبانی می‌کنند.

گواهی و هزینه استفاده از معماری ARM

ARM خود تولیدکننده نیمه هادی نیست و در عوض از راه صدور مجوز استفاده از طراحی‌های خود، درآمد کسب می‌کند. گواهی استفاده از معماری ARM شرایط خاص و متنوعی را دارد و در شرایط مختلف هزینه مربوط به استفاده از آن نیز تفاوت می‌کند. ARM به همراه گواهی‌نامه خود اطلاعات جامعی در مورد نحوه یکپارچگی قسمت‌های مختلف با هسته‌ها را ارائه می‌کند تا تولیدکنندگان به راحتی بتوانند از این معماری در سیستم-روی-یک-چیپ‌های خود بهره ببرند.

ARM در سال ۲۰۰۶ و در گزارش سالانه خود اعلام کرد که ۱۶۴.۱ میلیون دلار از بابت حق امتیاز یا حق اختراع، درآمد داشته که این مبلغ از بابت  فروش گواهی استفاده از معماری این شرکت در ۲.۴۵ میلیارد دستگاه مبتنی بر ARM بدست آمده است. این یعنی ARM Holding بابت هر گواهی ۰.۰۶۷ دلار درآمد کسب نموده، اما این رقم میانگین است و براساس نسل‌های مختلف و نوع هسته‌ها متفاوت خواهد بود. مثلا هسته‌های قدیمی ارزان‌تر و معماری جدید گران‌تر است.

اما در سال ۲۰۰۶ این شرکت از بابت گواهی استفاده از طراحی هسته پردازنده، نزدیک به ۱۱۹.۵ میلیون دلار درآمد بدست آورده است. در آن سال ۶۵ پردازنده براساس معماری هسته های ARM ساخته شده بودند که به این ترتیب بابت هر گواهی پردازنده مبلغ ۱.۸۴ میلیون دلار درآمد کسب کرده است. این عدد نیز بصورت میانگین می‌باشد و براساس نوع و نسل هسته‌ها متفاوت خواهد بود.

در واقع شرکت ARM Holding از معماری ARM دو نوع درآمد دارد یکی بابت استفاده از معماری این شرکت در ابزارهای مختلف که بابت هر تلفن یا تبلت یا هر ابزار دیگری مبلغی بدست می‌آورد و دیگری بابت هر پردازنده مبتنی بر معماری هسته‌های ARM نیز یک رقم نسبتا سنگین حدود ۲ میلیون دلار دریافت می‌کند. در سال ۲۰۰۶ نزدیک به ۶۰ درصد درآمد ARM از بابت حق امتیاز و ۴۰ درصد بابت گواهی ساخت پردازنده براساس معماری ARM بوده است.