《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業(yè)界動態(tài) > 嵌入式系統(tǒng)嵌入式開發(fā) ARM Cortex-M3處理器技術優(yōu)勢分析

嵌入式系統(tǒng)嵌入式開發(fā) ARM Cortex-M3處理器技術優(yōu)勢分析

2017-10-24

  在嵌入式開發(fā)設計中,對客戶來說用什么技術、芯片不是主要的。主要的是能否滿足要求。高性價比、開發(fā)門檻底、易于使用才是硬道理。Cortex-M3是一個32位處理器內(nèi)核。從理論上來說性價比高。

  598a778ab8cc1.jpg  

    三級流水線+分支預測

  ARM Cortex-M3與ARM7內(nèi)核一樣,采用適合于微控制器應用的三級流水線,但增加了分支預測功能?,F(xiàn)代處理器大多采用指令預取和流水線技術,以提高處理器的指令執(zhí)行速度。流水線處理器在正常執(zhí)行指令時,如果碰到分支(跳轉)指令,由于指令執(zhí)行的順序可能會發(fā)生變化,指令預取隊列和流水線中的部分指令就可能作廢,而需要從新的地址重新取指、執(zhí)行,這樣就會使流水線“斷流”,處理器性能因此而受到影響。特別是現(xiàn)代C語言程序,經(jīng)編譯器優(yōu)化生成的目標代碼中,分支指令所占的比例可達10-20%,對流水線處理器的影響會的更大。為此,現(xiàn)代高性能流水線處理器中一般都加入了分支預測部件,就是在處理器從存儲器預取指令時,當遇到分支(跳轉)指令時,能自動預測跳轉是否會發(fā)生,再從預測的方向進行取指,從而提供給流水線連續(xù)的指令流,流水線就可以不斷地執(zhí)行有效指令,保證了其性能的發(fā)揮。

  ARM Cortex-M3內(nèi)核的預取部件具有分支預測功能,可以預取分支目標地址的指令,使分支延遲減少到一個時鐘周期。

  哈佛結構

  ARMCortex-M3采用哈佛結構,并選擇了適合于微控制器應用的三級流水線,但增加了分支預測功能。

  從內(nèi)核訪問指令和數(shù)據(jù)的不同空間與總線結構,可以把處理器分為哈佛結構和普林斯頓結構(或馮.諾伊曼結構)。馮.諾伊曼結構的機器指令、數(shù)據(jù)和I/O共用一條總線,這樣內(nèi)核在取指時就不能進行數(shù)據(jù)讀寫,反之亦然。這在傳統(tǒng)的非流水線處理器(如MCS51)上是沒有什么問題的,它們?nèi)≈?、?zhí)行分時進行,不會發(fā)生沖突。但在現(xiàn)代流水線處理器上,由于取指、譯碼和執(zhí)行是同時進行的(不是同一條指令),一條總線就會發(fā)生總線沖突,必須插入延遲等待,從而影響了系統(tǒng)性能。ARM7TDMI內(nèi)核就是這種結構的。

  而哈佛結構的處理器采用獨立的指令總線和數(shù)據(jù)總線,可以同時進行取指和數(shù)據(jù)讀寫操作,從而提高了處理器的運行性能。ARM Cortex-M3、ARM966E、ARM926EJ、ARM1136JF等內(nèi)核都采用了哈佛結構。

  內(nèi)置嵌套向量中斷控制器(NVIC)

  針對業(yè)界對ARM處理器中斷響應的問題,Cortex-M3首次在內(nèi)核上集成了嵌套向量中斷控制器(NVIC)。Cortex-M3的中斷延遲只有12個時鐘周期(ARM7需要24-42個周期);Cortex-M3還使用尾鏈技術,使得背靠背(back-to-back)中斷的響應只需要6個時鐘周期(ARM7需要大于30個周期)。以STM32運行在75MHz為例,中斷延遲只有80ns-160ns。另外,Cortex-M3采用了基于棧的異常模式,使得芯片初始化的封裝更為簡單。

  ARM7TDMI內(nèi)核不帶中斷控制器,具體MCU的中斷控制器是各芯片廠商自己加入的,這使得各廠商的ARM7 MCU中斷控制部分都不一樣,給用戶使用及程序移植帶來了很大麻煩。Cortex-M3內(nèi)核集成NVIC,各廠商生產(chǎn)的基于Cortex-M3內(nèi)核的MCU都具有統(tǒng)一的中斷控制器,對用戶使用各種Cortex-M3 MCU,特別是中斷編程帶來了很大的便利。

  支持位綁定操作

  以前的ARM內(nèi)核不支持位操作,當需要對一個變量或端口的某一位操作時,先要用邏輯與/或指令屏蔽其他的位,使位操作需要較多的指令和時鐘周期。ARM Cortex-M3采用了一種特殊的方法——位綁定:把一個地址單元的32位變量中的每一位,通過一個簡單的地址轉換算法,映射到另一個地址空間,每一位占用一個地址,對此地址空間的操作,只有數(shù)據(jù)的最低一位是有效的,其余高31位的值被忽略。相當于把一個“橫”的32位字給“豎”起來。這樣對新的映射空間操作時,就可以不用屏蔽操作,優(yōu)化了RAM和I/O寄存器的讀寫,提高了位操作的速度。

  這種方法粗看起來好像損失了很多地址空間,其實對于32位的ARM處理器而言,總共可以尋址4GB的空間,而對于一個MCU來說,一般只用到幾百KB的空間。所以這種處理方法絲毫不會影響一個MCU的正常使用,又大大簡化了處理器的設計,可以說是一種良策。

  支持串行調(diào)試(SWD)

  ARM處理器一般都使用JTAG調(diào)試接口,使得仿真、調(diào)試工具統(tǒng)一而廉價,方便了用戶開發(fā)。但JTAG調(diào)試接口至少要占用芯片的5-6個引腳,這對于一些引腳較少的MCU來說,有時會對仿真調(diào)試和I/O使用帶來麻煩。

  ARM Cortex-M3在保持原來JTAG調(diào)試接口的基礎上,還支持串行調(diào)試(SWD)。使用SWD時,只占用2個引腳,就可以進行所有的仿真和調(diào)試,節(jié)省了調(diào)試用引腳,用戶就可以使用更多的引腳。

  另外,Cortex-M3支持8個硬件斷點(ARM7、ARM9只支持2個硬件斷點),可以減少斷點調(diào)試時對代碼的影響,保證仿真、調(diào)試的時序準確性。

  內(nèi)核支持低功耗模式

  ARM內(nèi)核已經(jīng)是一個高性能、低功耗的內(nèi)核,但ARM7、ARM9等內(nèi)核本身只有運行/停止模式,沒有其他模式。各芯片廠商只能在內(nèi)核基礎上,對各自加入的外設定義各種低功耗模式。Cortex-M3加入了類似于8位處理器的內(nèi)核低功耗模式,支持3種功耗管理模式:通過一條指令立即睡眠;異常/中斷退出時睡眠;深度睡眠。使整個芯片的功耗控制更為有效。以STM32為例,其RAM和寄存器狀態(tài)保持的停機模式耗電僅為14uA,從此狀態(tài)的啟動時間僅為7us。

  Cortex-M3的運行功耗(Active Mode)也很低。以STM32系列微控制器為例,其典型功耗約為500uA/MHz,也只是目前業(yè)界超低功耗單片機MSP430系列(約為250uA/MHz)的2倍。但MSP430是16位處理器,而STM32是32位處理器。

  高效的Thumb2 16/32位混合指令集

  ARM7、ARM9等內(nèi)核使用不同的處理器狀態(tài)分別執(zhí)行32位的ARM指令和16位的Thumb指令,使用狀態(tài)切換指令完成ARM狀態(tài)和Thumb狀態(tài)的切換。Cortex-M3使用更高效的Thumb2指令集,它是一種16/32位混合編碼指令,兼容Thumb指令。對于一個應用程序編譯生成的Thumb2代碼,以接近Thumb編碼的代碼尺寸,達到了接近ARM編碼的運行性能。Thumb2是一種緊湊、高效的新一代指令集。

  Thumb2指令集是面向高級語言的指令集,適合于C語言編程,由編譯器生成目標代碼,不建議直接使用Thumb2匯編語言編程。

  32位硬件除法和單周期乘法

  以往的ARM處理器沒有除法指令,在某些除法密集型應用中性能不盡如意。Cortex-M3加入了32位除法指令,彌補了這一缺陷,使Cortex-M3可以和其他通用處理器一樣,完成各種數(shù)學運算操作。

  Cortex-M3還改進了乘法運算部件,32結果的32位x32位乘法操作只要一個時鐘周期。這一性能使得使用Cortex-M3來進行乘、乘加運算時,已逼近DSP的性能,因此特別適合一些需要簡單DSP的應用領域,如電機控制、數(shù)字濾波、FFT變換等。

  需要指出的是,32位的乘/除運算,對于一個8位機而言,已經(jīng)是一段比較復雜的程序,而對于32位的Cortex-M3而言,只需一句指令。因此,即使二者工作主頻一樣,實際運行性能也不是一個數(shù)量級的。

  支持存儲器非對齊訪問

  基于Cortex-M3的MCU,為提高性能,其內(nèi)部存儲器(Flash、RAM)都是32位編址的。這樣當常量、變量是字節(jié)或半字類型時,如果處理器只支持對齊訪問(以往的處理器都是如此),那么這些字節(jié)/半字類型的數(shù)據(jù)也必須被分配、占用一個32位的存儲單元,這樣就浪費了部分存儲空間。

  Cortex-M3支持存儲器的非對齊訪問,它可以訪問存儲在一個32位單元中的字節(jié)/半字類型數(shù)據(jù),這樣4個字節(jié)類型(或2個半字類型)數(shù)據(jù)可以被分配在一個32位的單元中,提高了存儲器的利用率。對于一般的應用程序而言,這種技術可以節(jié)省約25%的SRAM使用量,從而可以選擇SRAM較小、更廉價的MCU。

  定義了統(tǒng)一的存儲器映射

  ARM7、ARM9等內(nèi)核沒有定義存儲器映射,各芯片廠商自己定義了存儲器映射,這使得各廠商的MCU存儲器映射都不完全一致,給用戶學習使用及程序移植帶來了麻煩。

  Cortex-M3內(nèi)核定義了統(tǒng)一的存儲器映射,各廠商生產(chǎn)的基于Cortex-M3內(nèi)核的微控制器芯片都具有一致的存儲器映射,對用戶使用各種基于Cortex-M3的 MCU以及代碼在不同MCU上的移植帶來了很大的便利。

  嵌入式開發(fā)設計服務商朗銳智科(www.lrist.com)認為基于Cortex-M3的微控制器相比于ARM7TDMI的微控制器,在相同的工作時鐘頻率下:平均性能要高約30%;代碼尺寸要比ARM編碼小約30%;價格一般也更低。以STM32系列Cortex-M3微控制為例,工作頻率可達75MHz,而價格比STR71x系列ARM7TDMI芯片要低約30%,具有極高的性價比。目前已有的芯片的功能太少。Cortex M系列在處理能力基本與ARM7同,主要是成本低,功耗小。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 男女网站免费 | 六月综合网 | 午夜亚洲精品 | 最近免费中文字幕大全视频 | 成人a级高清视频在线观看 成人a大片在线观看 | 欧美福利影院 | 久久永久免费视频 | 久久a 热6 | 你懂的 在线播放 | 热re91久久精品国产91热 | 国产精品久久久久久搜索 | 日本午夜精品一本在线观看 | 欧美人视频在线观看视频 | 日韩欧美国产高清在线观看 | 久久精品欧美一区二区 | 五月婷婷爱 | 欧美视频在线一区二区三区 | 中文字幕在线视频免费观看 | 欧美三级黄视频 | 国产精品麻豆久久久 | 欧美高清视频性播放 | 久久午夜夜伦伦鲁鲁片 | a级毛片视频免费观看 | 成人毛片100部免费看 | 在线观看免费黄色网址 | 亚洲人交性视频 | 小明免费视频一区二区 | 片成年免费观看网站黄 | 国产精品12p | 日日噜噜夜夜狠狠 | 亚洲第一综合网 | 夜夜爽夜夜爱 | 日本三级特黄 | 国产综合在线观看视频 | 狠狠色丁香六月色 | 亚洲国产精品热久久2022 | 午夜视频福利在线观看 | 国产黄色福利 | 无限资源日本好片 | 91精品国产闺蜜国产在线 | 国产成人精品在线 |