高通驍龍處理器在2016年可謂風光無限,驍龍820和驍龍821兩款處理器幾乎橫掃了所有的頂級安卓手機。本著“宜將剩勇追窮寇”的精神,在CES 2017上,高通又發布了全新旗艦——驍龍835處理器。這一次,高通又會在驍龍835上帶來如何強悍的性能和特別的設計呢?
在CES 2017上,高通公布了型號為驍龍835的全新SoC。作為率先使用三星10nm LPE FinFET工藝制造的處理器,驍龍835將替代驍龍820/821兩款產品,成為新一代的頂級處理器。
驍龍835的芯片封裝尺寸比驍龍820縮小了35%(有助于改善了電子產品的內部空間),包含超過30億個晶體管,在性能和功耗上都有不小的進步。終端手機廠商有望借助驍龍835推出擁有更強性能、更出色設計以及更輕薄的手機新品。接下來,小編就詳細為大家解讀驍龍835的各個方面。
三星10nm LPE FinFET工藝為基
對于SoC而言,更新的工藝可算是最重要的部分。原因很簡單,新工藝的晶體管體積更小,單位面積上可以容納的晶體管數量更多,驅動電壓也更低。如果說晶體管體積和密度對應的是設計人員能夠在芯片內部塞入更多晶體管、實現更多的功能或更強的性能的話,那么更低的驅動電壓就可以進一步降低新產品的功耗。再加上新材料和工藝設計上的改進,進一步降低漏電,新品就能實現相比老產品更低的功耗和更高的性能功耗比。
通過與三星合作,驍龍835率先使用上了三星10nm LPE FinFET工藝。
三星推出的最新工藝是10nm LPE FinFET,從命名就可以看出,新工藝的最小線寬可達10nm,并且采用了FinFET技術,大幅度降低了漏電等問題。為了克服縮放限制,新工藝還采用了三重曝光、應力優化等技術以及改善性設計。
驍龍835處理器結構簡圖
根據三星的數據,相比之前的14nm LPE,新工藝在芯片面積上縮小了大約30%、性能方面提高了27%(或者降低40%的功耗)。除了10nm LPE外,三星還將繼續研發工藝技術,使用更低K(介質常數)的材料,并在2017年推出新的10nm LPP FinFET,進一步降低功耗和提升性能功耗比。
從晶體管間距來看,三星的10nm工藝使用了全新的Mask和全新的庫文件,其晶體管間距要比英特爾的14nm更小一些,顯著小于之前三星、GF以及TSMC的14nm、16nm工藝。從制造角度來說,所謂10nm、14nm、16nm的意義并不顯著,因為這些數值更多是商業上的宣傳,性能方面最好只和自家產品相比而不要跨品牌(除非技術源自一家)。
驍龍835的封裝面積相比驍龍820大幅縮小
比如TSMC、三星的16nm FinFET和14nm LPE,在晶體管尺寸上其實和英特爾的22nm差距不大;三星10nm LPE又和英特爾14nm在晶體管尺寸上相距不遠。當然,涉及到芯片制造這樣的復雜環節,各家所用不同的材料和工藝控制都可能實現完全不同的結果,具體問題還需具體分析。
首個半定制化產品
之前驍龍820采用的是Kyro架構的自研處理器,在性能和功耗上表現都不錯。但是在驍龍835上高通一反常態,并沒有繼續使用自家的Kryo架構,轉而使用了一種全新的商業模式打造了新的處理器架構Kyro 280,這種商業模式被稱為“Built on ARM Cortex Technology”,簡稱為BoC。
Kyro 280是首個半定制化的ARM處理器
之前ARM提供了兩種技術授權模式供企業選擇,其中一種是購買處理器授權,比如Cortex-A57和Coretx-A53的處理器授權,然后不加以改動使用在自己的產品中。如驍龍810、麒麟960以及聯發科旗下絕大多數處理器,都直接購買處理器授權然后研發生產。另一種則不太多見,是購買架構許可,比如驍龍820的Kyro架構,是由高通向ARM購買了相關架構內容,包括ARM v8這樣的64位處理器指令集,然后自行研發處理器架構。
現在,ARM有了第三種方式,客戶可以向ARM購買某類處理器的授權,但是對這些處理器擁有一定的修改能力,借此生產自己的半定制化核心,使得最終產品的性能和功耗與自己所需的目標更為緊密地結合一致,或者與專有知識產權比如總線、GPU等更好地結合。
當然,這種授權的可更改內容是有限的,僅包括部分內容,而諸如處理器解碼器寬度、執行流水線等內容都不建議或者不允許客戶修改。因此,大量的修改內容就只涉及處理器的前段內容包括分支預測、指令獲取等。
異構計算解決方案,簡化異構編程。
驍龍835使用了四個定制的大核心和四個定制的小核心,組成了典型的big.LITTLE配置。但高通并沒有說明Kyro 280是基于哪些核心架構定制的,不過可選的大核心無非就是Cortex-A73和A72,小核心只能是Cortex-A53。
和預計的一樣,高通完全沒有給出任何有關Kyro 280究竟修改了公版核心哪些內容的信息,甚至是否使用ARM CCI-500緩存相關性互聯總線還是自己內部設計總線也不得而知。不過只能修改處理器前端部分的話,高通可能會增大指令窗口、增加可以亂序執行的指令數量。
頻率方面,雖然是定制化版本并采用了10nm工藝,但是高通看起來并沒有“飚頻率”的想法。Kyro 280的大核心最高只運行在2.45GHz,小核心最高只能運行在1.9GHz,高通宣稱在應用載入、網頁瀏覽、VR、3D游戲等復雜應用時等會調用大核,另外80%的時間都是小核心。根據之前的經驗,ARM在使用14nm/16nm工藝節點時,Cortex-A73最高可運行在2.6GHz~2.8GHz,在新的10nm下頻率突破3GHz并不是不可能的事。出現目前的情況有如下幾種解釋:
·高通Kyro基于Cortex-A72而不是Cortex-A73,相比之下,雙發射、較短流水線的Cortex-A73相比三發射、較深流水線的Cortex-A72在能耗比上表現要更出色一些,高通這樣做可能是為了控制功耗;
·高通對半定制產品做出的更改限制了最高頻率,比如增加指令窗口大小的設計;
·高通可能進一步平衡了CPU和GPU之間的能耗情況,將更多“熱預算值”留給了GPU部分;
·高通可能考慮電池性能和能耗比等因素,認為目前的性能已經足夠了。
在這種較低頻率的設定下,在2017年年中或者什么時候高通很可能忽然推出一個頻率更高的“驍龍840”來。反正迄今為止驍龍835并沒有太過強勢的競爭對手出現,放緩一點反倒對高通在市場上的操作更有好處。
多代驍龍頂級處理器規格對比
在緩存方面,Kyro 280的大核心部分使用了2MB緩存,小核心則使用了1MB緩存,緩存的大小要比驍龍820大一倍。根據高通的說法,較大的緩存能降低數據存取內存的頻率,同時提高性能并降低功耗。當然更換了處理器架構從而搭配更大緩存也是很可能的。另外,驍龍835的內存控制器由高通自行設計,沒有使用公版方案。
為什么高通在驍龍835上選擇了半定制架構而不是之前自研的Kyro?自研產品往往能更好地和自家其他架構相結合,并能更好地控制性能和功耗。對于這個問題,高通宣稱他們只是在所有可選項之間反復衡量后,選擇了最合適的技術。其中性能和功耗是最明顯的標準,其他因素比如成本、可用性和市場營銷等也會影響這個決定。很官方、很表面的回復,可參考的東西不多。
繼續加強的GPU
驍龍835的GPU采用了Adreno 540,相比之前驍龍820上的Adreno 530,兩者基本架構一樣,因此產品型號也沒有發生大的變化。高通宣稱新一代產品專注于優化瓶頸,比如通過檢查像素深度來剔除無效像素從而減少需要處理的像素工作量。當然高通還在ALU、寄存器等方面做了一些改進,不過沒有更多細節可供披露。
軟件中的Adreno 540信息,可以看到它的一些特性
Adreno 540相對于之前的設計,紋理濾波的效率更高、耗費更少了,比如每周期可以執行16個三線性過濾。相比之下,ARM-G71每周期只處理一個雙線性過濾,或者每兩個時鐘周期處理一個三線性過濾。因此ARM-G71MP16最多每周期處理16個雙線性過濾,但只能處理8個三線性過濾,只有Adreno 540的一半。
性能方面,高通宣稱Adreno 540相比Adreno 530在3D渲染性能方面提高了25%,目前尚不清楚是由于GPU架構改善還是頻率提升才帶來這么大的提升。考慮到架構基本相同,頻率提升也在意料之中。在API支持上,Adreno 540支持所有最新的圖形API,包括OpenGL ES 3.2、DirectX 12、Vulkan,此外還包括OpenCL 2.0以及Renderscript。
應用新技術的DSP、ISP
在驍龍835中,高通應用了全新的Hexagon 690 DSP,不過遺憾的是高通沒有透露更多信息。另外,在驍龍835中還有兩個額外的DSP處理器(這一點和驍龍820一樣)。其中一個在X16 LTE的調制解調器中執行信號處理,暫且不表。
另一個比較有趣,高通稱其為All-Ways Aware Hub,顧名思義,這款DSP是一直活動的,它位于單獨的電源區域中,并連接到一系列不同的傳感器上,通過支持Google Awareness API能夠實現諸如計步、LTE、Wi-Fi或者藍牙LE之類的定位。
驍龍835采用了名為Spectra 180的雙14位ISP
在ISP方面,驍龍835擁有名為Spectra 180的雙14位ISP,支持高達3200萬像素的單鏡頭或者兩個1600萬像素的雙鏡頭。目前雙鏡頭是旗艦手機最重要的功能之一。新的ISP增強了對混合自動對焦系統的支持,并且能夠根據照明條件來選擇合適的對焦方法。它還支持雙光電二極管相位檢測自動對焦(2PDAF),這種技術通過將每個像素(通常是較大的1.4μm像素)拆分成兩個光電二極管,其中一個用于圖像捕獲,另一個用于相位檢測。
通過使用每個像素進行相位檢測來加強自動對焦性能,甚至暗光條件下可達PDAF的兩倍。除了2PDAF外,Spectra 180還支持反差式對焦、激光對焦、紅外對焦、PDAF相位對焦、2PD對焦等,并根據情況不同自動選擇。
另外,Spectra 180還能夠支持HDR,它設計了一個固定的功能模塊來執行硬件加速的Zigzag HDR(zzHDR)—這是一種HDR成像技術,它通過Z字形檢測對角線數據來獲取曝光值。zzHDR能夠用于實時預覽HDR圖像,記錄HDR視頻或者捕獲HDR照片,除了照片分辨率略有犧牲外,不會損失任何快門速度。
持續改善的續航
除了前文所述的使用了新工藝、big.LITTLE技術外,高通還采用了其他一些技術來加強續航設計。包括名為Symphony System Manager的頻率和電壓控制模塊,能夠精確控制GPU和其他部分的頻率和電壓,實現對電池能源利用的最大化。
驍龍835擁有更為出眾的功耗控制,能延長移動設備的續航時間
高通宣稱新的驍龍835相比驍龍820功耗降低了25%,比之前大受好評的驍龍801降低了高達50%(不過并沒有說明測試情況)。在具有QHD顯示器和3000mAh電池的手機中,驍龍835能夠提供3小時以上的連續4K視頻編碼播放和2個小時的VR游戲時間。
支持QC 4.0的驍龍835能讓移動設備擁有更快速的充電體驗
此外,驍龍835還支持更快速的QC 4.0充電技術,兼容USB Type-C和USB PD標準,更新了高通INOV電源管理算法,能夠進一步降低電池循環損耗。相比QC 3.0,QC 4.0的充電速度能夠快20%。
強大的無線連接能力
驍龍835集成了一個X16的LTE調制解調器,能夠使用3×20MHz的載波聚合和256-QAM以及4×4 MIMO和2×2 MIMO實現下行鏈路高達1Gbps的速度。上行方面,2×20MHz以及64-QAM的設計能夠最高達到150Gbps,也就是X13標準。
由于通訊標準提高,驍龍835的手機如果支持所有的通訊接口的話,需要布置四個蜂窩移動網絡天線和Wi-Fi、藍牙、NFC等,加起來一共需要7到10個天線。由于手機中空間極為有限,廠商可能使用較小的天線用于較高頻率的通訊,將4×4 MIMO限制在1.8GHz和2.6GHz之間的中高頻段,較低頻段使用2×2 MIMO。不過即使到2017年,支持千兆網絡的運行商依舊很有限,因此驍龍835的4天線設計有可能被用來加強信號。
驍龍835配合WCN 3990,對Wi-Fi做出了的進一步強化
驍龍835可以與WCN3990芯片配套,提供2×2 MU-MIMO,藍牙5.0以及FM收音、802.11ac Wi-Fi功能。這是首個藍牙5.0的解決方案,能夠提供高達2Mbps帶寬,是之前藍牙4.2的兩倍。在功耗方面,相比驍龍820,驍龍835的Wi-Fi功耗降低了60%,LTE/LAA/Wi-Fi可以共享天線設計,因此手機中天線可以減少3個。此外,Wi-Fi方面如果有額外配套芯片支持的話,能夠實現高達4.6Gbps的802.11ad Wi-Fi。
支持更多高級功能的攝像
從目前移動產品的發展趨勢來看,從軟件到屏幕尺寸和分辨率、再到材料和設計,下一個爆發點應該是相機或者攝像頭。在2016年,蘋果在雙攝像頭上的努力讓人們看到了一種新的市場刺激方法,隨后幾個旗艦手機都紛紛采用雙攝像頭設計,并且今年這樣的設計還將持續增多。
之前在ISP部分,我們曾提到驍龍835增強了對雙攝像頭技術的支持。實際上,Spectra 180還專門為雙攝像頭的不同使用場景做出了優化,它能夠支持不同放大倍率的兩個鏡頭,比如iPhone 7使用的廣角鏡頭和56mm鏡頭,LG G5使用的廣角和魚眼鏡頭,Spectra 180支持平滑縮放功能使得用戶可以在兩個鏡頭之間任意切換。
高通正在考慮通過“驍龍相機模組”,方便廠商快速推出所需要的設備
除此之外,OEM廠商還可以使用高通的Clear Sight算法來整合兩個不同攝像頭傳感器的輸出圖形。比如第一個傳感器可以使用傳統的RGB拜耳式濾色器陣列來獲取顏色數據,第二個黑白傳感器可以用于收集亮度信息而不是更多的光信號。這種技術可以使得圖片獲得比只使用傳統單個RGB傳感器更高的亮度,并降低噪點、加強對比度,最終起到提高畫質的作用。
驍龍835還能支持光學變焦
在圖片的后期處理上,驍龍835繼續支持谷歌Halide語言,并配合Hexagon 690 DSP對圖像進行硬件加速處理。谷歌在驍龍820中就利用它實現了手機的HDR+功能,提高了圖像的質量,驍龍835也可以這樣做。并且驍龍835的DSP支持實時面部檢測和識別,大量美圖類軟件可以利用其實現自動美容算法或提高對焦性能。
當然,這些高級的成像功能需要大量的硬件和軟件開發才能實現,高通正在考慮推出驍龍相機模塊。它包含了已經預制完成的硬件/軟件模塊,方便廠商直接應用到手機上。目前高通已經推出了三個模塊,包括支持PDAF的單個相機模組(使用索尼IMX298攝像頭)、支持Clear Sight的雙攝像頭以及支持光學變焦的雙攝像頭。
驍龍835能夠支持HDR10和超清視頻編解碼
除了攝像功能外,驍龍835也在視頻功能上做出了很大優化。驍龍835的VPU和DPU目前已經可以解碼和顯示4K超高清(HDR10)功能。DPU能夠輸出具有10位彩色的2160p到支持HDR的顯示器上—不過目前尚未有任何支持這種色彩顯示的移動設備面板出現。另外,目前桌面的G-Sync和FreeSync等幀同步技術大行其道,驍龍835的DPU也帶來了Q-Sync,基本技術原理都差不多,GPU輸出畫面的幀率和顯示器刷新率一致,能夠帶來更平滑的游戲體驗。
視頻解碼能力方面,驍龍835支持對2160p@60fps、1440p@120fps或1080p@240fps的H.264(AVC)和H.265(HEVC)視頻的解碼。視頻編碼最高為2160p@30fps、1440p@60fps、1080p@120fps或720p@240fps。視頻穩定功能方面,驍龍835和驍龍820都使用了EIS 3.0視頻穩定技術,但前者加入了新的軌跡平滑算法。
不容錯過的VR和機器學習
目前最受人關注的無疑是VR,驍龍835對這方面的支持自然也不能落下。驍龍835的市場目標是頭戴式顯示器或者谷歌Daydream這樣的設備。一般來說,VR需要更高圖像分辨率,同時需要對音頻定位、手勢識別和空間跟蹤等技術提供很好的支持。
這為設備帶來了巨大的計算負荷,設計人員需要在每個板載處理器之間保證良好的性能和緊密協調性。此外,VR設備的延遲也是非常重要的一環,較高的延遲和卡頓會讓玩家變得頭暈甚至無法繼續使用。高通宣稱驍龍835的延遲大約為15ms,相比驍龍820的18ms略有降低。
面向沉浸式體驗,驍龍835在異構計算方面也做出了加強
在頭部追蹤方面,驍龍835使用的視覺慣性測量系統通過Hexagon 690 DPS處理來自攝像機的流失視頻數據(大約30fps),前文提到的All-Ways Aware DSP以800MHz~1000MHz的速度捕捉加速度計和陀螺儀的數據,然后這些數據會形成確定的擁有六個自由度的定位信息。高通表示,DPS在這方面的應用效率比CPU高出4倍。
除了VR、AR外,機器學習也是目前的熱點產業。高通發布了驍龍神經處理引擎SDK,這個SDK能夠利用驍龍835的異構計算能力來加強機器學習。此外,驍龍835還可以支持客戶創建神經網絡層和實現對TensorFlow的支持,后者是一個使用數據流圖執行機器學習的開源庫。高通宣稱驍龍835的Hexagon 690是第一款支持TensorFlow和Halide框架的移動DSP。
在有關機器學習方面,驍龍835針對不同的應用場景提供了不同的解決方案
在安全方面,驍龍835加入了Heaven安全平臺,提供了對眼球、面部、指紋、虹膜、聲紋等幾乎全部生物識別技術的支持,還加強了移動支付的安全性,使得用戶的資金和數據更有保障。
寫在最后
看了這么多,可以說驍龍835的確是目前移動計算市場上最出色、最全面的移動處理器之一。驍龍835擁有全新的半定制架構的CPU、加強的GPU。在人們一般不太關注的地方,比如DSP和ISP上,驍龍835也有了很大的進步。其Hexagon DSP能夠帶來強大的計算能力和大量新功能。
此外,ISP部分的加強也讓2017年的旗艦手機在攝影方面能夠給用戶更棒的使用體驗。當然,強悍的通訊能力也是高通那句“買基帶送處理器”玩笑話的來源,高達1Gbps的下載數據流以及對幾乎所有無線通訊協議的支持,使得驍龍835成為手機、平板等產品最好的選擇。
當然,我們還需要特別提及,由于驍龍835擁有更強的性能和更為先進的技術,使得大量設備有望使用驍龍835來驅動,這其中不僅包括手機、平板等,還有網絡攝像機、VR/AR設備以及最新推出的支持Windows 10的超便攜電腦——這種設備除了可以運行支持通用Windows平臺的應用程序外,還可以運行x86(32位)的Win32應用程序。這或許會直接挑戰英特爾在入門級市場的地位。總的來看,在2017年的舞臺上,驍龍835帶來了太多的可能性,我們會在更多不同領域的產品上,看到它的身影。