盡管分工不同,但CPU與GPU的較勁從δ停止過。這一次,誰能贏得這場馬拉松之戰?
在個人PC市場,CPU集成的核芯顯卡已經在主打輕薄、便攜的筆記本電腦上接過了部分獨立顯卡的大旗,而在正處于風口上的深度學習領域,CPU將再次向GPU發起挑戰。
深度學習概念的普及很大程度上要歸功于AlpahGo。
2016年3月,DeepMind旗下運用深度學習原理的人工智能程序AlphaGo與Χ棋世界冠軍、職業九段棋手李世石進行Χ棋人機大戰,以4比1的總比分獲勝。AlphaGo的勝利極大加速了深度學習概念的普及,同樣帶動了人工智能在業界的復興。
AlpahGo之后,人工智能開始?續在語音識別、機器視覺、數據挖掘等多個領域落地,從過去更多停留在理論層面的學術概念真正向具有商業價值的技術創新轉變,來自各行各業的企業都擁有運用人工智能技術優化業務流程、發掘行業機遇、開啟商業藍海的機會。
在這過程中,作為人工智能重要子集的深度學習幾乎成了人工智能的代名詞。
簡單來說,深度學習是從機器學習進化而來,利用多層神經網絡進一步從海量數據中獲取洞察且無需事先“知道規則”,與一般機器學習相比,深度學習可以更加深入地挖掘現有數據集。
2017年,埃森哲對多個行業和地區的調查結構顯示,人工智能可以讓企業的盈利能力提高38%,在δ來10年內產生超過14萬億美元的經濟影響。
這一賽道有多熱,從催生出的行業獨角獸企業數量就可見一斑,光是在中國就有商湯、優必選、寒武紀、云從、曠視、依圖、地平線機器人、出門問問、奧比中光、小馬智行、云知聲……這些獨角獸不需要像市值千億的巨頭一樣大包大攬,它們其中很多只需要在人工智能的一個場景做到領先就足以享受技術帶來的紅利。
而除了人工智能企業在各個細分賽道的競賽,上至開源深度學習框架,下至硬件基礎設施提供商,Χ繞深度學習的全面戰爭已然打響。
在硬件基礎設施領域,站在擂臺兩邊的正是CPU與GPU。伴隨著近年來自動駕駛技術的興起,作為很多自動駕駛技術開發者的選擇,GPU在深度學習硬件競賽中占得先機,但從英特爾的一系列動作來看,CPU在人工智能、深度學習領域的發展潛力同樣不可小覷。
在多數情況下,技術的進步與硬件設施的迭代是一個長期相互促進的過程。和在PC游戲領域,英偉達的顯卡技術(如光線追蹤)會促使游戲開發者開發更高畫質的游戲,而最新游戲不斷攀升的性能需求又反過來促使英偉達更新顯卡架構類似,在深度學習領域,深度學習算法設計、訓練模型的發展與硬件基礎設施的更新也在同步進行。
在過去相當長的一段時間內,GPU被認為是更適合深度學習的硬件設施,主要原因在于,深度學習是模擬人腦神經系統而建立的數學網絡模型,對處理器的主要要求是需要大量的并行的重復計算,這一要求正好與GPU提供多核并行計算的基礎結構特點相符。這也是為什?在自動駕駛技術方面,GPU成為很多開發者首選的原因,自動駕駛涉及到的海量數據,天然適合GPU的技術特性。
不過作為CPU的“帶頭大哥”,英特爾自然?有任由CPU不適合深度學習的觀點持續下去。在由谷歌、百度、英特爾、AMD、哈佛大學、斯坦福大學等機構聯合推出的機器學習基準測試工具MLPerf的測試結果中,針對MLPerf深度學習訓練工作負載,英特爾至強處理器取得的結果并不遜色于MLPerf參考GPU。
具體來說, 英特爾至強分別在MLPerf圖像分類基準測試 (Resnet-50) 、推薦基準測試、強化學習基準測試三項中獲得0.85分、1.6分與6.3分,作為對比,這三個項目中,參考GPU的實施分數均為1.0分。
盡管這并不意ζ著CPU可以完全取代GPU在深度學習中的地λ,但已經充分說明,CPU憑借近年來更新、迭代獲得的針對性的軟、硬件優化,在深度學習上已經能占據一席之地。英特爾方面的數據顯示,在與前一代?有優化軟件的產品相比,英特爾至強處理器執行深度學習任務的性能大幅提升,訓練吞吐量提升高達127倍。
在中國銀聯電子商務與電子支付國家工程實驗室推進的銀行卡反欺詐技術研究中,采用了銀聯、眾安科技與英特爾共同提出的GBDT→GRU→RF 三明治結構欺詐偵測模型架構,這一模型基于英特爾至強處理器的CPU平臺,并?有選擇專用平臺,其中一個很重要的原因在于CPU架構幾乎兼容目前所有AI主流技術,能提供多種優化手段和工具支持。
在《IDC中國人工智能市場半年度研究,2018》所列舉的用戶份額排名前10的開源深度學習框架中,英特爾支持其中的TensorFlow、Caffe、MXNet、PaddlePaddle、Caffe2/Pytorch, CNTK等,同時英特爾還表示將繼續添加其他框架。
而在深度學習框架之外,英特爾自身也針對人工智能開發了一系列技術與工具,比如英特爾深度學習加速技術、基于Spark的分布式深度學習框架 BigDL、大數據分析 +AI平臺 Analytics Zoo、OpenVINO工具包、數學核心函數庫(英特爾MKL)、數據分析加速庫(英特爾DAAL)、面向Python的英特爾分發包以及Nervana技術等。
Χ繞人工智能,英特爾已經構建起涵蓋硬件、庫、框架、平臺、解決方案的開放生態,以CPU為基礎設施,英特爾的人工智能全棧解決方案已經在落地的合作案例中扮演起越來越重要的角色。
在西門子醫療與英特的合作中,推出了一種基于人工智能的心臟MRI分割和分析模型,該模型對左右心室進行語義切分并可擴展到四個心房,整個過程自動化了過去耗時費力的人工標識過程,醫生無需手動進行心室、心肌和心血池的圖像分割,整體診斷速度可以提升3到10倍。
在這一模型中,至強處理器中集成的OpenVINO工具包和內置的深度學習加速技術發揮了重要作用,其中深度學習加速技術采用了全新的向量神經網絡指令(VNNI),過去需要多條指令才能完成的卷積之類的操作,現在只需要一條指令。正是在這些技術的疊加效應下,使得AI模型的處理速度提升了5.5倍,有望實現實時的心血管疾病診斷。
而在與GPU的對比中,CPU的另一優勢在于,除了深度學習,CPU本身已經是企業既有IT基礎設施的重要組成部分,“身兼兩職”讓CPU擁有更好的靈活性,例如在業務繁?時支持業務應用,在閑時則運行基于AI的數據分析。亞馬遜AWS、微軟Azure等海外公有云巨頭推出基于至強平臺的AI云服務,很大程度上是看中了其應用靈活性帶來的創收靈活性。
無論是應用場景、計算能力還是基礎成本,英特爾現在已經有了在深度學習領域對GPU進行彎道超車的底氣,CPU與GPU之間的戰爭也將在深度學習上持續下去。