超級電腦的競賽速度一再加快,但在朝百萬兆級(Exascale)發展的道路上,卻遭遇到功效、成本及資料安全性等重大挑戰。
本月初,包括超微(AMD),Appro,Cray,PenguinComputing和Supermicro等公司,針對高性能運算(HPC)進行了討論,而GartnerResearch副總裁暨分析師CarlClaunch將超級運算領域稱之為一個“不斷移動的目標”。
政府、企業和學術單位的資料都顯示系統對速度的需求不斷提高,Claunch說,這些系統必須應對日益增加的多種問題,從氣候變遷到防御核武,甚至還包含了朝生物醫學方面的發展挑戰。
Exascale級運算,即每秒可進行10的18次方(quintillion)運算,已不再是科幻小說了,業界希望能在2018年實現,Claunch說。
事實上,超級電腦和高性能運算受業界重視程度日增,且其應用跨越眾多產業,從核子物理到氣候建模,甚至金融業都包含在內,而目前大家對超級電腦的一致問題,都集中在效率、密度和成本上。
“大部份的超級電腦采購者都受限于預算,”Claunch指出,盡管已經在運算建模方面居得了很大進展,且HPC的設計彈性也不斷增加,但業界對更小、售價更低的系統需求依然強勁。
摩爾定律大幅改善了電晶體密度,但還有很多工作要做,與會的專家們指出,特別是在每瓦功率方面,如何將更多的電源轉換為FLOPS運算速度是關鍵。
超級電腦的電源預算不斷上升,而為了求取更高的效率,最終超級電腦的開發成本也不斷提高。
例如,美國政府已增加了太空計劃的投資金額,據報導僅2012年便將挹注1.26億美元在Exascale級運算的開發上,以提升其在超級電腦霸主地位方面的競爭力。特別是中國和日本最近在太空領域也展現出積極態度。
Cray的HPC系統資深副總裁MargaretWilliams指出,“超級電腦是維持美國領先地位的關鍵之一。”她表示,Cray經常與美國政府官員接觸,并游說美國能源部門投注更多資源在超級運算領域。“該領域確實需要大量的投資,”她強調。
盡管有些人認為美國并不需要做這些龐大的投資,但也有一些人表示,在HPC領域的投資最終將有利于整個產業發展,Supermicro公司行銷暨業務開發副總裁DonClegg認為,爭論終將平息。“今天的尖端技術就是明天的主流系統,”他說。
電力、地板空間限制
然而,盡管許多資金挹注在HPC領域,但仍有許多具潛力的超級電腦客戶,仍然受限于電力甚至是地面放置空間,Claunch說。他補充道,發展HPC將可提高效率,從而獲得巨大利益。
Supermicro的Clegg說,“”我們非常重視電源效率挑戰。他進一步指出,“大家都更加關注電源,”Supermicro的目標是獲得約94%的效率。“電源和冷卻是最大的問題,”Clegg再度指出,冷卻成本幾乎是和性能的提升呈指數級成長,因此要達到有利的成本效益比更加困難了。
“目前我們缺乏足夠的廉價電力讓我們發展Eexascale級運算,除非我們做出一些重大的架構變化,”他說。
Appro公司的AnthonyKenisky同意,“電力是Exascale級運算面臨的主要挑戰。”
AMD院士暨技術長ChuckMoore說,希望實現Exascale級運算的人,可能要考慮到每Megawatt高達百萬美元的花費。他補充說:Bulldozer或Interlagos處理器性能仍然不足,無法讓我們達到Exascale級的運算目標。
Moore預測,或許至少要到2019或2020年,AMD的晶片才能提供足以讓客戶達到Exascale級運算的可編程水準,他并指出,GPU將成為其中的一大關鍵因素。
事實上,業界人士大多同意在超級電腦內使用GPU會是推動該領域前進的關鍵之一。
“在抒解瓶頸方面,GPU是異質運算相當重要的一部分,”Clegg指出,繪圖處理器正成為建構異質運算的一項要素。盡管GPU近期一直是熱門討論議題,但Clegg仍抱持謹慎態度。“未來該領域是否100%都會是異質運算且基于GPU的?我不這么想,因為有一些應用會適合,但也有一些不會,”他說。
“此刻,GPU在HPC領域是相當流行的詞匯,”PenguinComputing公司CEOCharlesWuischpard說。該公司以‘依照需求的模型’來執行超級運算。“對我們的大型系統而言,我們所做的每件工作事實上都涉及到GPU,但大多數并不是對大量市場。”
GPU在超級電腦領域站穩腳步
“GPU逐漸在超級電腦領域站穩腳步,”Cray的Williams同意,并表示她的公司已經開發出一些全球最快的超級電腦系統,并看到了GPU在該領域的重要性日益提升。今年五月,Cray發表XK6混合超級電腦,整合了AMD的多核心純量處理器,及Nvidia的多核心GPGPU處理器器,達到了50petaflops的峰值性能,Williams并表示,該公司目前正在改良其Jaguar系統,預計將添加GPU。
Williams說,問題在于這個產業是否能讓應用程式更輕易地存取GPU,而且更具功效。
Appro的Kenisky同意,“應用程式將是驅動GPU在此領域應用普及的要素,”他并指出,雖然已經看到對GPU技術越來越廣泛的關注和需求,但該公司仍未看到GPU具有足夠的影響力。
“GPU運算仍處于起步階段,”Moore說。他表示AMD目前投注在GPU的發展工作將使其繪圖處理器更像是向量電腦,這將更容易進行編程。“最好的東西還沒到呢,他表示,該公司正試圖讓CPU和GPU之間的無縫切換更加簡便。
另外,這次會議也討論到了ARM架構。
“ARM只是缺乏x86的生態系統,”Williams說,而Cray并不指望ARM架構能在超級電腦領域快速起飛。
Kenisky則樂觀多了,他表示Appro公司認為ARM可作為“補充解決方案”,特別是在超級電腦領域中以外的嵌入式管理部份。
“ARM在高度競爭的產業維持了良好的競爭力,”Moore表示,AMD認為ARM推動了創新,但他懷疑ARM的平臺是否能在HPC領域扮演重要角色。
“在微控制器使用ARM核心是理所當然的,”Moore說,他承認ARM的平臺表現良,但很快便會面臨安達爾定律(Amdahl'sLaw)的局限性。
安達爾的論點經常被用來形容當希望最大幅度地改善整個系統時,該系統卻僅有部分獲得改善。
“x86將維持其作為超級電腦核心的地位,”Moore肯定道。
Clegg表示,對云端或HPC來說,現在還沒有一個放諸四海皆準的標準。
討論到在HPC和云端運算之間工作量差異時,與會人員同意,二者之間雖然有一些共通性,但在不同應用間應該采用何種模式仍然未有定論。