《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > DeepSeek推理任務(wù)中昇騰910C已達(dá)英偉達(dá)H100性能的60%

DeepSeek推理任務(wù)中昇騰910C已達(dá)英偉達(dá)H100性能的60%

2025-02-06
來源:芯智訊
關(guān)鍵詞: Deepseek GPU 昇騰 英偉達(dá)

1.jpeg

2月5日消息,據(jù)tomshardware等多家媒體報(bào)道, 華為最新的AI處理器昇騰910C(Ascend 910C)的推理性能已經(jīng)達(dá)到了英偉達(dá)(NVIDIA)H100 GPU的60%。雖然昇騰910C性能與英偉達(dá)最新的Blackwell系列AI芯片相比仍有很大差距,但它有助于降低中國(guó)對(duì)英偉達(dá)GPU的依賴。

根據(jù)DeepSeek 研究人員的測(cè)試數(shù)據(jù)顯示,在執(zhí)行基于DeepSeek模型的推理任務(wù)中,昇騰910C性能可達(dá)到英偉達(dá)H100的60%。

這顯示出,華為盡管受美國(guó)的制裁,無法獲得臺(tái)積電的先進(jìn)制程技術(shù)的支持,華為AI處理器的能力仍在快速進(jìn)步。據(jù)介紹,昇騰910C采用chiplet封裝,整合約530億個(gè)晶體管。過去昇騰910芯片采用臺(tái)積電N7+制程,而昇騰910C芯片則由中芯國(guó)際第二代7納米級(jí)(N+2)制程制造。

若透過手動(dòng)優(yōu)化CUNN核心,昇騰910C性能還可進(jìn)一步提升。此外,DeepSeek 對(duì)升騰處理器的原生支持,以及其PyTorch儲(chǔ)存庫(kù)可讓CUDA到CUNN無縫轉(zhuǎn)換,讓華為硬件更容易整合到AI工作流程中。

據(jù)了解,DeepSeek的支持為華為芯片帶來了關(guān)鍵優(yōu)勢(shì): 從第一天起就支持華為昇騰芯片,自主維護(hù)PyTorch倉(cāng)庫(kù),只需一行代碼就能將CUDA轉(zhuǎn)換為CANN;而且性能優(yōu)化潛力巨大,通過定制優(yōu)化可達(dá)到更高性能。

據(jù)華為官網(wǎng)介紹, CANN(Compute Architecture for Neural Networks)是昇騰針對(duì)AI場(chǎng)景推出的異構(gòu)計(jì)算架構(gòu) ,對(duì)上支持多種AI框架,對(duì)下服務(wù)AI處理器與編程,發(fā)揮承上啟下的關(guān)鍵作用,是提升昇騰AI處理器計(jì)算效率的關(guān)鍵平臺(tái)。同時(shí)針對(duì)多樣化應(yīng)用場(chǎng)景,提供高效易用的編程接口,支持用戶快速構(gòu)建基于昇騰平臺(tái)的AI應(yīng)用和業(yè)務(wù)。

據(jù)了解,CANN分社區(qū)版和商用版。 前者是快速提供新特性的體驗(yàn)版,供開發(fā)者提前試用;而后者是滿足商用標(biāo)準(zhǔn)的穩(wěn)定版本。目前,CANN社區(qū)版已經(jīng)來到了8.0.0.alpha003版本,針對(duì)Ascend C進(jìn)行了特性增強(qiáng)。而商用版CANN 8.0.RC3版本也已經(jīng)發(fā)布,新增適配7個(gè)操作系統(tǒng),簡(jiǎn)化了CANN安裝流程。

DeepSeek的Yuchen Jin表示,“長(zhǎng)周期訓(xùn)練的穩(wěn)定性是中國(guó)芯片最大難關(guān)”。這涉及英偉達(dá)軟硬體生態(tài)系統(tǒng)的深度整合,CUDA護(hù)城河已經(jīng)發(fā)展二十多年。雖然推理性能可繼續(xù)改善,但持續(xù)的訓(xùn)練工作負(fù)載需要華為進(jìn)一步改進(jìn)軟硬體堆疊。

有專家預(yù)測(cè),隨著AI模型向“Transformer構(gòu)架”(如GPT、BERT等)靠攏,CUDA和PyTorch編譯器的重要性將降低。此外,DeepSeek 團(tuán)隊(duì)在軟硬體優(yōu)化方面的專長(zhǎng),也可能大幅降低對(duì)英偉達(dá)CUDA的依賴,大幅節(jié)省成本。

此前的研究顯示,DeepSeek使用英偉達(dá)的H800芯片訓(xùn)練時(shí),使用英偉達(dá)底層硬件指令PTX(Parallel Thread Execution)語言,而非高級(jí)編程語言CUDA。這似乎也意味著DeepSeek繞過了CUDA,使用更底層的編程語言做優(yōu)化。

對(duì)于程序開發(fā)人員來說,CUDA是一種更加友好的高級(jí)語言,開發(fā)者只需要專注于程序和算法最相關(guān)的運(yùn)行邏輯,而不太需要考慮具體的程序是如何在GPU等硬件上具體如何執(zhí)行計(jì)算的,從而能夠降低開發(fā)難度。而PTX在接近匯編語言的層級(jí)運(yùn)行,允許進(jìn)行細(xì)粒度的優(yōu)化,如寄存器分配和Thread / Warp級(jí)別的調(diào)整。這種編程非常復(fù)雜且難以維護(hù),所以行業(yè)通用的做法是使用CUDA這樣的高級(jí)編程語言。

北京航空航天大學(xué)副教授黃雷表示,繞過CUDA可以直接根據(jù)GPU的驅(qū)動(dòng)函數(shù)做一些新的開發(fā),從而實(shí)現(xiàn)更加細(xì)粒度的操作。這也說明DeepSeek擁有一些擅長(zhǎng)寫PTX語言的內(nèi)部開發(fā)者。 假如它之后使用國(guó)產(chǎn)GPU,其在硬件適配方面將會(huì)更得心應(yīng)手,其只要了解這些硬件驅(qū)動(dòng)提供的一些基本函數(shù)接口 , 就可以仿照英偉達(dá)GPU硬件的編程接口去寫相關(guān)的代碼,從而讓自家大模型更加容易適配國(guó)產(chǎn)硬件。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 色老头永久免费网站 | 成人日韩 | 一个人免费观看视频www | 一级毛片特级毛片免费的 | 中文字幕在线视频不卡 | 欧美怡红院在线观看 | 国产成人欧美一区二区三区的 | 在线网站污 | 黄网站在线免费 | 一二三四在线视频播放社区 | 欧美综合自拍亚洲综合 | 日本一区二区高清免费不卡 | 欧美成人观看免费完全 | 青青青视频自偷自拍视频1 青青青视频免费一区二区 青青青久热国产精品视频 青青青国产在线 | 色www免费视频| 亚洲美女激情 | 黄色大片免费观看 | 麻豆精品国产免费观看 | 欧美深夜影院 | 国产视频资源在线观看 | 精品在线一区 | 91成人高清在线播放 | 日韩a毛片免费全部播放完整 | 久播影院免费理论片 | 伊人精品成人久久综合欧美 | 欧日韩美香蕉在线观看 | 亚洲国产成人91精品 | 天堂免费在线视频 | 猫色综合网 | 欧美日韩一区二区三区高清不卡 | 久久人人爽人人爽人人爽 | 国产一区二区在线观看动漫 | www.色五月.com| 最近更新2019中文国语字幕 | 久久国产午夜精品理论片34页 | 簧片免费网站 | 欧美日韩亚洲综合在线一区二区 | 色男人影院 | 丁香六月婷婷综合 | 日日射夜夜| 色列里番h本全彩无遮挡影片 |