琅琊榜海宴小说,好看的小说完本推荐,完结小说

DeepSeek開源周第二日：開源首個用于MoE模型訓練通信庫

日期： 2025-02-25

來源：C114通信網

關鍵詞： Deepseek 開源周 DeepEP MoE

今天是DeepSeek 開源周第二日，一早，DeepSeek如約就放出了開源代碼庫DeepEP王炸。

據了解，DeepEP是首個用于 MoE 模型訓練和推理的開源 EP 通信庫，它填補了MoE模型專用通信工具的空白，為大規模分布式AI訓練和實時推理場景提供了更高效的底層支持。

在這里，簡單介紹一下DeepEP的技術性能特點：

1、高效通信架構

支持優化的全對全通信模式，實現節點內和節點間的NVLink與RDMA互聯，提升數據傳輸效率

2、多精度與調度優化

原生支持FP8低精度運算調度，降低計算資源消耗。

3、重性能內核

據介紹，高吞吐量內核可適用于訓練和推理預填充場景，最大化數據處理能力；

4、低延遲內核

它針對推理解碼場景設計，采用純RDMA通信和自適應路由技術，減少延遲。

5、資源控制與重疊機制

通過靈活的GPU資源控制策略，實現計算與通信過程的高效重疊，避免資源閑置。

6、深度優化場景

針對NVLink到RDMA的非對稱帶寬轉發場景進行專項優化，提升異構網絡下的傳輸性能；

此外，它還支持SM（Streaming Multiprocessors）數量動態控制，平衡不同任務（如訓練與推理）的吞吐量需求。

Magazine.Subscription.jpg

版權聲明：本站內容除特別聲明的原創文章之外，轉載內容只為傳遞更多信息，并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經濟損失。聯系電話：010-82306118；郵箱：aet@chinaaet.com。

DeepSeek開源周第二日：開源首個用于MoE模型訓練通信庫

日期： 2025-02-25

來源：C114通信網

相關內容