2月8日,在中國移動的助力下,中國石油高效完成DeepSeek V3/R1全棧國產化的訓推適配和私有化部署。此次部署,基于DeepSeek的關鍵技術點,開展了系列基礎模型算法創新,實現了從底層芯片到框架、模型的全棧自主可控,為推動人工智能技術在能源化工領域的深度應用與國產AI技術生態的規模化落地注入了強大動力。
一直以來,中國移動與中國石油兩大央企積極響應國家人工智能戰略,努力推動 “人工智能 +” 在能源化工行業落地生根。此前,中國移動攜手中國石油發布能源化工領域首個行業大模型——700億參數昆侖大模型,助力中國石油打造“五個一”:建設一個央企領先的算力中心,一個集中統一AI中臺,一套高質量行業數據集,一套國內領先的行業大模型、一系列創新應用。
面對中國石油多模態、超百億參數的大模型訓練任務需求,移動云憑借強大的算力網絡能力,實現了資源的快速響應、彈性擴展及高質量供給。通過為中國石油構建“算力泛在、算網共生、智能敏捷、安全可靠、綠色低碳”的一體化算力體系,移動云已提供超過1000P的穩定算力資源,為大模型的建設和運行提供了堅實的算力保障。
為了使DeepSeek系列模型在昆侖大模型原有的框架下,獲得更好的適配效果和執行性能,中國移動第一時間開展相關的分析、適配與創新工作。中國移動通過配置化開發,在DeepSeek V3模型基礎上快速實現了自定義模型參數和規模的針對性優化。團隊在不實際啟動集群訓練任務的情況下,僅通過單卡即模擬出集群中所有卡的內存占用情況,從而制定整體的集群分布式訓練策略。
中國移動復現并優化了DeepSeek MTP多Tokens預測功能,通過DeepSeek-V3/R1主模型和MTP Module的分布式調度,實現一次解碼生成多個Token,并通過使整圖編譯功能,組合計算圖的通用算子,實現自動融合加速,提升DeepSeek-V3/R1端到端的推理性能。
此次DeepSeek大模型的成功部署,為中國政企客戶實現DeepSeek V3/R1全棧國產化的訓推適配和部署提供了重要參考。它也為中國石油昆侖大模型優化應用效果、縮短研發周期、構建健康生態提供了新引擎,推動“數智中國石油”建設步入快車道。
在應用層面,昆侖大模型的問答應用“行業大家”目前已新增DeepSeek深度推理能力。用戶在使用該應用時,除了可以得到昆侖大模型生成的能源化工領域專業問答結果,還能選擇“深度思考”模式,體驗知識推理、場景理解等AI服務。
在模型層面,昆侖大模型的AI中臺模型廣場目前已上線DeepSeek-V3與DeepSeek-R1模型版本,并實現全尺寸適配,用戶可基于AI中臺調用DeepSeek模型API服務,并使用AI中臺組件及工具構建智能體,以滿足不同場景的需求。
未來,中國移動與中國石油將繼續攜手共進,在油氣勘探開發、煉油化工、油氣銷售、工程建設等核心業務領域深入挖掘AI潛力,以新質生產力為中國式現代化建設貢獻力量。