對標 OpenAI GPT-4o 的中國版本來了!
7 月 5 日舉行的 2024 世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)分論壇上,國內 AGI 公司商湯科技發布日日新大模型 5.5 系列。
其中,最引發關注的,是國內首個所見即所得、實時流式多模態交互模型 " 日日新 5o",交互體驗對標 GPT-4o,實現全新 AI 交互模式。另外,全新日日新 5.5 的模型參數規模達 6000 億,綜合性能較 " 日日新 5.0" 平均提升 30%,在數學推理、英文能力和指令跟隨等能力明顯增強,交互效果和多項核心指標實現對標 GPT-4o,同時也是國內對標 GPT-4 Turbo 領先的國產大模型之一。
商湯科技董事長兼 CEO 徐立在演講中表示,大模型本質意義上是在做一個記憶的事情,記住世界的知識,而它有的一點智力完全是來自于對于知識背后高階的思維邏輯和記憶;同時,行業要進行變化,交互模式一定是先行的;另外,基于手機旗艦平臺,端側 5.5 Lite 模型版本性能精度提升 10%、首包延遲下降 40%、推理效率提升 15%,達到每秒 90.2 個漢字的處理速度。因此,商湯在模型上面的能力,實際上還是在日日新,不停地迭代和演進。
徐立還透露,為了讓更多企業用戶低門檻接入并使用 " 日日新 " 大模型體系能力,商湯于近期推出了 " 大模型 0 元 Go" 計劃。凡是 " 日日新 " 的新注冊用戶,都可獲得涉及調用、遷徙、訓練等多項免費服務大禮包。同時,商湯還將免費贈送 5000 萬 Tokens 包,并且派出專屬搬家顧問,幫助 OpenAI 用戶實現零服務成本遷移。
實際上,最近一年多,商湯持續擴大 AI 大模型投入力度,確立了 " 模型即服務 " 的商業模式,通過 " 大模型 + 大裝置 " 推動實現通用人工智能(AGI)目標。
今年 3 月,商湯科技董事長兼 CEO 徐立表示,在 Scaling Law(尺度規律)指引下,大模型正處于技術革命與性能提升的黃金時期。自 2023 年發布以來,商湯 " 日日新 " 大模型的能力每隔三個月都會有顯著提升,實現了萬卡萬參的大模型訓練能力,在基礎模型、多模態、編程和工具調用、百萬字無損上下文、終端小模型上都達到國內領先水平。
據 2023 年財報數據,商湯 " 日日新 " 大模型 + 大裝置驅動生成式 AI 業務爆發式增長 200%,收入達 12 億元,貢獻了 35% 的營收。這是商湯成立十年以來,以最快速度從無到有、超過 10 億元收入體量的業務。
業務層面,2024 年上半年,商湯通過其大模型技術與多家行業頭部企業達成緊密合作。例如金山辦公的 WPS AI 通過整合商湯的大模型技術,實現了辦公軟件的智能化升級;小米公司的小愛同學業務在商湯大模型技術的助力下,用戶體驗得到了顯著提升;海通證券與商湯合作,構建金融 AI 應用推動數字化升級;閱文集團通過結合商湯科技的擬人大模型技術,打造 AI native 的虛擬社交生態平臺——筑夢島。
徐立表示,商湯的大模型自從文本開始,拓展至代碼辦公、擬人對話、金融、農業等多個垂直行業,推出專屬模型和一體機,使客戶能高效、經濟地使用 AI 大模型。目前,商湯大模型已有超 3000 家客戶。
"現在的認知其實還是在于,說如何用大模型去賦能行業,而且我認為,我們處在一個很重要、關鍵的轉折節點,也就是接下來 AI 的超級時刻,有賴于我們共同去營造超級應用。" 徐立表示。
整體來說,全新商湯日日新大模型 5.5 版本,在原生多模態能力下按場景需求可提供純語言、多圖理解、4o 語音、文生圖、代碼 / 辦公小浣熊、擬人、端側模擬、行業模型等多模態、多版本、強場景 Agent 形態。
商湯披露,截至目前,已有超過兩百家企業選擇使用商湯代碼小浣熊工具,此次升級的小浣熊模型響應速度提升達 5 倍;同時,辦公小浣熊支持端側落地;基于 " 日日新 5.5" 大模型驅動下,從 5 月到今天,全新商湯擬人模型版本的平均使用時長在 SDK 調用下日均達到 130 分鐘,次日留存可以有 50% 以上,且人均的對話人數超過 90 次;另外,全新端側模型性能不斷提升,支持手機、平板、一體機、車載等終端設備,甚至還支持元蘿卜智能臺燈。
另外,商湯早前還發布國內首個 " 可控 " 人物視頻生成大模型 Vimi,也就是 " 圖生視頻 " 產品,僅通過一張任意風格的照片就能生成和目標動作一致的人物類視頻,并支持多種驅動方式,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動。
會前交流時,商湯研究院研發總監盧樂煒 向鈦媒體 AGI 等透露,目前商湯日日新的多模態模型就是邁向對于視頻理解、對真實世界理解。" 在視頻指標方面,我們的模型跟目前的 SOTA 的方法相比,有一個 10%-20% 的提升。"
" 性能提升需要模型有相當大的規模。另外,如何更快速地訓練一個更大(參數)規模的模型,無論從算法、設計還有工程的配合,都需要很大的工作量,所以我們過去兩個月一直在持續攻關。" 盧樂煒表示。
徐立強調,商湯持續推進模型應用,端側大模型的 API 接入價格將達到每臺設備、每年 9.9 元。
目前,商湯在多模態、基礎模型、文生圖、文生視頻、擬(數字)人模型、行業垂直模型、端側模型、開源模型等熱門技術上均有涉獵和持續迭代,同時也在不斷調整優化整體研發和商業化節奏。鈦媒體 AGI 了解到,預計 V6 版本將會在今年內公布。
" 所有的智能音箱、智能車載、智能眼鏡,大家都來接上我們的端側大模型,真正讓大家用得起 AI 大模型,AI 才會進入它的超級時刻。" 徐立在演講結尾表示。