《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 蘋(píng)果披露Apple Foundation Model AI模型細(xì)節(jié)

蘋(píng)果披露Apple Foundation Model AI模型細(xì)節(jié)

文本總結(jié)等方面超過(guò) GPT-4 谷歌 TPU 芯片訓(xùn)練
2024-07-31
來(lái)源:IT之家
關(guān)鍵詞: 蘋(píng)果 AppleIntelligence AFM

7 月 31 日消息,蘋(píng)果公司最新發(fā)布論文 [PDF],分享了關(guān)于 Apple Intelligence 模型的相關(guān)細(xì)節(jié),部分性能已經(jīng)超過(guò) OpenAI 的 GPT-4。

模型簡(jiǎn)介

蘋(píng)果在論文中介紹了 Apple Foundation Model(下文簡(jiǎn)稱(chēng) AFM)模型,共有以下兩款:

· AFM-on-device:本地運(yùn)行,30 億參數(shù),可以在 iPhone、iPad 等設(shè)備上高效運(yùn)行;

· AFM-server:蘋(píng)果尚未公布參數(shù)等細(xì)節(jié)。

訓(xùn)練數(shù)據(jù)來(lái)源

蘋(píng)果表示訓(xùn)練數(shù)據(jù)集包括從出版商處獲得授權(quán)的數(shù)據(jù)、經(jīng)過(guò)策劃的公開(kāi)或開(kāi)源數(shù)據(jù)集以及我們的網(wǎng)絡(luò)爬蟲(chóng) Applebot 抓取的公開(kāi)信息組成。

蘋(píng)果強(qiáng)調(diào)注重保護(hù)用戶(hù)隱私,數(shù)據(jù)混合物中不包括蘋(píng)果用戶(hù)的私人數(shù)據(jù)。

據(jù)《紐約時(shí)報(bào)》報(bào)道,蘋(píng)果公司在 2023 年底與 NBC、Condé Nast 和 IAC 等多家出版商達(dá)成了價(jià)值至少 5000 萬(wàn)美元的多年期協(xié)議,在出版商的新聞檔案中訓(xùn)練模型。

蘋(píng)果的 AFM 模型還在 GitHub 上托管的開(kāi)源代碼上進(jìn)行了訓(xùn)練,特別是 Swift、Python、C、Objective-C、C++、JavaScript、Java 和 Go 代碼。

論文稱(chēng),為了提高 AFM 模型的數(shù)學(xué)技能,蘋(píng)果公司特別在訓(xùn)練集中加入了來(lái)自網(wǎng)頁(yè)、數(shù)學(xué)論壇、博客、教程和研討會(huì)的數(shù)學(xué)問(wèn)題和答案。

蘋(píng)果利用了高質(zhì)量、可公開(kāi)獲得的數(shù)據(jù)集(論文中未提及名稱(chēng)),這些數(shù)據(jù)集“擁有允許用于訓(xùn)練...... 模型的許可證”,并經(jīng)過(guò)過(guò)濾以去除敏感信息。

AFM 模型的訓(xùn)練數(shù)據(jù)集約有 6.3 萬(wàn)億個(gè) token(token 是小塊數(shù)據(jù),通常更容易被生成式人工智能模型吸收)。相比之下,這還不到 Meta 用來(lái)訓(xùn)練其旗艦文本生成模型 Llama 3.1 405B 的 token 數(shù)量(15 萬(wàn)億)的一半。

訓(xùn)練硬件

根據(jù)論文描述,蘋(píng)果公司使用 8192 片 TPUv4 芯片訓(xùn)練 AFM-server 模型;2048 片 TPUv5p 芯片訓(xùn)練 AFM-on-device 模型。

0.png

每個(gè) v5p pod 由 8960 個(gè)芯片組成,每秒的浮點(diǎn)運(yùn)算(FLOPS)和內(nèi)存分別是 TPU v4 的兩倍和三倍,訓(xùn)練模型的速度快了近三倍。

0.png

模型性能

根據(jù)論文描述,蘋(píng)果自研大模型在指令遵循、文本總結(jié)方面測(cè)試超 GPT-4。

蘋(píng)果公司的數(shù)據(jù)顯示,AFM-server 有害輸出違規(guī)率為 6.3%,明顯低于 GPT-4 的 28.8%。同樣,在設(shè)備上,AFM 7.5% 的違規(guī)率低于 Llama-3-8B(由 Facebook 母公司 Meta 訓(xùn)練)21.8% 的得分。

在電子郵件、信息和通知匯總方面,設(shè)備上的 AFM 的滿(mǎn)意度分別為 71.3%、63% 和 74.9%。研究論文還指出,這三個(gè)模型分別領(lǐng)先于 Llama、Gemma 和 Phi-3 模型。附上相關(guān)性能結(jié)果如下:

1.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 日本一区二区三区中文字幕 | 成人毛片免费网站 | 在线成人国产 | 国产a一级| 亚洲天堂网站在线 | 免费羞羞视频网站 | 精品在线视频播放 | 日本一区二区三区在线观看视频 | 男女视频在线看 | 好吊日在线 | 久久人人爽人人爽人 | 操你啦在线观看 | 性刺激欧美三级在线观看 | 国产在线视频第一页 | 色狠狠婷婷97 | 天天干天天色综合 | 无遮挡动漫肉在线观看高清 | h网站免费在线观看 | 亚洲欧美日韩中文字幕在线不卡 | 成人羞羞| 亚洲 欧美 成人日韩 | 欧美中文字幕一二三四区 | 日韩网站在线 | 欧美第一视频 | 一本大道香蕉高清久久 | 国产精品成人一区二区三区 | 欧美日韩精品一区二区三区四区 | 一个人看的在线www视频 | 国产精品视频网 | 性夜黄a爽爽免费视频国产 性夜黄 a 爽免费看 | 成人一级黄色毛片 | 成年视频xxxxxx在线 | 一级aaaaaa片毛片在线播放 | 中国黄色片网站 | 黄色毛片黄色毛片 | 毛片在线全部免费观看 | 国产黄的网站免费 | 激情网五月天 | 日本人成大片在线 | 久热这里只有精品视频6 | 一级毛片免费毛片毛片 |