近年在深度學習(Deep Learning)模型技術的導入下,讓人工智能(AI)大放異彩,吸引眾多云端平臺與芯片廠商的關注和投入。拓墣產業研究院最新研究指出,深度學習的發展重點除了軟件模型架構的改善,還須仰賴強大的硬件運算能力,以及大量的有效數據才能達成。其中數據直接攸關AI模型訓練完畢的識別精準度水平如何,成為國際大廠角逐AI應用市場的重點所在。
拓墣統計,從目前AI機器學習的應用發展來看,以金融與信息安全、數字廣告科技比重最高,分別達20%與18%,其他產業的應用也正快速發展中。
大廠積極掌握重要數據或獲取數據使用權
觀察目前布局AI應用市場的廠商,主要為谷歌、AWS、臉書、IBM、微軟、蘋果、百度、騰訊、阿里巴巴等云端或軟件平臺大廠,其共同優勢是擁有大量用戶數據庫使用權,利于發展AI相關API、SDK等軟件工具。
拓墣分析師林貞妤指出,數據庫的擁有者與數據庫使用權未必畫上等號,廠商有時只是獲得數據的使用權,卻不擁有數據本身。AWS、谷歌或微軟的Azure,同時提供公有云與私有云的服務,但通常都不擁有客戶的數據,只在用戶為特定目的使用云端API等工具輸入數據,廠商才一面提供服務,一面使用這些數據進行自家云端API工具的效能優化。
林貞妤也表示,由于深度學習的實踐仰賴豐富的數據資源,廠商為發展出更多元的AI服務,也將開源框架(Open Source Framework)視為重要戰略之一。因為若能掌握軟件開發環境,就有機會拓展后續軟硬件服務,所以無論是谷歌的TensorFlow、臉書的Torch、微軟的CNTK,或英特爾并購開發Neon的Nervana Systems,越來越多廠商都試圖穩固自有的軟件開發環境,透露其中潛在的角力關系。
發展專業領域AI系統,專業知識(Domain Knowledge)與數據是關鍵
若希望利用數據訓練出符合某項專業領域的需求且具高信賴度的AI系統,掌握該領域的專業知識(Domain Knowledge)便成為系統發展的關鍵。舉例而言,若要訓練AI系統透過影像識別找出病灶,就必須先取得足量且攸關的病灶影像數據進行AI系統訓練才能達成。因此,掌握專業領域關鍵資料的廠商重要性將日益增加。
就以集邦咨詢為例,作為專業調研機構,除了累積過去逾十多年的數據庫能量外,仍持續累積科技產業各領域的關鍵信息,在產業全面邁向人工智能數據化的同時,未來期能提供客戶更高的價值。