市場領先的高質量AI標注數據服務供應商澳鵬中國今天宣布發布MatrixGo企業版,即日起在中國大陸、香港、澳門、臺灣及其它亞太地區市場上市。MatrixGo企業版是市場領先的AI數據標注平臺軟件,面向企業本地IT環境,將極大增強企業AI項目的規模化擴展能力。
今天,AI應用正由兩大趨勢定義:AI工程化與AI工業化。此前,AI的價值都是由單次、單點的項目所驅動。AI工程化指企業IT主管,通過將AI項目在企業內進行工程化擴展,從而獲得規模化收益。AI工業化指市場中的AI供應商,對AI技術、方案和數據的供應進行工業化生產,從而滿足企業客戶AI項目的規模化擴展需求。
AI工程化被Gartner連續列入年度戰略科技趨勢。根據Gartner,AI項目通常面臨可維護性、可擴展性和可治理性等方面的問題,從而導致很多企業面臨AI應用的挑戰。企業IT主管和AI供應商正采用ModelOps、DevOps和DataOps等AIOps手段,以應對這些挑戰。IT主管們已經使用了ModelOps和DevOps進行AI模型(即深度神經網絡模型)的優化,但其效果已經越來越不明顯。
澳鵬中國高級產研總監張童皓指出,在AI模型優化方面,現階段DataOps提供了更好的優化效果。數據標注是DataOps的重要一環,為了更好地訓練、管理和優化深度神經網絡模型,需要高質量的標注訓練數據集。而高度自動化的數據標注平臺,可取代之前的手工作坊式數據標注方式,借助AI輔助標注工具、智能工作流和豐富的API等,提升數據標注工作的生產力和效率。
隨著MatrixGo企業版的上市,澳鵬中國現在以公有云SaaS、支持私有文件服務器的SaaS和本地部署企業版,為亞太地區企業和組織提供高質量數據標注平臺軟件。MatrixGo基于澳鵬公司于2019年收購的市場領先的Figure Eight數據標注平臺軟件,同時面向亞太地區本地市場開發了大量功能。自從澳鵬公司在上海開設了中國公司后,澳鵬中國就開始開發本地化版本,以滿足本地市場的監管要求和本地客戶需求。
MatrixGo企業版的發布,是亞太地區AI數據標注產業的一個里程碑。MatrixGo企業版幫助企業IT主管們以高度自動化、標準化和可擴展方式,構建AI標注訓練數據供應鏈以及在企業內部執行數據標注項目。對于那些大規模投資AI的企業IT主管們,他們正在構建企業內部的數據資產管理平臺,平臺一邊連接著標注訓練數據供應鏈,一邊連接著AI模型訓練環境。市場上已經有眾多AI模型優化工具及供應商,但卻鮮有標注訓練數據供應鏈供應商。
作為一個集成的數據標注平臺,MatrixGo幫助企業IT主管們構建高質量的訓練數據集,從數據收集、標注、質檢、交付,到項目與工作流程管理,并提供更多更豐富的企業級功能。MatrixGo滿足端到端的企業數據標注項目集成,可大規模生產訓練數據集,同時確保數據安全。
MatrixGo企業版由四大模塊構成:項目管理、資源管理、標注工具集以及標注引擎。MatrixGo面向AI數據標注的項目經理、標注員/質檢員、供應商管理員、供應商項目經理供應商團隊標注員/質檢員、系統管理員等多種角色提供了豐富的平臺功能,幫助所有使用者獲得更高生產力,同時降低標注員和質檢員的門檻。MatrixGo還提供了豐富的API,以對接各種AIOps工作流。
MatrixGo的數據標注生產工具極具特色,可覆蓋所有的數據和用例。MatrixGo支持豐富的圖像與視頻標注工具,包括對象追蹤、像素級語義分割以及圖像轉寫,這些功能都很容易上手,降低了標注員的起步門檻,特別在項目冷啟動的時候,可以讓標注員邊培訓邊上崗。其中,2D圖像標注工具支持網格視圖模式、3D點云工具與2D標注框邏輯綁定,連續幀模式下可做到線性填充,部分幀可分鐘級完成標注,質檢達每幀秒級等等。語音數據處理工具支持高精度長語音的切分轉寫,提供用戶友好的瀏覽方式,進而提高標注員的生產力和效率。
澳鵬2D圖像復合標注示例
澳鵬3D點云拉框及2D映射(融合標注)示例
MatrixGo平臺內置了質量檢測,可自動確保數據標注質量,從而大幅減少手工質檢的工作量。MatrixGo還提供了模板引擎組件,支持快速進行腳本編程,可構建適配于項目定制化需求的工具,自定義工具可與平臺各流程節點直接集成。MatrixGo最重要的亮點是工作流調度,面向海量任務支持高并發呑吐架構,平臺上單點能夠支持每秒3萬任務的吞吐量,還可無限自動橫向擴容。工作流并行消費數據中心的數據,進行各自生產再向統一節點進行交付。在項目生產過程中,項目經理可以隨時修改任務,平臺自動確保工作流程的正確性。
“2022年將是AI數據標注產業的一個分水嶺 -- 之前的AI數據標注行業最佳實踐逐漸沉淀為可復用的軟件工具,為整個AI模型生命周期規模化提供高精度和高質量的標注數據。”澳鵬中國高級產研總監張童皓表示,“以工業化方式構建完整AI標注數據供應鏈,正在市場中形成趨勢。”數據標注平臺由多種復雜的技術構成,包括數據倉庫和AIOps等。對于企業IT主管來說,自行開發數據標注平臺并不是一個理想的選擇,澳鵬中國公司應運而生。
MatrixGo企業版主要是為了滿足對數據安全有更高訴求、在合規性方面有更高要求的中大型公司,科研和小型創業公司則更適合公有云SaaS方式。MatrixGo的SaaS版本可對接澳鵬全球的數據標注眾包人力資源并可通過擴展支持私有化文件服務的方式增強安全性。目前,澳鵬中國的主要客戶包括互聯網、高科技、自動駕駛、AI創業公司、零售、醫療、高校等,2022年還將拓展更多的企業數字化轉型市場。
澳鵬中國承諾數據質量,提供高質量、無偏見、豐富的AI訓練數據服務,確保數據標注過程的合規性與隱私保護。通過為AI生命周期管理提供高質量數據服務,澳鵬中國致力于賦能世界級的人工智能。隨著MatrixGo企業版的上市,澳鵬中國將重新定義亞太區數據標注產業。
關于澳鵬Appen
澳鵬Appen是全球領先的圖像、文本、語音、音頻、視頻等AI訓練數據服務提供商。憑借20多年的海外平臺實踐,澳鵬進入中國后迅速組建起一支來自互聯網、金融、AI等行業頭部企業的產研精英團隊,獨立自主打造了適合本土行業特點的“高精度AI數據服務平臺”。該平臺集成了澳鵬團隊強大的產品技術攻關能力、嚴謹高效的項目管理水平及百萬級眾包資源。澳鵬在全球擁有超過100萬名技能嫻熟的眾包資源,支持235+種語言和方言,來自全球170+個國家和70,000+個地區。目前,澳鵬已通過高質量的訓練數據助力全球7500+個科技、汽車、金融服務、零售、醫療、政府等行業的AI項目研發及商業化。