11月18日,京東集團(納斯達克股票代碼:JD,港交所股票代號:9618)對外發布了2021年第三季度業績。從2017年初全面向技術轉型以來,京東持續加大了對基礎科學與底層技術的投入力度,推動基礎設施建設的數量與效率的雙向提升,京東體系已在技術上累計投入已近750億元。
在第三季度,京東探索研究院人工智能團隊憑借多模態交互數字人技術、跨模態分析技術在第29屆ACM國際多媒體頂級會議(ACM International Conference on Multimedia,簡稱ACM Multimedia)上榮獲兩項大獎。這些獲得國際學術界頂尖榮譽的領先技術正在通過京東云這個統一平臺輸出服務各行各業。其中,基于多模態交互數字人技術研發的“虛擬數字人”能助力京東智能客服言犀提升智能接待、服務和虛擬助手的體驗,比如與某銀行合作落地應用,打造了全國第一個交互式數字人項目“數字柜員”。
斬獲國際AI頂會雙項大獎 京東云推動越來越智能的數字浪潮
今年三季度以來,京東探索研究院與各大實驗室繼續在可信人工智能、超級深度學習、量子機器學習等基礎科學領域持續推進創新研究,并取得累累碩果。
近日,京東探索研究院AI團隊憑借多模態交互數字人技術、跨模態分析技術,在國際AI頂會第29屆ACM Multimedia上分別斬獲2021年最佳演示獎及最佳開源項目獎,充分證明了京東在人工智能視覺與人機交互領域的全球領先性。
ACM Multimedia是計算機科學領域中多媒體領域的首要國際會議,1993年以來每年召開一次,已成為多媒體領域頂級盛典,大會致力于推動多媒體的研究和應用,京東探索研究院的兩項獲獎技術均為ACM Multimedia頒發的該技術領域唯一獎項,分量十足。
在傳統的AI認知中,視覺領域、語音領域、自然語言領域等領域之前是獨立演進的技術和應用,可以認為是單模態技術,而人是一個看、聽、說多模態共同工作的智能體,所以多模態技術是未來人工智能應用發展的方向。京東探索研究院的多模態交互數字人技術ViDA-Man致力于打造具備多感官交互能力的人機交互系統,深入多模態交互技術研究,專注于人機交互的消費科技產品打造?;谠摷夹g開發的多模態交互數字人形象引擎,能夠提供快速的形象定制能力,從外觀的數字化逐漸深入到行為的交互化、情緒的智能化。
近年來,數字浪潮的推動讓人工智能技術已經實現從不可用到可用。AI產品化時期,諸如智能語音識別技術、智能圖片處理技術、基于用戶興趣的算法引擎推薦、智能審核技術、AR/VR技術、5G技術等成為了AI落地的抓手,掀起了科技創新的新浪潮。京東探索研究院這些前沿技術的持續探索,也正陸續通過京東云這個統一平臺對外輸出,助力產業數字化。
VTM數字員工“加盟”銀行網點,京東云助力銀行網點數智化升級
在銀行行業,傳統銀行服務網點存在運營成本高、網點高峰期排隊、遠程柜員接待能力不足等痛點,制約了業務的擴展。
基于多模態交互數字人技術,京東智能客服言犀與某銀行合作,推出VTM數字員工,提升智能接待、服務和虛擬助手的體驗。區別于過往咨詢問答式機器人,雙方共同打造的VTM數字員工可獨立閉環完成交易業務全流程,在交互方式上,采用擬人化的對話方式與親和的形象,為用戶提供了良好的服務體驗,在交易場景中邁出了重大的一步。該數字人通過與VTM機、助農設備打通,形成了多渠道、全場景、端到端的VTM數字人解決方案。在傳統渠道升級方面,該數字人解決方案用智能化技術幫助傳統服務渠道,為傳統服務網點和無人網點建立了人資調配的通道,很好的提升了銀行的服務體驗和效率。在場景支持方面,拓展了數字人在銀行場景中的應用邊界,從傳統的咨詢、查詢、導覽拓展到了取款、開戶、密碼重置等交易場景中;在區域客戶的滲透方面,將通過便捷易操作的服務及與助農設備的互通,為適老化能力的建設和鄉村金融服務的街鄉級滲透提供新路徑。
京東智能客服言犀將數字人技術一方面融合了前沿的AI技術,包含NLP、TTS、ASR、虛擬形象、圖像識別等多項技術,具備感知、認知、交流、服務的能力,同時,還打通了VTM機系統,使得該項目可勝任各類金融服務場景;生動的3D形象配以親和的面部表情和肢體動作,充分模擬人與人之間真實的對話方式,打造的可媲美真人的VTM數字員工,為用戶提供接近于真人體驗的可視化服務。目前該項目已在銀行多個網點部署,并取得了良好的效果。
隨著人工智能的深入發展,像虛擬數字人這樣的AI技術早已走出了實驗室,與現實的產業場景不斷融合。京東AI技術之所以能取得如此優異的成績,是其在真實復雜場景的有效實踐和千錘百煉。作為整個京東集團對外提供技術服務的核心平臺,京東云不僅是政府、企業、家庭數字化轉型全生命周期合伙人,并基于人工智能、大數據、云計算、物聯網、區塊鏈、隱私計算等技術,通過數智化全鏈條技術服務,助力千行百業數字化轉型,激發產業無限可能。