圖為《Sunspring》劇照圖為《Sunspring》劇照
“這是一部你絕對猜不到結(jié)局、腦洞最大的科幻短片!”——這是一位觀眾對首部人工智能編寫的影片《Sunspring》的評語。這部出現(xiàn)在今年6月的倫敦科幻電影節(jié)的影片,引起了人們極大的興趣與關注,因為它的編劇“本杰明”,不是人。
讓人工智能(Artificial Intelligence:AI)編劇,是比會下圍棋的谷歌AlphaGo更具挑戰(zhàn)的嘗試。
影片的導演奧斯卡·夏普和來自紐約大學人工智能領域的研究者羅斯·古德溫把幾十部電影劇本輸入進AI,讓它自己“學習”。幾秒鐘后,AI就開始“唰唰”地寫起劇本,最終他們按照機器人對人性的理解與表達,拍出這部影片。
面對人工智能咄咄逼人的挑戰(zhàn),人類得以穩(wěn)坐如山的底線,便是擁有復雜多變的情感。正是“自己都不知道為什么哭”之類毫無理性邏輯可尋的特質(zhì),讓大部分人堅信機器永遠只能扮演仆人的角色。這部非人類作品的出現(xiàn),讓我們不禁嘀咕:未來是可以預測的么?
這是一道“語文”數(shù)學題
人類編劇往往要經(jīng)過苦思冥想,等待靈感一現(xiàn);或是體察生活,將其升華為藝術(shù)創(chuàng)作。而編劇本在“小明” (本杰明的昵稱)這里,沒這么復雜。
“其實,人工智能編劇就是利用機器學習技術(shù)實現(xiàn)語言文本的輸出。”浙江傳媒學院電子信息學院教授栗青生對科技日報記者說,它與前幾年機器寫詩的原理類似,不同在于現(xiàn)在使用了最新的人工智能技術(shù),如機器學習、深度機器學習等。而“機器學習”是人工智能的一個分支,側(cè)重于在數(shù)據(jù)統(tǒng)計分析基礎上的行為模式研究。
那么“小明”是如何學習的呢?“在學習這些劇本時,需要將劇本分為單詞、句子及段落等,并作為分析的單元,這個過程被稱為劇本的結(jié)構(gòu)化,然后找到期間的關聯(lián)模式及語義特性。”北京理工大學軟件學院數(shù)字媒體技術(shù)系副教授張龍飛向記者解釋。
“這種關聯(lián)可以是臨近詞之間的關聯(lián),也可以是上句與下句、上段與下段之間的關聯(lián)。”從事AI研究的專家趙宇說。
找到了關聯(lián),也就意味“小明”摸到了遣詞造句的規(guī)律。“利用機器學習的方法,讓機器自動分析已有劇本中組詞和組句的規(guī)律,然后對未知的詞句進行預測。”栗青生指出,對人的學習而言,我們常說“見多識廣”,其實對機器學習也是一樣。每一部劇本都包括有成百上千條的文本臺詞,而每一句臺詞中的字詞搭配都有一定的規(guī)律,知道了這個規(guī)律,就可以讓機器自動的組織這些臺詞文本,從而產(chǎn)生新的劇本。
但,這還是一般意義上的劇本嗎?“只能算是基于既有學習材料,根據(jù)統(tǒng)計學習預測產(chǎn)生的上下文語義關聯(lián)性聯(lián)結(jié),使之形式上成為一個劇本。”趙宇直言不諱。
從影片中不難看出,AI是憋足了勁往“科幻”上靠。在一個時空模糊的未來世界,注定要有人死去的懸疑背景、略顯突兀的三角戀情、男主一言不合就自殺、吐眼球……這一切元素都讓AI“硬生生”地融合在一起。其中,大段前言不搭后語的對白、跳脫的情節(jié)以及毫無邏輯的劇本結(jié)構(gòu),讓網(wǎng)友看得是一臉懵,直呼“小明,人類真的不知道你在說什么!”
看來,與其說“小明”編一個劇本,不如說它做了一道“語文”數(shù)學題。
但栗青生卻表示,應給予AI的“處女秀”更多包容。“機器的劇本創(chuàng)作現(xiàn)在還處在‘小學生’時代,要充分允許這樣的‘小學生’去‘照貓畫虎’‘比葫蘆畫瓢’。”
那么,在專業(yè)劇作者眼中,“小明”的首秀能打幾分呢?
高路是中國傳媒大學戲劇影視文學系副教授,同時也是影視編劇,曾撰寫過十余部影視作品。在觀看完九分多鐘的影片后,他向記者坦言:“我不認為這是個電影故事。”
“一個劇本的標準應該是按照邏輯講述一件事,塑造人物并傳遞情感。”高路認為,就影片本身而言,該劇臺詞缺乏邏輯,看不到人物塑造,感受不到情感傳遞,甚至看不明白基本的邏輯關系。
做“無厘頭”是高智商的事
那么,“小明”為什么會把劇本編得這么“雷”呢?答案可能令人笑出聲:太守邏輯和規(guī)則的AI,學不會人類的“腦殘”與“無厘頭”。
在影片中,男二號開場白就是“我要到頭骨里去一趟”,顯得莫名其妙;而男一號動不動就一句“我不知道你在說什么”,跟前后劇情毫無關系……
在栗青生看來,“小明”盡管使用了目前最先進的機器學習技術(shù),但還遠沒達到和人類的劇本創(chuàng)作一樣的水平。“畢竟和機器人寫新聞相比,機器人寫劇本要困難得多。不僅要考慮文本臺詞的語言表達、還要考慮文本臺詞的情感表達,同時人物角色、語言環(huán)境等也是重要的考慮因素。”
張龍飛更明確地指出,“雷劇”產(chǎn)生的原因在于,一是由于語義鴻溝,即計算機能看到的東西和人抽象出來的知識之間有或多或少存在區(qū)別;二就是學習的量不夠。“機器學習都需要大量的、甚至是海量的樣本進行學習,幾十本的訓練是嚴重不足的。”
今年年初,擊敗圍棋冠軍的AlphaGo學習了大量職業(yè)棋手的棋譜,加起來多達3000萬步。“但是圍棋的規(guī)則簡潔而確定,因此AlphaGo可以自創(chuàng)棋譜,在左右互搏中不斷提高。相對于學習圍棋,劇本創(chuàng)作復雜度高出很多量級,因此對學習內(nèi)容要求的數(shù)量更多。”趙宇說。
如果AI學得不夠,還能“將勤補拙”,但是創(chuàng)新能力卻是最頭疼的。“創(chuàng)作的核心在于創(chuàng)新,而創(chuàng)新某種程度上就是要打破既有規(guī)則的約束限制,這無形中增加了機器學習寫劇本的難度和復雜度。”趙宇認為,其實一個劇作家的創(chuàng)作不僅僅是通過學習大量劇本得到的,生活中的所見所聞、所聽所想,閱讀的小說、新聞、隨筆、紀實等都可能成為創(chuàng)作的素材,因此要擴充學習內(nèi)容,必須讓機器涉獵劇本以外的各項內(nèi)容。但由于其雜亂無章,無形中增加了難度。
匹諾曹的故事尚無結(jié)局
家喻戶曉的《匹諾曹的故事》,包含著關于AI的多個隱喻。故事里愛撒謊的木頭孩子,最終因為誠實而變?yōu)榱苏嫒恕5诂F(xiàn)實世界中,會撒謊的機器人,即便沒有獲得肉身,已然讓我們感到顫栗。
對“野心勃勃”的科學家來說,AI終有一日會摘掉“雷劇”的帽子。當然,堅持“人性至高”的人,并不會贊同。
如果想讓機器成為一名合格的編劇,其中一個技術(shù)瓶頸便是——編劇的創(chuàng)意能力能否被機器所替代。“目前的技術(shù)完全可以模仿某個著名編導的編劇風格,并對已有的劇本進行重新編排,但尚未有真正的創(chuàng)新出現(xiàn)。”張龍飛說,另一大問題是可以學習的編劇樣本相對匱乏,不太滿足海量學習需求。
“學而不思則罔。”在栗青生眼中,比海量學習更緊迫的是提升機器對文本的理解水平,可是當前AI在語義理解方面還沒那么“聰明”。
“一詞多義就是個老大難。”栗青生說,例如,在劇本中經(jīng)常見到的兩句臺詞“誰打的?”“我打的”,可以理解為“打人”“打字”“打車”和“打電話”等多種語境。此外,同義詞辨析更是一道坎。“忠誠”“忠實”“踏實”和“實在”等詞有相近的語義,在一定場合可以互相替換,但在用法上又有明顯不同。
要選擇哪種意思?現(xiàn)在的AI只能是“傻傻分不清楚”。
除了這些詞語特點外,漢語語法的“時隱時現(xiàn)”更讓機器“犯暈”。“有時自然語言必須遵循語法規(guī)范,但有時語言又可以突破語法限制,產(chǎn)生新的表示和新的用法。”栗青生說。
顯然,目前的AI編劇還談不上“合格”,但張龍飛覺得那一天并不遠。“或許機器不能成為一個開創(chuàng)性的編劇大師,但應該不會成為一個低于平均水準的編劇。”
張龍飛透露,目前國內(nèi)已有團隊在研發(fā)編劇機器人。“該機器未來也許不僅能勝任編劇,還可評估該劇本的受眾群體是哪些人,票房如何,并能根據(jù)不同的觀眾、演出地點、時令等對同一個劇本進行適應性修改,以便滿足個性化觀眾需求等。”
科學家們信心滿滿,但高路卻覺得“可以成為助手,但無法完全取代人類”。他認為,機器也許能創(chuàng)造出某幾種類型的故事,并且輔助人類研究觀眾的審美喜好,但無法全面替代人腦的藝術(shù)感知和情緒表達的能力。“對于AI能否傳達人類情感,讓觀眾產(chǎn)生心理共鳴,并展現(xiàn)出哲學高度的主題內(nèi)涵,我持謹慎的態(tài)度。”