布朗大學計算機科學助理教授斯特弗尼?特里克斯正在解決一個棘手的問題:機器人的抓握能力。她建立了一個機器學習模型,使機器人能夠自動學習操縱對象,并且能夠從中產生許多樣本數據,有了這些數據,其他研究人員可以用它來訓練機器人的抓握能力。
一開始,特里克斯言語之間就充滿著活力與激情,她慢慢陳述著在抓捏物體上,機器人所面臨的普遍問題。
“大多數的機器人在大部分時間能夠抓取物體,但是這也是有一定前提條件的。如果你去到機器人實驗室,并把一個陌生的從沒看到過的物體放在機器人面前,該機器人基本上是無法抓起這個東西的,因為它的‘思維’里沒有這個物體的信息,也沒有針對該物體做過訓練。”
這真的是一個實際問題,因為機器人要抓起這些物體,它們就必須明白具體的任務,以及從傳感器信息庫中知道關于該物體的相關信息。例如它的形狀,它所在的位置等等。而這些問題也是機器人手臂必須被解答的問題,通常還包括,要想抓起這些物體,那么機器人手臂應該調整到什么位置才能夠準確地抓起該物體呢?
研究人員對機器人進行編程之后,它可以拿起特定的物體,這其中都是有一部分規律可循的,但是這些編程好的程序通常只能幫助機器人抓捏起一小部分的物體。目前,要想使得機器人能夠自主地抓起某些不熟悉的物體或者移動它們,還是有很大難度的,有類似能力的機器人還在開發當中。
而特里克斯所構建的機器學習模型可以讓她的實驗室機器人在錯誤中進行學習,經過反復試驗,直到它能成功地抓起物體。在嘗試和錯誤的交替過程中,可以產生一系列的關于該物體的圖片信息庫,以及夾持器與物體之間也可以在磨合中更加熨帖。
機器人不斷練習所產生的附屬產品就是數據庫,它可以成為機器學習的樣本數據,用來訓練其他機器人來抓捏同樣的物體。但在特里克斯實驗室中,她的巴克斯特機器人卻不能夠產生足夠多的樣本數據。
為了解決這個問題,特里克斯推出了一個“百萬挑戰計劃”,她想要招募全世界的實驗室,針對400臺巴克斯特機器人來進行研究,讓這些閑置的機器人可以根據她所研發的機器學習模型來運行,讓它們對上百萬個物體進行抓取實驗,最終得到一份詳細的數據。
為什么樣本訓練數據很重要
近年來,機器學習的應用技術如自動駕駛汽車以及圖像識別的應用技術都得到了迅猛的發展,都是因為在這些領域有大量的樣本數據可以用來訓練這些機器學習模型。而機器人抓取能力的滯后,最主要原因在于樣本數據的缺少,從而無法訓練神經網絡。
使用標記的數據來訓練機器學習模型最便于理解的例子就是圖像識別。圖像識別的精度已經提高了90%。如此進步可以歸因于機器學習的應用以及龐大的樣本數據庫。數以百萬計的標記圖片集已經在學術研究中被廣泛使用了,如谷歌,Facebook和其他在線圖像存儲器。
神經網絡是如何工作的
神經網絡是一個由幾個簡單高度互連的處理元件組成的計算機系統,可以通過對外部輸入的動態回應來處理信息。它主要是通過處理大量的被標記的數據,從而來獲得理解不同情形的能力。
一張鳥的圖像中,鳥是特定的鳥,在一張汽車圖像中,汽車也是特定的汽車。大量的圖像樣本可通過機器學習軟件來進行處理,如Torch和Tensorflow,然后讓它在神經網絡上運行,就能夠對其進行訓練來識別照片中的物體了。
在這種情況下,輸入的信息主要就是大量的被標記的圖像,緊接著系統就能輸出關于該圖片的許多識別標簽,例如所輸入的圖片到底有沒有汽車。而還有一個隱藏的部分就是整個處理過程,通常包含神經元,以及根據算法而來的機器學習軟件處理程序,也可被稱為該圖像的中間值。
緊接著系統會對這些樣本數據進行重新處理,從而可以測試出該模型在推測圖片標簽上的準確性。然后再對結果進行比對,如果有錯誤就更正過來,并將其反饋到神經網絡中,算法程序就可以根據所反饋的內容做出相關判斷。這樣的糾錯過程會如此往復直到出現正確的預測。
自動駕駛汽車也是以同樣的方式來學習駕駛的。當有人在駕駛某一輛特定的汽車時,可以將路面的情況,以及各個轉彎的角度用3D視頻的方式記錄下來,形成樣本數據庫。
該日志可以輸入到機器學習系統當中,從而可以訓練算法正確地將相關信息輸入到視頻中去。這個過程會重復進行,直到調整到一個適用于車輛操作的駕駛模式。
用來訓練圖像識別系統的樣本信息量是很巨大的。而自動駕駛汽車有大量的數據集。谷歌研發的自動駕駛汽車已經行駛了一百萬英里,特斯拉也行駛了近10億英里,有了這些數據,可以提供更全的駕駛經驗。而訓練機器人的抓握能力時,卻沒有這些數據的支持。
“百萬挑戰計劃”
如果特里克斯的“百萬挑戰計劃”可以成功,將會獲得大量的數據,終將有一天可以讓機器人有更準確的抓握能力。