如果你見過一個孩子玩拼圖,見過他使勁兒想把某一塊拼圖放到合適的位置,那麼以下視頻會給你似曾相識的感覺。視頻中的機械人也在玩拼圖,在經歷了若干次失敗後,最終順利完成了——全靠自己的摸索,並無特定的程式幫忙

之前的深度學習能力已成功提升了(機械人的)語言、圖像識別能力;加州大學伯克利分校的研究者們研發了一種新演算法,使機械人通過練習和試錯,自己學會完成任務;這兩種深度學習技術頗為相似。研究者們說它們這種方式與人類學習方式更為接近。

在這個視頻中,我們看到機械人Willow Garage PR2學習怎樣玩樂高玩具、學會完成各種不同的簡單任務,包括開瓶蓋、組裝玩具飛機、插入鞋楦等。

當機械人離開工廠,進入更為嘈雜、充滿未知數的環境之中,如家庭、辦公室時,這些能力對他們至關重要。當然這也是「Rosie」和「傑森」(電影《摩登家庭》人物)一直以來的夢想;要實現這一夢想,機械人首先要學會觀察環境、學會適應變化、掌握許多技能;最理想的是:每一種新環境機械人都能適應,不用重寫程式

「重點是,機械人面對一種新事物時,我們不用為它重新編程。」該項目領導者之一,加州大學伯克利分校教授Pieter Abbeel 說,「寫入一個程式,告訴機械人怎樣學習,機械人使用同一個程式學習完成我們交給它的所有新任務。

另一個關鍵是:機械人能閱讀分析海量數據

BRETT,全稱叫做「消滅枯燥工作的伯克利機械人」,能通過攝像頭記錄其周邊環境,每次嘗試(任務)後給自己的表現打分;嘗試某個任務時,它的神經網絡(92000個神經元)會判斷任務完成與否——神經系統不停地計算、工作,直至機械人找到解決辦法

雖然這一技術與語言認知能力的技術類似,但實現前者的難度更大

「在一個事先沒有預設好的3D環境中行動,(對機械人)是一個全新的挑戰,」博士研究生Chelsea Finn說。「沒有明確的方向指引、沒有案例告知怎樣解決問題,沒有類似於語言和圖像識別程式那樣的解決方案。

BRETT像大多數機械人一樣,行動緩慢;但如果給它一點提示(如任務開始、結束階段的協助),10分鐘之內它就能學會完成一項新工作;如果沒有任何幫助,它完成任務的時間則會延長到3個小時左右

研究團隊希望未來幾年內使機械人的表現更出色。隨著計算機程式處理大數據的能力加強,而且數據庫容量擴大,(機械人)完成複雜任務指日可待

「讓我們的機械人學會打掃房間、洗熨衣服,我們還有很長的路要走。」Abbeel說。「但初步結果顯示,掌握了深度學習能力,對於機械人從零開始到學會完成複雜任務,有革命性的作用。未來510年內,我們也許將親眼見證機械人學習能力的驚人變化。

添加個人微信號「jiqizhixin2014」。本文來源於微信公眾號:機器之心(almosthuman2014

From 機器之心

本文原載Singularityhub,機器之心i莊園翻譯,柒柒校對。


 這個機械人不需要重新編程就能學習新事物,比如玩樂高