虎嗅注:科大訊飛副總裁、研究院院長胡鬱在GMIC大會期間參加了閉門媒體見面會,這是胡鬱首次公開面對媒體詳細介紹科大訊飛和深入分析人工智慧行業。本文作者機器之心參加了當日的媒體見面會,並根據胡鬱的對話進行了整理、編輯。
一、人工智慧再次火爆的原因
人工智慧的研究歷史可謂幾經周折,經歷了四次寒冬。而如今又再次變得異常火熱,學術界、產業界和媒體界都對該領域表達了廣泛關注。深度學習大師GeoffreyHinton、Yann LeCun和吳恩達分別被科技巨頭Google、Facebook和百度招致麾下;高校研究機構紛紛推出自己的人工智慧最新研究進展;眾多以DeepMind、Vicarious 為代表的眾多人工智慧創業公司開始興起,行業自身的發展加上媒體的大肆宣傳使這個行業得到了前所未有的熱度和關注。
胡鬱認為,人工智慧一下子火起來是有原因的,核心演算法、數據量的增長和應用模式這三個方面的成熟為人工智慧的發展提供了天時地利人和的環境,因此,人工智慧開始從技術上突破了產業上大規模應用的瓶頸。同時,不管是語音識別,還是圖像識別,這些人工智慧技術基本都是在同一時間發生了大的變化和突破,這些都和以下三個要素有關,有共性的東西。
1)核心演算法的提升
第一方面是深度神經學習為代表,基於統計模型的整體突破,這個方向被研究了幾十年,只有在這方面真正掌握一流的人才才能抓住這樣的機會。深度神經網絡(DNN)和遞歸神經網絡(RNN)就是可以很好提升圖像識別和語音識別能力的核心演算法。
2)大數據
現在人工智慧在很多方面是基於統計模型,統計模型裡非常重要的就是你要有足夠多的能符合我們真實世界的數據樣本。以前在實驗室環境下很難收集足夠多的樣本,現在數據容量相對以前在數量、覆蓋性和全面性方面都獲得了大幅提升,現在所獲得數據量更大,更加多維,同時覆蓋更全面。因此,對這些海量數據的處理能力就非常重要,需要有超級計算機還有海量存儲等工程技術體系的支撐。目前,科大訊飛和百度都擁有這樣的數據收集和處理能力。
3)應用模式的建立
現在與以往實驗室技術最大的不同在於,把研究技術、工程、產品、應用、最終用戶整個鏈條打通,形成了大數據、移動互聯網、雲計算和智能化的整個循環。這是一個不斷反覆運算優化的過程,讓每個用戶在使用這個技術同時也成為數據的貢獻者和經驗的分享者。他們在使用過程當中會碰到哪些問題,我們再改進。這種優化能力是一個系統化工程,是互聯網公司和訊飛這樣的公司,在互聯網有很多方面的積累之後才能做到的。這也是為什麼以前研究所和學校很難做到。
這三點具有普適性,用在圖像、語音都可以,是一個把人才、計算能力以及整合鏈條建立起來,並將最終用戶的數據不斷優化的整套體系,這是工業界的人工智慧,要想突破大規模應用就必須具備這三個天時地利人和基本要素。而且這三個要素也是互相補充,比如說有了移動互聯網和物聯網帶來了大數據,還要有相應的演算法和工程人員,這不是靠一個產品概念能解決的,這個部分需要科學家和工程師一起研究的。
二、對目前人工智慧領域的評價
1)產業界關心現實問題,關心如何用現有技術解決用戶需求
胡鬱強調了產業界不關心那些虛無縹緲的問題,比如大家討論人工智慧是不是要毀滅人類,這在短期內不是產業上應該關心的重點。
大家都注意到了一些AI威脅論,那都是有錢有閑人的事情。即便把人工智慧這個技術突破了,它不會有自己的意識情感,也不會考慮到危害還是不危害人的情況。我們現在連它最基本的認知、知識掌握還沒解決。從科學家嚴謹的角度來看,十年之內能不能解決還不確定。因此,我們應逐步推進,根據現在的技術水平反過來設計我的產品,多去考慮一下在現在技術情況下,我們的產品可以解決大家什麼問題。
比如在酒店裡面,你們住一個酒店,你要操縱酒店裡的燈和服務是在一個可控的受限環境中,現代技術通過某種工程的優化還有部分的自學習可以滿足大家的需求,不要幻想它一定那麼智慧。從科學家的角度來講,我們不停的研究新方法,從產品的角度來講,你現在有什麼技術,我如何避免它的缺點,如何利用它的優點做成用戶可以接受的產品,這兩條路要並行。
胡鬱提倡關注人工智慧的現實問題,這基本代表了產業界的共同心聲。不論媒體多麼喜歡追逐馬斯克和霍金等人的誇張言論並大肆宣傳,產業界依然在關注現實問題,關注現有技術進展,關注如何將現有技術轉化成滿足用戶需求的具體產品。Jordan Pearson曾在文章中指出,馬斯克科幻作品般的言論被大肆炒作和宣傳,當這樣的負面宣傳涉及到具體的研究工作時,會產生非常消極和有害的後果。Facebook人工智慧實驗室的負責人YannLeCun去年在Google+上總結到:「一些不實宣傳對於人工智慧是非常危險的。在過去的50年裡,人工智慧就先後因為不實宣傳而沉淪了四次。關於人工智慧的炒作必須停止。」
2)大腦模擬是一個值得嚴肅討論的路徑,但不適合產業界
通過模擬人腦的生理原理以實現人工智慧是一個長期主題,控制論奠基人沃爾特·皮茨早在上世界四五十年代就進行這樣的研究,用人造神經網絡來模擬人類大腦,他的論文《邏輯演算》影響了馮諾依曼現代計算機架構的提出。但皮茨卻在後續的研究中發現這條路根本走不通。
如今,這條通往人工智慧的路徑依然被學術界討論,只是沒有得到產業界的承認。Yann LeCun在接受IEEE採訪時表示,他最不喜歡的對「深度學習」的描述就是「它像大腦一樣工作」,雖然深度學習從生命的生物機理中獲得靈感,但它與大腦的實際工作原理差別非常非常巨大。將它與大腦進行類比給它賦予了一些神奇的光環,這種描述是危險的,這將導致天花亂墜的宣傳,大家在要求一些不切實際的事情。
胡鬱也認為,對人腦進行模擬這條路徑被國際很多人很嚴肅討論,但現在不是產業界走的路,是研究界或者是科學界走的路,那條路有可能,但不適合當前產業界急需的人工智慧突破。比如說HBP(歐盟人腦計劃)和美國人腦計劃,它們更多是研究腦生理,針對的是大腦疾病,順帶帶個尾巴提出了人腦模擬這個角度,後來有人把它延伸出來說可以通過腦模擬的方法實現人工智慧。
3)Google、百度和科大訊飛對人工智慧研究的目標有所不同
胡鬱表示,產業界對於人工智慧的觀點基本能夠達成共識,就是他之前提出的三要素,演算法、數據和應用。而區別在於將人工智慧技術應用於何種方向,自身擅長哪些產品。
Google和美國其他大公司第一是基於以深度神經網絡為代表的機器學習演算法,基於數學這套東西。第二是基於大數據處理,第三就是基於產業一體化。以應用反過來對產品、技術、研究進行整體的反覆運算和優化。這個思路上我們跟百度大腦有共識,我們都遵循,包括跟Google做的整個一套體系都是一樣。這是工業界實現人工智慧的路徑。但是真正你要講從這路徑出來真正攻克什麼領域,大家的目標根據自己的產業優勢就可能不一樣。
Google和百度使用人工智慧來解決的問題主要包括搜索、廣告、推薦、地圖和自動駕駛汽車等,他們有這樣的資源。科大訊飛和他們在人工智慧的實現路徑一樣,但目標不太一樣,科大訊飛更多關注在感知智慧和認知智慧,想突破機器怎麼掌握人類知識這一點,並將這些成果應用到智慧教育,政府智慧資訊化,智慧家居,智慧車載等等領域。
4)從感知智慧到認知智慧
胡鬱在此前其他的演講中就提到過,人工智慧主要分為計算智慧、感知智慧、認知智慧。感知智慧方麵包括語音識別、手寫識別和圖像識別等,認知智慧的目標是需要在語言理解、知識表示、聯想推理和自主學習四個方面實現突破。
此次胡鬱又從技術角度對認知智慧的實現進行瞭解釋,感知智慧是圖象識別、語音識別,認知智慧我們還有一段距離,學習能力還有對知識掌握的能力,是我們現在需要努力突破的地方。
5)人工智慧新方法的優勢
在傳統人工智慧方法下,我們首先要人工建立一個龐大的數據庫,然後再進行推理。而隨著大數據和神經網絡的發展,現在嘗試用新的方法做。解釋的簡單一點,就是用一些連續的概率統計,把詞和詞之間的關係用一種數學方法描述出來。
大家都知道給你們一組詞,「男人」和「女人」,「國王」和「王后」,如果按傳統的方法來看,「國王」是個男的,「王后」是女的。「國王」和「王后」的差別跟「男人」和「女人」的差別是一樣。現在有一種新的方法,是看「國王」和「王后」這兩個詞語在所有文本中出現的情況,他跟誰比較接近,他幹哪些事情,幹了哪些動作,在所有文本描述裡面周圍的環境是不一樣的。它能夠用一種概率統計的方法對「國王」和「王后」這些詞語周圍環境進行概率描述,算出來之後發現跟「男人」和「女人」周圍環境的概率是非常強的相關關係。這時候就可以推導出「「國王」減「王后」」等於「「男人」減「女人」」,並不是真正的建立那個體系,而是分析了「國王」和「王后」在各個地方出現的情況和「男人」和「女人」在各個地方出現的情況總結出來的。
這種新方法能否成功還不確定,但Google、Facebook、微軟等都在做這方面的東西,想在新的體系下看能不能找到新的方式。也許兩到三年內,知識表達解決了,自然理解也解決了,邏輯推理也完成了。形成這個東西之後,機器就可以自動去學習了。
還有一點是,原來我們傳統的系統不是按照這種學習方式設計的。我們在實驗室裡編好程式,然後再放到真實環境中去用。用戶怎麼反饋我不管(也看不到),我們只按照實驗室裡一套去我行我素。比如說,春節期間網傳的山東大漢與安吉星的對話視頻,當司機糾正了所說號碼後,安吉星依然在自說自話,沒有根據用戶的反饋進行相應調整。其實如果機器瞭解關於這個司機的反饋資訊並進行模型思考的話,這樣的錯誤就不會發生,但系統沒有學習到這些信息。之前的系統建設缺乏這樣的環境,而現在的思路是轉變為,一開始這個系統是不聰明的,但用了之後可以觀察用戶的反饋,從用戶反饋中提取資訊,包括你系統的評價,告訴你哪個地方不好,系統學習這些東西從而逐步變得聰明,這需要新思路和新方法解決這些問題。以前我們沒條件做這個事情,現在我們有條件了。比如說DeepMind發布的那個能夠自動玩遊戲的人工智慧系統,它是自己去運行那個遊戲,執行一些動作,再根據死的快不快、得多少分進行強化學習。研究這種方法是一個系統科學,每一個點的實現都需要一個團隊。必須掌握最先進的技術,把一個問題定義成一個可解決工程和科學問題,還要想出演算法優化它,這需要一個完整的團隊,有學生做高風險嘗試,還要有研究人員把可行的方案做起來。整個鏈條上需要這樣的人來組合。如果能解決這些問題,讓機器具有認知智慧才有可能實現。
微信公眾號:機器之心(ID:Almosthuman2014)。
From 機器之心
科大訊飛胡鬱:產業界才不關心AI會不會毀滅人類,都是有錢有閒人的杞人憂天