編者按:如果電腦能理解我們在網上輸入的文字,並將其轉換成一種表達其真實含義的語言,會發生什麼?對來自社交媒體的數據進行分析,可以洞悉我們的真實動機和感受此類深層次的問題,而不僅僅是數據統計。
法國哲學家Pierre Lévy從上世紀90年代開始從事網絡空間方面的寫作,是渥太華大學集體智慧研究領域的加拿大研究主席(Canada research chair in collective intelligence at the University of Ottawa),他正在研發一種能做到這點的軟件。他做了嘗試,用一種超語言(hyper-language)的語言為一整本法語詞典做了註釋,之所以稱其為超語言,因為它們能自我生成語言——他稱其為資訊經濟元語言( the Information Economy MetaLanguage, IEML)。剩下的工作就是編碼將其變為一個自動系統。
IEML的原理是,將特定語言中的每個詞語用符號表示,這些符號的排列組合可以代表幾個象限的含義:虛空,虛擬,實際,實物,存在和符號( empty, virtual, actual, things, beings, and signs)。識別並計算這些符號的演算法用IEML文本構建起一個語義網絡,並計算出此段文本和其它文本的關係。編寫一種軟件將自然語言轉成這種代碼,讓電腦通過這種代碼互動,線上傳播的本質和我們分析它所能得到的結果會徹底改變。
毫無疑問,從NSA(美國國家安全局)到網絡廣告主的每個人都喜歡這種能力,因為它使得電腦能夠自行搜索網頁理解意義。但是,在人工智慧方面,電腦之間能相互就真實意義進行交流會帶來哪些影響呢?下麵來聽聽哲學家怎麼說。
問:您能稍微和我介紹一下互聯網集體智慧的意指麼?
Pierre Lévy:好的。集體智慧根植於動物,眾所周知蜜蜂和螞蟻擁有集體智慧,社會性動物也有集體智慧,它們釋放信號告知彼此危險和食物所在。但是,在人類的例子中,我們的集體智慧更加強大,因為我們有語言,我們有技術,我們有複雜的社會機構,這是更高層次的集體智慧,從根本上說,這種智慧基於符號操作。
在人類歷史上,一旦出現增強我們操作符號能力的媒介,集體智慧也會得到增強。現在,我們處在操作演算法符號的階段,但是,這一新時期才剛剛開始,我致力於利用這一新媒介來增進集體智慧。
關於集體智慧有很多誤解。首先是集體智慧是創造出來的,但並不是,集體智慧已經存在了。第二個應當避免的觀點是,集體智慧是群體思維。集體智慧和群體思維恰恰相反,在哲學意義上,集體智慧是多樣性和奇異性的整合,而不是Kurzweilian。這不是整齊劃一,這是一起思考。
最後,最常見的錯誤是「哈,集體智慧?但是網上有這麼多蠢東西。」一個哲學家曾經對我說,你可以想像一下,「更像是集體愚昧!」我要說,群體智慧不是愚蠢的反面,是人工智慧的反面。
有人說:「我們要讓電腦更聰明,」他們得到了所有的資助。但是,如何使得人類更聰明呢?集體智慧就是一個讓人類在電腦的幫助下變得更聰明的研究項目,而不是讓電腦變得比人類更聰明。這是集體智慧真正的定義。
你已經注意到,一個問題有個長長的答案,所以好好選擇你的問題。
Pierre Lévy,圖片來自flickr
問:有些人擔心有朝一日人工智慧會滅絕人類,對此您怎麼看?
Pierre Lévy:我不同意。就因為許多名人這麼說,不意味著我們應該濫調重提,我強烈反對。電腦或者智慧軟件,或者人工智慧程式永遠不會掌權,絕不。如果沒有人維護它們,它們就會解體。從技術上講這不現實。
而且,用這種方式來拒絕承擔責任真是微妙。這些機器由人製造出來,這些軟件由人類編程設計,它們是我們意志、意圖的載體,它們沒有意志和意圖,它們只是延伸了我們的意圖、思想。它們沒有任何責任。
問:那如果人類知識被編碼入機器呢?
Pierre Lévy:好吧,你學過哲學?
問:是的,一點點。
Pierre Lévy:好的。所以,柏拉圖的《斐得若》是非常重要的對話篇。他提出了和你一樣的內容,但是不是關於機器,而是寫作。他說:「什麼,你要把我們所知道的全部資訊放進圖書館?」因此,在圖書館裡,假設是亞歷山大圖書館,人類知識全部彙編於此,我們不再需要教授了。所有人都失業了。好怕怕!你要知道,18世紀巴黎有3000人專職運水。然後水管發明瞭,啊,他們丟了工作,好怕怕!
因此,不,我不覺得我們應當以如此消極的方式看待演算法。我自己,曾經並且依舊在研究人工智慧,我也設計過專家系統。我採訪一組專家,試圖理解他們的專業知識。然後,我以一種創造性的方式將他們的知識加以正式組織,形成層次規則,這樣演算法能夠理解調用。他們沒有因此而變得過時。恰恰相反,他們成為這一專家系統的主人。一旦他們在我的幫助下建立起這個系統,他們就自維持了。將他們的實踐知識通過這個組織加以傳播非常有益。
就像印刷或者寫作,它們有利於知識傳播。將知識轉化成軟件的形式是傳播知識的好方法,應當加以鼓勵而不是畏懼。
問:IEML如何讓人們借助電腦這個工具變得更聰敏呢?
Pierre Lévy:你有萬維網這個巨大的數據庫。它們在物理層面上共用一個位址系統,你可以通過服務器的位址達到所有資訊,但是沒有通用的分類系統。圖書館之所有有價值是因為它的分類系統,否則你怎麼能找到正確的文件呢?
我們有許多種不同的分類法,我們有本體論,我們有許多方法給語言分類,不同的自然語言內部分類又不一樣。實際上,當你不知道你在找什麼的時候,資訊搜集變得相當苦難。當你知道你在找什麼的時候,穀歌很實用。但是,當你試圖駕馭知識的時候,就變得有點困難了。
一個很好的解決辦法是求助維基百科,但它和19世紀大英百科全書的組織方式一樣,基於相同的劃分和分類。這些跨學科區分不是真實存在的,自然語言也是個問題。
我的想法是,採用一個通用的分類系統,得像自然語言一樣靈活,當你想描述一份檔的時候,言無不盡。你不必遵守任何必須這樣或者那樣的規定。但是所有的描述都使用同一種語言,你也無需學習這種語言,因為你可以用自然語言和其交流。這種語言有一個奇妙的屬性,即它是一個演算法代碼,每個短語都可以顯示其內部語義網絡,而且它也會計算某一個文本和其他相關文本之間的語義關係。
如果你用這個系統(所有的數據按照語義關係加以組織)進行數據分類,數據管理,並且在網上描述你在做什麼,就會出現新思想。人們共同創造了這些思想,一起創造了思想組織的方式,通過他們的交流,思想的生態圈就此湧現。這就是關於自反的集體智慧我所宣揚的東西,集體智慧已經存在了,尤其是在互聯網上,但是我們真的不太清楚我們在共同做點什麼。
你熟悉這張著名的互聯網圖片,巨大網絡上的連結像神經元,看看這些色彩。節點代表理位置,連結代表節點間的流量,但是你不知道其中的真正含義。我們將要實現的是一種地圖,節點代表思想,而連結代表計算,這意義重大。
許多人混淆計算和數量,不是這樣的。計算在談數量,甚至數學也在談數量。如果我們能將這些結構關係數學化,我們就能計算語義關係。但是我們需要正確的代碼。
brewbooks 圖片來自flickr
問:我還有一個問題。你在建立組織資訊的學說,這看上去會從根本上改變互聯網上資訊的搜集和編碼。這會使得操作這個系統的所有人在一樣層面上就互聯網上的數據獲得前所未有的洞察,你認為這裡存在政治考量嗎?
Pierre Lévy:當然了。目前分析大數據的權力掌握在一些強大的實體手中,這些跨國公司,穀歌,Facebook……我不知道。
問:NSA,國家通訊總局......
Pierre Lévy:這些政府和大企業,它們是使用這些大數據演算法的主要人群,他們看上去掌握了很多,但其實沒那麼多深度見解。我知道這背後是什麼,主要是數據。數據可以為你提供資訊,但真沒有那麼多。
在政治層面上,我的想法是給人民賦權,這種想法和上世紀70年代矽谷的激進分子如出一轍,他們想給每人一台電腦。他們做到了。現在每個人都有計算能力,每個人都應當有分析理解大數據的能力,這是主要觀點之一。
如何做到呢?有兩種主要工具。首先是語言自身,其次是實現語言的軟件,這個軟件必須是開放的免費的。這將在第三版GPL許可證下發布(著名的自由軟件許可證)。正如Richard Stallman告訴我的,IEML每步行動都是透明的。
不是每個人都能為IEML字典出力的,因為你需要專業知識——語言能力,數學能力等等,但是,這一層面上的所有事情都將是透明的而不是隱藏的。新標籤的創立等等將向所有人開放。當然,按照定義,給數據賦予語義標籤的應用將是完全免費而開放的。
我不知道此外我能做什麼。你不能強迫人們免費,但是,你能為他們提供工具。我最多幫到這裡。
添加個人微信號「jiqizhixin2014」。本文來源於微信公眾號:機器之心(almosthuman2014)
From 機器之心
本文選自Motherboard,作者:JORDAN PEARSON,機器之心編譯出品,參與成員:電子羊、YulinSama、微胖。
互聯網集體智慧如何戰勝AI?