人和機器的視覺體驗：為什麼人工智能「會做夢」？

科技

2015-09-11 |

2278

Google 的人工智慧機械人將普通的照片生成了帶有幻覺的圖像，工程師們把這些圖像和夢境進行比較，並將 Google 的這種圖像生成手法命名為「盜夢風格」(Inceptionism)，將所使用的生成代碼叫做「深度夢境」(Deep Dream)。

但是許多人在觀看了這些圖像之後都有一個相同感受：它們並不是來自一個夢幻的世界，而是嗑藥之後的反應。

在電腦生成的圖像中充斥著色彩的變幻，扭曲的線條，拉長的臉孔，漂浮著的眼睛，以及由陰影和光線組成的、令人不安的波浪形狀。電腦看起來像是出現了幻覺，看起來有點像是人類，太奇怪了。

深度夢境

這個項目背後的主旨是，通過命令機器描述它所看到的畫面，來測試計算機神經網絡對不同動物和風景圖像的學習達到了一種怎樣的程度。與以往向計算機展示一幅樹木的圖片，之後讓它「告訴我這是什麼」的做法不同，工程師這一次讓機器做的事情是「放大你看到的圖像元素。」

這是給電腦看的原圖⋯⋯

⋯⋯機器輸出的結果是這樣的：

Google 工程師表示，這種效果與人們可能從不同形狀的雲朵中看出形狀的情況並無不同。當給出能夠辨識出的圖像時，人類——還有計算機——會分辨並「過度解讀」(over-interpret) 已知事物的形狀。

「(Google 所使用的) 神經網絡主要靠動物圖像進行訓練，所以很自然地它就會將圖形解讀成動物。但因為數據是以很高的抽象程度被存儲的，所以結果就是這些機器學習特徵的有趣組合，」Google 工程師在該公司的官方博客上這樣寫道，「基於圖像的不同，結果也非常不一樣，因為輸入圖像的特徵會導致神經網絡傾向形成某些解讀。比如，水準線條會用佛塔的造型填充，岩石和樹木會變成建築。鳥和昆蟲出現在葉子的圖像裡。」

因為神經網絡以層的形式分析圖像——通過色彩、線條類型和形狀描述，等等——生成結果的複雜程度取決於工程師要求計算機放大的是哪個層。最低一級的層是輪廓——線和陰影——最高一層則是更加複雜的畫面。「比如，偏低的層往往會生成筆畫線或是簡單的像裝飾一樣的圖案，因為這些層對於基本特徵如邊緣和方向這些屬性來說要比較敏銳。」Google 工程師這樣寫道。

這些簡單的圖案模式，經由「深度夢境」放大強化之後，結果看上去就變得扭曲和魔幻。但是為什麼畫面會變成這樣，仍舊沒有回答人們提出的問題：為什麼電腦神經網絡「夢到」的畫面會反應出人類嗑藥後才有的致幻體驗？

視覺體驗

「要記住很重要的一點是，人類所有正常的感觀體驗都是經由感觀輸入限制後的幻覺，」紐約大學蘭恭神經科學所 (New York University's Langone Neuroscience Institute) 研究助教 Lucas Sjulson 這樣說道，「我們的幻覺從某種程度上說反映出外在世界的真實情況。但是感知全都是在內部形成的。」

換句話說，所有人類感知都是由大腦思維形成，而不在真實世界形成，即便你感知到的是真實存在也是如此。「人們將眼睛看作像攝像頭一樣，但其實不是，」Lucas Sjulson 解釋說。你的眼睛能夠讓你看到東西，但你的大腦才是真正將看到的事物進行解釋的器官——無論是放在桌上的咖啡杯，還是在你腦中投射分型圖像的萬花筒。

當人們使用致幻藥物的時候 (LSD)，會刺激大腦的某個皮層「產生這一類模式的形成能力」。所以當習慣處理多層圖像的電腦被命令針對某一層圖像進行放大時，出現類似的視覺效果，就不奇怪了。「我認為這大概是類似現象的一個例子。如果你研究一下頭腦的運作，會發現它參與長時間解決問題的活動，而且以一種高度優化的方式進行。人類在進化中學習，同樣也要靠視覺體驗。

人工智慧與人類大腦的相似之處

視覺體驗也是人類訓練計算機視覺的方法。神經網絡識圖的方式，與電腦「看到的」具體圖像相比，前者可能對回答之前的問題更有幫助。也就是，Google 工程師最初希望探索的到底是什麼。

「我們實際上始終會『看到』並沒有的東西，」紐約大學心理學家 Jeffrey Guss 這樣說道，他的研究課題是在一些毒蘑菇中出現的致幻物質如何幫助癌症患者進行治療。「我們的視覺皮層——而不是我們的眼部——專門用於捕捉可識別的模式⋯⋯去觀察我們眼睛提供的資訊。有許多心理學試驗表明，我們經常看到期望看到的事物以及被事前告知將看到的事物，而不是真正存在的事物。」

儘管致幻體驗常常和嗑藥文化聯繫起來，但人們的確會穩定地出現奇異的視覺體驗，即便是他們在沒有受到影響的情況下。已故的神經科學家 Oliver Sacks 在他的作品《幻覺》一書中指出，這種體驗要比許多人所意識到的更普遍。「在其他一些文化中，幻覺被認為是來自上帝或繆思的饋贈，但是當代社會在公眾當中卻有一種不詳的含義，在醫學上也是，往往被認為是嚴重精神或神經疾病的徵兆，」他在 2012 年發布在《紐約時報》的文章中這樣寫道，「對許多人來說，擁有幻覺是一個恐怖的秘密——有數百萬人——他們從不提起，也很難承認，但這並沒有什麼不尋常。」

在人類的大腦中，詭異的圖像感知與眼部、頭部和其他狀況有一定聯繫：比如偏頭痛、發熱和痙攣等。在計算機的腦中，類似的圖案表明，人工智慧要比他們看上去更像人類。Google 的「盜夢風格」對人類來說好像服藥後的致幻體驗一樣，這個事實說明我們的大腦機能從某種意義上說「在深層次中」與電腦神經網絡有相似之處。