虎嗅注:本文來自WSJ.com
百度公司最近宣稱在ImageNet(圖像識別最大數據庫)的圖像識別人工智慧基準測試中擊敗了Google和微軟。但是週二(6月2日),ImageNet宣稱百度在測試中存在違規行為,百度已經為自己「誤導公眾」而道歉。
百度的行為凸顯了人工智慧領域競爭中存在的高度風險。目前,全球頂級科技公司都在爭相研發人工智慧技術,包括允許計算機識別圖像、控制機械人、理解口語以及執行其他任務等。而積累起巨大計算資源的互聯網巨頭承受著巨大壓力,它們需要竭力維持自己的領先地位,無論是聲望還是潛在商業利益方面。
除了百度、Google、微軟外,蘋果、Facebook、IBM等科技巨頭也都在重金招募大量人工智慧研究人員,並且各具雄心。
5月份,百度宣稱其在ImageNet測試中取得了全球最好結果,其圖像識別錯誤率僅為4.58%,而微軟是4.94%,Google為4.8%。在這種測試中,人類辨識ImageNet照片的錯誤率為5%左右。
可是,週二,ImageNet的計算機科學家發表聲明指出,百度在測試中存在違規行為,百度採用了密集測試的方法以提高成績。按照規定,ImageNet只允許參與者每週向測試服務器提交2次測試結果。可是在3月份的5天時間內,百度卻提交了40次結果。ImageNet表示,百度還使用了30個不同的賬號,在過去6個月中提交了約200次測試結果。
在ImageNet測試中,人工智慧需要掃描擁有100多萬張圖片的數據庫,然後將它們分為1000個不同類別。大多數研究人員通常使用數據庫中的部分圖片,對軟件進行圖像識別測試。而通過密集測試,百度工程師可以通過調整他們的軟件熟悉這些圖片的資訊,從而獲得優勢。
人工智慧公司Clarifai首席執行官、ImageNet競賽上屆贏家馬休·澤勒爾(Matthew Zeiler)表示:「這種做法是非常糟糕的,這也是為何要限制參賽者向獨立服務器提交測試結果的原因。如果你知道了測試內容,你就可以調整參數模型,從而獲得更好的測試結果。」
ImageNet已經要求百度在今後一年停止遞交ImageNet測試結果。百度拒絕回答相關問題,但在ImageNet網站發表聲明稱,百度科學家吳韌已經為他所謂的「失誤」道歉。他寫道:「我們已經在研究中添加了註釋……我們將繼續提供相關更新。」
From WSJ.com
超Google微軟?百度道歉:我錯了!在圖像識別競賽中違規