上月,微軟旗下視頻通話服務Skype開始在英語和西班牙語用戶之間測試實時翻譯功能。預計不久之後,谷歌也將發布翻譯應用的升級。谷歌翻譯的文字版目前提供了90種語言的翻譯,並且已經能對少數幾種常用語言進行聽譯。在此次升級之後,這款應用能自動識別用戶是否在講某種常用語言,並將其自動轉為文字。
使用體驗
這種將某一語言翻譯為另一語言的技術可能效果並不是很好。在使用該服務時,用戶需要佩戴頭戴式耳機,而只有當說話者停下來靜聽對方正在說什麼時,才能發揮最好的效果。整個體驗就像是兩名電話銷售員在使用對講機。
不過,在使用過程中,這樣的抱怨將會被「奇跡」帶來的震驚所取代。在幾分鐘時間里,我就習慣了這一流程,並與一名哥倫比亞人自由地討論他在麥德林的妻子、孩子和生活。Skype最開始曾將麥德林聽成了「Made A」,但隨後做出了修正。雙方溝通的最大障礙,即語言的差異,正在消失。對語言的改進已經成為在線產品優化的關鍵一部分。這些服務利用了機器學習算法,使計算機不斷檢查結果,並做出相應的調整。這將使在線拼寫檢查變得更加可靠,同時使搜索、地圖導航,以及其他在線服務越來越好。我那位來自哥倫比亞的朋友塞巴斯蒂安·庫伯羅斯(Sebastian Cuberros)在Skype上表示:「在你對話的過程中,程序在進行學習。目前,這已經很不錯。」儘管語法並不完美,但你能知道對方在說的是什麼意思。
目前,只有幾千名用戶在Skype上使用該功能,而這一功能將從他們身上進行學習。此外,還有近4萬名用戶正在等待嘗試這一西班牙語和英語之間的翻譯服務。即使仍處於開發早期,但這帶來了許多的可能性,例如讓美國和墨西哥的兒童共同參加社會學習課程,或是對生活在敘利亞的家庭進行實時訪談。谷歌翻譯工程谷歌表示,其翻譯應用已被安裝在Android手機上超過1億次,而其中大部分都將收到谷歌推送的升級。「每月,在所有平台上,我們的翻譯服務擁有5億活躍用戶。」谷歌翻譯工程主管邁克杜夫·休斯(Macduff Hughes)表示。由於全球80%至90%的網頁都只採用約10種語言,因此翻譯已成為了許多人進行學習的關鍵一部分。谷歌Chrome瀏覽器已經提供了一項功能,將網頁自動翻譯為某種主要語言。Chrome瀏覽器的用戶可以將一個英文頁面直接轉換為韓文等其他語言。此外,Gmail設置等頁面支持在約140種語言之間切換。用戶可以將自己的電子郵件語言設置為克林貢語、海盜語和艾瑪語等搞怪的語言。其他一些小眾語言,例如切諾基語,並不是為了搞笑,而谷歌已實現了對這些語言的全面翻譯。
谷歌還將發布一款服務,在用戶拿起手機對準國外街道上的標誌時,就能在屏幕上看到實時的翻譯結果。微軟的必應翻譯引擎被用於了Twitter和Facebook。Facebook運營着全球最大的照片分享服務,涉及了多種語言。為此,該公司也在開發翻譯服務。此外,Skype的數千名用戶已註冊排隊,等待其他同步翻譯服務的推出,這些翻譯服務包括了漢語和俄語。給「語料庫」加入更多數據對某些語言來說非常重要,而對機器學習算法的優化也是如此。谷歌翻譯最初的語料庫數據來自人工翻譯。谷歌近期開始支持哈薩克語,而一名政府官員近期在電視機上呼籲人們給予幫助。休斯表示:「人們有着非常強烈的呼聲,要求我們將他們的語言納入到服務中。」
問題和隱憂不過,一些專家仍然擔心,機器可能會深入學習語言的其他部分,例如聲調和幽默感。與搜索關鍵詞和Facebook「點贊」記錄類似,這些信息是否會被廣告主和司法部門所利用?從事未來通信技術研究的Hypervoice Consortium聯合創始人凱利·菲茲西蒙斯(Kelly Fitzsimmons)表示:「技術可能擁有魔力,但帶來的威脅也真實存在。
如果政權發生更替,而新政府不喜歡人們所說的話,那麼這時語料庫信息意味着什麼?」菲茲西蒙斯表示,目前,只有不到1%的用戶願意讓他們的數據被記錄。這可能是由於用戶願意幫助機器學習翻譯,也可能發生在他們使用Siri等語音助手服務的過程中。她認為,個人用戶將越來越擅長管理自己的個人隱私,而不是將隱私保護的責任都交給服務提供商。不過從目前來看,用戶更看重便利性。Skype這一項目的產品營銷負責人奧利弗·馮塔納(Olivier Fontana)表示,在檢查翻譯質量之前,會話已被分成了多個不同文件。
他表示:「沒有辦法知道,什麼人說過一些什麼。美國國家安全局無法從中獲得有用的信息。」休斯則表示,谷歌對於語音記錄非常謹慎。這部分是由於,隨着語音等生物信息安全方式取代傳統的密碼,這可能會帶來潛在的問題。除此之外,應當採取一些方式,讓翻譯語音與普通語音有所區別。例如,如果用戶說漢語,那麼可以採用一種女性的聲音,使人們知道這是翻譯的內容。
Google翻譯已能聽懂常用語種