曾西瓜: 「 在電腦配鑰匙都能被包裝成「人工智能配鑰匙」的今天,你需要通過這份重磅報告了解人工智能真正的應用場景、潛在機會,以及目前世界範圍內的重要玩家都打算拿人工智能做什麼。 」

(該文章轉自  機器之心)

選自高盛 機器之心編譯

不久之前,高盛推出了一份講解人工智能生態的重磅報告(共 99 頁)。報告從最基本的人工智能概念開始,主要內容包括人工智能所能變革的行業、人工智能生態、使用案例、背後的主要驅動者(谷歌、亞馬遜、英偉達、百度等)等,並附有高盛調查得到的 150 多家人工智能與機器學習公司列表。機器之心編譯了報告的主要部分,點擊閱讀原文可查看完整報告。

人工智能(AI)是信息時代的尖端技術。在最新的「創新簡介」(Profiles in Innovation)系列文章中,我們將對機器學習和深度學習的進展進行研究考察。

在和更強大的計算資源以及不斷擴增的數據結合以後,一些非相關行業的公司也能夠接觸到人工智能了。AI-as-a-service 的發展有可能開闢一塊新的市場並打破雲計算的市場。我們相信,在接下來幾年,一個公司利用人工智能技術的能力將成為體現公司競爭力的一個屬性,同時這種能力也將帶來生產率的復蘇。

 

目錄

概要

什麼是人工智能?(略)

價值創造的主要驅動力(略)

加強未來的生產率(略)

人工智能和生產率悖論:採訪 Jan Hatzius(略)

生態系統:雲服務,開源在未來的 AI 投資周期中的關鍵受益人

使用案例(略)

農業(略)

金融(略)

醫療(略)

零售(略)

能源(略)

驅動者

附錄(業內公司列表)

披露附錄

 

概要

人工智能是信息時代的尖端技術。從人類建立起需要指導控制才能運行的計算機,到計算機擁有可以自己去學習的能力,這一飛躍對各行各業都產生了巨大的影響。雖然此時此刻可能是下一個 AI 冬季(圖8)到來之前的「給予承諾又讓人失望」的周期,但這些投資和新技術至少會給我們帶來有形的機器學習生產力的經濟利益。

與此同時,人工智能、機械人和無人駕駛汽車已經成為了流行文化甚至是政治話語的前沿。而且我們在過去一年的研究使我們相信這不是一個錯誤的開始,而是一個拐點。正如我們將在本報告中探討的那樣,這個變化的原因有顯而易見的(更快更強的計算資源和爆炸式增長的數據庫),也有細緻入微(深度學習,專有硬件和開源的崛起)的。

這個 AI 拐點(AI inflection)中更令人興奮的一個方面是「現實世界」的使用案例比比皆是。雖然深度學習使計算機視覺和自然語言處理等技術有了顯著的提高,比如蘋果公司的 Siri,亞馬遜的 Alexa 和 Google 的圖像識別,但是 AI 不僅僅是「科技技術」(tech for tech),也就是大數據集與足夠強大的技術相結合的情況下,價值正在被慢慢創建,競爭優勢也變得越來越明顯。

例如,在醫療保健中,圖像識別技術可以提高癌症診斷的準確性。在農業中,農民和種子生產商可以利用深度學習技術來提高作物產量。在製藥業中,深度學習可以用於改善藥物的研發。在能源方面,勘探效率正在提高,設備可用性正在不斷增強。在金融服務方面,通過開闢新的數據集,實現更快的分析,從而降低成本,提高回報。AI 現在還處於發現其可被利用場景的早期階段,這些必要的技術會通過基於雲的服務實現大眾化、平等化,我們相信隨之而來的創新浪潮將在每個行業中創造新的贏家和輸家。

AI 的廣泛應用讓我們得出了一個結論:它是一種可以變革全球經濟的技術,是提高生產力並結束美國生產率停滯增長的驅動力。結合 GS 首席經濟學家 Jan Hatzius 的研究,我們明確了資本深化目前的停滯及其對美國生產率的相關影響。我們相信,AI 技術將會驅動生產力的提高,就像 20 世紀 90 年代那樣,驅動企業投資更多的資本和勞動密集型項目,加快發展的腳步,提高盈利能力以及提高股票的估值。

 

啟示

雖然我們看到了人工智能可以及時地影響到每個公司、行業和一部分經濟,但對投資者而言,我們認為這其中有四個影響最為顯著。

生產率。AI 和機器學習具有激發生產率增長周期的潛力,這會有利於經濟的增長,提升企業的盈利能力,資本回報率和資產估值。根據 GS 首席經濟學家 Jan Hatzius 所說:「大體上而言,AI 看起來似乎比上一次創新浪潮更有可能在統計數據中捕捉到更有價值的東西,人工智能可以降低成本,減少對高附加值生產類型的勞動投入。舉個例子,這些在商業部門成本節約上的創新可能比在 iPhone 中增加應用程序的可用性和多用性更利於統計學家去捕獲有價值的東西。考慮人工智能對商業部門的成本結構的廣泛影響,我有理由相信它會被統計學家接受,並且會出現在整體生產力數據中。」

尖端技術。AI 和機器學習在速度上的價值有利於構建一種在建設數據中心和網絡服務時讓硬件更便宜的趨勢。我們認為這可能推動硬件,軟件和服務支出的市場份額的大幅度改變。例如,在「標準」數據中心計算資源上運行的 AWS 工作負載的成本低至 $ 0.0065 /小時,而在使用 AI 優化過的 GPU 上運行的成本為 0.900 美元一小時。

競爭優勢。我們看到了 AI 和機器學習具有重新調整每個行業的競爭秩序的潛力。未能投資和利用這些技術的管理團隊在和受益於戰略智能的企業競爭時,有很大可能會被淘汰掉,因為這些技術可以讓企業的生產力提高,併為它們創造資本效益。在第 41 頁開始的短文中,我們將研究這些競爭優勢是如何在醫療保健、能源、零售、金融和農業等領域發展起來的。

創辦新公司。我們發現了 150 多家在過去十年中創建的人工智能和機器學習公司(附錄 69-75)。雖然我們相信人工智能的大部分價值都掌握在具有資源、數據和投資能力的大公司手中,但我們也期望風險投資家、企業家和技術專家可以繼續推動新公司的創立,從而促進實質性的創新和價值創造,即使最後創業公司會被收購。當然我們也不能忽視人工智能巨頭(人工智能領域的谷歌或 Facebook)的出現。

在接下來的篇幅中,我們將深入探討 AI 的技術,歷史,機器學習的生態系統以及這些技術在行業和領頭公司中的應用。

 

什麼是人工智能?

人工智能是做出能夠以人類智能的方式學習並解決問題的智能機器和計算機程序的理工科。傳統而言,該領域包括自然語言處理與翻譯、視覺感知與模式識別,以及決策制定。但該領域以及應用的複雜度都在急劇擴展。

在此報告中,我們的大部分分析集中在機器學習(人工智能的一個分支)與深度學習(機器學習的分支)上。我們強調兩點:

簡言之,機器學習是從樣本和經驗(即數據集)中進行學習的算法,而不是依靠硬編碼和預先定義的規則。換言之,也就是開發者不再告訴程序如何區分蘋果和橘子,而是向算法輸入數據(訓練),然後自己學習如何區分蘋果和橘子。

深度學習的重大發展是人工智能拐點背後的主要驅動。深度學習是機器學習的一個子集。在大部分傳統的機器學習方法中,特徵(即有預測性的輸入或屬性)由人來設計。特徵工程是一大瓶頸,需要大量的專業知識。在無監督學習中,重要特徵並非由人預定義,而是由算法學習並創造。

為了更加明了,我們不注重真人工智能、強人工智能或通用人工智能這樣的概念,它們意味着複製人類智能,也經常出現在流行文化中。雖然已經有了一些有潛力的突破,比如谷歌 DeepMind 的 AlphaGo 系統,我們還是更注重立即有實在經濟的人工智能發展。

 

為何人工智能發展加速?

深度學習能力的極大發展是如今人工智能拐點背後的催化劑之一。深度學習的底層技術框架——神經網絡,已經存在了數十年,但過去 5 到 10 年的 3 種東西改變了深度學習:

數據。隨着全球設備、機器和系統的連接,大量的無結構數據被創造出來。神經網絡有了更多的數據,就變得更為有效,也就是說隨着數據量增加,機器學習能夠解決的問題也增加。手機、IoT 、低成本數據存儲和處理(雲)技術的成熟使得可用數據集的大小、結構都有了極大增長。

例如,特斯拉收集了 780mn 英里的駕駛數據,而且通過他們的互連汽車,每 10 小時就能增加 100 萬英里的數據。此外,Jasper 有一個平台,能讓多家汽車製造商和電信公司進行機器間的交流,這家公司於今年 2 月份被 Cisco 收購。Verizon 在 8 月份做了類似的投資,宣布收購 Fleetmatics,Fleetmatics 做的是將汽車上的遠程傳感器通過無線網絡連接到雲軟件。

未來,5G 網絡的上線將會加速數據生成與傳輸的速率。據 IDC 的 Digital Universe Report 顯示,年度數據生成預期到 2020 年達到 44zettabytes,表明我們正在見證應用這些技術的使用案例。

圖 1:年度數據生成預期到 2020 年達到 44zettabytes

2. 更快的硬件。GPU 的再次使用、低成本計算能力的普遍化,特別是通過雲服務,以及建立新的神經網絡模型,已經極大的增加了神經網絡產生結果的速度與準確率。GPU 和並行架構要比傳統的基於數據中心架構的 CPU 能更快的訓練機器學習系統。通過使用圖像芯片,網絡能更快的迭代,能在短期內進行更準確的訓練。同時,特製硅的發展,比如微軟和百度使用的 FPGA,能夠用訓練出的深度學習系統做更快的推斷。另外,從 1993 年開始超級計算機的原計算能力有了極大發展(圖 2)。在 2016 年,單張英偉達遊戲顯卡就有了類似於 2002 年之前最強大的超級計算機擁有的計算能力。

圖 2:全球超級計算機的原計算性能,以 GFLOPs 測試

成本也有了極大的降低。英偉達 GPU(GTX 1080)有 9 TFLOPS 的性能,只要 700 美元,意味着每 GFLOPS 只要 8 美分。在 1961 年,串夠 IBM 1620s 每提供 1 GFLOPS 需要的錢超過 9 萬億。

圖 3:每單位計算的價格有了極大下降

3. 更好、更普遍可用的算法。更好的輸入(計算和數據)使得更多的研發是面向算法,從而支持深度學習的使用。例如伯克利的 Caffe、谷歌的 TensorFlow 和 Torch 這樣的開源框架。比如,剛開源一周年的 TensorFlow,成為了 GitHub 上有最多 forked repositories 的框架。雖然不是所有的人工智能發生於普遍可用的開源框架中,但開源確實在加速發展,而且也有更多先進的工具正在開源。

 

方向

雖然本報告的重點是人工智能的發展方向以及公司如何把握這個方向,但是了解人工智能對我們生活的影響程度也是很重要的。

在線搜索。就在一年多以前,谷歌透露,它們已經開始將大量的搜索工作移植到了 RankBrain(一個人工智能系統),使其和鏈接(links)以及內容(content)成為了谷歌搜索算法的三個最重要的標誌。

推薦引擎。Netflix,亞馬遜 和 Pandora 都在使用人工智能來確定推薦什麼樣的電影和歌曲,突出哪些產品。5 月,亞馬遜開源了它們的深度可擴展稀疏傳感網絡引擎(the Deep Scalable Sparse Tensor Network Engine(DSSTNE),簡稱「Destiny」),它被用於產品推薦,同時可以被擴展以實現超越語言和語言理解以及異議識別的目的。

人臉識別。Google(FaceNet)和 Facebook(DeepFace)都投入了大量的技術來確定您的照片中的人臉和真實的人臉是不是幾乎完全吻合。1 月,蘋果採取了進一步措施,購買了 Emotient(一個致力於通過讀取人的面部表情來確定其情緒狀態的 AI 創業公司)顯然,這些技術遠遠不止於對照片進行標記。

雖然個人助理應用產品有無數的用戶,比如蘋果的 Siri,信用貸,保險風險評估,甚至天氣預測。在接下來的篇幅中,我們探討企業該如何使用這些技術來加速增長,降低成本和控制風險。從這些技術及其使用這些技術的應用的發展速度來看,它們充其量不過可以為公司和投資者提供一些方向,以保持他們的競爭力。

 

加強未來的生產率

美國的勞動生產率在 90 年代中期的快速增長和過去十年的緩慢增長和之後,近年來已經停止增長了。我們認為,就像 20 世紀 90 年代互聯網技術被廣泛採用那樣,消費類機器學習和人工智能的擴散有可能大幅度地改變全球產業的生產範式。

在整個行業中,我們發現在自動化的促使下,勞動時間減少了約 0.5%-1.5%,同時,由於 AI / ML 技術帶來的效率增益,到 2025 年,這些技術將對生產力增長產生高達 51-1154 個基點(bps)的影響。雖然我們期望 AI / ML 可以隨着時間同時提高生產率的分母和分子,不過我們認為最重要的是,早期的影響將是低工資任務的自動化,即以更少的勞動時間推動類似的產出增長水平。我們的基本案例 AI / ML 驅動提高了 97 個基點,這意味着 2025 年的增長生產率中的 1.61% 將由 IT 貢獻,比 1995 - 2004 年高出 11 個基點(圖 9,10)。

圖 9:生產力分析;單位百萬美元,假設 2019 年之後 GDP 線性增長

 

 

生態系統:雲服務,開源在未來的 AI 投資周期中的關鍵受益人

我們相信,在未來的幾年中,一個公司利用人工智能技術的能力將成為體現公司在所有主要行業競爭力的一個屬性。雖然戰略會因公司規模和行業而有所不同,但如果管理團隊不會把重心放在領導人工智能和在此基礎上的利益上,那麼未來產品創新、勞動效率和資本杠桿都會存在落後的風險。因此,我們認為公司需要投資這些新技術以保持競爭力,同時這將導致對人工智能所以依賴的人才、服務和硬件的空前的需求。

作為比較,20 世紀 90 年代技術驅動的生產力繁榮推動了相應的激增。增加對技術的資本支出導致了新的企業和業務的增加來捕獲這些資本支出。在不可避免的行業整合發生之前,成立軟件、硬件和網絡公司開始發生轉變。下圖 13 突出了軟件行業內的這種模式。在 1995 - 1999 年期間,在通貨膨脹調整後,市值在 20 億美元到 50 億美元之間的公共軟件公司的數量幾乎增加了兩倍,在 2000 年代中期才得到鞏固。

 

圖 13:伴隨 20 世紀 90 年代生產力激增的驅動者生態系統(enabler ecosystem)

 

圖 14:這十年來,投資人工智能的風險資本出現了暴增

 

我們看到了由 AI 驅動的生產率具有產生下一個相似的繁榮周期的潛力,可以通過利用這些潛力,把軟件、硬件、數據和服務提供商作為商業投資來創造價值。如上圖 14 所反映的那樣,與 AI 相關的初創企業的風險投資在這十年中急劇增加。AI 企業投資的繁榮現象的巨大潛力也開始推動整合。尤其是雲平台對 AI 相關人才進行了大量投入,自 2014 年以來,谷歌、亞馬遜、微軟和 Salesforce 共進行了 17 項與 AI 相關的收購(下圖)。

在上下文中對 AI 和 ML 技術的發展和歷史技術周期的比較中,我們看到了前者的一些益處。與過去 50 年的其他主要技術的周期一樣,計算(和摩爾定律)一直是進步的抑製劑和推動者。

例如,在系統架構方面,我們目睹了從大型機系統轉變為客戶端-服務器模型的整個過程,並且近年來已經開始被雲/移動模式所取代。這種進化的驅動因素是計算能力、存儲容量和帶寬的改進。每個轉換都伴隨着應用開發的轉變,包括各種新編程語言的出現和演變(見圖表 15)和各種可能的應用程序各種的類型。如上下文中所提及的一樣,AI 這個概念已經存在幾十年了,其中神經網絡的概念出現在 20 世紀 60 年代,雖然直到最近幾年,計算能力才開始讓神經網絡能在實際環境中使用。

我們相信我們正處於 AI 平台的早期階段,就如同 20 世紀 50 年代大型機才開始商業化到 21 世紀的智能手機和雲的商業化。隨着平台曲線的變化(我們認為它正在發生),應用程序、工具和服務驅動者(enabler)會爆炸式增長,我們將在下面更詳細地討論。

圖 15:人工智能的發展可以與歷史上的系統架構和編程語言的採用的技術革命相比,儘管我們認為我們目前仍然處在人工智能發展和應用的早期階段

 

stack 的演變過程以及和 AI 之間的對應關係

藍色 =專有供應商,橙色 =開源,綠色 =雲服務(注意:一些供應商,如 IBM 和 Microsoft 都是專有服務和雲服務)

圖 17:生產中的機器學習:如何在機器學習管道中利用各種開源和雲技術

圖 18:機器學習管道中的關鍵開源項目。可用的項目支持公司和風險投資

圖表 20:人工智能即服務(AI-as-a-Service(AI-aaS))概覽:機器學習 API 正在被開發以解決水平和垂直使用案例

圖表 21:水平 AI-aaS 產品和定價:來自雲平台的 AI-aaS 產品示例

 

中國人工智能現狀

 iResearch 預測,2020 年,中國人工智能市場將從 2015 年的 12 億人民幣增長至 91 億人民幣。2015 年,約 14 億資本(年增長率 76%)流入了中國的人工智能市場。

在政府政策方面,中國的國家發展改革委員會(發改委)和其他相關政府機構于 2016 年 5 月 18 日發布了《「互聯網+」人工智能三年行動實施方案》。《方案》指出了人工智能領域發展的六大保障措施,包括資金支持、標準體系、知識產權保護、人才培養、國際合作和組織實施。《方案》提出,到 2018 年,中國的人工智能基礎資源與創新平台、產業體系、創新服務體系、標準化體系應基本建立。發改委期望中國人工智能產業整體與國際同步,系統級別(system-level)的人工智能技術和應用要位於市場領先位置。

中國已經做出一些重大舉措,而且根據提及「深度學習」和「深度神經網絡」的被引用期刊論文數量,2014 年,中國已經超越美國(Exhibit 23)。中國擁有世界領先的語音和視覺識別技術,其人工智能研究能力也令人印象深刻(Exhibit 24)。百度于 2015 年 11 月發布的 Deep Speech 2 已經能夠達到 97% 的正確率,並被《麻省科技評論》評為 2016 年十大突破科技之一。另外,早在 2014 年香港中文大學開發的 DeepID 系統就在 LFW 數據庫中達到了 99.15% 的面目識別正確率。

Exhibit 23:提到「深度學習」或者「深度神經網絡」的期刊文章

 

Exhibit 24:至少被引用一次的、並提到「深度學習」或者「深度神經網絡」的期刊文章

中國的互聯網巨頭百度、阿里巴巴和騰訊(BAT)正在領導中國的人工智能市場,同時數以百計的初創公司也正滲透到這一產業中,並在各種人工智能細分市場及應用領域建立服務模型。目前,中國的人工智能領域包括:

 

基本服務,如數據資源和計算平台;

硬件產品,如工業機械人和服務機械人;

智能服務,如智能客戶服務和商業智能;以及

技術能力,如視覺識別和機器學習。

根據 iResearch,目前,語音和視覺識別技術分別占中國人工智能市場的 60% 和 12.5%。在中國,所有和人工智能相關的公司中,71% 專註于開發應用。其餘的公司專註算法,其中,55% 的公司研究計算機視覺,13% 研究自然語言處理,9% 致力於基礎機器學習。

我們認為,人工智能前沿的重要參與者可能會繼續來自美國和中國。

百度:

2015 年 9 月,百度「度秘」:聲控人工智能個人助理(整合進百度移動搜索應用)

2015 年 11 月,百度 DeepSpeech 2:包含一個大型神經網絡的語音技術,通過樣本學會將聲音與語詞聯繫起來

2015 年 12 月,百度無人車:百度無人車在北京道路上完成測試,並在硅谷設立自動駕駛部門(ADU)

2016 年 8 月,百度「DuSee」:為移動設備打造的 AR 平台(整合進百度搜索和地圖移動應用),在搜索廣告方面有着廣泛應用

2016 年 9 月,百度大腦:官方介紹,百度的人工智能平台

2016 年 9 月,Paddle Paddle:百度近期開源的深度學習工具包

2016 年 10 月,百度移動應用 8.0:新升級的移動搜索應用,內含一個整合了智能搜索和個性化新聞推薦的系統,其背後採用了人工智能、自然語言處理和深度學習技術

 

阿里巴巴:

2015 年 7 月,阿里小蜜「阿里小秘書」:虛擬人工智能客服,據公司 2016 年 10 月報告,問題解決率已達到 80%

2015 年 8 月,DT PAI:基於阿里雲的服務,用來處理機器學習過程,被該公司稱為是中國的第一個人工智能平台

2016 年 6 月,阿里媽媽光學字符識別:該技術獲得文檔分析與識別國際會議(ICDAR)Robust Reading 比賽第一名

2016 年 8 月,阿里雲 ET:一套綜合的人工智能解決方案套件,包括視頻、圖像和語音識別技術

 

騰訊:

2015 年 6 月,優圖:騰訊為開發者開放了其面部識別技術,以及優圖科技的其他核心技術

2015 年 8 月,騰訊 TICS 實驗室:2015 年騰訊設立的智能計算和搜索實驗室,專註于四個方面:搜索、自然語言處理、數據挖掘和人工智能

2015 年 9 月,Dreamwriter:騰訊上線中國第一個新聞報道機械人

2015 年 11 月,WHAT 實驗室:微信-香港科技大學人工智能聯合實驗室,于 2015 年 11 月 26 日成立

 

人工智能生態:關鍵參與者

人工智能生態:使用案例與潛在機會

 

創新人工智能的驅動者:谷歌、亞馬遜

 

谷歌在做些什麼?

谷歌的搜索算法在過去二十年裡進展迅速。從 1998 年的 PageRank 到 2015 年的 RankBrain,基於鏈接的網絡排名已經進化成人工智能驅動下的查詢匹配系統,後者能夠不斷適應那些獨特的搜索(占谷歌所有搜索的 15%)。

在雲技術方面,公司五月份公布了針對平台的定製化硬件加速器方面取得的進展,一種定製化的 ASIC,亦即 TPU,這一進展對 2015 年開源的機器學習軟件庫 TensorFlow 進行了補充。過去三年中,在與人工智能相關的收購戰中,公司也當仁不讓。

被收購的公司中,最知名的當屬 DeepMind,它提升了 Alphabet 的神經網絡功能並已經將其應用於各種人工智能驅動的項目中。

 

為何重要?

在搜索中使用算法,谷歌可謂先行者。將自然語言處理應用到配備用戶搜索意圖和可欲結果方面,公司一直處於領先地位,這也不斷加強了公司在該領域的競爭優勢。

在進一步推進人工智能領域的融合。在促進人工智能一體化(AI integration)方面,公司的開源應用 TensorFlow 已經為其他雲平台以及研究社區利用公司資源提供了先例。同時,谷歌正通過自身優勢,比如 TPU,充分利用開源世界為公司提供競爭優勢,儘管其機器學習庫是開源的。

因為 DeepMind, 公司提升了端到端的強化能力;2015 年末擊敗職業圍棋選手的 AlphaGo。將人工智能帶到更為廣泛的研究社區,同時也通過軟硬件方面的自身優勢進行創新,谷歌是最好例子。

 

亞馬遜在做什麼?

亞馬遜正在公司內部和雲端使用機器學習技術。2015 年 4 月,公司發布 Amazon ML,這款機器學習服務能夠為對雲數據的使用提供機器學習功能(無需之前的客戶經驗)。公司緊隨谷歌的開源步伐,今年 5 月開源了 DSSTNE,一個針對推薦深度學習模型的的庫。通過改善搜索、定製化產品推薦以及語音識別、增加有質量的產品評價,公司內部也在使用機器學習改善端到端的用戶體驗。

 

為什麼重要?

借助 AWS,亞馬遜成為全球最大的雲服務商,可能也是最成熟的人工智能平台。借助 Amazon ML,公司成為作為服務的人工智能(AI-as-a-service)生態系統的領先者,將複雜的推理能力帶到之前幾乎沒有機器學習經驗的公司辦公室當中。

無需基於定製的複雜應用,AWS 用戶就能使用機器學習訓練模型,評估以及優化潛力。亞馬遜推薦引擎使用了機器學習,在匹配用戶意圖以及可欲結果方面,具有競爭優勢,也為公司創造了商機。公司正更加高效地利用收集到的數據合理化用戶購物體驗,也讓電子商務體驗更具互動性。

隨着 DSSTNE 的開源,亞馬遜也與其他科技巨頭一起,推動科技社區的人工智能進步。

 

蘋果在做什麼?

去年,蘋果已經成為最活躍的人工智能公司收購商,比如 Vocal IQ, Perceptio, Emotient, Turi, 以及 Tuplejump。幾乎同時收購了 Vocal IQ 和 Perceptio,公司請來了 Johnathan Cohen,當時還是英偉達 CUDA 庫以及 GPU 加速軟件項目的負責人。

近期,據報道,公司請來 Ruslan Salakhutdinov 擔任人工智能研究總監,這也標志著公司人工智能戰略的轉型。在此之前,公司最初人工智能成果之一是 Siri , 第一款嵌入移動技術的虛擬助手,2014 年,其語音識別技術被移入神經網絡系統。

 

為什麼重要?

直到去年,蘋果已經取得相對專有的機器學習成就;2015 年 10 月,Bloomberg Businessweek 報道,在大眾消費方面,蘋果研究人員還沒發過一篇與人工智能有關的論文。不過,這一策略轉型多少與新的、與人工智能相關的雇傭與收購有關,科技記者 Steven Levy 在 Backchannel 的一篇報道強調公司已經在人工智能領域活躍一段時間了。特別是,公司收購 Turi 突出了公司要按規模推進非結構數據和推論,以及開放給更為廣泛的人工智能研究社區。這次收購,配以基於收購公司技術的較小應用,反映出蘋果致力於用這些新技術創新公司產品。

 

微軟在做什麼?

CEO Satya Nadella 表示,微軟正在大眾化人工智能(democratizing AI)。公司的人工智能和研究團隊(總人數大約 5 千多),關注改變人類體驗和與機器的互動。微軟已經積極地將新的、融合人工智能的功能嵌入公司核心服務中,並在對話計算(比如 Cortana)、自然語言處理(SwfitKey)等方面取得進展。公司正進一步打造基於 GPU 和 FPGA 的雲(Azure),在公司所謂的更高水平的人工智能服務,比如語音識別、圖片識別以及自然語言處理當中,為機器學習提供動力和速度。

 

為什麼重要?

兩個單詞:人工智能大眾化(democratizing AI)。由於這個行業中的公司將研究計劃甚至庫開放給人工智能研究社區,微軟發明了這一表述,用來解釋許多領先的人工智能創新者的舉動。去年,微軟在人工智能領域頗為活躍,正式發布了產品以及研究計劃,並宣布了一個新的人工智能和研究小組(2016 年 9 月下旬)。

微軟的 FPGA 表現突出了人工智能可以為普通商業或個人帶來什麼;不到十分之一秒,它就翻譯完了整個維基百科(30 億個單詞和 500 萬條條款)。而且伴隨着虛擬助理 Cortana, Siri, Alexa 以及其他助理之間的競爭,進一步將人工智能研發融入廣泛使用的產品中去,通過產品進步吸引客戶似乎是必須的。

 

Facebook 在做什麼?

Facebook 人工智能研究部門(FAIR,2013 年)的策略是在更廣泛的研究社區背景下研發技術。這個團隊以推進無監督表徵學習(比如,觀察世界、而不是借助人類算法干預,借助對抗網絡進行學習)的進步而為眾人所知。應用機器學習部門(AML)在 FAIR 之後成立,聚焦將研究應用到公司產品中,時間限製為月或季度(而不是年)。公司正將機器學習功能應用到各種垂直領域中,比如面部識別,機器翻譯以及深度文本(DeepText)語言或文本學習。

 

為什麼重要?

公司已經發布了多個無監督學習方面的研究成果,隨着機器學習超越從「正確答案」中學習,開始聚焦獨立的模式識別,無監督學習已經成為一個重要的焦點領域。無監督學習有望去除更多的、與大數據有關的人類成分,公司在 Yann Lecun 的帶領下,正引領該領域的研究。今年五月,公司發布的 FBLearner FLow 合理化了端到端 UI(從研究到工作流程、實驗管理以及視覺化和比較輸出)。公司的人工智能項目和工作流程應用不限於 AML 成員,公司各部門領域都可以使用借鑒。這樣一來,公司就可以利用研究部門之外所取得的人工智能進步。

 

Salesforce 在做什麼?

在 2014 年和 2015 年,Salesforce 開始解釋自己的 Apex 開發平台如何可被用在 Salesforce1 雲上完成機器學習任務。從此,該公司開始在人工智能上投入更多的資源,收購了多家人工智能公司,包括 Minhash、PredictionIO 和 MetaMind。在 9 月份,Salesforce 推出了 Einstein——一個面向多平台的基於人工智能的雲計劃。該計劃專註于將人工智能融入銷售雲、市場雲、服務雲、社區雲、IoT 雲和 app 雲。

 

為什麼重要?

Salesforce Einstein 有潛力促進商業使用數據的方式。在銷售雲中,該公司希望讓各個組織通過預測銷售線索得分、洞見機會以及自動捕捉活動來優化銷售機遇。市場和服務雲將提供預測參與度得分,來分析消費者使用情況。還能提供預測客戶,從而幫助定位市場,並基於趨勢和用戶歷史通過自動案例分類更快解決消費者服務事件。Salesforce 用微妙的使用案例將機器學習帶到雲中,強調它對公司核心競爭力的影響。

 

英偉達在做什麼?

英偉達已經從之前電子遊戲 GPU 生產商轉型為機器學習應用硬件廠商。2015 年年底,公司表示,較之使用傳統 CPU,使用了 GPU 神經網絡的訓練速度提升了 10 到 20 倍。儘管英特爾重金投入的 FPGA(作為 GPU 的替代產品)加入硬件市場角逐,但是,GPU 的機器學習應用能實現更加密集的訓練。相對而言,FPGA 可以提供更快、計算密集程度更低的推理和任務;這說明市場會根據實際應用案例區分對待。過去五年,到 2016 年 6 月為止,英偉達所占 GPU 市場份額已經從二分之一上升到近四分之三。

 

為什麼重要?

在人工智能創新公司和學術機構中,GPU 加速的深度學習一直是許多項目的前沿。英偉達所佔據的市場份額意味着,隨着人工智能越來越成為未來幾年中大型商務的中心議題,公司可以從中獲益。使用公司產品的一個例子,俄羅斯的 NTechLab,使用 GPU 加速的深度學習框架來訓練面部識別模型,識別密集集會中的個人,並在 AWS 中利用這些 GPU 進行推理。

作為一種選擇,許多大學也使用英偉達 Tesla 加速器來模擬可能的抗體突變,這種變異可能會擊敗進化中的伊波拉病毒,將來研究會進一步關注流感病毒。

 

英特爾在做什麼?

英特爾的戰略比較獨特,其使用的案例多種多樣。2016 年年中,公司發布了第二代 Xeon Phi 產品系列,以其高性能計算(HPC)能力著稱,它可以讓人工智能擴展到更加大型的服務器網絡和雲端。在硬件不斷進步的同時,公司也下重金投資 FPGA,這主要歸功於其推理速度和靈活的可編程性。英特爾令人矚目的收購包括 Nervana(深度學習),以及 Altera——該公司將 FPGA 的創新帶入了英特爾。

 

為什麼重要?

英特爾關注 FPGA 創新補足了英偉達對 GPU 的關注。當處理大型數據庫(微軟等許多大公司用來測試大數據分析的邊界),FPGA 能夠提供更加快速的推理速度。在物聯網的應用環境中,公司也宣布了一個計劃,旨在將學習技術融入可穿戴微芯片中(顯然是通過 Xeon Quark)。物聯網和人工智能的銜接有助於為公司和個人日常使用案例的數據搜集機制提供機器學習解決方案。

 

Uber 在做什麼?

Uber 正在使用機器學習優化 UberX ETA 以及接送地點的準確性。為了實現這一點,需要數百萬之前搭乘記錄的數據點來探測常規交通模式,從而可以相應調整 ETA/接送地點。今年 9 月,Uber 展開了一個自動駕駛試點項目,地點位於匹茲堡,由來自 CMU 的研究人員(受雇於 Uber)負責該項目,很多大型汽車製造商業參與了進來。該公司還和沃爾沃達成了一項合作(金額 300 萬美元),研發協作也為這個試點項目提供了機遇。不過,公司並不止步于小轎車。公司收購了一家自動卡車創業公司 Otto,今年十月在科羅拉多,公司試點快遞了 5 萬瓶啤酒。

 

為什麼重要?

Uber 的機器學習負責人 Danny Lange 在接受 GeekWire 的採訪中提及,他們的團隊正在將這種技術無縫供給公司的其他團隊,這些團隊無需具備機器學習背景就可以使用 APIs。這也能讓公司不同部門能高效利用機器學習基礎架構,例如,UberX、UberPool、UberEats 以及自動駕駛工具都使用到了公司的人工智能技術。

 

IBM 在做什麼?

IBM 在全球有 3000 多名研究人員。過去十年,IBM 在認知計算上超過有 1400 項專利,下一代雲上有 1200 項,在硅/納米科學上有 7200 項專利。IBM Watson 利用自然語言處理機器學習技術識別模式,並提供在非結構數據上的洞見,據該公司表示這代表如今所有數據的 80%。其他 Watson 產品包括 Virtual Agent,一個響應分析的自動消費者服務體驗;Explorer,這是一個分析並連接大量不同數據集的工具。

 

為什麼重要?

IBM 一直是該領域的先驅,有着極大的成就,包括上世紀 90 年代的 DeepBlue 和 2011 年的 Watson。Watson 的應用包括醫療中的病人治療分析,基於 twitter 數據的股票推薦,零售中消費者的行為分析,以及對抗網絡安全威脅。據財富報道,GM 將 Watson 加入到了汽車中,在 OnStar 系統上結合了 Watson 的能力。

 

百度在做什麼?

百度的人工智能研究由百度大腦所推進。它包含 3 個元素:

1)一個模擬人類神經網絡的人工智能算法,有着在百十億的樣本上訓練的大量參數;

2)能在數十萬台服務器與大量 GPU 集群上進行高性能計算(HPC)的運算能力。HPC 能容納更多可擴展的深度學習算法。百度是首家宣布這種架構的公司,並正與 UCLA 合作;

3)標記數據,借此技術,百度收集到了數以億計的網頁,包括百億的視頻/音頻/圖像內容碎片,還有數十億的搜索請求和百億的定位要求。為特定模型訓練一台機器可能需要很高的(exaFLOPS 級)計算能力以及 4T 的數據。

 

為什麼重要?

人工智能正在改進百度全線產品的用戶體驗和提升用戶粘性,也在推動針對每一用戶的定製化高質量內容。建立一個內部平台來運行從網頁搜索到廣告投放的帶有標籤數據的深度學習實驗,能夠預測點擊率(CTR),這會直接影響百度的廣告投放,因此也是它們目前的主要收益。此外,基於人工智能的技術也能帶來更高的 CTR,而且每點擊成本的降低也能促進變現。

附錄:150多家人工智能與機器學習公司列表(略)

此部分是相當詳細的全球人工智能或機器學習公司列表,但截圖會影響閱讀,建議讀者下載原報告瀏覽。

 

©本文為機器之心編譯文章,轉載請聯繫本公眾號獲得授權。


 【高盛人工智能生態報告】美國仍是主導力量,中國正高速成長