這次A.I.浪潮看着眼花繚亂但實際上只有四個可能的落地方向:

一是語音、語義的突破導致語音交互最終真的成為可能;

二是計算機視覺的突破導致AR這樣的混合了現實空間和虛擬空間的顯示方式;

三是計算機視覺的突破讓自動化得以升級,出現自動駕駛汽車、機械人這樣的高度自動化產品;

四是機器學習提供了新的數據處理方式。(最後一種方式的基本創業模式參見此前文章:谷歌DeepMind剛做的兩件事所帶來的AI創業啟示)

前三種的創業模式又可以分為:產品系,從軟到硬以及從硬到軟。這篇文章探討這三種模式的優劣。

 

產品系

我們耳熟能詳的人工智能創業公司基本上是產品系,比如國內的出門問問、Rokid機械人,國外的Jibo、Savioke、Knightscope、Meta等。這類創業公司的根本特徵是嘗試借用人工智能上的技術突破,打造具有新奇體驗的新產品(帶語音交互或者AR等),並跑出漂亮的銷售曲線。

那什麼是漂亮的銷售曲線?它大概會像下面這樣:

漂亮的銷售曲線意味着新產品的市場一旦啟動,那在之後的三年裡,銷售曲線是倍增(可能高於2倍)的,而不是每年增加百分之十這類緩慢遞增。

反過來講這意味着這些創業公司的決勝期實際上只有三年。不管你之前做了多少,一旦你錯過這三年,那所有努力工作可能就變得沒有價值。

那多久市場才會從早期市場變得真的啟動呢?這沒人知道,趨勢是可以用邏輯推演判斷的,但具體的啟動時間點其實都是瞎猜。可能是1年,也可能是2年,甚至5年,10年。

這樣一來所有產品系的ai創業者們要把握的關鍵點就只有兩個:

在一個不可清晰預測長度的預熱期做好充足的準備,包括產品、銷售渠道、生產製造能力等。

 

2.一旦市場啟動,那跑出上面那種銷售曲線。

如果第一點沒做好,那就是老羅和他的鎚子科技,如果第二點沒做好那其實會像某些大企業,比如摩托羅拉,什麼都不缺但就是干不成事。如果兩點都做好了那就必是新的獨角獸企業。

這裡必須強調的是達成上述兩個目標時真正重要的是產品體驗而不是技術的先進性,也就是說這種模式更需要喬布斯這樣能用好技術的人而不是謝爾蓋布林這樣能創造技術的人。

哪怕所有技術都是別人的,但只要不影響用戶體驗,那其實關聯不大,但實際上由於這一代AI的創業者都非常聰明和野心勃勃,他們都不想純粹的變成組裝型企業,所以這類創業公司通常會在初期就嘗試卡住技術上的某幾個關鍵點,比如ASR等。這裡面比較極致的是出門問問,根據各種信息來看,出門問問全線打造了自己的ASR、NLU甚至搜索。

這就導致產品系創業很像爬珠穆朗瑪峰的北坡,成了必是一番大事業,但成功非常艱難。高風險來自於這樣兩個方面:

1.預熱期的時長高度不可預測。

拋開AI不論,到現在為止這個模式下裡國內比較成功的一家企業是大疆。大疆的銷售開始起飛大約是2013年(暫時沒有官方數據,只有Dronelife的猜測數據)。

那大疆哪一年成立的呢?2006年,也就是說大疆等待產品起飛等待了差不多7年。

 

2.成本因想卡住關鍵技術點而大幅增加。

前面提到過,新一批創業者們通常並不想自己成為單純的組裝和銷售公司,所以會在早期就把握住幾個關鍵的技術點。這對產品起量後企業發展有利,沒有這些點上的控制權即使成了也可能變成現在的某類PC和手機企業。

這未必不對,畢竟亞馬遜為了做Echo也收購了三家公司完整搭建自己的技術體系,但無疑,這對創業公司而言會顯著增加成本和風險,會導致企業長期處在收入沒着落但支出比較高的狀態。

 

從硬到軟

不管從硬到軟還是從軟到硬,說的都是公司本身不做產品、而是為做產品的公司提供服務。從硬到軟說的是公司認為公司優勢必須從前端(比如麥克風陣列)開始,延伸到後端(雲端)。

從軟到硬則是說公司認為雲是智能的核心,前端優先級較低。當然我們可以講最好兩端都強,但創業公司由於資源、創始人背景限制通常只能先強調某一部分。這兩種模式又可以分別落在語音交互與計算機視覺上,但由於很難雜在一起說的清楚,所以下面會拿語音交互這個方向做例子先把這兩種模式說清楚,最後再總的分析下這兩種模式。

國內語音交互人工智能創業公司裡走從硬到軟賽道的公司還比較稀少,最典型的應該是聲智科技(這公司是我Portfolio公司,所以比較了解),聲智科技是從最底層的聲學陣列開始,先做噪聲抑制、混響消除、回聲抵消等,反過來再考慮上面的ASR等,與雲知聲等的道路正相反。

這種模式的好處是可以站到產業鏈的最前端,容易落地,是數據的必經之路。而數據本身是未來ASR甚至NLU的核心驅動力,所以後勁比較足。

壞處是短期需要用硬件獲取客戶,並且需要組織硬件的生產,需要較多的啟動資金。

可以講產品系創業公司的成功事實上有兩個外部要求:一是趨勢要來,其次是產品要經得起市場檢驗。從硬到軟的公司也有兩個外部要求,一是趨勢要來,二是要技術過硬,有價格優勢。2B的公司所面臨的客戶通常非常理性,很多花哨營銷反倒是作用不大。

 

從軟到硬

語音交互上從軟到硬比較典型的創業企業則是雲知聲,這種模式選擇和公司定位甚至從名字上就可以看得出來。

從軟到硬的好處是更容易覆蓋已有的成熟計算平台,比如所有的 App 都需要一個自己的Siri,那雲知聲這樣的企業只要做好技術壁壘,等着攜程、今日頭條上門就行了。這個方向上主要的挑戰在於要和大公司(比如百度和訊飛)直接競爭。我們這篇文章主要關注的是新硬件產品上落地,所以這點不再展開。

壞處則是在新硬件產品(Echo、汽車、機械人、AR等)上很難落地,因為為了在新硬件產品上落地,中間必須加入陣列那一層,否則效果會很差。而一旦無法落地,其技術優勢就很容易被突破。

語音識別的精度骨子裡是數據驅動的,但顯然不做陣列等硬件,你沒法落地,沒法落地就沒有數據,也就很難獲得數據、技術、精度、場景上的正反饋,也就不容易解決真實環境的語音識別精度問題。

雲知聲等顯然認識到了這一點,所以也在積極往這一方向擴展。這時候通常會碰到軟件企業跨界做硬件的一般性問題,比如供應鏈侃價搞不定會導致同樣的產品成本會高個百分之幾十等。

 

路線差異起源於對計算架構的認知

上面拿語音語義的企業做了個例子,但事實上在計算機視覺上同樣成立,只不過細節會有差異,比如Movidus的芯片可能在端上就把圖像識別處理完了,而不需要像麥克風陣列那樣自己處理後再把結果傳到雲端。這種模式選擇背後隱含的共通的東西是對計算架構認知和假設。

到現在為止這種假設和認知一共有三種:

一種是為保證體驗(速度等)端始終要扮演重要的角色,雲用來輔助端完成計算。所有我們用的硬件產品:手機、Pad等基本都是這種模式;

一種是計算應該大部分發生在雲上。Google主推的ChromeBook是這種模式,以前銀行裡的終端也是這種模式;

一種是正在興起的傳感器+Fog computing+雲架構。這種可以看成是第一種架構的擴展,比如智能家居裡所有的設備都直接連雲上計算成本太高,那就不如家裡有一個中樞先把能處理的處理了(比如天冷開空調,下雨關窗戶就不傳到雲端了),實在不行的再連雲。

前兩種架構在現實裡經常會發生PK,並且導致很嚴重的後果,下面說兩個例子:

一次PK發生在PC上,那時候Oracle等嘗試做的Network Computer骨子裡的含義就是把各種計算轉移到後端,讓前端就變成輸入輸出設備。這種嘗試顯然失敗的慘不忍睹,但有意思的是20幾年後當PC這個品類足夠成熟後仍然走這條路線的Chromebook卻看到了些成功的曙光。

一次發生在Native APP和HTML5上,當時Facebook是很希望主推HTML5,那時候扎克伯格想用Web App來打破iOS和Anroid的壟斷,但實際上Facebook差點死在在這個選擇上,因為這選擇幾乎讓它錯過移動互聯網,後續的Instagram與WhatsApp大額收購很可能與這種錯誤路線的選擇有關。

我個人對此的基本認知是:對於新品類硬件產品剛出現的時候,首先是端要足夠強大,把體驗做到極致,隨着應用、帶寬等的逐步發展,那端上的計算量可能會轉移到雲上,因為那會有成本優勢,但這需要一個漫長的過程,PC走了20幾年剛看到這可能性。

如果這是對的,那意味着在新硬件產品上,首先成立的會是從硬到軟的模式,而不是從軟到硬。

AR、自動駕駛等都和前面說的語音交互一樣要先解決終端上的問題,讓產品能夠快速準確的進行實時響應,確保用戶體驗,之後再談其它。也可以換個角度來考慮這問題,在新產品上更可能是先有iPhone才有Android手機,而不是掉過來,因為iPhone給用戶的衝擊更強,更容易樹立起一個新的品類,但iPhone不可能用HTML做出來的。

但確實從硬到軟的模式對創始人提出更複雜的要求,比如聲智科技的陳孝良首先是聲學專家,同時也是語音識別專家所以才會選擇這種從前端開始,結合後端的路線。而雲知聲的CTO是計算機科學家,更擅長的是算法,深度學習,所以先天上就會傾向於用數據、神經網絡算法和大幅增長的計算能力(從雲計算到HPC)來解決問題。轉到重視端的這條路上來同時需要跨越思維和技術壁壘,也許不太容易。

 

小結

下面這兩件事情是高度確定的:

1.AI的浪潮來了。

2.一定會有新的硬件產品出現。

所以一定會有新的獨角獸從產品系中誕生。

如果你認為新硬件產品必須端的強大做支持,確保體驗,而新品類的基本出現次序也是先有 iPhone,才有 Android,那很可能你會同意有獨角獸會先從從硬到軟的模式裡出現。(我曾經和很多人講過這些觀點,但很巧的是直到最近才碰到一個做投資的美女和我認知非常一致,不會說我是抄襲她觀點吧......)

必須強調的是這篇文章裡主要探討的是新的硬件產品下的可能狀態,數據分析類不在這篇文章覆蓋範圍內(數據分析是純粹的雲端計算),主要面向現有平台(手機、Pad等)的產品或服務也不在這文章覆蓋的範圍內。

 

訂閱號:zuomoshi(琢磨事),文章裡一般會講AI對商業的影響,AI對社會的影響則在《終極複製:人工智能將如何推動社會巨變》一書中做系統闡述。


 尋找下個獨角獸:深度解析 A.I. 創業的三種模式