虎嗅注:2015 年 4 月 29 日,騰訊舉辦 2015 「互聯網+中國」峰會,騰訊董事會主席兼首席執行官馬化騰在主題演講中給了互聯網一個新的定義——資訊能源。他指出,和兩次工業革命類似,像蒸汽機和電力一樣,互聯網應該定義為第三次工業革命的一部分。
所謂能源,其抽象的含義是指「提供能量轉化的物質」。那麼,如何理解所謂的「資訊能源」?這種「能源形態」的能量轉化過程一般是怎麼發生的?對政治、經濟和社會文化可能有哪些重大的影響?(這個問題比較大) 本文試圖從一個側面簡單闡述,謹供諸位虎嗅讀者參考。
信息和黑盒
人類通過獲得、識別自然界和社會的不同資訊來區別不同事物,進而認識和改造世界。人類社會傳播的一切內容,均可以視為資訊。資訊在互聯網領域的表現形式,就是如今我們常常會聽到一個詞:數據。
互聯網對於數據資訊的處理,理所當然地,遵循計算機軟件程式的一些基本原理方法。其中很重要的一點,就是「黑盒」。「黑盒」原本指的是軟件測試的一種方法:把測試對象看成一個黑盒子,完全不考慮程式內部結構和處理過程,只在介面處進行測試。產品自成一體 (即數據封裝),使用者不需要關心產品的工作原理,就能直接使用 (即數據隱藏)。
「黑盒」當中發生的事情,恰恰是大部分普通用戶不清楚、不理解或是不關心的。而「資訊能源」的能量轉化過程,最關鍵的步驟,恰恰就發生在「黑盒」當中。馬化騰說,騰訊要做的兩件事「連接器」和「內容產業」,從本質上說,指的就是「黑盒」和「數據資訊」。
「資訊能源」在「黑盒」裡進行能量轉化
互聯網業界曾經流行一句話,叫「羊毛出在狗身上,豬買單」。有一種解釋:互聯網讓企業在主營業務之外賺錢。一個簡單的例子是公司靠軟件免費積累用戶,再將用戶流量賣給協力廠商。雖然從表面上看是軟件公司,但是軟件都是免費提供,用戶流量才是真正賺錢的。對於用戶來說,有免費軟件用就夠了,不必關心公司怎麼賺錢。
這個例子在一定程度上描述了「黑盒」裡面發生的事情。「資訊能源」在這裡將免費軟件轉化為用戶流量,正是這一步關鍵的轉換,打通了整個鏈條。這是一個典型的「黑盒」。
驗證碼系統 reCAPTCHA 是另一個典型的「黑盒」案例,本來這是一個區分用戶和機械人程式的驗證系統。在用戶介面端表現為一個由用戶回答的問題,其內容圖像比較模糊,並進行了扭曲變形的幹擾處理,為的是過濾機械人程式。如果用戶輸入正確則視為驗證通過。reCAPTCHA 的「黑盒」另一端介面是書本掃描中無法準確被 OCR 識別的文字,也就是說,在用戶看來自己完成了一個驗證碼輸入操作,通過「黑盒」的轉換,用戶實際上完成了一次人工識別並手工輸入字串的操作。《紐約時報》利用 reCAPTCHA 系統,完成了大量文字資料的數字化工作。
「黑盒」的關鍵是資訊,或者說數據。基於數據,騰訊這樣的互聯網公司才能設計「黑盒」,針對不同的數據,「黑盒」內部又有不同的設計實現,根據需要來完成不同的「資訊」能量轉化過程。沒有數據,「黑盒」就無從談起。
於是我們看到整個互聯網經濟的崛起過程,始終是從積累數據開始。互聯網公司想盡各種方法,獲取用戶貢獻的數據,最典型的手段就是免費。網景瀏覽器發明者、風投家馬克•安德森 (Marc Andreessen) 用「免費雪糕」的說法來比喻互聯網公司吸引用戶、積累數據的方法:假設現在有人在大街上推著雪糕車,一邊吃一邊向過往的路人免費贈送,你會不會去拿一份嘗嘗?當然會,誰會和免費又好吃的雪糕作對呢?
這裡有個例子:2007 年 4 月,Google 推出了 Goog-411,這是一種通過打電話進行操作的語音搜索服務。411 是美國常見的電話查詢服務,在 Goog-411 推出的時候,全美境內每年有 26 億次 411 撥叫,市場規模 70 億。但是, Goog-411 服務完全免費。用戶通過撥打電話使用這項服務,完全通過機器提示音進行操作。
著名科技博客 TechCrunch 在報道該服務時給出的評價是——付費 411 電話服務會被顛覆。可是在三年之後,2010 年 11 月 12 日,Goog-411 服務宣佈關閉,理由讓人恍然大悟:Google 推出該服務的初衷是為了搜集語音數據,為正在研發中的語音助手 (也就是我們現在用到的 Google Now) 建立數據庫。什麼顛覆 70 億的市場,Google 根本沒往那兒想。換句話說,通過 Goog-411 這個「黑盒」,用戶全都成了 Google 設計語音助手的免費勞動力。
類似地,諸如攜程早年的免費登記送會員卡,和現今一些公司的裝 APP 返現金活動,也是「免費雪糕」典型例子。
當免費的產品能夠製造足夠誘人的衝動時,用戶願意用一些現階段價值 (注意,是現階段) 不那麼明顯的東西去交換——甚至很多時候都不知道這種交換的存在。對一些互聯網公司來說,無論拿什麼和用戶交換,最終一定要得到能夠為「黑盒」所用的——數據。
當然,獲取數據還有一種最直接也最有效的方式:收購有數據的公司。
Octazen 是馬來西亞的一家創業公司,2010 年 2 月,Facebook 收購了這家公司——可能至今我們能搜到的關於這家公司的新聞也只有這一條。直到 Facebook 前員工安迪•瓊斯 (Andy Jones) 在網上解釋 Facebook 獲取用戶數據的方法並以收購這家公司的交易舉例時,我們才發現 Facebook 要的是數據。「Octazen 有一個龐大的數據庫,Facebook 要的就是這個。」他說。
當積累數據的工作完成到一定進度 (比如說到了「大數據」階段),針對各個行業設計「黑盒」的工作,就可以披上「互聯網+」的外衣,粉墨登場了。畢竟,互聯網行業有大量的「資訊能源」迫不及待地要到「黑盒」中做能量的轉化。
「資訊能源」在「互聯網+」和傳統行業結合過程中,發揮作用的案例分享和經驗總結,相關的探討已經很多,並且會繼續多下去。相信以 BAT 為首的互聯網公司早就有了深入的研究,本文暫不贅述。
做為一個科技媒體,本文下面想要重點提出的是,在「互聯網+」大趨勢下,企業對用戶隱私所應承擔的責任和義務。順便沿著「黑盒」的角度,試著回答一下為什麼 Google、Facebook 和 Twitter 無法在中國大陸地區訪問的問題。
用戶數據——「互聯網+」時代的金礦
如果用「免費雪糕」的例子來比喻,那麼 Google、Facebook 和 Twitter 是——至少在一大部分網絡用戶來看——比百度、人人和微博更好吃的「雪糕」。誠然,Google、Facebook 和 Twitter 在某些方面技術更先進,用戶體驗更好,按理說應該成為中國大陸廣大網民可以使用的優秀產品。
但最大的問題是,這三家公司的數據並不是完全開放的,積累數據的方法和具體搜集的數據內容全都在它們的「黑盒」裡。用戶數據在「互聯網+」時代的重要性不言而喻,依馬化騰的「第三次工業革命」角度來看,視為「戰略性資源」也不為過。如果一個國家的「資訊能源」沒有掌握在本國政府的監管之中,從國家產業發展的角度來說,無疑是重大的戰略失誤。
讀到這裡可能有一些對防火牆深惡痛絕的朋友已經開始要罵我了,那麼我們就來回顧兩起事件,看看 Facebook 和 Twitter 的「黑盒」裡,曾經發生過什麼?
2014 年 6 月,Facebook 的數據科學家發布了一項研究報告,報告稱 2012 年 1 月在美國國防部的資助下,Facebook 通過操縱 Facebook 的信息流,在用戶不知情且未獲允許的情況下,以 68 萬名用戶為試驗對象,進行了一次「情緒感染試驗」 (emotional contagion) 。英國《衛報》在文章中指出:「Facebook 向人們表明,它可以操縱用戶情緒。」
消息一出引發軒然大波,美國議員致信 FTC 要求調查並出臺監管措施,並呼籲消費者瞭解在社交網絡上的隱私權。美國數字保護組織 EPIC 向 FTC 提起訴訟,要求製裁 Facebook。事件最後以 Facebook 首席運營官桑德柏格 (Sheryl Sandberg) 公開道歉而暫告一段落。
如果 Facebook 能夠通過改變資訊流內容來操縱我們的情緒,我們會作何感想?
再來看看 Twitter:2009 年 5 月,伊朗第十屆總統大選開始,5 月 17 日,Twitter 按計劃本來要在舊金山時間當日深夜進行系統維護,所以需要臨時暫停伊朗地區的服務。但是在一位美國國務院官員的要求下,延遲了系統維護時間。因為 Twitter 在這次伊朗大選中發揮了重要的作用:伊朗民眾是否能夠正常使用 Twitter 對政局發展可能帶來深遠影響。那一年的事情我們都知道了,而這位美國國務院官員在轉年 9 月應 Google 首席執行官施密特 (Eric Schmidt) 的邀請,加入了 Google。當月《外交政策》(Foreign Policy) 雜誌採訪了他,當問到「有什麼事情是美國國務院做不了,但可以在 Google 做的事情?」他回答說:「有一些事情是民營公司可以,但是美國政府不能做的⋯⋯在一些問題上,以政府的名義去做的話會非常敏感。」
如果新浪微博能夠在美國大選中發揮類似的作用,是否也會有外交部的官員出面要求新浪延遲系統維護時間呢?
對於一個國家的經濟來說,土地和人口是基本資源。對於 Facebook 這樣的「虛擬國家」來說,沒有土地,用戶就是它的人口。而用戶免費提供的數據,就是 Facebook 的「人口稅」。
像用戶數據這樣,如此寶貴的「資訊能源」,有關監管部門又怎麼可能拱手送人做「人口稅」呢?
我的數據是我的,你用之前和我說清楚了嗎?
一方面是用戶在免費提供數據,另一方面是互聯網企業用數據大發財源。這種情況是否合理?換句話說,如果一個用戶自己的數據,被企業拿去用來當「資訊能源」,是否侵犯了這位用戶的權益?
在互聯網產業發達和公民維權意識較高的歐美國家,互聯網隱私保護方面的立法方面已經在積極探索。美國白宮今年初就宣佈了保護民眾網絡隱私的法案,讓消費者決定哪些資訊可以被收集。奧巴馬在回答媒體相關問題時直截了當地對記者說:「你擁有你的數據,我擁有我的數據。就是這樣。」
有觀點認為,在巨大的利益誘惑下,企業是什麼事都做得出來的。無論如何,制度或法治環境的建設都要發揮應有的作用。如果企業濫用數據,理應受到制度的懲罰和法律的製裁。
既然我們都擁有各自的數據,那麼當普通用戶涉及個人隱私的數據,在不知情的前提下,被企業搜集來設計「黑盒」並獲得商業利益時,用戶的隱私權是否被侵犯?
企業是否有義務告知用戶「黑盒」裡面發生了什麼?
每一個普通用戶「貢獻」的數據又被用在了哪裡?
作為一個普通用戶,我很想知道。
From 涵詔
黑盒裡的數據:馬化騰所說的「信息能源」指什麼?