政府情報機構和企業通常會在人們不知情或說無需通過人們同意的情況下,對公民在網絡空間中留下的海量數據進行存儲和分析。基於這些數據,他們可以知道人們不同意或反對什麼,而這些想法和行動對人們的生活有着深遠的影響。雖然大家並不情願,但事實是我們處於大規模監控之下,至少,美國公民的確是這樣。
元數據的真面目
絕大部分人對美國國家安全局(NSA)的了解,要歸功於愛德華·斯諾登。作為NSA的項目承包商,斯諾登收集了NSA有關監控活動的成千上萬份文檔,並於2013年逃到香港把資料交給經過他慎重選擇的記者。
這些文檔曝出的第一個故事就是收集所有美國公民的手機電話撥打記錄,注意,只是撥打記錄。據此,美國政府就一直以「撥打記錄」為辯護說詞,說是他們收集的「只是元數據「。也就是說,NSA並沒有收集電話的談話內容,只是收集了接打雙方的電話號碼,以及撥打電話的日期、時間和時長。
元數據(Metadata),儘管大多數人並不確切地知道它意味着什麼,但聽上去似乎能給人帶來一定的安撫作用。但實際上,收集元數據同樣屬於赤裸裸的監控。
比如,國外電影中經常有雇傭私人偵探竊聽某人的情節。請注意,這裡的用詞是「竊聽」。私人偵探接收委託后,會在被監視人的家中、辦公室和汽車中裝上竊聽器,偷聽電話內容、查看計算機。然後,委託人會收到一份被監聽者的詳細談話內容報告。
如果把委託任務從「竊聽」變為「監視」呢?最後委託人收到的報告內容肯定有所變化,但範圍卻更廣了。監視包括,被監視人的行蹤去向,幹了什麼事,與誰談話並談了多長時間,與誰通信,閱讀什麼,購買什麼等等。這些信息就是「元數據」。簡而言之,竊聽可以得到談話內容,監視則包含所有其他的背景或相關信息。
元數據是描述數據屬性的集合,是對數據的說明,比如,數據的類型、名稱、字段等。
電話元數據還可以透露更多的信息。比如,根據談話的時機、長度和頻率,能推算出談話人彼此之間的關係。是密友,商業夥伴,還是其他什麼人。電話元數據顯示被監視人對誰感興趣,什麼對他是重要的,不管這些信息有多麼私密。它是窺探人們個性的窗口,它能夠在任何時間點繪製出被監視人的事件報告。
有些人覺得不以為然,這些所謂的元數據能有什麼嚴重的隱私問題,是不是有點大驚小怪了?
好,我們來看看美國斯坦福大學做過的一項分析電話元數據的實驗,這次實驗在幾個月的時間里收集了500個志願者的元數據。
志願者A與多個地方的神經病學小組有聯繫,聯繫過一家專項藥房,一個罕見病癥管理服務機構,以及一條藥品熱線,該熱線只用來咨詢多發性硬化症的複發。
志願者B與一個大型醫療中心的心臟病專家詳談,還與一個醫療實驗室有過簡短會話,接過藥房打來的電話,並接通過一個家用醫療設備的熱線,該設備用於監視心率失常。
志願者C給一家專門售賣AR半自動步槍的槍支商店打過不少次電話,而且還與AR步槍的生產商客戶服務詳談過。
志願者D一連三個星期與家居改善店、鎖匠、水栽經銷商和煙草用品商店聯繫。
志願者E在一個早晨與她的姐姐通了很長時間的話。兩天後,她給當地的計劃生育機構打了許多電話,兩周后又打了幾個,一個月后打了最後一個電話。
這五個志願者的元數據代表着什麼呢?
一個多發性硬化症患者,一個心臟病患者,一個半自動武器持有者,一個家庭大麻種植者,最後是一個做流產的母親。
搜索引擎的殺傷力
下面我們再來看看網頁搜索數據,它是另一種NSA用於大規模監視公民行為的私密數據。有人認為網頁搜索數據不能算是元數據,但NSA認為是,理由是搜索詞是嵌入在網址中的。(話說這算哪門子理由?)
之所以說搜索數據是私密的,是因為人們不會對搜索引擎撒謊,這些數據甚至比朋友、情人或是家人更與自身緊密和貼切,因為我們總是盡可能準確的告訴搜索引擎,我們在想什麼。
Google知道每一個人搜索的色情網站,知道人們內心深處的擔心和秘密,甚至是恥辱和罪惡。如果Google想知道某一個網民心裡面正在想什麼,它就能知道,不管你是在想逃稅還是計劃抗議政府的某項方針政策。曾經有人說,Google比自己的妻子還了解自己。但實際上還可以更進一步,應該說Google比你自己還了解自己,因為它能毫無改變地、永遠地記住你曾經在那個長條框里輸進去的東西,不管它是什麼。
現在,我們來用Google的自動完成功能做一個實驗(由於工作原因,筆者很少用百度)。這個功能可以實時的把你想要查詢的問題補充完整。當我鍵入「should i tell my w」的時候,搜索框自動會出現以下幾個結果:
should i tell my wife i cheated(我應該告訴我妻子我出軌了嗎)
should i tell my wife about emotional affair (我應該告訴我妻子我有外遇了嗎)
should i tell my wife i filed for divorce(我應該告訴我妻子我提交離婚申請了嗎)
should i tell my wife i』m in love with another woman(我應該告訴我妻子我愛上另一個女人了嗎)
好吧,2011年我迷過一陣電吉他
元數據可以殺人
還有很多其他的私密數據和元數據的來源。你的網上購物記錄會透露你大量的習慣,你的微博會告訴全世界你何時起床吃早餐,何時道晚安睡覺。你的朋友圈和聯繫人會暴露你的政治傾向,甚至是性取向。你的電子郵件或你的短訊息可以顯露誰是你職業、社交和個人感情生活的中心,你手機上的APP可以定位你的位置,去過哪裡……
數據與元數據可以這樣來區別,前者是內容,後者是背景。背景常常比內容顯示更多的信息,尤其是把元數據集合起來的時候。當你監視一個人的某次具體行動時,他的談話內容、手機短訊和電子郵件的確比元數據重要。但當你監視一個人的生活,或是大面積區域人口的時候,元數據的作用就無可比擬了。無論是重要性、實用性,還是對問題的判斷和預示上,都極有意義。
「元數據絕對可以告訴你某個人其生活的一切事情。如果你有足夠多的元數據,你就不需要數據內容。」
——美國國家安全局前法律總顧問斯圖爾特·貝克爾
就在去年,前美國中央情報局和國家安全局局長邁克爾·海登曾在一次公開的會議討論中說過一句令人瞠目的話:
「我們基於元數據殺人。」
接着他為了減緩這句話給人帶來的震驚,又補充了一句:
「但我們收集元數據的目的不是用來殺人。」
邁克爾·海登
本文無意去探討「元數據殺人」的真正含義和背後故事,但本文至少可以看出美國情報機構打着元數據的旗號,卻乾著嚴重威脅公民隱私的勾當。君不見,美國參議院以罕見的神速通過《網絡空間安全信息共享法》方案了嗎?票數是14:1。
相關信息
美國參議院情報委員會於3月上旬通過《網絡空間安全信息共享法》,其內容是對企業的信息共享行為增加法律上的照顧,以鼓勵美國企業把信息安全漏洞信息共享給其它企業以及政府部門。參議員羅恩·威登是CISA唯一的反對者,他表示,只有在公民合法隱私權利得到足夠保護時,信息共享措施才是可以接受的,否則只是另一項用來監視美國公民的法案。
From 王小瑞
元數據殺人?我們已被網絡空間綁架