Airbnb的數據團隊,Riley Newman是後排右邊數第5

本文作者Riley NewmanAirbnb的首席數據科學家,文章來自VentureBeat,本文由數據客翻譯,歡迎關注微信idacker和我們交流。

5年前我加入Airbnb成為了一名數據科學家。那個時候,只有很少的人知道這家公司,而整個公司只有7個人。

 

首先瞭解問題的背景,建立一個完整的計劃簡介。這更多是一個探索性的過程

簡要理解計劃,包括區分主次以及假設我們可以達到的結果。預測分析在這個階段更為重要,當我們做出一個決定,是基於我們希望可以產生最大的影響

計劃進行中時,我們要做一個控制實驗。A/B 測試是最常用的,但我們的業務在各方面的合作可以讓我們有更多的實驗機會,以市場為基礎的測試以及傳統的網絡環境的測試

最後我們測量實驗的結果,確定結果的影響。如果成功,我們就從社區中推廣出去,如果不成功我們就回到最初來重複這個過程

有時候這個過程是簡單的,但是更多時候我們需要挨個步驟來論證,確保這個決策對Airbnb的每一個用戶都是有效的。最終我們將用這種方式來解決用戶的需求

民主化的數據科

當一個數據科學家可以有足夠精力和他人溝通時,可以產生一個良好的循環,但現實是一個公司的規模和速度將超過數據團隊的成長速度。這在2011年尤為明顯,因為Airbnb開始快速發展,年初我們還是一個在舊金山的小公司,我們三個數據科學家就可以有效地和大家合作,但是6個月之後我們開了10多個國際辦事處,同時擴大了產品、營銷和客戶支持團隊

突然我們和每一位員工直接溝通的能力就消失了。正如它無法滿足社區的每一個新成員,它是現在也不可能滿足與每一位員工的工作,我們需要找到一種方式民主化工作擴大我們同其他同事甚至是整個社區的聯繫。

這裡有一些的例子,我們是如何走近每一層的規模:

 

個人互動:這對於數據科學家快速的行動非常有效。在數據基礎設施上的投資是重要的,這可以保證有更快更可靠的技術來傳輸數據

授權團隊:把報告和基本數據探索從數據科學家的工作中剝離開,讓他們可以集中於更有效的工作,例如利用儀錶板等工具。我們還開發了一個強大的和直觀的數據倉庫工具,來幫助人們查詢作者

除了個人的團隊,我們更多思考數據文化在公司整體中的作用:我們告訴員工我們是如何思考Airbnb的生態系統,如何使用工具,(如Airpal),消除數據的壁壘,激發他們的好奇心,告訴他們每個人如何可以更好地利用數據。類似的行為有助於改變他們把統計當做是臨時請求的思想,可以解放我們

擴展數據團隊:擴展數據科學團隊並不容易,但這是可能的。特別是如果每個人都認為這不僅僅是必須的,而是一個公司的重要組成部分

五年來,我們已經學到了很多東西。改善了如何利用我們收集的數據,如何與決策者互動,以及我們如何在公司進行民主化。但到什麼程度了這些工作才算是成功的呢

測量一個數據科學團隊的影響是困難的,但一個信號是,現在大家一致認為數據需要由技術和非技術人員一起決定。我們的團隊成員在決策過程中被視為合作夥伴,而不僅僅是統計採集

另一個原因是,我們越來越有能力提煉我們工作的因果影響。這一直是比較棘手的,因為發現生活中的生態系統是複雜的,有多種因素的影響,例如網絡效應,季節性強,交易頻繁,但這些挑戰,使工作更加精彩。在過去的幾年中,我覺得我們仍然只是皮毛,還有巨大的潛力

我們正處在一個爆發點,我們的基礎設施穩定,工具有效,而且數據倉庫乾淨可靠,我們已經準備好去解決那些令人興奮的新問題。目前我們期待著從批量實時處理,到開發一種更強大的異常檢測系統,加深我們對網絡效應的理解,並提高我們個性化的匹配

但是,這些想法僅僅是個開始。數據是客戶對我們的期望和聲音,而無論我們以後做什麼,都將由這些聲音驅動。

From pamire


 Airbnb數據科學家深度剖析:Airbnb快速增長背後,數據在幹什麼