Big Data,彷彿是企業潮流的字眼,但企業該如何運用令其增值?市面上充斥著各種借「Big Data」作銷售亮點看方案,令 Big Data 的
範疇留有灰色地帶,一切變得撲朔迷離。 Forbes 最近發表一篇有趣的文章,並名命為「如何辨認虛假的 Big Data 產品」,講述了如何辨認甚麼是 Big Data 科技、甚麼不是,以及講述了一般人對 Big Data 的誤解,人們應該追求革新而不是追求方法。
某些資料供應商巧立名目(為求達到不正當的目的),自稱 Big Data,企業應小心分辨。
重點不在於「大」、也不在於「資料」
大資料其實已經運行了差不多十年,起初進入市場時,「大」是其銷售重點,供應商需要面對很多挑戰,不停地攝取和消化以給予改進,包括如何進化為1PB(1,000TB),如何運行這容量及製造一些結果,當時一切都以「大」為主題,故此如何運用和演繹都變得次要。
另一個具爭議性的地方是「資料」。Big Data 本來就是以大量資料進行一連串分析以找到一些結果,這也不難理解。這的確是一個有效方法,在過去多年,很多人都希望找尋一個方法去消化一系列的資料而找尋結論,然而 Big Data 滿足了這個要求。時至今日,消化資料變得容易,而這趨勢看似將會繼續不停地發展下去。
那麼 Big Data 不在於「大」,也不在於「資料」,那在於甚麼?以下為一些見解,可助企業分辨 Big Data 工具的真偽。
Big Data VS 大商業智能
大商業智能(Big Business Intelligence,Big BI),有以下3點:
1. 分析擁有相同結構及交易類型的資料,像過往多年一樣,也許有更多這方面的資料。
2. 這些資料是一組組的,也是舊資料。
3. 分析的結果並不能讓企業進行行動。
而 Big Data 則有以下三點特徵:
1. 把新舊資料混合在一起,尤其是那些有結構性和非結構性的資料。
2. 可以即時或接近即時性分析。
3. 製造亮點以採取即時行動。
由此可見,兩者方案其實都是企業的資訊工廠,然而各有特殊不同的特點和觀點價值。大企業智能的創造及維持資訊記憶十分有用;而 Big Data 方案則引領企業徹底地進入另一營運模式及換來另一全新結果。
而第二個「真」「假」Big Data 工具在於,真 Big Data 能説明企業融合結構和非結構性資料、即時或接近即時性分析、以及分析出亮點;而假Big Data 並不能進行以上行為,所以企業必須小心分辨,以免浪費金錢。
Big Data能克服各種限制
資料湖(Data Lake)擁有大量最新資料,儲存在資料倉庫等待進行分析,不過這字眼其實是比較舊,以「湖」形容其實並不太準確,雖然資料很多很大,可以以「海量(巨量)」來形容,故此用「資料淹沒」會比較合適。
腐爛、發臭、骯髒和非常困難的發展作為一些有用分析,協助企業生產就是資料淹沒的意思。即使再進行資料解壓、轉化及讀取,有不少隱藏資料都已損毀而無法使用。
相反地,好的 Big Data 工具容許資料受到分析、生產、儲存及管理,不論在甚麼地方都可以,包括任何 Mobile 裝置、社媒、雲端等。事實上,資料能夠穿越地域限制,即使在小小空位也能隨意運用。如果需要時間移動、轉化、清洗和讀取,那麼這樣的 Big Data 就失去了它存在價值。
Big Data 運行時,資料必須夠快和準確,同時也要容許使用者在過百或過千的資料中運作,即使在訊號微弱時也能夠做得完美,而不是受資料淹沒而無力進行分析,這樣才是 Big Data 最大價值。
甚麼都與大數據有關?小心提防廠商借 Big Data 騙財
https://www.facebook.com/hkitblog