大數據分析

「大數據」也被稱作「巨量資料」,指透過各種來源取得的大量非結構化或結構化數據。

「大數據」主要概念來自於過去十年間被用來作為企業內部的資料分析、商業智慧及統計應用之統合。

 

大數據的特色

一般來說,大數據擁有以下特性:

  • 大量性(Volume):以過去的技術無法管理的資料量,資料量的單位可從 TB(terabyte,一兆位元組)到 PB(petabyte,千兆位元組)。
  • 即時性(Velocity):資料每分每秒都在更新,技術也能做到即時儲存、處理。
  • 多樣性(Variety):企業的銷售、庫存資料;網站的使用者動態、客服中心的通話紀錄;社交媒體上的文字影像等企業資料庫難以儲存的「非結構化資料」。

上面三種特性被稱作「3V」,在3V成為大數據主要定義後,隨著儲存資料的成本下降、取得成本也下降,大數據發展出第四個特性:真實性(Veracity),指除了資料量,也需要確認資料的真實性,過濾掉不真實的數據與異常數值之後,分析出來的結果才能達到準確預測的目的。

 

企業為什麼需要大數據分析?

對一般企業而言,有哪些資料屬於對企業有用的數據?