「ビッグデータ」とは、文字どおり巨大なデータを意味し、様々なソースから得られる大量の構造化データおよび非構造化データを指します。
「ビッグデータ」は、10年ほど前から注目されるようになったテクノロジーで、企業に蓄積された大量のデータは、統合、分析され有効活用されています。
一般的にビッグデータには以下のような特徴があります。
上記3つの特徴は、ビッグデータを定義する「3つのV」と呼ばれていましたが、データの収集及び保管にかかるコストが低下するにつれ、正確性(Veracity)という「4つ目のV」が追加されました。収集したデータの正確性も重視されるようになり、非現実的なデータや異常値は除外され、正確な分析結果を得ることができるようになりました。