最近、世間では統計学がちょっとしたブームとなっています。書店に行けば、データ分析や統計学に関する書籍が多数出版されています。このデータ分析に関連して、「ビッグデータ」という言葉が雑誌やメディアなどで取り上げられることも多くなっています。
ビッグデータとは、一般的には「3つのV」で、その特徴を説明されることが多く、具体的には、「Volume(多量性)」、「Variety(多様性)」、「Velocity(流動性)」の特徴を持ったデータのことを指します。多量性はデータの総量、多様性はデータの種類、流動性はデータが生成されるスピードを示しています。
近年、スマートフォンやタブレット、SNS(※1)などのソーシャル・メディア、M2M通信(※2)の普及に伴い、世界中で生成・蓄積されているデータ量は急増しています。また、扱われるデータの種類は、従来からの販売や在庫などに関する数値や文字列のデータ(構造化データ)のみならず、ツイッターなどの代表されるテキストデータ、センサーやカメラから得られる位置情報やセンサーデータ、音声、動画、クリックストリーム(※3)などのデータ(非構造化データ)が増加しており、ビッグデータの8割を非構造化データ(※4)が占めていると言われています。
図 ビッグデータを構成するデータ(例示)
(出典)総務省情報通信審議会ICT基本戦略ボード「ビッグデータの活用に関するアドホックグループ」資料
これまで、大量のデータの収集・分析などは、時間と費用の面で限界がありました。しかし、ICT(情報通信技術)の進歩によって、非構造化データのデータベース管理システムの実用化、大量のデータの分散・リアルタイム処理手法の普及などが進むことで、大量で多種多用なデータの生成・収集・分析が可能となりました。これに伴い、様々な業界でビッグデータを活用し、新たなビジネスを創り出そうとする流れが生まれています。
また、最近では、ビッグデータは企業における活用だけでなく、震災や環境問題などの社会問題の解決にも活用できるのではないかという期待が高まっています。
2011年に発生した東日本大震災では、当時記録された携帯電話やカーナビの位置情報、ツイッターなどの震災に関する膨大な電子データ(いわゆる"震災ビッグデータ")が残されており、これらを活用することで、震災の全貌を明らかにしようとする動きがあります。
震災ビッグデータの解析によって、地震発生後の人々の避難行動(※5)、被災地における復興の遅れや帰宅困難者を生んだ首都圏での混乱の要因が明らかになるなど、産官学が連携し震災ビッグデータを防災などに活かす取り組みが進められています。
故障予測、異常検出
最適治療(電子カルテ等活用)、風邪の流行予測
利用者の属性や行動・購買履歴データを基に、最適な商品を推奨する手法。
参考:意外なところに統計学「レコメンド機能」へ
ウェブサイトの閲覧履歴やECサイト(商品やサービスをウェブサイト上で販売するサイト)上での購買分析などを蓄積し、利用者の趣味・嗜好を分析した上で、利用者ごとにインターネット広告を出し分けるサービス。
▲ 活用例のトップへ携帯電話会社や通販会社、保険会社、レンタルDVD会社など、契約による会員制で商品やサービスを提供する会社では、過去の顧客データや退会データに基づき、サービスを退会しそうな顧客(離反)を予測。
▲ 活用例のトップへ実際に自動車が走行した位置や車速などの情報から、道路の渋滞情報などの道路交通情報を提供。
▲ 活用例のトップへ通信機器やGPS機能を備えた車載機を車両に搭載し、走行距離や走行時間、運行速度、位置情報などの運行状況をリアルタイムに取集・分析することで、車両管理や安全運転支援、エコドライブなどのサービスを提供。
▲ 活用例のトップへビニールハウス内に設置したセンサーがM2M通信機器を通じて、温度や湿度、日照時間、二酸化炭素など作物の育成環境のデータをモニタリング。農家はスマートフォンやタブレット端末でデータを随時参照して、作物の品質確保と生産業務の効率化に活用。
▲ 活用例のトップへコピー機や複合機などのハードウェア機器に取り付けられた各種センサーから、紙詰まりなどのエラー情報や機器の利用履歴、消耗品の劣化状態などのデータを取集・分析することで、故障などのトラブルの予兆を検出。
▲ 活用例のトップへクレジットカードの膨大な利用履歴データを分析することで得られる、顧客ごとに不正利用を示唆するパターンから、オンラインでの不正モニタリングなどの可否判定を行う。
▲ 活用例のトップへツイッター上のツイートを解析することで、市場の動向を予測。
▲ 活用例のトップへツイッター上の風邪に関するツイートを検出し、風邪をひいている可能性が高いユーザーを集計。そして、風邪に関するツイートの増減と気温や湿度などの気象データとの関連性を分析することで、週間天気予報と組み合わせて風邪の流行を予測。
▲ 活用例のトップへカメラ映像からリアルタイムに人物の顔を検出し、その特徴を自動的にデータベースに登録することで、不審者を検索するサービス。不審者が特定エリアに入ったときから監視を開始し、事案発生前に検知・事前警告などによる防犯措置を行う。また、過去の映像や画像ファイルからの不審者の絞り込みや分析・検索も可能。
▲ 活用例のトップへCopyright ? 2013 総務省 統計局 All rights reserved.
〒162-8668 東京都新宿区若松町19-1 TEL 03-5273-2020(代)