なるほど統計学園高等部 > 豆知識 > ビッグデータとは?
ビッグデータとは?

ビッグデータとは?

 

 最近、世間では統計学がちょっとしたブームとなっています。書店に行けば、データ分析や統計学に関する書籍が多数出版されています。このデータ分析に関連して、「ビッグデータ」という言葉が雑誌やメディアなどで取り上げられることも多くなっています。
 ビッグデータとは、一般的には「3つのV」で、その特徴を説明されることが多く、具体的には、「Volume(多量性)」、「Variety(多様性)」、「Velocity(流動性)」の特徴を持ったデータのことを指します。多量性はデータの総量、多様性はデータの種類、流動性はデータが生成されるスピードを示しています。

 近年、スマートフォンやタブレット、SNS(※1)などのソーシャル・メディア、M2M通信(※2)の普及に伴い、世界中で生成・蓄積されているデータ量は急増しています。また、扱われるデータの種類は、従来からの販売や在庫などに関する数値や文字列のデータ(構造化データ)のみならず、ツイッターなどの代表されるテキストデータ、センサーやカメラから得られる位置情報やセンサーデータ、音声、動画、クリックストリーム(※3)などのデータ(非構造化データ)が増加しており、ビッグデータの8割を非構造化データ(※4)が占めていると言われています。

(※1)
Social Networking Service(ソーシャル・ネットワーキング・サービス)の略。
(※2)
Machine to Machine通信の略。人間を介在せず、ネットワークを通じて機器同士が情報交換を行う通信方法。
(※3)
ウェブサイト内で訪問者がどのページを歩き回ったのかを示す履歴。
(※4)
定型フォーマットで記録される構造化データとは異なり、非構造化データは、音声や動画、テキストデータなど構成する要素が多様で、容易に分類化・体系化しづらいデータを指します。









図 ビッグデータを構成するデータ(例示)

ビッグデータを構成するデータ(例示)

(出典)総務省情報通信審議会ICT基本戦略ボード「ビッグデータの活用に関するアドホックグループ」資料

 これまで、大量のデータの収集・分析などは、時間と費用の面で限界がありました。しかし、ICT(情報通信技術)の進歩によって、非構造化データのデータベース管理システムの実用化、大量のデータの分散・リアルタイム処理手法の普及などが進むことで、大量で多種多用なデータの生成・収集・分析が可能となりました。これに伴い、様々な業界でビッグデータを活用し、新たなビジネスを創り出そうとする流れが生まれています。

≪ビッグデータの活用例はこちら≫

 また、最近では、ビッグデータは企業における活用だけでなく、震災や環境問題などの社会問題の解決にも活用できるのではないかという期待が高まっています。
 2011年に発生した東日本大震災では、当時記録された携帯電話やカーナビの位置情報、ツイッターなどの震災に関する膨大な電子データ(いわゆる"震災ビッグデータ")が残されており、これらを活用することで、震災の全貌を明らかにしようとする動きがあります。
 震災ビッグデータの解析によって、地震発生後の人々の避難行動(※5)、被災地における復興の遅れや帰宅困難者を生んだ首都圏での混乱の要因が明らかになるなど、産官学が連携し震災ビッグデータを防災などに活かす取り組みが進められています。

(※5)
震災ビッグデータによって、地震発生後に一旦避難した被災者が再び家族や知り合いを心配して浸水地域に戻り、命を落としたことなどが明らかになりました。



ビッグデータの活用例

小売

 レコメンド行動ターゲッティング広告顧客離反分析

交通

 渋滞予測テレマティクスサービス

農業

 農業ICT

製造

 故障予測、異常検出

金融

 不正検出株式市場の予測

健康・医療

 最適治療(電子カルテ等活用)、風邪の流行予測

セキュリティ

 不審者監視サービス


小売/レコメンド

 利用者の属性や行動・購買履歴データを基に、最適な商品を推奨する手法。
 参考:意外なところに統計学「レコメンド機能」へ

▲ 活用例のトップへ

小売/行動ターゲティング広告

 ウェブサイトの閲覧履歴やECサイト(商品やサービスをウェブサイト上で販売するサイト)上での購買分析などを蓄積し、利用者の趣味・嗜好を分析した上で、利用者ごとにインターネット広告を出し分けるサービス。

▲ 活用例のトップへ

小売/顧客離反分析

 携帯電話会社や通販会社、保険会社、レンタルDVD会社など、契約による会員制で商品やサービスを提供する会社では、過去の顧客データや退会データに基づき、サービスを退会しそうな顧客(離反)を予測。

▲ 活用例のトップへ

交通/渋滞予測

 実際に自動車が走行した位置や車速などの情報から、道路の渋滞情報などの道路交通情報を提供。

▲ 活用例のトップへ

交通/テレマティクスサービス

 通信機器やGPS機能を備えた車載機を車両に搭載し、走行距離や走行時間、運行速度、位置情報などの運行状況をリアルタイムに取集・分析することで、車両管理や安全運転支援、エコドライブなどのサービスを提供。

▲ 活用例のトップへ

農業/農業ICT

 ビニールハウス内に設置したセンサーがM2M通信機器を通じて、温度や湿度、日照時間、二酸化炭素など作物の育成環境のデータをモニタリング。農家はスマートフォンやタブレット端末でデータを随時参照して、作物の品質確保と生産業務の効率化に活用。

▲ 活用例のトップへ

製造/故障予測

 コピー機や複合機などのハードウェア機器に取り付けられた各種センサーから、紙詰まりなどのエラー情報や機器の利用履歴、消耗品の劣化状態などのデータを取集・分析することで、故障などのトラブルの予兆を検出。

▲ 活用例のトップへ

金融/不正検出

 クレジットカードの膨大な利用履歴データを分析することで得られる、顧客ごとに不正利用を示唆するパターンから、オンラインでの不正モニタリングなどの可否判定を行う。

▲ 活用例のトップへ

金融/株式市場の予測

 ツイッター上のツイートを解析することで、市場の動向を予測。

▲ 活用例のトップへ

健康・医療/風邪の流行予測

 ツイッター上の風邪に関するツイートを検出し、風邪をひいている可能性が高いユーザーを集計。そして、風邪に関するツイートの増減と気温や湿度などの気象データとの関連性を分析することで、週間天気予報と組み合わせて風邪の流行を予測。

▲ 活用例のトップへ

セキュリティ/不審者監視サービス

 カメラ映像からリアルタイムに人物の顔を検出し、その特徴を自動的にデータベースに登録することで、不審者を検索するサービス。不審者が特定エリアに入ったときから監視を開始し、事案発生前に検知・事前警告などによる防犯措置を行う。また、過去の映像や画像ファイルからの不審者の絞り込みや分析・検索も可能。

▲ 活用例のトップへ

参考

  • ・ビッグデータの衝撃 巨大なデータが戦略を決める、城田真琴、東洋経済新報社
  • ・平成24年度版情報通信白書、総務省
  • ・businessnetwork.jp ウェブサイト、ビッグデータビジネスを立ち上げるには?
  • ・NECウェブサイト、不審者監視セキュリティーソリューション
  • ・NHKスペシャル 〜震災ビッグデータ〜
▲ ページのトップへ

Copyright © 2013 総務省 統計局 All rights reserved.

〒162-8668 東京都新宿区若松町19-1 TEL 03-5273-2020(代)