日本の統計の中核機関

  • ご意見・お問合せ
  • サイトマップ
  • 文字サイズ等の変更
  • English

ホーム > インフォメーション > 広報資料 > 統計Today 一覧 > 統計Today No.112

ここから本文です。

統計Today No.112

統計におけるオープンデータの推進
〜福井県との連携事業の成果〜

総務省統計局統計情報システム課長  柿原  謙一郎


統計におけるオープンデータとは

 皆さんは、「オープンデータ」という言葉を聞いたことがありますか。
 「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」であり「人手を多く掛けずにデータの二次利用を可能とするもの」という定義があるのですが、要するに、ソフトウェアによるデータ取得や加工、他のデータと組み合わせた分析などが、それほど手間を掛けずに利用できる形式で公開されているデータのことです。
 オープンデータの代表的なものとして、総務省統計局を始めとした政府機関が、政府統計の総合窓口(e-Stat)において公表している統計データがあります。このほか、インターネットには、民間団体も含めて様々な機関が公表している統計データが、PDFやExcelといった様々な形式で掲載されています。 一方で、統計データを加工し、それを基に分析をしようとしても、必要となるデータを探すために、あるいは編集可能なデータ形式に変換するためなどに、多くの時間と手間が掛かる場合があります。

図1 データ利用の現状及びLODの活用

データ利用の現状及びLODの活用(イメージ図)


 このような(前掲図1)問題を解決するデータ形式として、「LODLinked Open Data)」(※1)があります。総務省統計局では、平成27年度に、福井県及び独立行政法人統計センター等と連携し、LOD形式の統計データを提供する「オープンデータモデル事業」 (※2)を実施しました。
 このモデル事業の成果として、国勢調査や経済センサスなど7統計の一部の統計データについてLOD形式の統計データ【統計LOD】を作成し、平成28年6月30日からe-Statで提供を開始しました。

  (※1)データ構成を統一し、データを表す情報と同じ意味を表す情報のリンクを付与したデータ

  (※2)事業の実施については、統計Today No.95を参照


統計LODの公開レベルは最高ランク

 統計LODは、オープンデータの公開レベルの最高ランク(図2)であるLOD形式での統計データを提供しています。

図2 オープンデータの公開レベル

オープンデータ公開レベルのイメージ図表。レベル1はデータ形式がPDF、JPGで編集不可。レベル2はデータ形式がXLS、DOCで編集可能。レベル3はデータ形式がXML、CSVで編集及び機械判読可能。レベル4はデータ形式がRDFで機械判読可能。レベル5はデータ形式がLinked-RDFで機械判読可能。


統計LODの情報量は世界トップレベル

 6月30日から公開されている統計LODの情報量(※3、図3)は約3億個と、世界の各機関で提供している情報量(※4)と比較しても、トップレベルの量となっています。

  (※3)情報量とは、一つのセルの中の数値とそのセルに関する情報の合計の数を示します。

  (※4)イタリア国家統計局:約4千万個
   アイルランド統計局:約2千万個
   EURO STAT:約80万個


図3 統計LODのイメージ

統計LODのイメージ


今後の展開

 統計LODは、データの属性情報が明確になることに加え、同一又は関連したデータの所在が示されることから、データの検索や比較が容易になります。また、データ形式も同一のため、データ取得後の処理が短時間・的確に実現できます。
 今後は、統計LODの利用者から御意見を伺い、課題等を整理・検討した上で、統計LODの充実や利用ガイドの提供等を行う予定です(※5)
 こうした取組がオープンデータの利活用を促進し、新ビジネスの創出、公共サービスの向上や地方への企業進出など、地域の活性化につながるものと期待しています(※6)

  (※5)平成28年7月7日時点での統計LODのページビュー 約8,300

  (※6)福井県が担当している事業の成果については福井県オープンデータライブラリを参照
   http://www.pref.fukui.lg.jp/doc/toukei-jouhou/opendata/modeljissi.html別ウィンドウで開きます。


(平成28年7月25日)


バック ホーム

ページの先頭へ戻る