ここから本文です。
統計Today No.112
統計におけるオープンデータの推進
〜福井県との連携事業の成果〜
総務省統計局統計情報システム課長 柿原 謙一郎
統計におけるオープンデータとは
皆さんは、「オープンデータ」という言葉を聞いたことがありますか。
「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」であり「人手を多く掛けずにデータの二次利用を可能とするもの」という定義があるのですが、要するに、ソフトウェアによるデータ取得や加工、他のデータと組み合わせた分析などが、それほど手間を掛けずに利用できる形式で公開されているデータのことです。
オープンデータの代表的なものとして、総務省統計局を始めとした政府機関が、政府統計の総合窓口(e-Stat)において公表している統計データがあります。このほか、インターネットには、民間団体も含めて様々な機関が公表している統計データが、PDFやExcelといった様々な形式で掲載されています。 一方で、統計データを加工し、それを基に分析をしようとしても、必要となるデータを探すために、あるいは編集可能なデータ形式に変換するためなどに、多くの時間と手間が掛かる場合があります。
図1 データ利用の現状及びLODの活用
このような(前掲図1)問題を解決するデータ形式として、「LOD(Linked Open Data)」(※1)があります。総務省統計局では、平成27年度に、福井県及び独立行政法人統計センター等と連携し、LOD形式の統計データを提供する「オープンデータモデル事業」 (※2)を実施しました。
このモデル事業の成果として、国勢調査や経済センサスなど7統計の一部の統計データについてLOD形式の統計データ【統計LOD】を作成し、平成28年6月30日からe-Statで提供を開始しました。
(※1)データ構成を統一し、データを表す情報と同じ意味を表す情報のリンクを付与したデータ
(※2)事業の実施については、統計Today No.95を参照
統計LODの公開レベルは最高ランク
統計LODは、オープンデータの公開レベルの最高ランク(図2)であるLOD形式での統計データを提供しています。
図2 オープンデータの公開レベル
統計LODの情報量は世界トップレベル
6月30日から公開されている統計LODの情報量(※3、図3)は約3億個と、世界の各機関で提供している情報量(※4)と比較しても、トップレベルの量となっています。
(※3)情報量とは、一つのセルの中の数値とそのセルに関する情報の合計の数を示します。
(※4)イタリア国家統計局:約4千万個
アイルランド統計局:約2千万個
EURO STAT:約80万個
図3 統計LODのイメージ
今後の展開
統計LODは、データの属性情報が明確になることに加え、同一又は関連したデータの所在が示されることから、データの検索や比較が容易になります。また、データ形式も同一のため、データ取得後の処理が短時間・的確に実現できます。
今後は、統計LODの利用者から御意見を伺い、課題等を整理・検討した上で、統計LODの充実や利用ガイドの提供等を行う予定です(※5)。
こうした取組がオープンデータの利活用を促進し、新ビジネスの創出、公共サービスの向上や地方への企業進出など、地域の活性化につながるものと期待しています(※6)。
(※5)平成28年7月7日時点での統計LODのページビュー 約8,300
(※6)福井県が担当している事業の成果については福井県オープンデータライブラリを参照
http://www.pref.fukui.lg.jp/doc/toukei-jouhou/opendata/modeljissi.html
(平成28年7月25日)