本県には多くの空き家が存在しており、空き家の調査に手間と費用が掛かっていました。空き家と思われる建物に対して実地調査を行いますが、調査対象には居住実態がある建物も多く含まれ、事前の対象の絞り込みに課題がありました。
また、調査結果は定期的に更新する必要がありますが、調査にかかる手間や費用から、結果を何年も更新していない自治体も多いのが現状です。
ここから本文です。
和歌山県における空き家分布の推定
和歌山県 企画部企画政策局企画総務課 データ利活用推進班(データ利活用推進センター)
和歌山県 特別賞 人口問題 公共インフラ・まちづくり 行政運営 公的統計データ 行政データ 2022
概要
本県には多くの空き家が存在しており、空き家の調査に手間と費用が掛かっています。こうした手間と費用を軽減し、効率的に調査を行うため、和歌山市が保有する行政データと国が保有するミクロデータを活用した機械学習モデルを構築し、空き家の分布を推定する取り組みを行っています。
また、他の自治体でも同様に行えるよう、推定手法のマニュアル化や簡単な操作のみで推定ができるツールについても作成を行っています。
導入費・運用費
導入費 約2,600万円(平成30年度〜令和4年度)
運用費 ―
受賞
- 「第7回 地方公共団体における統計データ利活用表彰 特別賞」(2022)
取組の流れ
-
空き家調査の際の調査対象の事前把握や結果の更新に課題
-
行政データを活用し機械学習による推定モデルの構築を計画
-
県下の自治体と調整し行政データの提供を受ける
-
利用可能なデータに応じて二つの推定モデルを構築
-
高精度で空き家を予測し実地調査のコスト軽減へ
ヒアリング・ここが知りたい!
どのような課題がありましたか?
空き家調査の際の調査対象の事前把握や結果の更新に課題
エビデンス(データ)収集のために、どのような計画を立てましたか?
行政データを活用し機械学習による推定モデルの構築を計画
市町村は、建物やそこに住む住人に関する行政データ(住民基本台帳、建物登記情報、水道情報等)を保有しています。これらの行政データと空き家調査の結果を組み合わせ、そこから機械学習による空き家分布推定モデルを構築すれば、高い精度で空き家かどうか判定できるようになると考えました。
また、データの取得や機械学習モデルの構築にあたり、和歌山市、東京大学、総務省統計局・独立行政法人統計センターと連携しました。
データの収集はどのように行いましたか?
県下の自治体と調整し行政データの提供を受ける
行政データを保有している市町村と調整し、必要に応じて関係市町村の個人情報保護審議会で事業等の概要説明を行うなどして、必要な行政データの提供を受けました。
国勢調査及び住宅・土地統計調査については、総務省統計局・独立行政法人統計センターへミクロデータの利用申請を行い、提供を受けました。
(活用した統計データ:国勢調査、住宅・土地統計調査、住民基本台帳、水道情報、建物登記情報、空き家調査結果)
どのような分析を行いましたか?
利用可能なデータに応じて二つの空き家分布推定モデルを構築
空き家分布推定モデルを構築するにあたっては、サンプルデータを使用した試験的分析を行い、必要な行政データ(住民基本台帳、建物登記情報、水道情報)を精査しました。得られた行政データと過去の空き家調査結果をジオコーディング(地理座標を付与すること)により統合し、機械学習させることで推定モデルを構築しました。
また、行政データを利用することができない場合に向けて、空き家調査結果、国勢調査及び住宅・土地統計調査のミクロデータを使用した推定モデルを構築しました。
(活用したツール等: EXCEL等の表計算ソフト、ArcGIS 、QGIS、R、Python等 の分析ソフト )
(分析手法:XGBoost)


結果としてどのような政策に結びつきましたか?
高精度で空き家を予測し実地調査のコスト軽減へ
行政データを用いたモデルでは、建物ごとに空き家リスクを判定し、90%以上の適合率*1、60%以上の再現率*2で予測することに成功しました。
国勢調査を用いたモデルでは、調査区ごとの空き家割合を高精度に予測することができました。
これらのモデルを使用することで、空き家調査の対象を事前に高い精度で絞り込むことができ、実地調査の手間と費用を削減できると考えています。


データ利活用(収集や分析)において工夫した点や難しかった点について教えてください。
異なるデータを統合するための準備が鍵
異なるデータを統合するための前処理が難しい部分でした。例えば、ある自治体のデータの前処理では、ジオコーディングのために住所と緯度経度を結びつけるデータベースの整備や住所の表記揺れの修正が必要でした。特に行政データは自治体によってデータレイアウトや使用できる変数が異なるため、前処理のマニュアル化が難しく、個々に対応する必要があります。
その政策によって、どのような効果が現れましたか?
また、今後どのような改善点や展望をお考えでしょうか?
推定モデルに関するマニュアルやツールの提供、他事業への活用も
構築した空き家分布推定モデルを様々な人や自治体が活用できるように、空き家分布の推定手法のマニュアルや、簡単な操作で推定結果を出力できるツールの作成を予定しています。
また、空き家調査の効率化に加えて、地域政策や都市計画等様々な施策における活用が見込まれることから、庁内関係課等と調整しているところです。
脚注
*1 適合率:
二値分類の予測において、推定モデルが「真」と予測したもののうち、実際に「真」だったものの割合。ここでは、構築した推定モデルが「空き家」と予測した建物のうち、実際に「空き家」だった建物の割合で、予測の正解率を表している。
*2 再現率:
二値分類の予測において、実際に「真」であるもののうち、推定モデルが「真」であると予測したものの割合。ここでは、実際の「空き家」のうち、構築した推定モデルが「空き家」と予測した建物の割合で、現地調査の結果をどの程度カバーできているのかを表している。