目的:自治体業務データの学術利用基盤整備と経済分析への活用
- 全国の自治体と連携し、法学者・情報工学者の参画も得て、個人情報を保護しつつ多くの社会科学研究者が全国の行政業務データを容易に学術利用できる仕組みを確立する
- これら税や福祉に関するデータを基に、所得リスク・格差、雇用・社会保障などの分野における実証分析を行い、社会的に望ましい政策についてインプリケーションを得る
自治体が持つ税・福祉・教育に関する詳細かつ正確な個人単位のデータは、経済学・社会学・行政学・教育学など社会科学の幅広い分野の発展の基盤となりうるが、これまで個人情報保護の観点等から活用が進んでこなかった。行政業務データの活用により既存のサーベイデータではできなかった分析が可能となり、実証社会科学全体の活性化に資する。
行政記録情報である業務データの有用性と活用の遅れ
これまでの日本では、本領域計画がカバーする社会科学の実証分析に用いられるデータは、母集団から抽出された世帯を対象に実施されるサーベイ調査に基づくものが中心であった。しかし、行政記録情報である業務データは政府統計を含むサーベイ調査で得られる情報に比べて優れた点が多い。
しかし、これまで日本では業務データの学術利用が進んできたとはいいがたい。これは、行政記録情報には機微な個人情報が記録されているため、本来の業務目的以外に用いられると個人のプライバシーが侵害されるリスクが大きく、そこを乗り越える技術的な解決法がなかなか共有・実践されてこなかったためである。
こうした遅れも一因となって、日本は国際的な数量的・実証的社会科学の研究水準から劣後することになった。本研究領域はこの厳しい現状認識に基づき、業務データの学術利用を促進し、日本の研究水準を、欧米並みまで引き上げることを目標にする。
領域マネジメント体制
本領域は、データ整備を担う学術利用基盤整備班(A04)と、そのデータを用いて経済分析を行う他の研究班(A01~03)からなるが、学術利用基盤整備班(A04)が一方的にデータを提供するのではなく、各研究班が研究上のニーズを整備班や参加自治体に伝えて学術研究に活用しやすい形のデータ整備を推進することが研究領域全体の今後の発展の鍵となる。
参加自治体は、学術利用基盤整備班(A04)と共同で匿名化処理やデータベース間の接合などの処理を行う。こうして提供されたデータを用い他の研究班(A01~03)は分析を行う。また、例えば雇用・社会保障班(A02)で推計した労働供給の弾力性を所得リスク・格差班(A01)や税理論・実験班(A03)がモデル構築のための基礎パラメータとして利用する等、各班の研究成果を他班の研究のための資料として用いることもある。また、税理論・実験班(A03)は希望する自治体と協力して税徴収施策に関するランダム化比較実験(RCT)を実施する。
なお、自治体から税務データの提供を受け学術利用に活用するとともに自治体へ政策上有用な情報をフィードバックする仕組みは、東京大学政策評価研究教育センターの「EBPM推進のための自治体税務データ活用プロジェクト」の枠組みを拡張したものであり、当プロジェクトは本領域研究の一部として存続する。また、雇用・社会保障班を中心に、独立行政法人経済産業研究所のプロジェクト「子育て世代や子供をめぐる諸制度や外的環境要因の影響評価」とも、匿名化処理済データを活用した研究成果の発信で連携していく。
研究領域の波及効果と発展可能性
各研究班それぞれの分野における学術的貢献が見込まれるほか、将来的には自治体が持つもう一つの業務データである教育関係のデータとの接続も視野に入れている。これにより、さらに幅広い問いを検証できる可能性が拡がる。
本研究で進める業務データの整備は、より多くの研究者に使われてこそ、学術的価値が増す。様々な匿名化を施しできる限りデータを多くの研究者にアクセス可能なものとすることを計画している。また、将来的には、匿名化されたデータだけでは十分な研究ができないテーマについての研究を志す研究者には公募研究を通じて研究に参加してもらえるような体制を構築していきたい。