政府統計情報をデータカタログサイトから取得|オープンデータを活用しよう(第3回)

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

政府統計情報をデータカタログサイトから取得する

前回、政府統計の総合窓口(e-Stat)から人口などの政府統計情報をダウンロードしましたが、今回は、データカタログサイトから政府統計情報をダウンロードする方法を記載します。

データカタログサイトとは

データカタログサイトは日本の各府省が公表する統計データを一つにまとめたポータルサイトです。データカタログサイトのページから情報を自由に取得できます。取得できるデータの形式は、CSVファイル、Excelファイル、PDFファイル、HTMLなど様々あります。データ分析を行う場合、データの取得形式は、CSVファイルの方が、取り扱いやすいと思います。

データカタログサイトとe-Statの違い

管理している機関が違う

データカタログサイトは、内閣官房情報通信技術(IT)総合戦略室による企画・立案の下、総務省行政管理局が運用するオープンデータに係る情報ポータルサイトです。政府統計の総合窓口(e-Stat)は、府省等の参画のもと、総務省統計局が中心となり開発を行い、独立行政法人統計センターが運用管理するオープンデータに関するポータルサイトです。このように、運営する機関がが異なります。

取扱っているデータ種類が違う

データカタログサイトとe-Statで同様の統計データを多く持っています。2つのサイトで重複するデータを選んだ場合、データカタログサイトの統計データの取得元は、e-Statサイト内の統計データを指定している場合があります。また、データカタログサイトは、e-Statより多いデータ種類を取得できます。しかし、e-Statの方が、過去の情報の保有量は多いようです。

検索結果が名前になる

データカテゴリサイトは、e-Stat同様にキーワード検索機能とリンクでデータを絞り込む検索方法があります。リンクでデータを絞り込む検索方法の場合、データセット、組織、グループ、タグ、データフォーマットの5種類からデータの絞り込みを行います。その際、検索結果をして表示されるデータは、統計データの名前順になります。e-Statの場合、同一年の国勢調査などの、同一年の同一調査方法の関連する統計データが一覧で表示されないため、関係する複数の統計情報を取得するには、e-Statの方が向いていると思います。data_categore1

データカタログサイトとe-Statの使い分け

このようにデータカタログサイトは、統計データ種類は多いが、過去統計データや関連統計データの取得には不向きな部分があります。基本的な政府統計情報の取得先をe-Statにし、e-Statにない情報は、データカタログサイトから取得することをお勧めします。

【連載/関連記事リスト:オープンデータ活用
SERVICE