オープンデータとは? ~データ分析の幅を広げる脇役~|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

分析データにオープンデータを加えることで分析の深掘りができる

世の中には様々なデータあり、日々の店舗売上データやホームページのアクセスログのような企業や団体が所有するデータがあります。これらのデータは、一般の人が入手して利用することはできません。しかし、「オープンデータ」は、誰でも入手をして、自由に利用することができます。今回は「オープンデータ」の活用法までご紹介したいと思います。

オープンデータとは

オープンデータについて、Wikipediaの内容を転記します。

オープンデータ(Open Data)とは、特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるというアイデアである。
引用:Wikipedia | オープンデータ

オープンデータは、企業や団体、政府、自治体などが作成し、インターネット中心にデータ配布しています。データファイル形式もCSVなどの誰でも閲覧・加工しやすいデータが主流になっています。オープンデータを公開する目的として、企業や団体はサービス向上やPR活動、グローバルスタンダード化などを目的にし、政府や自治体は経済の発展などを目的にしています。

オープンデータの活用

オープンデータは、それ単体でも過去の状況を確認したり、郵便番号から住所を検索するなどの活用方法はあります。(参考:郵便番号情報を取得|オープンデータを活用しよう) しかし、オープンデータは、オープンデータ単体ではなく、店舗売上データなどと組み合わせることで、今まで見つけられなかったデータ変化の因果関係などを発見することができます。

気象情報を使った例

気象情報は気象庁のホームページから入手できます。気象情報には都市ごとの気温、降水量などが含まれ、最古で1872年(一部地域)からの情報を取得できます。例えば、日々の店舗売上データと気象情報を日時で紐付けた場合、雨や気温の変化による商品の売れ筋の分析などが行えます。(参考:過去の気象情報を入手|オープンデータを活用しよう
 
jma1

政府統計情報を使った例

政府統計情報は、総務省から公開されている情報です。複数の入手先ホームページが存在しますが、政府統計の総合窓口(e-Stat)、またはデータカタログサイトで大概の情報は収集できると思います。これらの政府統計情報は、国勢調査などを元に作成されているため5年に1度更新されるなど更新頻度が遅い情報もあります。(参考:政府統計情報をe-Statから取得 / 政府統計情報をデータカタログサイトから取得|オープンデータを活用しよう)
政府統計情報には、各地の世代人口、世帯構成、土地の利用状況など様々な情報があります。これらの情報を活用して、新規店舗の出店計画や、若い世代が多い地域店舗に若い人の向けの商品を多く販売するなどの販売予測などに使えます。e-stat2

オープンデータを活用するためには粒度を合わせる事が重要

世の中には、様々なオープンデータが存在し、CSVデータファイルなどで配布しています。しかし、これらのデータは、直ぐに売上履歴などの業務データに紐づけることができない場合があります。その場合は主要となる分析データに合わせて、オープンデータの粒度を変える必要があります。例えば、店舗売上データと地域に関係する政府統計情報を紐付ける場合、店舗に合わせてオープンデータの地域範囲の粒度を変更する必要があります。

連載/関連記事リスト:オープンデータ活用
データ分析用語:索引
SERVICE