「どこ」から「どんなデータ」を「どうやって」集め「どのように整理する」べきか。|データの集め方と整理の仕方(1)

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

データソースが「価値」の基本

graffeでは、“ビックデータ”の“分析”を日々行う中で、新たな示唆・視点を生み出しすことにより、クライアント企業に価値を提供し続けています。この”価値”を提供する源泉はデータであり、そのデータのハンドリングは非常に重要な業務の一つで、「どこから」「どんなデータを」「どうやって」集め、「どのように整理する」のかは、データの大小(正確には多少)に関わらず、しっかり考えなければなりません。
この分析の“土台”となる「データの集め方」と「データの整理の仕方」を間違うと、その後の全ての分析の価値を毀損する可能性が大きい為、毎回新しいプロジェクトが開始される前には慎重に議論しています。

なぜ、データの集め方が武器になるのか?

“ビックデータ”と一言で言っても、実は分析に必要な全てのデータを包含している訳ではありません。
例えば、クライアント企業からデータを提供される場合を考えてみましょう。POSデータやID-POSデータは頂けるでしょうが、店舗の情報や天候情報、セールの情報などが貰えないなどのデータが”結合された状態”ではご提供いただけないことが多いです。そのため、それらの情報を付加していくこと自体が価値となることも多いのです。
こういう状況下において、これらの情報を、「どこから」「どんなデータを」「どうやって」集めるかは重要な事項となりえるのです。
これは、なにも企業のシステムからデータを抜出し、専用のソフトウェアにデータを格納する、という“ビックデータ”だけに限った問題ではありません。
例えば、
「新たに販売するココナッツ果汁を利用した飲料の世界での市場規模を調べて」
「昨年1年間に起きた交通事故のデータを分析して」
「東南アジアの国に工場を建設したいのだが、ざっと各国の状況を知りたい」
というお願いを部下のAさんにお願いした結果、次のように言われたらどのように感じますか?
「インターネット掲示板で、よく知らない人の書き込みで、ココナッツ果汁の市場規模が30億円って書いてありました」(そのデータソースは信じていいのですか?)
「昨年1年間の交通事故が地図に纏めて載っているデータがありました」(そのデータを分析したいのだけど、画像データから手打ちでデータベースにするのですか?)
「図書館に行って、各国の情報誌からデータベースを作ります」(インターネットで取りまとめてあるのでは?)
さすがにここまで極端なことはないかもしれませんが、情報が入手しやすいからこそ、“ビックデータ”で無い“データ”であっても、「どこから」「どんなデータを」「どうやって」集めるかが、価値を生み出す基本となってくるわけです。
(つづく)

連載/関連記事リスト:データ収集とデータ整理
SERVICE