データを「整理する」ことの重要性|データの集め方と整理の仕方(2)

AUTHOR :   ギックス

3.8k

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

データの”出所”・”定義”を記録しておかないと後で困る

前回記事において「どこから」「どんなデータを」「どうやって」集めるかが、価値を生み出す基本となるとお伝えしました。そうして集めたデータを「どのように整理する」のかを考えることも非常に重要です。

データの整理の仕方の大切さ

データというものは、極わずかな例外を除いて、必ず行方向(横方向)に項目軸があり、列方向(縦方向)に1件1件のデータが格納されていくという法則を元にしています。
(例えば、最近のExcelを例にとっても、横方向にはA列からXFD列(=16,384列)しか無いのに対して、縦方向は1行から1,048,576行まであります)
前回の事例で上げたココナッツ果汁の市場規模調査であれば、国名(地域名)、飲料の分類、販売数量、販売金額、成長率などが項目軸として並び、実際の行には、「アメリカ、スポーツドリンク、XXトン、XXドル、XX%」といった情報が書かれていく構造になっていなければなりません。(もちろん出所情報も必ずデータベースの中に記載することを忘れないで下さい)
このように調査結果データを“型”に沿ってしっかりと取り纏めておくことが全ての価値を生み出す源泉となるだけでなく、後々になって他人に引き継ぐ時や、しばらくたって自分自身が「これなんだっけ?」「どこからこの情報を持ってきたんだっけ?」「新しく手に入れた情報をどうやって足せばいいんだっけ?」といった際に、スムーズにデータにアクセスできるという効果もあります。
このように、「どこから」「どんなデータを」「どうやって」集め、「どのように整理する」のかという分析の“土台”作りは非常に重要です。本連載では、「データの集め方」と「整理の仕方」について基礎的な内容から実際のケーススタディを交えながら、全般的に重要なポイント・考え方をお伝えしていきたいと思います。
このデータの集め方と整理の仕方は重要ですが、簡単なポイントを押さえれば、誰でも身に着けることができるアナリティックスの基本ですので、次回からの本連載を読んで、身に着けていきましょう。
(次回に続く)

連載/関連記事リスト:データ収集とデータ整理
SERVICE