データは納品すると思って「整理」せよ!|データの集め方と整理の仕方(9)

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

お客様や上司に「納品」できるレベルで整理するとミスが減る

さて、前回までは、「どこから」「どんなデータを」「どうやって」に集めるかという話をしてきました。今回はいよいよ、データを「どのように整理する」のかについてお話しします。

あるべきデータの整理とは

一生懸命収集したデータを、きちんと正しい形で整理することは、データ分析を正確に行う上での基本になります。(データ分析の為に必要な、データをどのように構造化して整えるかは、「ミスプリベンション in 分析(4)データの構造を最初に考える」で詳細にお話しさせて頂きました。
その中でも、データを収集して、整理する上で必須の考え方の一つだけを、引用しつつ、復習しておきましょう。

“基本お作法:データテーブル(シート)の“作り”の原理原則に沿う)
データ分析ファイルのデータテーブル(Excelではシートと呼ばれるもの)の1つ1つにおいて、“作り”の原理原則に則った構造を構築することがミスプリベンションの基本となります。データ分析に当たって、タイトル行が一行であることや、データ以外の情報が入り込んでいないことは、そのファイルを元にした分析を行っていく上では至極当たり前はなく、と考えてください。表計算ソフトに馴染んでいる方は特に、様々な情報をデータシートに入れてしまいがちで、縦と横のデータ構造を無視しがちです。インプットであってもアウトプットであっても、基本はタイトル行が1行でデータがそのあとに続いている形を保持してください。“

後の祭りにならないために

なぜ、データの整理をしっかりやっておくことが重要であり、キチンとやっておかないとどういうことが起きるのかというと・・・。

  • 既に入手している情報をもう一度探す。(システム部署に同じお願いをもう一度して怒られる。顧客企業に同じお願いをして信頼を失う)
  • 上司が気になっている情報がすぐに見つけられないことで、データに弱い人間と思われる
  • データを引き継ぐ時には、もう一度一から綺麗に纏め直さなければならない

など、もっと言ってしまえば、プロジェクトの最終報告が終わって、さあ打ち上げの飲み会だ、有給休暇だとみんなで喜んでいるときに、データ収集のとりまとめを行わないとプロジェクトが終わらない(納品出来ない)為、一人寂しくプロジェクトルームで、数か月前に行ったデータ収集を取り纏めなければならない、、などということに陥らないために、次回お話しする内容をしっかりと理解し、データを収集するそばから、ちゃんとデータを整理しておく癖を身に着けましょう。
(次回へつづく)

連載/関連記事リスト:データ収集とデータ整理
SERVICE