分析データの大掃除は定期的に行おう

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

分析データを整理して、気持ちよく新年を迎えましょう

様々な分析を行っていると分析データやBIツールデータ、レポートなど様々な分析データが作られます。分析業務を行っているときは、忙しさにかまけて、ついついデータ整理を後回しになってしまい、気付いたらドキュメントフォルダやデスクトップがごちゃごちゃになっていませんか?

分析データは知らないうちに溜まる

データ分析業務では、仮説を立て、そこから様々な視点から分析、検証を行います。視点が多さに比例して、分析結果やレポートも多くなります。つまり1つの仮説検証には、そのボリュームに見合った分析データが生まれることになります。また、データ分析業務では、定期的に報告や打合せを行い、分析を進めます。そこで配布するレポートの元となる分析データは、そのレポート毎に作成されることが多いです。そのため、報告や打合せの度に分析データが増えることになります。
この様な状況で分析業務を行っていると、数か月で分析結果を登録しているファイルサーバーやDBはごちゃごちゃになり、使途不明ファイルや重複ファイルが存在する事態になります。

分析データの管理が煩雑だと困ることも多い

分析データの管理が煩雑だと、必要な時に必要なファイルが見つからないことも勿論ですが、一番、怖いのが分析結果のデグレードです。最新の分析データと信じていたデータが最新でなく、それを知らずに間違ったデータで分析してしまったら、もちろん正しい分析結果にはなりません。
また、個人情報などの機密情報が入った分析データを扱っている場合は、様々な場所にファイルを置いていると、それだけ情報漏えいの危険性が高まります。このような取り扱いが難しいデータは、限定された場所で、限定された分析者のみがアクセスできる場所に保存する必要があります。

日ごろから分析データ管理はしっかりしよう

分析業務が落ち着いたタイミングで分析データの整理をすることも重要ですが、その前にフォルダ構成やファイルのネーミングルールを決めて、できるだけ分析データがごちゃごちゃになるのを防ぐことが重要です。
なお、弊社(ギックス)では、分析プロジェクト開始時にアクセス権の設定できるフォルダをファイルサーバーに作成し、そこに下記のようなフォルダ作成してからプロジェクトスタートしています。

  • 提案資料
  • 受領資料
  • DB資料
  • プログラム
  • レポート
  • 会議資料
  • 納品資料
  • その他
SERVICE