CONCEPT
データ活用診断
データ基盤構築
採用情報

「カタいデータ」と「やわらかいデータ」 ~定量か定性かだけでは語り切れないデータの種類~

AUTHOR :   ギックス

900
ギックス
「カタいデータ」と「やわらかいデータ」 ~定量か定性かだけでは語り切れないデータの種類~

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

「カタいデータ」を分析してから、「やわらかいデータ」に進もう

データ分析をする際に、まず考えるべきことが「データの種類」です。
POSデータ、人流データ、ログデータ、出荷データ、受注データ、ソーシャルメディアデータ・・・などなど、分析したくなるデータはたくさんありますが、それが「何者なのか」を考えることから始めましょう。

「カタいデータ」か、「やわらかいデータ」か。

データの種類を分類しよう、という話になると、最初に思いつくのが「定量」「定性」という切り口だと思います。
しかし、この切り口だけでは不十分です。では、何を考える必要があるのでしょう?

そのデータは「使えるのか、使えないのか」

それは、そのデータが、すぐに使える状態かどうか、です。具体的にいえば

  • そのデータは、手元にあるのか・無いのか
  • 手元に無い場合、簡単に手に入るのか・入らないのか
  • 手に入った、あるいは、手元にある場合に、加工が必要か、不要か
  • さらに、なんらかの「解釈」をせねばならないか、否か

というあたりです。
例えば、メーカーの場合、「小売店が実際にお客さんに販売したデータ=実売データ」を分析したくなると思います。しかし、そのデータは通常「手元にない」データです。手に入れるためには購入することになるでしょう(これを、”簡単”というかどうかは、各社の状況によると思います)。手に入った後に、どの程度加工が必要か、という話ですが、商品コードやカテゴリが、どういう形で、どの程度メンテされているかなどによって変わってくるでしょう。解釈の要否という観点では、カテゴリ情報がきちんと整理されていれば、解釈する範囲が限定されるでしょうね。
これらの条件において「手元にあるor簡単に入手できる」且つ「加工および解釈がほとんど必要ない」データは、【カタいデータ】と言ってよいでしょう。(もちろん、ここでいう「解釈」はデータの解釈の話であって、結果の解釈は、どんな分析をしたとしても必要ですよ)
そして、当然ながら「定量データ」の方が、「定性データよりも【カタいデータ】と言えます。(解釈が必要ないですからね)

分析は「カタいデータ」から始めよ

昨今、極めて柔らかいデータの分析である「ソーシャルリスニング」などが注目を集めています。しかし、そういう「やわらかいデータ」を扱う前に「ほんとうに、手元のカタいデータを、きちんと分析していますか?」という視点で、自社を眺めることを忘れてはいけません。(もちろん、並行して進める、ということを否定するわけではありませんが、これは優先順位の問題です。一般的に、リソースは有限です。)
【カタいデータ】から始めるのが鉄則です。そして、自社が【カタいデータ】をしっかりと活用できているかを見つめなおしましょう。

分析したいデータを整理するには「定量・定性」×「内部・外部」が便利

とはいえ、いきなり【カタさ】を判断するのは難しいです。まずは、簡単且つMECEなマップで情報を整理しましょう。オススメなのは、定番である「定量・定性」に「内部・外部」の視点を加えた2x2マトリックスで整理することです。
メーカーを例にとって書いてみましょう。
harddata_softdata
定量×内部データ(図の左上)が、【”極めて”カタいデータ】であることが分かります。まずは、この情報がしっかりと分析できているのかと自問してください。
その問いに、自信をもって「YES」と答えられる場合には、いきなり右下に行かずに、右上や左下を検討してみてください
大切なのは”徐々にやわらかい方へ進む”です。この流れを意識することで、少しずつ、しかし着実に、社内の分析力が高まると思いますよ。

SERVICE