CONCEPT
データ活用診断
データ基盤構築
採用情報

(2)「相関」と「比較」で事足りる|事業会社の新入社員が知るべき「データ分析」のお作法

AUTHOR :   ギックス

2.3k
ギックス
(2)「相関」と「比較」で事足りる|事業会社の新入社員が知るべき「データ分析」のお作法

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

関係性を読み解く+差を見極める だけで、大局観がつかめる

前回、「分析の前に、まずはビジネスを覚えることから始めよう」とお伝えしました。今回は、事業会社における新入社員の「分析」の基本思想についてご紹介します。

ビジネス上の意思決定のための材料として、データを捉えよ

事業会社における「分析」とは、ビジネス上の意思決定をするために行うものです。そのため”だけ”に限定するならば、多くの場合、以下の2つの考え方で事足ります。
それは、

  • 相関:一定のルールに基づく関係性があるか
  • 比較:複数のものを比べて、そこに差があるか

です。
この2つの考え方をマスターすれば、大局的に物事を俯瞰し、意思決定のための(最低限の)材料を手に入れることができます。

「相関」=”一定のルール”があるかどうか

なんらか2つの要素をもってきて、例えば「比例」「反比例」のような関係性にあるかをみることが多いです。例えば、来店客数が増えれば売上が増える、というのは”正の相関”ですね。あるいは、年齢が上がると体力が落ちます、というのは”負の相関”です。
実際の業務で使えそうな例を挙げると、

  • 広告接触回数が多い人は、購買する比率が高まるか?
  • 来店頻度が高い人は、購買回数が増えるのか?
  • レストランの滞在時間が長い人は、サイドメニューをオーダーするのか?

などのケースを考える際には、相関を考えることになります。
この考え方は、非常に便利です。極端な例ですがドットが3つしか打てなくても、一応引いてみる、とかもアリです。もちろん、これだけでは統計的には全く意味がありませんが、この3点がピシッと一直線上に並んでいると「ひょっとすると相関関係にあるのではないか?」という仮説が立ちます。仮説をもとに、アンケートなどを実施して分析対象となるデータを増やしていくというのも一つの手です。
ちなみに、この場合、最も大事なのは「二軸(縦と横)を何に設定するか」です。先ほどの例だと【広告接触回数 vs 購買金額】だと、なんとなくうまくいかない気がします。【来店頻度 vs 1回あたり購買金額】というのも厳しいように思います。(まぁ、最初のうちは、あんまり難しいことを考えずに、とにかくいろいろ試してみる、というのも悪くない選択です。)

「比較」=”差”があるかどうか

もう一つの大事な考え方が「比較する」です。これは、

  1. 自分の感覚(知識や経験)との差
  2. 他のグループとの差
  3. 相関における「近似曲線」からの”差”

の3つを覚えておけば、大抵のケースはカバーできます。
1つめの「自分の感覚(知識や経験)」との比較は、新入社員の皆さんにはなかなかハードルが高いと思います。しかしながら、「思ったより顧客の男女比率が男性に偏っているな」だとか、「接客していて、水曜日も忙しいのに、来店客数が他の曜日より少ないのは不思議だぞ」だとかいった”違和感”を感じることはできるはずです。これは、ビジネスにおけるデータ分析において、かなり重要な感覚ですので、日々の業務の中で継続的に鍛え上げていってください。(ただし、これらの感覚に、データによる裏付けがないと「勘・経験・嗅覚」という言われ方をされてしまいますので、常に、最新のデータで検証しつづけることを肝に銘じておいてください)
2つめの「他のグループ」との比較は、分析の基本のキです。A店とB店で売上の大きさを較べる。A店とB店で、商品別の売上構成比を較べる。などですね。まぁ、一般的には、2つだけだと「大小」しか分からないので、3つ以上で比べて、A店が突出して××だ、というように比べていくことになります。敢えて「他の”グループ”」という表現を使ったのは、必ずしもA店vsB店という比較だけではなく、「関東エリアの10店舗」vs「関西エリアの8店舗」を比べるようなケースも多いからです。顧客の場合が典型的で、1人1人を比べるよりも「30代男性」などのカタマリで比較することが多いです。そんななかで「関東エリアの他の9店舗に比べて、A店の売上におけるアルコールの占める割合が高い(=同一グループ内の平均値と”差”がある)」であるとか「20代女性だけが、突出して来店頻度が高い(=他グループと”差”がある)」であるとかいったことを検知していくことになります。
最後の3つめは、先ほど述べた「相関」を見たうえで行います。物事が相関するからと言って、すべてのデータがバッチリ相関する(Rスクウェア1.0)なんてことはまずありません。多少、その「相関を示すライン(近似曲線)」から外れるものがでてきます。先ほどの例で上げた【来店頻度が高い人は、購買回数が増える】という関係性がある=相関している場合にも、かならず「来店頻度が(相対的に)低いけれど、購買回数が(相対的に)多い」という人や、その逆で「来店頻度は高いけれど、まったく購買してくれない」という人もいるのが常です。このような「普通なら相関してるはずなのに、そこから外れている=”差”がある」という人たちは、どんな人なのだろう?という着眼点を持つことが、近似曲線と比較する、という考え方になります。
 
分析に際しては、まずは、この「相関」「比較」あたりを試してみると良いでしょう。
それでも、何から手を付けてよいのか迷ってしまった場合には、「2.他のグループとの比較」を前提にして、いくつかの属性でグループ分けをしてみましょう。そして、それらの中でなんらかの違いが無いかを見てみましょう。きっと、何か、面白い着眼点が見つかるはずです。
尚、この時のコツとして「時間軸」という切り口があることを頭の片隅に置いておいてください。A店とB店とC店を比べても何も面白い結果が出ず、関東エリアの10店平均とA店・B店などの個店を比べても何も面白い結果が出ないときに、例えば「曜日別でみる」と何か見えるかもしれませんよ。(この「曜日別」も、他の曜日と比べる・他の週の同じ曜日と比べる、などのバリエーションがありますよね。レッツトライです。)

「相関→因果」「差がある→その理由」は ”解釈”

然しながら、ここまでご紹介したのは、あくまでも「相関がありそうだ」「(特徴的な)差がありそうだ」というところまでです。いわゆるFindings(ファインディングス)という奴ですね。これを、なんらかの意味のあるものに”解釈”することが必要です。この解釈の結果が、いわゆるInsight(インサイト)という奴です。
特に、相関関係の場合は、因果関係があるのかどうか、ある場合には、その因果の方向はどうなっているのかを考えることになります。要は「年齢が上がって体力が落ちる」という相関関係は、「年齢が上がるから体力が衰える」のであって「体力が落ちたから年齢が上がる」わけではない、ということですね。これは、データからは見えてきません。自分自身の常識や業務知識を最大限に活用して”解釈”することが求められています。(関連記事:因果の方向性を考える
そして、先ほどの「比較」の3番目に挙げた「近似曲線との比較」は、この因果関係があるときに「因果から外れるとはどういうことか?」を考えることになります。これは、非常に面白いですよね?ワクワクしませんか?
とはいえ、この部分は、新入社員の皆さんは業務知識もまだまだ足りない状況だと思いますので、先輩や上司をつかまえて、分析結果をブツけて議論させてもらうのが良いと思います。議論そのものが業務知識の勉強になるのは勿論ですが、この際、業務知識不足をカバーできる武器として「データ(ファインディングス)はコチラが握っている」ことが非常に重要なポイントです。武器の無い状態で先輩や上司に戦いを挑むと一刀両断にされるリスクがあります。必ず、自分なりに面白いと思えるファインディングスを「相関」「比較」の観点で見つけ出した上で、最低限の「解釈しようという努力」をした状態で、果たし状(笑)を持っていくようにしましょう。
 
さて、最低限の「分析の考え方」は以上となります。次回からは、(前回、少し頭出しした)具体的な「グラフの使い方」のお話にコマを進めていきます。

連載 事業会社の新入社員が知るべき「データ分析」のお作法 記事一覧
ギックスの書籍が発売されました

コチラの書籍では、分析の前に、果たして何を考えるべきかを中心に解説されています。今回の「分析のお作法」のお話も収録されています。是非、ご一読ください。
数字力×EXCELで最強のビジネスマンになる本
数字力×EXCELで最強のビジネスマンになる本

SERVICE