(5)折れ線グラフを使い倒せ!|事業会社の新入社員が知るべき「データ分析」のお作法

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

仮説立案→検証プロセスを体に叩き込め!

前回「棒グラフを使い倒せ!」というお話をしました。今回は、「折れ線グラフ」を使い倒してみましょう。

折れ線グラフ=推移を示すのに最適

前々回もお伝えした通り、折れ線グラフは、推移を表現するのに適しています。ですので、横軸は常に「時間の流れ」です。そして、時間軸は左から右に流れます。そして、縦軸は「何らかの数字で大小が示せるもの」です。
ここで重要になるのは、「複数の線を引いて”比較”する」(比較については、以前ご紹介しましたね)ことですので、それぞれの線を「何」にするかをしっかりと考える必要があります。。
具体的な例を挙げると

  • 同じレベルのモノ(会社同士、部門同士、商品同士)を比較する
  • 似た概念=関連性が高そうなモノ(販売数と利益率、人口とGDP)を比較する
  • 違う概念=一見関係なさそうなモノ(気温と来店客数、アルコール摂取量と寿命)を比較する

みたいなものが代表的です。下図をご参照ください。

図:折れ線グラフの基本構造

graph_howto_06
棒グラフの時と同じく、これは「当たり前」ですよね。

「基準点」を決めることで世界が変わる

しかしながら、折れ線グラフも、少しの工夫で様相を変えます。
それが「基準点」という考え方です。先に、下図をご覧いただきましょう。

図:折れ線グラフの応用

graph_howto_07

左側の利益率推移の図をみると、A社が好調で、B社が伸び悩んでいるように見えませんか?
しかし、最初の年=2010年度を「基準点」として”変化率”をみると、グラフのメッセージは大きく変わります。B社は、目覚ましい利益率改善を果たしていますが、A社は(もちろん、もともと高い水準だからなのですが)伸びていないということが分かります。
今回の例が利益”率”であることを考えると、左のグラフの方が正確に状況を示しているかもしれませんが、もし、これが利益”額”だった場合には、右側のグラフはかなり重要な示唆を与えてくれます。

棒グラフと組み合わせてみると「複数の因子」の「推移」がスッキリ頭に入る

さらに、前回ご紹介した棒グラフと、競演させてみましょう。龍虎あいまみえる、という感じですね。

図:折れ線グラフと棒グラフの併用

graph_howto_08
まず上図の「上半分」を見てください。ご覧のとおり、時間推移に沿って、複数の因子がどのように動いたか、ということをわかりやすく表現できます。尚、この場合、棒グラフにするのは「量」の概念をもったものであるべきですので、間違っても「利益率を棒グラフで表現する」なんてことはしないでくださいね。
一方、「下半分」を見ていただくと、横軸を「時間」にする、という基本思想から外れてしまっています。棒グラフ単体で見ると、横軸に「要素」が並んでいても違和感がないのですが、折れ線グラフが入った瞬間に「かえって分かりにくい」ということが起こります。こういう場合には「散布図」をつかってあげると、二つの因子の関係性がクリアになると思います。

散布図が無いと不便なのでは?と思ったあなたに

と、ここで「おまえ、棒グラフと折れ線グラフだけで良いって言ってたやんけ」と思われる新入社員の皆様がいらっしゃることでしょう。おっしゃる通りです。皆様の記憶力に脱帽です。
そうなんです。不便なんです。なので、必要に応じて、散布図もバンバン使ってください。ただ「むやみやたらと使わなくてもいいんじゃないかな」と思っています。
本連載で一貫してお伝えしている通り、分析の最終目的は、ビジネス的な結果を出すことです。そして、そのために”分析”が果たす役目は「意思決定するための材料」を取り揃えることです。そうすると、最初の一歩は、「表」でも、十分だったりします。

表:無理にグラフにしなくても、分かることもある
売上高  利益率
A支店  80   2.5%
B支店  70   2.0%
C支店  40   2.8%
D支店  85   2.9%
E支店  115   3.1%

たとえば、こんな表を最初に見て、「A支店とD支店は、売上高は近いけど利益率は差がある感じがするな」「E支店が高売上 且つ 高利益率だな」「C支店は低売上だが、利益率は高いな」ということを考えると「これは、相関してないんじゃないか?」という仮説が立てられます。それを検証するのに、散布図を作ってみればよいでしょう。(検証の結果、自分の仮説=感覚があっていたかどうかを、しっかりと受け止めましょう。これが、ヒューリスティックバイアスを防ぐための最良の訓練だと思います。)
大事なのは、この「考えるというステップをすっ飛ばさない」ということです。便利なツールは沢山ありますが、だからといって、いきなり分析(計算)しちゃうのは”考えない人間”を作り出します。新入社員の皆さんには、ぜひ「考える人間」になっていただきたいと思います。ですので、こういう「考える行為」を厭わずに、感覚を研ぎ澄ます努力をしていただければと思います。(そして、前掲のとおり、感覚を過信せずにちゃんとリアルなデータにあたって検証する、という姿勢を徹底しましょう。)
もう一つ、例を挙げます。

図:相関の可能性 を折れ線グラフで見出す

graph_howto_09.png
左側の図を見て「ひょっとして、相関してるかも?」と思えるかどうかです。この検証には「散布図」が最適です。こういうときには、ビシバシ散布図を使って、ガンガン検証してください。(ちなみに、数字を消しているので検証のしようがないわけですが、元データはRスクウェア1.0でビシッと相関する数字で作ってます)
このプロセスが、いわゆる「仮説思考」というものです。小さな世界ではありますが、仮説立案ー検証をしています。そして、ここから、次のステップの(すなわち、ビジネスの世界の)仮説検証プロセスとして、「【販促費をかけるほど→売上高が上がる】という因果関係があるのではないか?」という仮説を考えて、検証していくことになります。また、その場合、「販促費を無限に投下すれば、売上高が永遠に上がり続けるなんて起こり得ないだろう」というサブ仮説をもって「飽和するポイントはどこか」を考えていくのが妥当な感じがしますよね。
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

おわりに

今回の連載は、新入社員の知るべき「データ分析」のお作法と題してお話をしてきました。しかしながら、このような分析のベースとなる考え方をしっかりと理解し、実践している人は世の中に殆どいません。この根本の部分を理解することができれば、それだけで、社会人としての大きなアドバンテージになります。
数多ある統計的手法を学んでいくことは大事なことです。また、機械学習なども活用領域によっては非常に効果を発揮しますので、学ぶ機会があれば積極的に学んでいくべきです。ただ、これらの世界には「専門家」がいます。ぶっちゃけてしまえば、「そういうところは、専門家に任せてしまう」という選択肢もあるわけですよ。(関連記事:機械学習とは)
では、(事業会社の)新入社員の皆さんは、何をするべきか?まずは、連載の冒頭で述べたとおり「ビジネス」をしっかりと理解してください。そして、本連載で述べた「データ分析に対する態度」を身につけてください。そうすることで、上記の専門家と「会話できる」状態になります。これは非常に有益なことです。キチンと会話できるようになれば、その道のプロに任せるべきところを任せてしまうことができます。そうすると、自分たちは「ビジネスの世界(=本業の世界)」で”データ活用”に力を入れられます。
ここで言うデータ活用とは、ビジネスの世界での「仮説検証」をしていくことです。それはつまり、”ビジネス視点”でデータを”解釈”していくということを意味します。この部分の能力は(欧米のデータサイエンティストという定義から敢えて切り出して)データアーティストと呼ぶと良いと考えています。この能力を磨くことで、本当の意味でデータを活用できる人材となれます。そして、所属する企業のデータ活用力の底上げに、間違いなく寄与することができます。
新入社員が変われば会社は変わります。そして、会社が変われば日本は変わります。どうか「データ分析に対してアレルギーの無い日本の実現」を目指すための、最初の一歩を、皆さん一人一人が踏み出してください。
本連載が、その一助となることを願ってやみません。

連載 事業会社の新入社員が知るべき「データ分析」のお作法 記事一覧
ギックスの書籍が発売されました

コチラの書籍では、分析の前に、果たして何を考えるべきかを中心に解説されています。今回の「分析のお作法」のお話も収録されています。是非、ご一読ください。
数字力×EXCELで最強のビジネスマンになる本
数字力×EXCELで最強のビジネスマンになる本

SERVICE