回帰分析とその応用① ~回帰分析は何のために行うのか?

AUTHOR :   ギックス

各種回帰分析の実施方法を解説

本連載では、回帰分析の実施方法について、本日から5日間に渡り説明してまいります。第一回目は、回帰分析の目的、実施例および回帰分析の種類についての解説です。

回帰分析は何のために行うのか?

そもそも、回帰分析は何のために行うのでしょうか?一般論でいえば、いろいろな回答が考えられるかと思いますが、マーケティング分野において端的にいえば、「『結果』に対する『原因』を推測する」ことにあるのではないかと思います。言葉で説明してもわかりにくいかと思いますので、具体例を挙げてみましょう。

たとえば、下の表のように、ある会社のある年度について、月ごとの「広告宣伝費」と「来店者数」のデータがあったとします。この時、表からの目視でも「広告宣伝費をかけた月は、来店者数が多くなるのではないか」という傾向が読み取れるかと思います。この時、「来店者数」と「広告宣伝費」の2つの数値の関係を定量的に分析するのが、回帰分析です。

表 広告宣伝費と来店者数

表1 広告宣伝費と来店者数

(出所:柏木吉基(2012)『明日から使えるシンプル統計学』(技術評論社)p.124)

回帰分析をやってみよう

ここで、実際に回帰分析を行ってみます。厳密に言えば、「線形単回帰分析」ですが、回帰分析の種類については、後ほど説明します。

01回帰分析のイメージ

図 回帰分析のイメージ

回帰分析(線形単回帰分析)を簡単に言えば、「原因=広告宣伝費」(説明変数)を横軸に、「結果=来店者数」(被説明変数)を縦軸にとった散布図を作り、2つの変数が比例関係にある場合に、最も当てはまりの良い直線を引く作業といえます。この直線の「引き方」は数学的に計算するのですが、第2回で説明いたします。なお、ここまではExcelで簡単にできますので、詳細は前記文献をご参照下さい。

図で示したように、回帰分析(線形単回帰分析)の結果は、

Y=0.525X+3080

といったように、

Y= b1X+b0

という一次関数の数式で表現できます。この式が、回帰分析の基本になります。

数式で表現するメリットは何かというと、「予測」が可能になるということです。この例でいえば、広告宣伝費を千円増やすごとに、0.525人来店者数が増える、すなわち、広告宣伝費を一万円増やすごとに、約5人来店者が増えるということがわかります。また、その月の広告宣伝費の予算がわかれば、数式の「x」の部分に代入することにより、来店者数を「予測」することができることになります。

回帰分析の種類

ここで説明した「回帰分析」は、「線形単回帰分析」という、回帰分析の最もシンプルな形です。「線形」というのは、説明変数と被説明変数の関係を「直線」(一次関数)で当てはめることを意味しており、「単」回帰分析というのは、説明変数が一つの場合のことです。回帰分析のモデルが複雑になると、説明変数が一つでなく、複数になり、場合によっては何十という場合もあります。このような回帰分析のことを、「重回帰分析」といいます。また、被説明変数が、「来店者数」のような数値ではなく、あるサービスを利用しているか、していないかという、「1-0」の場合もあります。この場合、線形回帰分析を用いず、「ロジスティック回帰分析」というモデルを用います。

 今後の本連載の紹介内容

次回以降は、各回帰分析の説明やその使い方について、以下の順に説明してまいります。

  • 重回帰分析
  • ロジスティック回帰分析
  • ロジスティック回帰分析の応用事例としての「スコアリング」
  • 非線形回帰分析

 

  1. 回帰分析とその応用① ~回帰分析は何のために行うのか?(今回)
  2. 回帰分析とその応用② ~重回帰分析
  3. 回帰分析とその応用③ ~ロジスティック回帰分析
  4. 回帰分析とその応用④ ~スコアリング
  5. 回帰分析とその応用⑤ ~非線形回帰分析

関連記事一覧はコチラから

 

【当記事は、ギックス統計アドバイザーの中西規之が執筆しました。】

nakanishi

中西 規之(なかにし のりゆき)

ギックス統計アドバイザー。公益財団法人日本都市センター研究室主任研究員、フェリス女学院大学国際交流学部非常勤講師(社会統計学)などを歴任。東京工業大学大学院社会理工学研究科社会工学専攻修士課程修了。最近の関心は、市民、民間、行政の3者が「Win-Win-Win」になるような、公共サービスにおけるビッグデータ・オープンデータの活用のあり方について。

SERVICE