回帰分析とその応用④ ~スコアリング

AUTHOR :   ギックス

9.1k
ギックス
eyecatch_kaiki_bunseki_nakanishi

各種回帰分析の実施方法を解説

本連載では、回帰分析の実施方法について、5日間に渡り説明してまいります。第4回目の本日は、ロジスティック回帰分析を使ったスコアリングを紹介します。

ロジスティック回帰分析によるスコアリング

マーケティングにおいて近年よく用いられている統計的な手法の一つに、「スコアリング」というものがあります。マーケティング分野における「スコアリング」は、「個々の見込み客が持つ、自社への将来的な「価値」を予測し、その価値に準じて順位をつけること」(コトバンク)と定義されており、「順位付けは、デモグラフィックデータやBANT条件(Budget、Authority、Needs、Timeframe)と、マーケティングやセールスキャンペーンに対する見込み客の行動解析を組み合わせて行う」(引用元同上、ただし括弧内は筆者注)こととされています。

歴史的には、もともと医療分野で疾病リスクを計算するのに用いられていましたが、金融分野での貸し出しの審査や、クレジットカードの審査などに応用され、現在はマーケティングの分野でも、応用が進んできています。

かつては、「線形判別分析」という手法による点数化がよく用いられていましたが、前回説明したように、ロジスティック回帰分析では確率を予測できることを利用して、ロジスティック回帰分析を用いて、点数を直接確率で表現することが主流になってきています。確率の予測は、医療分野では疾病リスク、金融分野では貸し倒れリスク、マーケティング分野では見込み客が財・サービスを利用する確率といった形で、多くの分野で応用されています。

スコアリングの例

ここで、実際に例を挙げてみましょう。使用するデータは、前回同様「体重2.5kg未満の新生児が出産される原因となる因子」を探索するために調査データです。このうち、前回分析に使用しなかった63件のデータについて、前回計算した、以下のロジスティック回帰分析の式に当てはめて、「体重2.5kg未満の新生児が出産される『確率』」を計算します。

実際に計算した結果を、確率の低い順に左から並べたグラフが、下図になります。このグラフのことを、「(予測の)ゲインチャート」といいます。たとえば、この時、63人については、年齢や体格、疾病経験などの情報を事前に把握しておいて、確率が0.5、ないし0.4以上の妊婦については、事前に体重2.5kg未満の新生児が産まれやすいことを本人に伝えて注意喚起を促したり、病院側で何らかの準備をするなどして、活用することが考えられます。

media_nakanishi10

図 スコアリングのイメージ(予測のゲインチャート)

マーケティング分野における具体的な利用方法としては、全顧客のデータから、あるプロダクトを購入する確率についてロジスティック回帰分析による予測を行い、予測確率が70%以上で、なおかつそのプロダクトを購入していない顧客を対象として、ダイレクトメールを送るといったようなことが考えられます。

 

  1. 回帰分析とその応用① ~回帰分析は何のために行うのか?
  2. 回帰分析とその応用② ~重回帰分析
  3. 回帰分析とその応用③ ~ロジスティック回帰分析
  4. 回帰分析とその応用④ ~スコアリング(今回)
  5. 回帰分析とその応用⑤ ~非線形回帰分析

関連記事一覧はコチラから

 

【当記事は、ギックス統計アドバイザーの中西規之が執筆しました。】

nakanishi

中西 規之(なかにし のりゆき)

ギックス統計アドバイザー。公益財団法人日本都市センター研究室主任研究員、フェリス女学院大学国際交流学部非常勤講師(社会統計学)などを歴任。東京工業大学大学院社会理工学研究科社会工学専攻修士課程修了。最近の関心は、市民、民間、行政の3者が「Win-Win-Win」になるような、公共サービスにおけるビッグデータ・オープンデータの活用のあり方について。

SERVICE

SERVICE

BANNER

graffe

grip

GiXo BLOG

recruit

Aibou

amazon web service partner network

TAG BOX