機械学習とは：過去の経験から未知の事象を判断する仕組み｜データ分析用語を解説

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフより移設されました（2019/7/1）

機械学習は、現状の改善や効率化といった場面で利用する

数年前までは研究開発分野の世界の言葉だった「機械学習」ですが、最近では実用化が進み、ビジネスの世界でも頻繁に耳にするようになってきました。Amazon Machine LearningやMicrosoftのAzure Machine Learningなど、手軽に機械学習を利用できる環境が整ってきたことが、実用化が進んでいる要因でしょう。
本記事では、この「機械学習」について、そもそも機械学習とは何なのか、また機械学習はどのような場面で利用できるのか、といった基本的な内容について説明します。

人間から与えられた”変数”の重みを計算するのが「機械学習」

機械学習は、AI（人工知能）の一分野として研究が進められてきました。
このAIには4つのレベルがあるといわれています。

言われた通りにやる
探索や知識を使って、言われた通りにやる
変数の重みを学習する
変数を発見する

このうち、3が「機械学習」、4が「深層学習（ディープラーニング）」と呼ばれるものです。これらの違いですが、3のレベルでは”変数”（要因）の候補を人間が機械にあらかじめ与えるのに対し、4のレベルでは機械が自ら”変数”を見つけ出すところにあります。
レベル3の代表例の一つが、小売店の来店客数予測です。来店客数に影響を与えそうな要因として、「曜日」「時間帯」「天候」「価格」「広告」などが考えられます。これらの”変数”が来店客数に与える影響の重みを算出し、それぞれの重みを考慮して来店客数を予測します。
一方の、レベル4の代表例として、画像認識が挙げられます。人間は、経験的にイヌの写真とネコの写真を見分けることはできますが、イヌの写真とネコの写真の違いを決定づける”変数”が何であるかはわかりません。ディープラーニングでは、この”変数”を見つけ出し、見つけ出した変数を用いて、イヌの写真とネコの写真を判別します。
現在のAIの研究はレベル4の「ディープラーニング」が中心となってきています。ただ、ディープラーニングの精度が上がれば、レベル3の「機械学習」が不要になるかというとそういうわけではなく、学習させたい内容によって使い分けることになるでしょう。数値予測など定量的な分析では「機械学習」が、画像認識やテキストマイニングなど定性的な分析には「ディープラーニング」が向いていると考えています。

「機械学習」は過去の経験に基づいた予測が得意！（＝未経験なことは予測困難）

「機械学習」により、過去に蓄積された経験から、今あるデータを分類したり、未知の結果を予測したりできます。重要なことは、機械学習はあくまで過去の経験が無ければ予測を行うことができないということです。
小売店の例で考えると、「これまでは折込チラシのみでしか広告を出していなかったものを今後はWebでも広告を出そうと考えているが、この効果を予測したい」といった場合に機械学習は役立ちません。
機械学習のインプットとなりうる、「Web広告を出した時のデータ」が無いためです。ただし、他の店舗でWeb広告を出した時のデータがあり、これを横展開する場合や、Web広告をテストで出して、テストの検証結果から採用するかをどうかを判断するといった場合には機械学習は有効です。
これらの場合には機械学習のインプットとなるデータが存在するからです。機械学習は、このような性質上、仕入れ量の最適化や商品のレコメンデーションなど、「現状の改善や効率化」における利用価値は高いです。
一方で、市場の拡大など新しい世界を創り出していくような用途に、機械学習を使うのは簡単ではありません。この用途で機械学習を利用していくためには、人間の意思やアイデアとの融合が必須でしょう。
データ分析用語：索引

機械学習とは：過去の経験から未知の事象を判断する仕組み｜データ分析用語を解説

機械学習は、現状の改善や効率化といった場面で利用する

人間から与えられた”変数”の重みを計算するのが「機械学習」

「機械学習」は過去の経験に基づいた予測が得意！（＝未経験なことは予測困難）

SERVICE

TAG BOX

機械学習は、現状の改善や効率化といった場面で利用する

人間から与えられた”変数”の重みを計算するのが「機械学習」

「機械学習」は過去の経験に基づいた予測が得意！（＝未経験なことは予測困難）

データとは？：後から解釈し、理解できる情報のカタマリ｜データ分析用語を解説

RFM分析とは：購買行動で顧客を分類し、理解する｜データ分析用語を解説

データベースマネージメントシステム(DBMS)とは？：データを”管理”するためだけにつくられたソフトウェア｜データ分析用語を解説

キュー(queue)とは？：コンピュータでも「待ち行列」は重要｜データ分析用語を解説

Hiveとは？：Hadoop上で稼動するデータベースマネージメントシステム(DBMS)｜データ分析用語を解説

正規表現とは？：データの中からパターンに一致する文字を見つける手法｜データ分析用語を解説

SERVICE

TAG BOX