clock2013.12.11 15:11
SERVICE
home

アクセンチュア アナリティクス日本統括 工藤卓哉氏 ビッグデータ対談 その③

AUTHOR :  網野 知博

現実論8:理想論2のバランスが重要

日本を代表するデータサイエンティストの工藤卓哉氏。
11月上旬に工藤氏の著作である『データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方』(日経BP社)が発刊されたのを機に、弊社の網野知博が対談を行って参りました。
(インタビュー日時:11月18日 ※発言内容は当時の状況になります)

データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方

 

網野:

さて、ここで今流行のデータサイエンティストに関して少し議論させて頂こうかと。工藤さんの本では、データサイエンティストの定義として、「分析の前提理解」、「特徴次元空間を意識」、「一専多能型のコミュニケーション」が要件として挙げられていますよね。

ちなみに、そんなスーパーマンに出会ったことがありますか?しかも、工藤さんが活躍していたNYではなく、このIn Japanで。笑

工藤:

うーん、正直いないですよね。苦笑

サイエンティストなので、サイエンスの知識が必要な事は言うまでもないのですが、データサイエンティストには当然ながらビジネスセンスも必要だと思います。

決して悪く言うつもりはないですが、統計専門の先生方はデータ分析のテクノロジーなどに関していい方向性を示してくれるのでとても尊敬しているのですが、必ずしもビジネスセンスがあるかというと、そうではないこともあるでしょうし、、、。

この世界ではビジネスとして成り立たせることができないと持続性がないと思います。エンドカスタマーが喜んでくれることで、会社を大きくし、更に雇用を増やすことがデータサイエンティストだと思いますから。

網野:

私はデータ分析が分かるコンサルタント、もしくは事業家というスタンスにいますが、その観点から見ても、工藤さんが提唱するデータサイエンティストのハードルは高いなと思っています。

弊社にも大学生のインターンがいて、彼らはまだ若く、あと40年はビジネス的な寿命があるわけです。それなので、この志が高い要件を目指せば良いと思いますが、一方で、大会社の経営企画の40歳の課長や部長からしたら、この要件は非常にきついですよね。

今更”一から”統計もデータサイエンスも学んでいる時間は残されていないようにも感じます。

例えば、経営企画室の人はデータサイエンスや統計学といった分野についてどの程度理解してくれてればいいんでしょうか?

工藤さんの本の3章”データサイエンティストでなくても知っておきたい統計基礎”にかいてある位の統計知識を前提として持っていればいいのですかね?

工藤:

正直統計の知識はそこまではいらないと思っています。

私がやるべきだと思うのは参謀を置いてほしいと言うことです。参謀の役割はマネタイズにつながる「8:2」を考えることです。

私もデータサイエンティストであると共に、組織の長でもあります。私が常に考えてるのは、組織として理想論だけではなく、ビジネスとして成り立たせるための現実も重要という事です。

つまり、理想論だけではなく、現実論として8割を見て、常に稼働率などのKPIを抑えています。

しかし、8割だけだとメンバーは疲弊してしまう。だから2割のおもしろい仕事を取り入れて、皆にローテーションでやらせてあげるようにしています。

例が正しいかは分かりませんが、参謀として重要なのは組織論として「8:2」を考えられることだと思います。

加えて、データ解析プロセスである、「明確な目標の設定」-「解析」-「最適化」のプロセスに勘所のある人間を参謀に置く事です。

一人の人間には限界があるので、事業計画を立てられる人、組織を考えられる人、仮説を思いついて勘所が働く人、などを分担させてもいいと思います。

じゃあ、使う側は分析に関して素人で鼻が利かなくても大丈夫なのか?と聞かれますが、実はそんなに難しいことじゃないのです。

たとえば、使う側としては、統計の専門家と自称している人に対して、こんな質問をぶつけてみればいいんです。

「なんでSASなの? なんでマハウトじゃないの?」

統計の専門家を謳っていて、これで答えにつまる人は怪しいと思って下さい。笑

この質問に的確にこたえるためには、処理基盤も踏まえたアルゴリズムを適用すべきです。MahoutはOSSで協調フィルタリング等は無料実装できるので、むしろHadoopを意識して開発されたMahoutは、SASと比べてHadoopに適合したつくりになっています。SASは大好きなツールの一つですが、それなのになぜわざわざSASで完結させようとしているのかと疑問に抱かないほうがおかしいのです。

統計は難しいので、統計の知識を金科玉条(きんかぎょくじょう)の如くしている人が多いのも事実です。

ですが、そういった輩は、実はやっている事が包括的じゃないので、私から見るとあまり良くないことだと思っています。

こういう人たちが世間でデータサイエンティストだと言われるのは間違っています。

こういった方々はコンピューターサイエンスがわかっていないわけで、これはこれで非常にバランスが悪い人なのです。統計の事だけ言ってる人は実は胡散臭いなと思って下さい。

『統計学が最強の学問である』(ダイヤモンド社・西内 啓さん著)は大ベストセラーとなりましたよね。著者の専門性である頻度論統計の本領が発揮されており、読み手を引き込む工夫もされていて、本当に素晴らしい本だと思います。

先日私も著者の西内氏にお会いする機会があり、次の著書を期待しているところです。

ただ、重要なのは、私の本もしかり、西内さんの本もしかりですが、ある1冊の本を読んで、そこに載っていたことを理解できたからといって、それで全て学んだ気になり、金科玉条の如くになって思考停止していしまうとしたら、それは怖いことなんです。

統計学は本当に幅広い。データマイニングなどでSASを使ってる人は機械学習のことをわかってない事もあります。

例えば協調フィルタリングや、集合知プログラミングとか・・・。

話を戻すと、とにかく「なんでSASなんでしたっけ?」とぶつけてみる事が一番です。

あと、経営企画で考えないといけないのは、3つのプロセス「明確な目標の設定」-「解析」-「最適化」ができる人を参謀として構えておくことです。

私のNY時代の上司は「常に患者のためになっているのか考えなさい」と毎日言っていました。患者が喜んでくれないものを分析して提供したって意味がないのです。

ビジネスの世界では統計だとか、ビッグデータだとかの前に、経営企画の方は「常にお客様の為になっているのか?」を考え続ける事が必要だと思っています。

次号に続きます

————————————
連載記事一覧

GiXo Network|インタビュー記事リストはコチラから

SERVICE