センサーデータとは:行動分析の鍵となる”キレイな”データ|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

センサーデータを「使う」人材の重要性が増してくる

ビッグデータ時代において、注目の集まるデータの一つ「センサーデータ」について解説します。

センサーとは

まず、そもそもセンサーとはなんでしょう。wikipediaから引用します

センサまたはセンサー(英: sensor)は、自然現象や人工物の機械的・電磁気的・熱的・音響的・化学的性質あるいはそれらで 示される空間情報・時間情報を、何らかの科学的原理を応用して、人間や機械が扱い易い別媒体の信号に置き換える装置のことをいい、センサを利用した計測・判別を行うことを「センシング」という。検知器(英: detector)とも呼ばれる。
出所:wikipedia

要するに、科学的に”何か起こった”ことを判別して、それを ”信号” としてくれる機械のことをセンサーと呼ぶわけですね。
具体的な例を挙げると、自動ドアが開くのは「人が来た」とセンサーが判別して、「人が来たよ」という”信号”に変換し、プログラムがその信号を受けて「ドアを開ける」という指令を出す、という流れが行われているわけです。尚、引用内に「センシング」という言葉が出てきましたが、センサーは「センシングデバイス」という呼び方をされることもあります。「センサーを利用した計測・判別を行うこと=センシング」であり、「センシングするための機械(センシング・デバイス)=センサー」ということですね。
sensor_data_01

センサーデータとは

では、センサーデータとはなんでしょうか。これは、「センサー」が感知した事象・現象が ”信号” に変換されたもののことです。ただし、ビッグデータ界隈で「センサーデータ」という場合は、この”信号”ひとつひとつというよりは、それを蓄積した”ログのカタマリ”みたいなものを指すことが多いです。
sensor_data_02

センサーデータは「キレイなデータ」

センサーデータは、分析に適したデータです。というのもの、そこに「ノイズ」が少ないからです。以前お伝えした「カタいデータ、やわらかいデータ」の概念でいえば、「相当カタいデータ」だと言えます。
先日「graffeの本棚」でご紹介した、「データ活用実践教室」の第5章から、引用します。

一般的に言うと、センサーデータは品質の良いデータの代表である。ウェアラブルデバイスには心拍センサーや加速度センサー、位置情報センサーなどが組み込まれている。アナリティクスの専門家がウェアラブルデバイスから目を離せないのは、これが理由だ。
出所:トップデータサイエンティストが教える データ活用実践教室(日経BP刊)より、 第5章:分析官の決断(工藤卓哉)

ウェアラブルデバイスを例に挙げていますが、最初の一文「品質の良いデータの代表である」というところがポイントです。

データ前処理の約7~8割の工数を占めるクレンジング(データの誤りや重複を取り除きデータの品質を高めること)や補正処理に苦心するデータサイエンティストであれあなおさらのことだろう。正確なシグナルを抽出するにはデータは客観的であるほど良い。
ウェアラブルデバイスは、「データは嘘をつかない」の代表格である。人が申告するデータや人の手で入力されたデータは、往々にしてノイズが混入する。これに対してウェアラブルデバイスの生み出すセンサーデータはまさに「嘘をつかない」のだ。
出所:トップデータサイエンティストが教える データ活用実践教室(日経BP刊)より、 第5章:分析官の決断(工藤卓哉)

これも、ウェアラブルデバイス云々というところよりも、「データが嘘をつかない」「ノイズが無い」というセンサーデータの特徴に注目すべきでしょう。

「キレイなデータ」で何が分かるのか

では、その「キレイなデータ」で何が分かるのでしょうか。
最もシンプルなのは「扉の開閉回数」などを記録し、どれくらい使われているかを知る、あるいは、故障に至るプロセス(=耐用回数)を把握する、というような「対象物そのもの」の評価に使うというものです。そこから、もう一歩踏み込むと、室内の温度変化などを調べて、そこに保管してある商品の品質管理の「ログ」として使うことなどができます。
ただ、ビッグデータという切り口でセンサーデータを扱う際には、多くの場合、「人の行動」を捉えるのに使われます。いわゆる「行動分析」というものです。
例えば、赤外線センサーで、人(とは限らないが、なにか動く物体)が通ったことを記録していけば、「一定時間内に、何人通過したか」ということがわかります。そうすると、「どのエリアにどれくらいの人数がいたのか」を類推することもできます。これは人流分析と呼ばれます。(関連記事:人流分析とは
その他にも、先ほど挙げた「扉の開閉回数」でも、人の流れを示すことができるでしょう。あるいは、椅子に感圧センサーを付けておけば、空席率や滞在時間を把握することができますね。(博多ラーメンの名店”一蘭”の味集中カウンターの空席表示も、感圧センサーでコントロール可能ですね。まぁ、実際は、係りの方がボタンを押しているんじゃないかと想像しますけれども。)

今後、ますますセンサーデータ活用のチャンスは増える

今後、センサーデータは、どんどん活用されていくことだろうと思います。ひとつには、先ほど引用した中にもあった「ウェアラブルデバイス」が、当たり前のように世の中にでてきています。また、IoTという言葉で表現される「すべてのものがインターネットにつながる時代」が目の前まで迫っています。そうなると、身につけたすべてのもの、身の回りのすべてのものが「センサー(すなわち、センシングデバイス)」としての役割を果たします。
このような膨大な「信号」が取れるようになってきたからこそ、次は「どのように使うか」が重要になるわけです。無限の可能性の中で、意味のある使い方を考える人が、今後ますます求められ、そして重用されるようになってくるでしょう。
データ分析用語:索引

SERVICE