clock2017.03.17 09:06
SERVICE
home

ゲーミングパソコンはデータ分析に使えるのか? ~DELL ALIENWARE AURORA で検証~

AUTHOR :   ギックス

データ分析パソコン選びの基準は「NVMe接続」

きっかけは非常に単純だった。オンプレミスPCでデータ分析がどのくらいできるか?

大量データを高速で処理したい場合は、どうしても大掛かりなサーバー環境が必要になり、そのため比較的手軽に使えるクラウドサービスを使うことが一般的になってきました。そのため「ビッグデータ分析=クラウド」構図が当たり前となっていますが、どの程度の規模までならオンプレミスで耐えられるかは誰も分かりません。という事で時代に逆行してオンプレミスPCで大量データを処理してみました。

見せて貰おうか。DELLのゲーミングパソコンの性能とやらを!

経緯:なぜ、ゲーミングパソコンなのか

最強のオンプレミスPCで検証しようとした時、最初からゲーミングパソコンにスコープを絞っていたわけでなく、結果としてゲーミングパソコンになってしまいました。

今までデータ分析業務を技術者視点から見てきて、ハードディスクへの読み書きがボトルネックになっていた事が分かっていたため、SSDタイプのパソコンを探すことにしました。(SSDは通常のハードディスクドライブより読み書きが速い特性があります) 更に、今回のパソコン検証だけのために流石に高価なパソコンを購入するわけには行きませんので、パソコンリースを選択することになりました。結果、選択肢の少ないリース可能なSSD搭載のパソコンの中から最もデータ分析に向いていそうなパソコンがゲーミングパソコン「DELL ALIENWARE AURORA R5」になってしまいました。

DELL ALIENWARE AURORA の第一印象

ますはデカい!! 一般的なタワー型のパソコンを一回り太らせた感じの非常に重量感のある見た目です。ガンダムでいうところのガンダムヴァーチェといった感じです。この写真は、たまたま弊社にあった「仕事の基礎力(田中耕比古 著)」と比較したものですが、非常に筐体が大きいことが分かると思います。そして、ユニコーンガンダムのように両サイドが光ります。alienware1

しかし、派手な見た目とは裏腹に、作動音は非常に静かです。殆ど無音といってよいでしょう。そして、電源を入れてから数秒でWindows OSが起動して、非常にサクサク動き、動画も滑らかに動きます。

データ分析の要はディスクスピードだ!!

5億件のトランザクションをテーブル結合してみた

今回の検証では、パソコン内にPostgreSQLのローカルデータベース環境を構築して、大量のトランザクションデータを登録して、SQLでテーブル結合や集計処理をやってみました。

結果、思った以上の性能を出してくれました。当初、予定では1億件程度のトランザクションデータを処理できれば良いだろうと考えていましたが、5億件のトランザクションと複数のマスタのテーブル結合を4時間ほどで処理できました。普段、Redshiftなどのビックデータ向けのクラウド環境に慣れていれば「えっ?4時間も??」と思われるかもしれませんが、5年ほど前の一般消費者向けのパソコンの性能では4億件のデータなどは到底処理できないボリュームです。

処理速度の秘密はNVMe接続

「NVMe接続」と聞いて直ぐに分かる人は、相当パソコンに詳しい人だと思います。ちょっと自作パソコンをやってみた程度の知識でしたら殆ど知らないと思います。

NVMe接続(正式名称:NVM Express)は、パソコンの中でSSDを接続するための接続インターフェース規格です。現在主流のハードディスクドライブは記憶容量は大きいがデータの読書きスピードがそれほどでもないため、シリアルATAという接続インターフェース規格で十分なデータ転送速度でした。しかし、SSDはデータの読書きが非常に早く、シリアルATAのデータ転送速度ではSSDの性能を発揮することが出来ませんでした。

ここで生まれたのがNVMe接続です。NVMe接続はシリアルATAの何十倍ものデータ転送能力があり、SSDのデータ読書きの処理能力を100%使うことが出来ます。しかし、NVMe接続に対応したSSDが購入できるようになったのは最近で、流通量や種類も少なく、512GBで4万円前後と非常に高価です。そのため、これを搭載しているパソコンは、ごく一部のハイエンドモデルかゲーミングパソコンなどに限られます。

実際のところNVMe接続はどのくらい速いの?

長々、文章を書いてもNVMe接続の速さが分からないと思うので、普通のハードディスクドライブ(左側)とALIENWARE AURORA(右側)をCrystalDiskMarkというメジャーなハードディスクのベンチマークツール(性能測定ツール)で比較しました。それぞれの測定内容は割愛しますが、数が大きければ多いほど速いため、ALIENWARE AURORAのNVMe接続のSSDの方が圧倒的に速いことが分かります。alienware2

GPUを使えばDeep Learningも高速に処理できる

ALIENWARE AURORAはゲーミングパソコンです。ゲーミングパソコンには3Dゲームを快適にプレイするために非常に高性能な画面出力用のグラフィックカードが搭載されています。

近年、グラフィックカード内のGPUが、画像処理だけでなく、Deep Learningなどにも向いていることが注目され、クラウドサービス各社ではGPU機能を強化したクラウドサーバーを提供しています。ALIENWARE AURORAに搭載されているグラフィックカードも、Deep Learningで実績のあるグラフィックカードが入っていたので検証してみたかったのですが、リース期間の関係から至りませんでした。残念です。

データ分析環境はクラウドだけではない

今回のALIENWARE AURORAを検証した結果、ディスクの読書きが速いゲーミングパソコンはデータ分析として非常に優れていることが分かりました。しかし、非常にデカく、外観の主張が激しいため普通のオフィスに置くパソコンとしてはちょっと難しいかもしれません。また、残念なことにALIENWARE AURORAのホームページには、NVMe接続に関する記載がなく、他のパソコンよりディスク読書きが優れている事が分かりません。せっかく良いものを搭載しているなら、それに対して記載がないのは勿体ないです。

最近の高度なテクノロジーの視点はクラウドやIoT、AIなどに向いていますが、オンプレミスPCも日々進化しています。今回、注目したNVMe接続のSSDは、現段階ではクラウドサーバーには導入されていません。確かにクラウドサーバーは、24時間365日動き続ける環境としてはオンプレミスPCより優れている点が多いです。しかし、ETL処理やBIツールのデータ読込などでのディスクの読書きが多い処理では、オンプレミスPCの方が処理速度の面で優位になります。クラウドサービスも良いですが、たまには振り返って、昔からのやり方で新しいテクノロジーを検証してみることも大切だと思いました。

次回は自作パソコンで ALIENWARE AURORA R5 のディスク読書き速度に挑戦します!

関係記事
SERVICE