Tech & Science 2017.02.08 09:02 Amazon Athena の分析サービスとしての位置付けについて考えてみる Amazon Athena は Google BigQuery と MS PolyBase を足して2で割ったようなサービス 昨年末、Amazon Web Services(以下、AWS)が主催したAWS re:Invent 2016から...
Tech & Science 2017.06.05 07:58 データレイクとクラウドサービス ~①データレイクの今までをおさらい~ データレイクはビッグデータ分析とともに常に進化している ちょうど2年前。弊社ブログで「データレイク(Data Lake)」について取り上げさせていただきました。その当時「データレイク」という言葉だけが先行し、何を使えばよいか、どんな場面で...
Tech & Science 2017.06.12 08:35 データレイクとクラウドサービス ~②クラウドサービスが支えるこれからのデータレイク~ クラウドサービス進化によってデータレイクの運命が決まる 前回、データレイクとはどういうものか、データベースと何が違うかについて触れました。今回はクラウドサービスがデータレイクにどの様に影響しているか、そして、今後、データレイクはどの様に変...
Tech & Science 2017.04.24 15:26 Amazon Redshift Spectrum を使ってみた ~Redshift Spectrum は Redshift のデータレイクの入り口になる~ Amazon Redshift Spectrum によってデータ分析の業務フローが変わる 先日、サンフランシスコで開催された AWS Summit 2017(2017.4.18 - 19)で Amazon Redshift(以下、Reds...
Tech & Science 2017.12.05 11:52 Redshiftの弱点をRDSとRedshift Spectrumでカバーする ~SQL命令だけでデータ分析ができる環境を考える~ RDSの機能を使えばRedshiftのデータを使用したGIS環境も構築できる クラウド上のデータベース(クラウドデータベース)は、非常に高性能、かつ安定していながら、費用的や技術的にも容易に環境構築することが可能です。しかし、これらの利点...
Tech & Science 2014.01.06 13:03 大規模投資の前のトライ&エラーが重要|ギックスのビッグデータ分析体系 ⑦ 大規模システムを作る前にまず試す ここまで「ビジネスの理解」「データの準備・理解」「2次属性の作成」「セグメントの特徴把握」というビックデータ分析を試みる際にまず実施すべき一連の流れと、「モデリング」という統計的探索手法をご紹介しました。...
Tech & Science 2016.02.17 08:15 効率的なデータ分析を実現するための4つのコツ データ分析の価値は何? データ分析の価値とは何でしょうか? 一つに「今まで知らなかった新しい情報を知ることができる」ということがあげられます。特にこれまであまりデータ分析をしてこなかった組織や個人がデータ分析を実施すると、得ることが...
Tech & Science 2016.11.16 08:12 データベースを”倉庫”ではなく”道具”として使う発想 ~データベース上で分析データを下ごしらえする~ データベースの特性を活かすことで "誰でも"、"確実に" データ分析が行える データ分析 = データベース。こんな公式を書いて何の違和感もないほど、データベースは、データ分析のために「なくてはならない存在」です。まさに、両者は切っても切れ...
Tech & Science 2017.03.17 09:06 ゲーミングパソコンはデータ分析に使えるのか? ~DELL ALIENWARE AURORA で検証~ データ分析パソコン選びの基準は「NVMe接続」 きっかけは非常に単純だった。オンプレミスPCでデータ分析がどのくらいできるか? 大量データを高速で処理したい場合は、どうしても大掛かりなサーバー環境が必要になり、そのため比較的手軽に使...
Tech & Science 2017.05.18 17:31 クラウドサーバーが、常にオンプレミスより優れているとは限らない ~スモールローカルサーバーという新たな選択肢~ クラウドサービスの空白地帯を考えたオンプレミスの導入 Amazon社がクラウドサービスの Amazon Web Services (通称、AWS)を公開して10年。新規システムならクラウドサービス内で作るのが当たり前となり、既存のオンプレ...