オンプレ分析データベースのHeteroServerを検証してみた ~GPUによる超並列処理の実力検証~
HeteroServerはオンプレ分析データベースの導入のハードルを下げる新たな選択肢 ビッグデータの分析データベースと言えば、Amazon Redshift や Google BigQuery などのクラウドデータベースが一般的になりつつ...
HeteroServerはオンプレ分析データベースの導入のハードルを下げる新たな選択肢 ビッグデータの分析データベースと言えば、Amazon Redshift や Google BigQuery などのクラウドデータベースが一般的になりつつ...
PythonプログラミングだけでParquet形式にファイル変換 AWS(Amazon Web Services)にはクラウドストレージの Amazon S3 に溜まったデータファイルをSQL命令で参照できるデータレイクサービスとして、Am...
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1) XMLは情報通信、定義情報ファイル、データベースなど活躍場所が多い非構造化データ 様々な種類がある非構造化データのデータ...
外部データベースに切り替えて負荷分散とリスク回避を行う 前回までは実際に開発した経験からAirflowのジョブ作成について説明しました。暫くしてから運用関係のご報告を...っと考えていたのですが、本番稼働してまだ1ヵ月ちょっとですが早くも...
Airflowのタスク処理はPythonで開発すると便利 前回までは簡単なジョブ処理の作成・実行まででしたが、今回はちょっと応用編です。そのため、Pythonの基礎的なスキルが必要になりますが、Pythonを使うことで「やれること」も多くな...
Airflow公式ドキュメントは難解。重要ポイントから先に読み解こう 前回、タスクスケジューラーの必要性とAirflowの概要やメリットについてご紹介しました。しかし、「とりあえず触ってみよう!」っと思ってもAirflow公式ドキュメント...
分析の試行錯誤フェーズではRedshift。分析の”型”が決まったらBigQuery。 ビッグデータ分析においてデータベースは必要不可欠であることは言うまでもありません。これらのビックデータ向けデータベースの代表格としてオンプレミスではO...
Airflowを導入することでエンジニアは処理本体の開発に集中できる 分析業務に限らず定常的な処理はバッチ処理として纏めることは多いと思います。そして、バッチ処理も実行するタイミングが決まったら、自動化システムとしてバッチ処理をスケジュー...
RDSの機能を使えばRedshiftのデータを使用したGIS環境も構築できる クラウド上のデータベース(クラウドデータベース)は、非常に高性能、かつ安定していながら、費用的や技術的にも容易に環境構築することが可能です。しかし、これらの利点...
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1) データベースに求める処理性能は大量アクセス? それとも大量データ? データベースと言っても様々な種類があり、表形式のテー...
