Cloud Composer と GKE を活用して機械学習のワークフローを構築する
GKE を効率的に使うために 弊社の機械学習基盤では、ワークフロー管理ツールとして Cloud Composer (Airflow) を利用しており、機械学習タスクは別の Google Kubernetes Engine (以下、 ...
GKE を効率的に使うために 弊社の機械学習基盤では、ワークフロー管理ツールとして Cloud Composer (Airflow) を利用しており、機械学習タスクは別の Google Kubernetes Engine (以下、 ...
DevOps(デブオプス)のML(機械学習)版 本日は、MLOpsという言葉について解説します。 MLOpsチームを立ち上げた、MLOpsチームで積極採用中である、というお話が、各方面で上がっていますので、「MLOps(エムエ...
Katalon + Selenium =単純作業から解放される未来 情報検索や買い物、事務手続きなど様々な作業をブラウザを通してインターネットで済ませることができる時代です。移動することなくアプリケーションもインストールする必要もなく非常に...
RDB以外はNoSQL。だから種類も機能も多種多様 システム開発やデータ分析の仕事をしていると一度は目にする「NoSQL」と言うバズワード。直訳するとSQLを使わないデータベースのような感じもします。NoSQLのシステム事例や製品紹介では「...
HeteroServerはオンプレ分析データベースの導入のハードルを下げる新たな選択肢 ビッグデータの分析データベースと言えば、Amazon Redshift や Google BigQuery などのクラウドデータベースが一般的になりつつ...
PythonプログラミングだけでParquet形式にファイル変換 AWS(Amazon Web Services)にはクラウドストレージの Amazon S3 に溜まったデータファイルをSQL命令で参照できるデータレイクサービスとして、Am...
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1) XMLは情報通信、定義情報ファイル、データベースなど活躍場所が多い非構造化データ 様々な種類がある非構造化データのデータ...
外部データベースに切り替えて負荷分散とリスク回避を行う 前回までは実際に開発した経験からAirflowのジョブ作成について説明しました。暫くしてから運用関係のご報告を...っと考えていたのですが、本番稼働してまだ1ヵ月ちょっとですが早くも...
Airflowのタスク処理はPythonで開発すると便利 前回までは簡単なジョブ処理の作成・実行まででしたが、今回はちょっと応用編です。そのため、Pythonの基礎的なスキルが必要になりますが、Pythonを使うことで「やれること」も多くな...
Airflow公式ドキュメントは難解。重要ポイントから先に読み解こう 前回、タスクスケジューラーの必要性とAirflowの概要やメリットについてご紹介しました。しかし、「とりあえず触ってみよう!」っと思ってもAirflow公式ドキュメント...
