clock2020.12.02 08:36
SERVICE
home

MLOps Div. の紹介

AUTHOR :   ギックス

この記事は GiXo アドベントカレンダー の 2日目の記事です。
昨日は、GiXo Advent Calenar 2020 でした。

MLOps Div. の廣津です。本記事では、私が所属する MLOps Div. の紹介ということで、私のチームが取り組んでいる業務やミッションについて取り上げるとともに、技術スタックや現行のチーム体制についても書いていきたいと思います。

MLOps Div. のミッション・体制

ミッション

“MLOps” という名前から、世の中で言われているような機械学習モデルのパイプラインや自動化などが想起されるかもしれませんが、現状としては MLOps の種となるような機械学習を活用したプロダクトの開発がメインの業務となっています。具体的には、以下の3つを我々のミッションとして定義しています。

  • ML を活用したプロダクトを展開するためのエンジニアリング業務全般の遂行
  • プロダクトの種となるアイデアからプロトタイプを素早く作成し、プロダクションレベルへの引き上げを実施
  • 社内プロジェクトにおける効率的な ML 活用のための ML 基盤の整備

これまでに開発してきたプロダクトとしては、例えばトチカチが挙げられます。トチカチの開発については Google Cloud の活用事例としてもご紹介いただいていますが、フロントエンドとバックエンドそれぞれ1人ずつという少人数の体制で全ての開発を完遂しています。

また、 ML 基盤としては Refeed という名前で社内の分析者向けのシステムを整備しています。以前にブログ記事として公開した Cloud Composer と GKE による機械学習ワークフローの構築Cloud Dataflow の活用 なども、この Refeed という基盤のプロトタイプを構築する上での要素技術を紹介していました。(現在は Cloud Composer は使用していませんが)

トチカチや Refeed のアーキテクチャや利用技術については本アドベントカレンダーにて個別で取り上げて行く予定なので、ここでは簡単な紹介に留めたいと思います。興味がある方は後日公開する記事をご参照ください。

体制

MLOps Div. は2020年12月時点で3名の体制です。私を含め3名全員が Kaggle Master ですが、Kaggler でありながら全員が分析ではなく開発業務を主業務として取り組んでいるのは結構珍しいのではないかと思います。Kaggle が業務に役立つか論がしばしば Twitter 上で炎上しているのを見かけますが、幅広い機械学習のタスクに対して取り組んできた引き出しの広さや、一定の精度のモデルをクイックに作って実際に動かすスキルは業務においても役立っている面は多いと考えています。

現状はフロントエンド担当が2名、インフラ・バックエンド担当が私1人という状況なので、組織として採用を進めながら体制を拡大するとともに、プロダクトの開発をより推進していくのが来年の目標の1つであると個人的には思っています。

弊社に興味を持っていただけた方は、ぜひこちらからご応募いただけると嬉しいです(カジュアル面談も歓迎です)。

利用する技術

プロダクトによって採用する技術はもちろん変わってきますが、人数が少ない中で開発のレバレッジを効かせるため、GCP のマネージドサービスを積極的に利用することを一つの指針としています。言語はフロントエンドは React (Typescript)、バックエンドは主に Python を採用しており、インフラには Firebase や GKE を利用することが多いです。技術選定に際して目的に対してオーバースペックにならないことはもちろん前提としてありますが、トレンド技術には積極的にチャレンジしていくことを大事にしています。

また、チームの全員がフルリモート・フルフレックスで働いているため、Slack や Zoom を主に活用しながらチーム開発を行っています。IT エンジニア職においてはこのような制度はもはや標準になりつつあるかもしれませんが、自由な環境で働けるというのはアウトプットの効率化にも繋がっていると感じています。

業務のやりがい・楽しさ

MLOps Div. における業務の楽しさは、プロダクトを創り上げていく中で、自分の技術力やアイデアを積極的に取り入れていける点だと感じています。少人数で開発を行っているということもあってエンジニア一人ひとりに求められるアウトプットの質や量も相応にはなりますが、それだけ裁量も大きく自分の成果が見えやすいため、エンジニアとしても成長を感じやすい環境だと思います。

プロダクト開発に取り組む中で技術的に最適化できていない領域がまだまだたくさんありますが、新しい技術や機械学習の活用などを検討しながら、このような課題を改善していくプロセスを日々回していくことにもやりがいを感じています。

おわりに

組織紹介記事ということで個々の細かい技術については触れませんでしたが、具体的な開発事例については後日公開予定の記事を参照いただけますと幸いです。

もし、私達と一緒に働きたい!と思っていただけた方がいらっしゃれば、ぜひこちらからご応募ください。まずはカジュアル面談で話だけ聞いてみたい、という方も歓迎です。

明日は Technology Div. Lead の柳より、「Technology Div. 紹介」を公開予定です。


Masaaki Hirotsu
MLOps Div. 所属 / Kaggle Master
機械学習・データ分析基盤の構築に関わる事例や、クラウドを活用したアーキテクチャについて発信していきます

SERVICE