Yodo Labsについて
Yodo Labsは東京・大阪を拠点とする応用AIの研究・エンジニアリング企業です。計測、検査、安全確認のための現場ビジュアルAIシステムを構築しています。作業員が既に持っているスマートフォンやエッジデバイス上で動作するシステムです。鉄道、電力、建設、製造。オフライン対応。数週間で導入。
このポジションについて
ベンチマークでは完璧に動くのに、工場の現場では失敗するモデルを学習させた経験があるはずです。正常サンプル1万件に対して欠陥サンプルが3件しかないデータセットに悩まされたことがあるはずです。研究プロトタイプと保守作業員が実際に使うシステムとの間のギャップは、デプロイメントの問題ではなくモデリングの問題だと分かっているはずです。
Yodo Labsでは、現場で正確な視覚判断を行うビジョンシステムを構築しています。私たちのモデルは、どのデータセットにもほとんど存在しない欠陥を検出し、1枚のスマートフォン画像から寸法を計測し、作業員が通電する前に安全上重要な接続を確認する必要があります。しかも10-50MB、完全オフライン、AIのために設計されたわけではないハードウェアで動作させなければなりません。
コンピュータビジョンエンジニアとして、データからデバイスまでのパイプライン全体を担当します。クライアントが10年間で3回しか見たことのない欠陥のための合成学習データを生成します。学習セットが数枚の参照画像と検査員との会話だけという状況で、ビジョン言語モデルをファインチューニングします。その結果を、接続のないトンネル内のスマートフォンで動作するサイズに蒸留します。
これは研究職でもなく、純粋なエンジニアリング職でもありません。課題がそれを求めるため、両方を同時にこなすポジションです。
業務内容
- 現場検査、計測、安全確認のためのビジョンモデルを設計・学習する。各デプロイメントは最小限の既存データしかない新しいドメインです
- 合成データ生成パイプラインを構築・維持する:少数の実例から、レアケースの長尾をカバーする数千のトレーニングサンプルを生成する
- ビジョン言語モデルを少数ショット例と自然言語タスク記述から新しい検査タスクを学習するようにファインチューニングする
- 大規模モデルをスマートフォンやエッジハードウェアで完全オフライン動作するコンパクトなオンデバイスモデル(10-50MB)に蒸留する
- 実際の現場条件でモデルをデプロイ、テスト、イテレーションする。あなたの仕事はダッシュボードではなく、建設現場、鉄道軌道、変電所に届きます
代表的なプロジェクト
- 鉄道架線設備の摩耗検出のための合成データパイプラインを構築する。クライアントが提供した12枚の参照画像から始め、クライアントが撮影したことのないクラックパターン、腐食段階、環境条件をカバーする学習セットを生成する
- 電力会社向けに活線接続確認を行うビジョン言語モデルをファインチューニングする。タスク定義はラベル付きデータセットではなく、ベテラン検査員との2時間の会話から得られる
- 20億パラメータのビジョンモデルを、製造ラインの表面欠陥検出で95%以上の精度を維持する30MBのオンデバイスモデルに蒸留する。標準的なスマートフォンで推論時間200ms以下
- 現場作業員が不確実な予測にフラグを立て、実世界のエッジケースを学習パイプラインにフィードバックする能動学習ループを設計する。作業員にML専門知識は不要
こんな方に向いています
- コンピュータビジョンの実務経験がある方:物体検出、セグメンテーション、画像分類、または外観検査。モデルを学習させ、正直に評価した経験がある方
- モデル圧縮の実践経験がある方:蒸留、量子化、プルーニング、またはオンデバイスデプロイメント(ONNX、CoreML、TFLite等)
- ビジョン言語モデル(CLIP、LLaVA、Florence等)に精通し、限られたデータで新しいドメインに適応させる方法を知っている方
- データ不足に対する実用的なアプローチを持つ方。1万件のラベル付きデータを要求する前に、合成データ、データ拡張、少数ショット学習に手を伸ばす方
- PyTorchの経験があり、学習からデプロイメントまでのパイプライン全体で快適に作業できる方
- 実世界でテストする本能がある方。損失曲線が平坦になった時ではなく、現場で動いた時にモデルは完成すると知っている方
- ビジネスレベルの英語。日本語ができれば望ましいですが必須ではありません
必須ではない経験
- トップティアビジョン学会での論文。構築しリリースしたものを重視します。被引用数ではありません
- 当社の特定業界での経験。鉄道のクリアランスチェックがどのようなものかを学べる方なら、ドメイン知識は後からついてきます
- 博士号。優れたエンジニアリングスキルとビジョン課題への純粋な好奇心の方が、資格よりも重要です
応募方法
team@yodolabs.jp 宛に件名 「コンピュータビジョンエンジニア(フルタイム) - [お名前]」 でメールをお送りください。以下をお含めください:
- 履歴書・職務経歴書
- 誇りに思うビジョンモデルの簡単な説明。課題、アプローチ、学んだことを理解したいです
- GitHubプロフィールや関連プロジェクトリポジトリへのリンク
勤務条件
勤務地: 東京・大阪(リモートフレンドリー) 勤務形態: フレックスタイム。クライアント施設への現場訪問あり ビザサポート: 可能な限り就労ビザをサポートします
すべての条件を満たしていなくても、ぜひご応募ください。