クライアント背景
AspiraTechは、テクノロジー主導の野心的な組織を、事業開発、戦略、クロスボーダー市場展開を通じて支援する東京拠点のテクノロジー・コンサルティング企業です。最先端技術を活用したデジタルソリューションの企画・運営も手がけています。
AspiraTechの特徴は、コンサルティングレベルの厳密さとプロダクト志向の実行力の融合です。「テクノロジーの力で、大志ある事業を新しい地平へ」というビジョンは、先進的なAIイニシアティブから実践的で価値を生み出すサービスまで、幅広いポートフォリオに反映されています。
課題
採用・ヘッドハンティング業務には、複数のWebツールの操作、構造化された情報の抽出、レコードの照合、標準化された更新作業など、大量のブラウザベースの反復作業が含まれます。これらのタスクは高頻度で例外が多く、スクリプトのみの脆弱な自動化には適していません。
AspiraTechは、以下の要件を満たすアプローチを求めていました:
- 実際のWeb UI上で確実に動作すること(動的ページ、変化するレイアウト、マルチステップフロー)
- 採用業務が機密データを扱う可能性を考慮し、安全に隔離された環境で実行されること
- ビジネスオペレーションに適した監査可能な出力と実行トレースを生成すること
- プラットフォームを毎回再設計することなく、パイロットワークフローから複数の類似ワークフローにスケールできること
Yodo Labsのソリューション
Yodo Labsは、クラウドサンドボックスAIブラウザを設計・開発しました。AIエージェントが厳格な制御下でエンドツーエンドのブラウザタスクを実行し、構造化された出力と実行トレースを生成する、隔離された「仮想ブラウジングワークスペース」です。
システムは2つの主要な構成要素を組み合わせています:
AIエージェントオーケストレーション層がブラウザ制御プレーンの上位に位置し、高レベルの目標を実行可能なステップに変換し、ツールを選択し、ページの状態を検証し、一般的なUIエッジケース(タイミング、リダイレクト、モーダルダイアログ)からハードコーディングなしで回復します。
- プロダクショングレードのブラウザ自動化層(Playwright)
Playwrightをブラウザの決定論的制御プレーンとして使用し、最新のWebアプリケーションとの堅牢なインタラクション、一貫したセッション管理、環境間で予測可能に動作する自動化プリミティブを実現しました。[1]
- 実行を隔離するセキュアなクラウドサンドボックスランタイム(E2B)
隔離を強制し、エージェントに安全な実行サーフェスを提供するため、E2Bを使用してブラウザとエージェントランタイムをクラウドサンドボックス内で実行しました。E2Bは、信頼されていないまたはAI生成のワークロードをセキュアで隔離されたサンドボックスで実行するために設計されています。E2Bは、クラウド上のセキュアな隔離サンドボックスでAI生成コードを実行するためのオープンソースインフラストラクチャであり、SDKを介して制御可能です。[2]
この「サンドボックス内のAIブラウザ」アーキテクチャは、一般的なエンタープライズ要件に対する実用的な回答を提供します:エージェントを自由に動作させつつ、制御された影響範囲内でのみ動作させる。
動作の仕組み(高レベル)
1) ワークフロー定義とガードレール
AspiraTechとYodo Labsは、ハードコードされたクリックスクリプトではなく、目標指向のワークフローとしてターゲットタスクを定義し、エージェントが許可される操作に明確な制約を設けました。
2) エフェメラルサンドボックスのプロビジョニング(E2B)
各実行はで隔離されたサンドボックス環境を起動します。これにより実行間の強力な分離が実現され、クロスセッションリスクが軽減されます。E2Bの設計思想は、エージェントワークロードのデフォルト実行モデルとしてセキュアな隔離を重視しています。[2]
3) エージェント駆動のブラウジング(Playwright + ツール使用)
サンドボックス内で、エージェントはPlaywrightを通じて実際のブラウザを制御します。Playwrightが信頼性の高いブラウザ制御プリミティブを提供し、エージェントがUIの変動性やエッジケースに対する適応的な意思決定を行います。[1] エージェントは内部タスクプランを維持し、各ステップで完了基準をチェックし、定義されたリスク閾値を超えるアクションについては人間によるレビューにエスカレートします。
4) 構造化された出力 + 完全な実行トレース
各実行は、運用利用を目的とした構造化された結果(標準化されたフィールド、サマリー、推奨される次のアクション)と、レビューおよび継続的改善のための実行トレースを生成します。
サンドボックス + AIブラウザの理由(従来の自動化との比較)
従来のブラウザ自動化は、UIが変更されたり例外が発生したりすると失敗することが多くあります。採用業務はこれらのエッジケースが特に発生しやすい分野です。サンドボックスAIブラウザパターンは2つの問題を同時に解決します:
- 信頼性:エージェントの推論が変動性に対応し、Playwrightが制御された実行を保証します。[1]
- セキュリティとガバナンス:サンドボックスが実行環境を隔離し、エージェント機能のより安全なロールアウトをサポートします。[3]
これは、「エージェントインフラストラクチャ」(安全なランタイム、仮想コンピュータ、隔離された実行)がエージェントを本番環境で実用的にするための基盤となるという、より広いトレンドと整合しています。[4]
成果
本プロジェクトは、採用コンテキストにおける業務自動化のスケーラブルな基盤を確立しました:
- 反復的なブラウジングとデータ処理をエージェント駆動のワークフローに移行することで業務負荷を軽減
- 標準化された出力と構造化されたサマリーによる一貫性の向上
- サンドボックス隔離と制御可能なセッションライフサイクルによるより安全な実行
- プラットフォームを毎回再構築することなくワークフローを改善できる高速なイテレーション
最も重要なのは、AspiraTechが拡張可能な「自動化サーフェス」を獲得したことです。AIブラウザ + サンドボックスランタイムが整備されたことで、同じセキュリティと運用モデルを維持しながら、隣接するワークフローを段階的にオンボーディングできるようになりました。
参考文献
- Microsoft Playwright , 公式ドキュメント。playwright.dev
- E2B , GitHubリポジトリ。github.com/e2b-dev/e2b
- Cloudflare , ブラウザ分離とは? cloudflare.com
- Pan Xiuxi, "E2B"(Note記事)。note.com/panxiuxi/n/ndde3241c77f9
