クライアントの背景
AspiraTech は、東京を拠点とするテクノロジー・コンサルティング企業であり、意欲的なテクノロジー主導の組織に対して、ビジネス開発、戦略立案、越境市場拡大の支援を提供しています。さらに、最先端テクノロジーを活用したデジタルソリューションの企画・運用を組み合わせたサービスを展開しています。
AspiraTech の特徴は、コンサルティングレベルの厳密さとプロダクト志向の実行力を兼ね備えている点です。「テクノロジーの力で、大志ある事業を新しい地平へ」というビジョンは、先進的なAIイニシアチブから実践的な価値創出サービスまで幅広いポートフォリオに反映されています。
課題
リクルーティングおよびヘッドハンティング業務には、ブラウザベースの反復的な作業が大量に含まれます。複数のWebツールの操作、構造化された情報の抽出、レコードの照合確認、標準化された更新の実行などです。これらのタスクは高頻度かつ例外処理が多いため、スクリプトのみの脆弱な自動化には適していません。
AspiraTech が求めたアプローチは以下の通りです:
- 実際のWeb UIで確実に動作すること(動的ページ、レイアウトの変更、複数ステップのフロー)
- 採用業務では機密データを扱う可能性があるため、セキュアに分離された環境で実行されること
- ビジネスオペレーションに適した、監査可能なアウトプットと実行トレースを生成すること
- パイロットワークフローから複数の類似ワークフローへ、プラットフォームを毎回再設計することなくスケールできること
Yodo Labs のソリューション
Yodo Labs は、クラウドサンドボックス型AIブラウザを設計・構築しました。これは、AIエージェントが厳格な制御のもとでエンドツーエンドのブラウザタスクを実行し、構造化されたアウトプットと実行トレースを生成する、分離された「仮想ブラウジングワークスペース」です。
本システムは3つの主要コンポーネントで構成されています:
AIエージェントオーケストレーション層 はブラウザ制御プレーンの上位に位置し、高レベルの目標を実行可能なステップに変換します。ツールの選択、ページ状態の検証、一般的なUIエッジケース(タイミング、リダイレクト、モーダルダイアログ)からの回復を、すべてのパスをハードコーディングすることなく処理します。
プロダクショングレードのブラウザ自動化層(Playwright)
モダンなWebアプリケーションとの堅牢なインタラクション、一貫したセッション管理、環境間で予測可能に動作する自動化プリミティブを実現するため、Playwright を確定的な制御プレーンとして使用しました。[1]
- 実行を分離するセキュアなクラウドサンドボックスランタイム(E2B)
分離を確保し、エージェントにとって安全な実行サーフェスを提供するため、E2B を使用してブラウザとエージェントランタイムをクラウドサンドボックス内で実行しました。E2B は、信頼されていないコードやAIが生成したワークロードをセキュアかつ分離されたクラウドサンドボックスで実行するためのオープンソースインフラストラクチャであり、SDK を通じて制御可能です。[2]
この「サンドボックス内のAIブラウザ」アーキテクチャは、エンタープライズで一般的な要件に対する実践的な回答を提供します。つまり、エージェントに自由に作業させつつも、制御された影響範囲内に限定するということです。
仕組み(概要)
1) ワークフロー定義とガードレール
AspiraTech と Yodo Labs は、対象タスクをハードコーディングされたクリックスクリプトではなく、目標指向のワークフローとして定義し、エージェントが許可される操作に対して明確な制約を設けました。
2) エフェメラルなサンドボックスのプロビジョニング(E2B)
本実装では、各実行がフレッシュなサンドボックス環境でプロビジョニングされました。これにより、実行間の強力な分離が実現し、クロスセッションのリスクが軽減されます。E2B はパーシステントサンドボックスもサポートしていますが、本ユースケースでは分離を最大化するため、実行ごとに破棄されるエフェメラル運用モデルを選択しました。[2]
3) エージェント駆動のブラウジング(Playwright + ツール使用)
サンドボックス内では、エージェントが Playwright を通じて実際のブラウザを制御します。Playwright が信頼性の高いブラウザ制御プリミティブを提供し、エージェントがUIの変動やエッジケースに対応する適応的な意思決定を行います。[1] エージェントは内部タスクプランを維持し、各ステップで完了基準を確認し、定義されたリスク閾値を超えるアクションについては人間のレビューにエスカレーションします。
4) 構造化されたアウトプット + 完全な実行トレース
各実行は、運用目的に適した構造化された結果(標準化されたフィールド、サマリー、推奨される次のアクション)と、レビューおよび継続的改善のための実行トレースを生成します。
なぜサンドボックス + AIブラウザなのか(従来の自動化との比較)
従来のブラウザ自動化は、UIの変更や例外パスが増加すると脆弱になりがちです。リクルーティング業務は、こうしたエッジケースが特に発生しやすい領域です。サンドボックス型AIブラウザパターンは、2つの課題を同時に解決します:
- 信頼性:エージェントの推論が変動に対応し、Playwright が制御された実行を保証します。[1]
- セキュリティとガバナンス:サンドボックスが実行環境を分離し、エージェント機能のより安全なロールアウトをサポートします。これは、リモートブラウザ分離のアプローチ [3] と概念的に類似していますが、エンドユーザーのデバイス保護ではなく、サーバーサイドのAIエージェント実行に適応させたものです。
成果
本プロジェクトにより、リクルーティング領域におけるオペレーション自動化のスケーラブルな基盤が確立されました:
- 反復的なブラウジングとデータ処理をエージェント駆動のワークフローに移行することで、オペレーション負荷を軽減
- 標準化されたアウトプットと構造化されたサマリーにより、一貫性を向上
- サンドボックスによる分離と制御可能なセッションライフサイクルにより、より安全な実行を実現
- ガードレール、プロンプト、アウトプットスキーマの調整によって新しいタスクを定義できるため、プラットフォーム層の再構築なしにワークフローの迅速なイテレーションを実現
このアーキテクチャにより、同一のセキュリティおよびオペレーションモデルを維持しながら、隣接するワークフローを段階的にオンボーディングできる再利用可能な基盤が構築されました。
References
- Microsoft Playwright ─ Official documentation. playwright.dev
- E2B ─ Official documentation: Sandbox lifecycle & persistence. e2b.dev/docs/sandbox/persistence
- Cloudflare ─ What is browser isolation? cloudflare.com
