単一エージェントがスケールで破綻する理由:MAS の基礎と 3 つの制御トポロジ
2024–2025 年、AI Agent は実験室から本番へ移行しました。しかしすべてのタスクを 1 つの LLM Agent に任せると、規模化時にシステムが崩壊します。
コンテキストウィンドウの上限:中間状態がウィンドウを埋め、推論品質が急降下します。
専門能力の希薄化:検索・コーディング・監査を 1 体で担うと、どれも中途半端になります。
並列処理の欠如:逐次実行では総レイテンシが各ステップの合計になります。
単一障害点:1 回のモデル呼び出し失敗でワークフロー全体が停止します。
根拠データ:Google Agent Bake-Off では処理時間が 1 時間から 10 分に短縮(6 倍)。AdaptOrch は SWE-bench で 12–23% の改善を示しました。
マルチエージェントシステム(MAS)は、定義されたプロトコルとオーケストレーションを通じて協調する独立エージェント群です。各エージェントは単一責任・専用ツール・状態分離・独立アップグレード可能であるべきです。
| トポロジ | 利点 | 欠点 | 適用 |
|---|---|---|---|
| 集中型 | 監査可能・制御しやすい | オーケストレーターがボトルネック | コンプライアンス |
| 分散型 | 高弾性・低レイテンシ | デバッグ困難 | ピア協調 |
| 階層型 | 両者のバランス | 中程度の複雑さ | エンタープライズ |
6 つのオーケストレーション設計パターン:順次パイプラインからハイブリッドまで
以下 6 パターンで本番システムの 95% 以上をカバーできます。
| パターン | 核心 | レイテンシ | 用途 |
|---|---|---|---|
| ① 順次パイプライン | A→B→C 線形 | 合計 | コンテンツ生成・コードレビュー |
| ② 並列 fan-out/fan-in | 並行ワーカー+統合 | 最大値 | 多源リサーチ・リスク評価 |
| ③ 階層 supervisor-worker | Supervisor がルーティング | 動的 | コーディングアシスタント |
| ④ Swarm | P2P+終了規則 | 不可予測 | コードレビュー議論(本番は慎重に) |
| ⑤ ブラックボード | 共有ワークスペース | 非同期 | 時間単位の異種ワークフロー |
| ⑥ ハイブリッド | ルーター+supervisor+並列 | 混合 | エンタープライズ CMS |
パターン 1は LangGraph StateGraph で retriever→analyzer→writer。パターン 2は Send API と Annotated[list, operator.add] で真の並列実行。パターン 3はキーワード高速ルート(<1ms)+ LLM フォールバック。パターン 4は AutoGen max_round=6。パターン 5は task_status: research_done で条件起動。パターン 6は Intent Router→Supervisor→並列研究+品質パイプライン。
AdaptOrch の結論:マルチエージェントでは、エージェントの組み方がモデル選択より重要です。
LangGraph vs CrewAI vs AutoGen と MCP + A2A 二層プロトコル
| 次元 | LangGraph | CrewAI | AutoGen |
|---|---|---|---|
| パラダイム | 状態機械グラフ | ロールベース | 会話型 |
| 状態管理 | ネイティブ | 要自前実装 | 限定的 |
| HITL | interrupt() ネイティブ | 要自前実装 | 対応 |
| 本番対応度 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ |
2026 年の通信は 2 層標準(Linux Foundation Agentic AI Foundation):MCP(垂直)はツール/API 接続を標準化。A2A(水平)は Google が 2025 年 4 月オープンソース、2026 年初 v1.0、Atlassian・Salesforce・SAP 等 50+ パートナー。Agent Card 発見→スキル確認→JSON-RPC 2.0 message/send でタスク委譲します。
本番マルチエージェント 6 ステップ:永続化・HITL・サーキットブレーカー・可観測性
PostgreSQL チェックポイント:PostgresSaver と thread_id でプロセス再起動後も復元します。
Human-in-the-Loop:高リスク操作前に interrupt() で一時停止します。
サーキットブレーカー:CLOSED/OPEN/HALF_OPEN、failure_threshold=5。
Token 予算:TokenBudgetManager で呼び出し前に残予算を確認します。
分散トレーシング:OpenTelemetry の correlation_id を全 Agent 呼び出しに付与します。
ハンドオフ検証 + LLM-as-Judge:Schema 検証、信頼度 <0.7 拒否、4 次元自動評価。
上限設定:MAX_ITERATIONS=10、MAX_TOOL_CALLS_PER_AGENT=20、MAX_TOTAL_TOKENS=50_000。
可観測性指標・4 つの落とし穴・意思決定ツリー・2026 トレンド
MAST の 1642 トレース分析:設計問題 41.77%、エージェント間不整合 36.94%、検証失敗 21.30%。57% が本番運用、可観測性完成は 8% のみ——HTTP 200 でエラーが返るケースに注意が必要です。
落とし穴 1・コンテキスト汚染:幻覚が次エージェントの「事実」になる——全ハンドオフで検証。
落とし穴 2・暴走ループ:Token 費用が 100 倍に——上限を必ず設定。
落とし穴 3・過剰設計:最適数は 3–8 体、順次パイプラインから開始。
落とし穴 4・Demo→本番ギャップ:入力長制限・プロンプト注入検知・PII フィルタ必須。
2026 トレンド:連邦オーケストレーション、マルチモーダル MAS、適応型トポロジ、EU AI Act 監査チェーン。
7×24 マルチエージェント編排と安定した MCP/A2A 接続には、KVMNODE 専用 Mac Mini M4 / M4 Proが本番向けです。料金ページ、注文、ヘルプセンターをご参照ください。