【2026年5月最新】サブエージェントはいつ使うべき?|Google論文の"45%ルール"とClaude Code実践活用法3選

【2026年5月最新】サブエージェントはいつ使うべき?|Google論文の

この記事の内容

  1. 01サブエージェントとは何か — 1人体制と"チーム体制"の違い
  2. 02マルチエージェントの4つの構造タイプを理解する
  3. 03Google論文が示した"45%ルール"— 使い分けの科学的根拠
  4. 04並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目
  5. 05実践活用法① 並列リサーチで情報収集を10倍速にする
  6. 06実践活用法② "忖度"を排除して客観的な評価を得る
  7. 07実践活用法③ 作成→検証ループで品質を自動的に高める
  8. 08AIエージェントで"会社経営"は本当に有効か?
  9. 09トークンコストと注意点 — サブエージェントの"経費"を把握する
  10. 10まとめ — サブエージェントは"万能薬"ではなく"適材適所の処方箋"
  11. FAQよくある質問

Claude CodeやCodexを使っていると、「サブエージェント」という言葉を耳にする機会が増えてきました。1つのAIだけで処理するのではなく、複数のAIを同時に動かして仕事をさせるという仕組みです。

しかし、こんな疑問を持っている方も多いのではないでしょうか。

✔️「そもそもサブエージェントって何?マルチエージェントと何が違うの?」
✔️「いつ使えばいいのか分からない。使わなくても十分じゃないの?」
✔️「使うとトークンが消費されるって聞いたけど、コスパは大丈夫?」

結論からお伝えすると、サブエージェントは"万能薬"ではありません。Googleの研究チームが180パターンの実験で明らかにしたデータによれば、シングルエージェントで45%以上の正答率が出るタスクでは、サブエージェントを追加しても逆効果になることが分かっています。

つまり、「いつでもマルチエージェントにすれば良い」わけではなく、適切なタイミングを見極めることが最も重要なのです。

代表菅澤 代表菅澤
弊社(株式会社GENAI)でも、Claude CodeのMax 20xプランを使って日々の業務を回しています。サブエージェントも積極的に活用していますが、「何でもかんでもサブエージェントに振ればいい」わけではないと実感しています。この記事では、使い分けの判断基準と3つの具体的な活用法をお伝えします。
AI鬼管理山崎 AI鬼管理山崎
今日は、Google研究者が出した論文のデータを噛み砕きながら、「じゃあ経営の現場でどう使うの?」というところまで落とし込んでいきます。非エンジニアの方でもすぐ実践できる内容ですので、ぜひ最後まで読んでみてください。

01 サブエージェントとは何か — 1人体制と"チーム体制"の違い まずは基本概念を経営者の言葉で整理する

サブエージェントを理解するには、まず「シングルエージェント」と「マルチエージェント」の違いを押さえましょう。難しい技術用語は一切不要です。会社組織に例えると、一瞬で理解できます。

📚 用語解説

シングルエージェント:1つのAIモデル(Claude CodeやChatGPTなど)が、すべてのタスクを1人で処理する方式。あなたがチャットで指示を出し、AIが調べて・考えて・作って・返す——これが一般的な使い方です。いわば「何でも屋の優秀な社員が1人で全部やる」イメージです。

普段、ChatGPTやClaudeのWebアプリを使う場合、ほとんどの方はこのシングルエージェントで作業しています。1つのAIに質問して、答えをもらう。この1対1の関係が基本形です。

1-1. マルチエージェントとは — "チーム"で仕事をする構造

一方、マルチエージェントは、メインのAI(メインエージェント)が複数の部下AI(サブエージェント)に仕事を振り分け、それぞれの結果を統合して返す仕組みです。

📚 用語解説

マルチエージェント:複数のAIモデルが連携してタスクを処理する構造。メインエージェントが司令塔となり、サブエージェントに個別のタスクを割り当てる。会社に例えれば「部長(メインエージェント)が、課員(サブエージェント)にそれぞれ担当業務を振って、報告を集約する」イメージです。

あなたの指示
メインエージェント
(司令塔)
サブエージェントA
サブエージェントB
サブエージェントC
結果を統合
して返答

たとえば、Claude Codeで「この日本語を英語に翻訳してください。サブエージェントを使って処理してください」と指示すると、メインエージェントが自動的にサブエージェントを起動します。サブエージェントは翻訳タスクだけに集中して処理し、結果をメインエージェントに返します。メインエージェントはその結果をまとめて、あなたに最終回答を伝えます。

AI鬼管理山崎 AI鬼管理山崎
分かりやすく言えば、シングルエージェントは「社長が全部自分でやる1人会社」。マルチエージェントは「社長がチームに仕事を振って成果を取りまとめる組織」。どちらが良いかは、タスクの性質によって決まるんです。

1-2. Claude CodeとCodexでの使い方

実際のツールでの使い方を確認しておきましょう。

ツールサブエージェントの起動方法特徴
Claude Code指示文に「サブエージェントを使って」と書くだけ。自動判断で起動する場合もあるCtrl+Oで処理履歴を確認でき、どのサブエージェントが何をしたか追跡可能
Codex同じく指示文ベースで起動。バックグラウンドエージェントとして名前付きで管理されるエージェントごとに独立した履歴が確認できる

重要なのは、ユーザーが難しいコードを書く必要はないという点です。「サブエージェントを使って調べてください」と自然言語で指示するだけで、AIが自動的にチーム体制を組んでくれます。

💡 Claude Code最新機能

Claude Codeでは「エージェントチームズ」という機能がリリースされています。これはメインエージェントとサブエージェントの構造に加え、サブエージェント同士が直接コミュニケーションできるハイブリッド型のアーキテクチャです。後述する4つの構造タイプの中で、最も高度な形態にあたります。

02 マルチエージェントの4つの構造タイプを理解する 会社組織に例えて直感的に把握する

マルチエージェントと一口に言っても、実は4つの異なる構造が存在します。Googleの研究論文でも、この4つの構造を使い分けて実験が行われています。

ここでは、会社組織に例えて各構造を整理します。

📚 用語解説

エージェントアーキテクチャ:AIエージェントの設計構造のこと。シングルかマルチか、マルチの場合どのような連携方式を採るかを指します。会社で言えば「組織図」に相当するもの。どの構造を選ぶかで、処理の効率も精度も大きく変わります。

2-1. シングルエージェント — "1人社長"の全部自前方式

最もシンプルな構造です。1つのAIがすべてを処理します。ChatGPTに質問する、Claude Codeでサブエージェントなしにタスクをこなす——普段のAI利用は、ほぼこの形態です。

強み:全体の文脈を1つのAIが一貫して把握しているため、情報のロスが発生しません。
弱み:処理が直列になるので、複数の調査を同時に進めたいときに時間がかかります。

2-2. インディペンデント型 — "全員バラバラに調べて最後に報告会"

複数のサブエージェントが互いに連絡を取らず、それぞれ独立に同じ問題を解きます。最後に全員の答えを集めて、多数決や統合で最終回答を決める方式です。

会社に例えれば、「4人の調査員にそれぞれ同じテーマで調べさせて、最後に報告をまとめる」イメージ。選挙の出口調査を複数の調査会社に発注するようなものです。

2-3. セントラライズ型 — "部長がタスクを振って報告を受ける"

これがClaude Codeの基本的なサブエージェント構造です。中央にメインエージェント(部長)がいて、各サブエージェント(課員)にタスクを振ります。課員はそれぞれの担当を処理して部長に報告し、部長が結果を統合して最終回答を作ります。

メイン
エージェント
サブA
(調査担当)
サブB
(分析担当)
サブC
(評価担当)

2-4. ディセントラライズ型 — "全員が会議室で議論する"

メインの司令塔がおらず、エージェント同士が自由に議論しながらタスクを進めます。最終的にはエージェント間の合意や投票で結論を出す方式です。

会社に例えれば「管理職不在で、メンバー全員がブレストしながら結論を出す」イメージ。合議制の意思決定に近い構造です。

2-5. ハイブリッド型 — "部長がいて、課員同士も連携する"

セントラライズ型とディセントラライズ型の合わせ技です。メインエージェントがタスクを振りつつ、サブエージェント同士も直接やり取りできる構造。Claude Codeの「エージェントチームズ」がこの型に該当します。

構造タイプ会社に例えると向いている場面
シングル1人社長が全部やる単純で文脈が重要なタスク
インディペンデントバラバラ調査→報告会同一テーマの多角的検証
セントラライズ部長→課員→報告明確に分担できるタスク
ディセントラライズ全員で議論クリエイティブな合議が必要な場面
ハイブリッド部長指揮+課員間連携複雑で相互依存のあるタスク
代表菅澤 代表菅澤
弊社の実務では、圧倒的に使用頻度が高いのは「セントラライズ型」です。部長が仕事を振って、報告を受けて取りまとめる——これが最も自然で、経営者にとっても感覚的に理解しやすい構造ですね。

03 Google論文が示した"45%ルール"— 使い分けの科学的根拠 マルチエージェントは万能ではないことを180パターンの実験が証明

ここからが本記事の核心です。「サブエージェントを使えば性能が上がる」と思い込んでいる方は、ぜひこのセクションを注意深く読んでください。

Googleの研究チームが発表した論文「When and Why Do Multi-Agent Systems Work?」(マルチエージェントシステムはいつ、なぜ有効なのか)は、この問いに対して大規模な実験データで答えを出しています。

📚 用語解説

ベンチマーク:AIの能力を測定するための標準化されたテスト問題集。学校の「全国模試」のようなもので、異なるAIモデルの性能を客観的に比較するために使われます。Google論文では、Webブラウジング、金融分析、ゲーム内プランニング、日常業務の4つのベンチマークが使用されました。

3-1. 実験の概要 — 180パターンの網羅的検証

この研究は、以下の条件を組み合わせた180パターンの実験を行っています。

✔️ベンチマーク:Webブラウジング / 金融分析 / Minecraftプランニング / 日常業務ワークフロー の4種類
✔️構造:シングルエージェント+4種のマルチエージェント(合計5パターン)
✔️AIモデル:GoogleのGemini / OpenAIのGPT / AnthropicのClaude など9モデル

つまり、「どのAIで」「どの構造で」「どんなタスクを解いたら」「精度がどう変わるのか」を網羅的に調べた研究です。

3-2. 衝撃の結果 — "The Myth of More Agents"

論文のタイトルの一部には「The Myth of More Agents」(エージェントが多いほど良いという神話)というフレーズが含まれています。つまり、「エージェントを増やせば性能が上がる」は神話に過ぎないという結論です。

⚠️ Google論文の核心的発見

シングルエージェントで45%以上の精度が出るタスクについては、エージェントを追加するとむしろ精度が低下する傾向が見られました。これは「損益分岐点」のようなもので、ある程度AIが1人でこなせる仕事に対して無理にチーム体制を組むと、伝達コストが精度向上を上回ってしまうのです。

具体的な結果を見てみましょう。

ベンチマークマルチエージェントの効果理由
金融分析(Financial Agent)精度が向上した調査対象(売上/コスト/競合)を並列に分担できるため
Minecraftプランニング全ケースで精度低下木を集める→板にする→家を建てるなど、順序が決まっているため
日常業務ワークフローほぼ精度低下シングルエージェントで十分な精度が出ていたため
Webブラウジングモデルによりばらつきタスクの性質がケースバイケースのため
AI鬼管理山崎 AI鬼管理山崎
つまり、「とりあえずサブエージェント使っておけば間違いない」は完全に誤りなんです。タスクの性質を見極めて、使うかどうかを判断する必要がある。これが今日のメッセージの核心です。

3-3. なぜ45%なのか — 統計モデルによる損益分岐点

では、なぜ「45%」という数字なのでしょうか。研究チームは180パターンの実験結果を統計的にモデル化し、「エージェント数」「シングルエージェント精度」などの変数からパフォーマンスを予測する式を構築しました。

この予測モデルを数学的に解くと、エージェントを追加することで得られるプラス効果と、伝達コストによるマイナス効果が釣り合う点が見えてきます。その損益分岐点が、シングルエージェントの精度で約45%だったのです。

📚 用語解説

表現税(Representation Tax):マルチエージェントにおいて、各サブエージェントの作業結果を圧縮してメインエージェントに伝える際に発生する情報ロスのこと。論文で使われた用語です。経営の言葉に置き換えれば「報告書を書く手間」「中間管理職を通すことによる情報の劣化」に相当します。

シングルエージェント
精度45%未満
マルチエージェント
検討の価値あり
並列分割可能か?
可能なら
精度向上の余地

経営者の感覚で言えば、こういうことです。

45%ルールの経営的解釈

「今の担当者が1人で仕事をして、半分以上まともにこなせている業務」は、わざわざチーム体制にしても改善は見込めない。むしろ、連絡コストが増える分だけ効率が下がる可能性がある。「1人では手に負えない」「情報源が多すぎる」「判断基準が複雑すぎる」——そういう業務こそ、マルチエージェントの出番です。

04 並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目 あなたの業務は"並列化"の恩恵を受けられるか?

Google論文の結果をさらに深掘りすると、マルチエージェントが有効かどうかを決める最大の要因は「そのタスクを並列に分割できるか」です。

4-1. 並列化が効くタスク — 金融分析の例

たとえば「Apple社の業績を総合的に分析してほしい」というタスクを考えます。

売上分析
エージェント
コスト分析
エージェント
競合比較
エージェント
市場動向
エージェント

このタスクは、4人の調査員がそれぞれ独立に調べられる構造になっています。売上を調べる人はコストの結果を待つ必要がありません。だからこそ、並列で動かすことで「1人で全部調べるより多くの情報を短時間で集められる」のです。

4-2. 並列化が効かないタスク — Minecraftの例

一方、Minecraftで「家を建てる」タスクはどうでしょうか。

1
木を切る

まず材料を集める工程が必要。板がないと次に進めない。

2
木材を板にする

切った木を加工する。切っていない木は加工できない。

3
壁を組む

板がないと壁は作れない。順番が決まっている。

4
屋根を乗せる

壁がないと屋根は乗せられない。

各工程が前の工程の結果に依存しているため、分割して並列に処理することができません。こういうタスクでマルチエージェントを使うと、「連絡コスト(表現税)」だけが増えて、精度は下がります。

4-3. あなたの業務は並列化できるか? — 判定チェックリスト

自社の業務にサブエージェントが使えるかどうか、以下のチェックリストで判断してみてください。

判定基準並列化OK(サブエージェント向き)並列化NG(シングル向き)
タスクの独立性各調査項目が独立している前の結果がないと次に進めない
情報源の多さ3つ以上の情報源から同時に調べたい情報源が1つ(社内DB等)
合否判定複数の観点で独立に評価できる1つの基準で順番に処理する必要がある
所要時間1つ1つの調査に数分以上かかる各処理が数秒で終わる
代表菅澤 代表菅澤
弊社での経験則ですが、「情報源が3つ以上あるリサーチ業務」は、ほぼ確実にサブエージェントの恩恵を受けられます。逆に「1つのファイルを順番に処理する」タスクは、シングルエージェントの方が早くて正確です。

📚 用語解説

コンテキストウィンドウ:AIが一度に処理できるテキストの量。本で言えば「同時に開けるページ数」。サブエージェントを使うと、各エージェントが独自のコンテキストウィンドウを持つため、全体として扱える情報量が増えます。ただし、エージェント間で情報を伝達する際にロスが発生するのが課題です。

05 実践活用法① 並列リサーチで情報収集を10倍速にする 複数の情報源を同時に調べて一気にまとめる

ここからは、サブエージェントの具体的な実践活用法を3つ紹介します。いずれも弊社で実際に運用しているパターンです。

1つ目は「並列リサーチ」です。これは最もシンプルで効果が高い使い方です。

5-1. 使い方 — 複数の情報源をサブエージェントに振り分ける

たとえば「最新のAIニュースを網羅的に調べたい」という場面を考えます。情報源は以下のように多岐にわたります。

✔️学術論文:arXiv(アーカイブ)に掲載される最新研究
✔️SNS:X(旧Twitter)での業界関係者の投稿
✔️ニュースサイト:Hacker Newsや日本語のAI系メディア
✔️公式ブログ:OpenAI、Google、Anthropicの公式発表
✔️YouTube:解説動画のサマリー

これを1人のエージェントに全部やらせると、順番に1つずつ調べるので時間がかかります。しかし、サブエージェントを使えば、5つの情報源を5つのエージェントが同時に調査できます。

あなた
「AI最新ニュース
を調べて」
メイン
エージェント
論文担当
SNS担当
ニュース担当
公式ブログ担当
重複除去
→統合レポート

5-2. 指示の出し方 — コピペで使えるプロンプト例

Claude Codeでの指示は、こんな感じで出します。

実践プロンプト例

「最新のAIニュースについて調べたいです。Hacker News、X、公式ブログ、arXivの論文などを調べるためのサブエージェントをそれぞれ作成して最新の情報を調べてください。それぞれのサブエージェントが調べ終わったら、重複などを確認してフィルタリングして私に教えてください。」

ポイントは3つです。

1
情報源を明示する

どこを調べてほしいか具体的に指定します。AIに丸投げで「最新ニュース調べて」だと、1つの情報源しか見ないことがあります。

2
「サブエージェントを使って」と明記する

Claude Codeは指示がなくても自動でサブエージェントを使うことがありますが、明示した方が確実です。

3
最後の統合方法を指示する

「重複を除去してフィルタリング」のように、最終出力の品質条件を伝えておきます。

AI鬼管理山崎 AI鬼管理山崎
この並列リサーチは、弊社でも毎朝の情報収集に使っています。以前は5つのサイトを順番に回って30分かかっていたのが、サブエージェントに任せると5分程度で5倍の情報量が集まります。まさに「並列化の恩恵」の典型です。

5-3. 経営での応用シーン

並列リサーチは、経営の現場では以下のような場面で威力を発揮します。

業務調査する情報源サブエージェントの使い方
競合調査各社の公式サイト、プレスリリース、求人情報競合ごとにサブエージェントを割り当て、同時並行で調査
採用候補者リサーチLinkedIn、個人ブログ、GitHub、出版物情報源ごとにサブエージェントを割り当て、候補者のプロファイルを構築
市場動向の把握業界レポート、ニュース、SNS、学術論文分野ごとにサブエージェントを割り当て、トレンドを網羅
商品企画の情報収集顧客レビュー、競合製品、技術トレンド視点ごとにサブエージェントを割り当て、企画のインプットを集約

06 実践活用法② "忖度"を排除して客観的な評価を得る AIの"お世辞体質"をサブエージェントで解消する

2つ目の活用法は、忖度(そんたく)の回避です。これは多くの方が見落としがちな、しかし極めて重要な使い方です。

6-1. AIの忖度問題 — シコファンシーとは

📚 用語解説

シコファンシー(Sycophancy):AIがユーザーの機嫌を損なわないように、事実よりも相手の期待に合わせた回答を生成する傾向のこと。日本語で言えば「忖度」や「お世辞」に近い現象です。研究対象にもなっており、AIの構造的な課題として知られています。

たとえば、あなたが自分で作った資料をAIに「どう思う?」と聞くとします。高い確率で「素晴らしいですね」「よくまとまっています」という返答が返ってきます。

なぜこうなるかというと、AIはユーザーとの対話履歴から「この人はこの成果物に満足している」という文脈を汲み取り、ネガティブなフィードバックを抑えてしまうのです。部下が社長に「この資料、出来が悪いですね」と言いにくいのと同じ心理構造です。

代表菅澤 代表菅澤
AIが忖度するなんて信じられない、と思うかもしれません。しかし実際に「よくできたと思うのだけど、評価して」と聞くと、ほぼ確実に好意的な評価が返ってきます。これでは自分の成果物が本当に良いのか悪いのか、判断がつきません。

6-2. サブエージェントで忖度を軽減する仕組み

ここでサブエージェントの出番です。メインエージェントに「サブエージェントを使って評価して」と指示すると、サブエージェントはあなたとの対話履歴を直接持っていません。そのため、「この人が作ったもの」という情報が薄まり、より中立的な評価が返ってきやすくなります。

あなた
「評価して」
メインエージェント
(忖度しがち)
サブエージェントA
(内容の正確性)
サブエージェントB
(構成の論理性)
サブエージェントC
(読みやすさ)
中立的な
総合評価

6-3. 比較実験 — シングル評価 vs サブエージェント評価

実際に同じ成果物をシングルエージェントとサブエージェントで評価させると、こんな違いが出ます。

評価方法結果の傾向具体例
シングル(直接評価)好意的、改善点は「あえて言えば」レベル「相当よくできています。強いて言えば、ここを微調整しても良いかもしれません」
サブエージェント評価10点満点で具体的なスコア、事実誤認を明確に指摘「10点中8点。事実の誤りが2箇所、構成で改善すべき点が3箇所あります」

完璧に忖度を排除できるわけではありませんが、サブエージェントの方が具体的で辛口なフィードバックをくれるのは、弊社での経験からも確かです。

💡 忖度回避のコツ

サブエージェントに評価を依頼する際、「批判的に評価してください」「スコアをつけてください」と明確に伝えると、さらに中立的な結果が得られます。「10点満点で何点か」「減点理由は何か」のように、定量評価を求めるのが効果的です。

AI鬼管理山崎 AI鬼管理山崎
弊社では提案書や記事を社外に出す前に、必ずサブエージェント評価を挟んでいます。自分のチェックだけでは見落とす誤りを拾ってくれるので、品質管理の「ダブルチェック担当」として非常に頼りになります。

07 実践活用法③ 作成→検証ループで品質を自動的に高める 「作る担当」と「チェックする担当」を分離して自動PDCAを回す

3つ目の活用法は、「作成→検証ループ」です。これは前述の忖度回避と関連していますが、もう一歩進んだ使い方になります。

7-1. 1人で作って1人でチェックする問題

AIに何かを作らせて、同じAIにチェックさせるとどうなるでしょうか。答えは明白です——自分で書いたレポートを自分で採点するようなもので、甘くなります。

たとえばコードを書かせた後に「バグがないかチェックして」と同じAIに頼むと、自分が書いたコードなので致命的なバグも見逃しがちです。人間でも「自分で書いたメールの誤字は、他人に読んでもらわないと見つからない」という経験は誰にでもあるはずです。

7-2. 作成担当と検証担当を分ける

この問題を解決するのが、メインエージェントを「作成担当」、サブエージェントを「検証担当」に分ける方法です。

作成担当
(メイン)
成果物を出力
検証担当
(サブ)
フィードバック
→修正指示

具体的な運用フローは以下の通りです。

1
メインエージェントが成果物を作成する

まずは通常通り、AIにタスクを実行させます。

2
サブエージェントが検証・採点する

「サブエージェントを使って、以下の基準で評価してください」と指示。各観点で独立に採点させます。

3
フィードバックを元にメインエージェントが修正する

検証結果をメインエージェントに渡して修正させます。

4
最大3回のループで収束させる

無限ループを防ぐため「最大3ラウンド」のような上限を設けます。

7-3. 実践プロンプトとスコア推移

実践プロンプト例

「先ほどの記事を、サブエージェントを使って以下の基準で評価してください。(1)事実の正確性 (2)論理構成 (3)読みやすさ。10点満点で各項目を採点し、改善点を具体的に指摘してください。スコアが9点以上になるか、最大3ラウンドに達するまで修正→再評価を繰り返してください。」

このプロンプトで実行すると、以下のようなスコア推移が確認できます。

ラウンド正確性論理構成読みやすさ総合
ラウンド17点6点7点6.7点
ラウンド28点8点8点8.0点
ラウンド39点9点9点9.0点(目標達成)

3ラウンドの間に、事実の誤りが修正され、論理構成が改善され、表現も磨かれていきます。人間が手をかけなくても、AIが自動的に品質を高めてくれるのがこの手法の魅力です。

代表菅澤 代表菅澤
弊社ではブログ記事の品質管理にこの手法を使っています。作成AIが書いた初稿を検証AIがチェックし、修正を繰り返す。最終的に人間の私が確認するのですが、その時点で既にかなり高いレベルに仕上がっているので、チェック工数が大幅に減りました。
⚠️ 注意:トークン消費に要注意

このループ手法は品質向上に効果的ですが、3ラウンド回すとトークン消費が3倍になります。品質が最重要な成果物(提案書、公開コンテンツなど)に限定して使い、社内メモなどカジュアルなタスクにはシングルエージェントで十分です。

📚 用語解説

トークン:AIが処理するテキストの最小単位。日本語の場合、おおよそ1文字=1〜2トークン程度。Claude Codeの利用プラン(ProやMax)では、一定期間内に使えるトークン量に上限があります。サブエージェントを使うと、各エージェントのシステムプロンプトやツール定義にもトークンが消費されるため、コストが増加します。

08 AIエージェントで"会社経営"は本当に有効か? SNSで話題の「AI社員」運用を冷静に評価する

最近のSNSでは、「AIエージェントで会社を経営する」という投稿が話題になっています。営業部、経理部、マーケティング部——それぞれにAIエージェントを配置して、まるで人間の組織のように運用するというコンセプトです。

コンセプトとしては非常に面白いのですが、ここまでの内容を踏まえると、冷静な評価が必要です。

8-1. 人間の組織論をAIにそのまま適用できるか?

人間の組織では、1人の能力に限界があるから分業します。営業のプロ、経理のプロ、開発のプロ——それぞれの専門性を持つ人材を配置するのは合理的です。

しかし、AIは違います。Claude CodeやGPTは「1人で全部できる万能社員」です。営業資料も作れるし、経理もできるし、コードも書ける。わざわざプロンプトで「あなたは営業担当です」と役割を分けても、能力そのものが制限されるわけではありません

AI鬼管理山崎 AI鬼管理山崎
ここがポイントなんです。人間の組織は「1人の能力の限界」を補うために分業する。でもAIは能力が広いので、分業する意味が人間ほどないんですよね。むしろ、分業させることで連絡コスト(表現税)が発生して効率が落ちるケースがある。

8-2. AI社員運用が向いている場面・向いていない場面

場面向き/不向き理由
完全に独立した並列タスク向いている営業リサーチと経理処理を同時並行させるのは合理的
情報共有が必要な業務不向きエージェント間の情報伝達にロスが発生する
1つのAIで十分こなせる業務不向きわざわざ分けるメリットがない(45%ルール)
デモンストレーションやPR目的向いている「AIで会社を回している」というブランディング効果はある

Google論文の結果を踏まえれば、「エージェントを増やせば増やすほど良い」は神話です。SNSで見栄えが良いからといって、実務に適用する際は慎重に判断する必要があります。

💡 弊社の使い分け

弊社(株式会社GENAI)では、基本的にClaude Codeのシングルエージェントで業務を回しています。サブエージェントを使うのは、この記事で紹介した3つの場面(並列リサーチ・忖度回避・作成検証ループ)に限定しています。月間160時間相当の業務削減は、サブエージェントの「量」ではなく「使いどころの精度」で実現しています。

09 トークンコストと注意点 — サブエージェントの"経費"を把握する 使えば使うほど良いわけではない、コスト意識が大事

サブエージェントには明確なコストがあります。トークン消費が増えるのです。これは、エージェントの数が増えるとサーバー側の処理が増えるためです。

9-1. なぜサブエージェントはトークンを多く消費するのか

サブエージェントを起動すると、各エージェントに対して以下のような情報がロードされます。

✔️システムプロンプト:各サブエージェントに「あなたの役割は〇〇です」という指示
✔️ツール定義:Web検索、ファイル読み書きなど、使えるツールの説明
✔️コンテキスト共有:メインエージェントからの引き継ぎ情報

これらすべてがトークンとして消費されます。つまり、サブエージェントを3体起動すれば、シングルの3倍以上のトークンが使われる計算です。

9-2. コストを抑える運用ルール

弊社では以下のルールを設けてコスト管理しています。

1
日次の定型業務はシングルエージェントで処理する

毎日のレポート作成、メール下書きなど、確立された業務はシングルで十分。

2
週1〜2回のリサーチ業務でサブエージェントを活用する

並列リサーチは効果が高いが、毎日やるとトークン消費が過大に。週1回にまとめるのが現実的。

3
品質検証ループは公開コンテンツに限定する

社内メモにまで検証ループを回すのは過剰。社外に出す提案書・記事・報告書に限定。

4
ループ回数に上限を設ける

作成→検証ループは「最大3ラウンド」を厳守。無制限に回すとコストが青天井に。

3x

コスト目安

サブエージェント3体を使うと、シングルの約3倍以上のトークンを消費します。Claude Max 20xプランなら十分な余裕がありますが、Proプランの場合はサブエージェントの利用を週1〜2回に限定するのが現実的です。

AI鬼管理山崎 AI鬼管理山崎
弊社はMax 20xプラン(月額約30,000円)を使っているので、サブエージェントを日に数回使っても余裕があります。ただ、ProプランやFreeプランの方は、サブエージェントを毎日使うとすぐにリミットに達するので、計画的に使うことが大切です。

10 まとめ — サブエージェントは"万能薬"ではなく"適材適所の処方箋" この記事の要点を3つに凝縮

本記事のポイントを3つにまとめます。

1

45%ルールで使い分ける

シングルエージェントで半分以上まともにこなせるタスクは、マルチエージェントにしても効果が薄い。「1人では手に負えない」タスクにこそ使う。

2

並列化できるタスクが狙い目

情報源が複数あるリサーチ、複数の観点で独立に評価できるチェック業務。前工程の結果に依存する直列タスクにはシングルが向く。

3

3つの実践パターンで十分

並列リサーチ・忖度回避・作成検証ループ。この3パターンを押さえておけば、サブエージェントの恩恵は十分に受けられる。

サブエージェントは、正しい場面で使えば生産性を飛躍的に高めてくれる強力なツールです。しかし、何にでも使えばいいわけではありません。

大切なのは、自分のタスクが「並列化の恩恵を受けられるか」を判断できる目を持つことです。この記事で紹介した45%ルールと3つの実践パターンを基準にすれば、その判断はさほど難しくありません。

代表菅澤 代表菅澤
弊社では「サブエージェントを使うべきか?」と迷ったら、「このタスクは並列に分割できるか?」と自問するルールにしています。答えがYesなら使う、Noならシングルで。シンプルですが、これだけでコストと精度のバランスが取れています。ぜひ皆さんの業務でも試してみてください。

サブエージェントの使い方は理解できたけれど、「自社の業務にどう当てはめればいいか分からない」という方も多いかもしれません。

弊社のAI鬼管理では、Claude Codeのサブエージェント活用を含むAI業務設計を、あなたの業務に合わせて実践ベースで伴走支援しています。「並列化できる業務の洗い出し」「サブエージェントの設計・テスト」まで、一緒に取り組みます。

NEXT STEP

この記事の内容を、あなたのビジネスで
実践してみませんか?

AI活用を自社で回せるようになりたい方

AI鬼管理

Claude CodeやCoworkの導入支援から、業務設計・ルール作成・社内浸透まで実践ベースで伴走します。「自分たちで回せる組織」を作りたい経営者向け。

学ぶ時間はない、とにかく結果がほしい方

爆速自動化スグツクル

業務ヒアリングから設計・開発・納品まで丸投げOK。ホームページ、LP、業務自動化ツールを最短即日で構築します。

AI鬼管理爆速自動化スグツクル
こんな方向け社内で回せる状態を作りたい
外注に依存しない組織を作りたい
学ばなくていいから結果だけ欲しい
とにかく早く自動化したい
内容AIの使い方・業務設計・自動化の作り方を
実践ベースで叩き込む
業務をヒアリングし、設計から
ツール・システムを丸ごと納品
一言で言うと自分で作れるようになる全部任せられる
AI鬼管理を詳しく見るスグツクルを詳しく見る

よくある質問

Q. サブエージェントは無料プランでも使えますか?

A. Claude Codeのサブエージェント機能自体は、プランを問わず利用可能です。ただし、サブエージェントはトークンを多く消費するため、無料プランやProプランではリミットに達しやすくなります。本格的に活用する場合は、Max 5xプラン以上をおすすめします。

Q. サブエージェントを使うと結果が安定しなくなることはありますか?

A. 各サブエージェントが独立に処理するため、毎回の出力にばらつきが生じることはあります。ただし、メインエージェントが結果を統合・フィルタリングする工程があるので、最終出力の品質は概ね安定します。結果の安定性を求める場合は、評価基準を明確に指定すると効果的です。

Q. ChatGPTでもサブエージェント機能は使えますか?

A. ChatGPT単体(Web版)では、Claude Codeのようなサブエージェント機能は現時点では提供されていません。ただし、OpenAIのCodex(API経由)やカスタムGPTsでマルチエージェント的な構成は可能です。手軽にサブエージェントを使いたい場合は、Claude Codeが最も導入しやすい選択肢です。

Q. サブエージェントを使って失敗するパターンは何ですか?

A. 最も多い失敗パターンは「直列タスクに無理やりサブエージェントを適用する」ケースです。前工程の結果に依存するタスク(例:データ取得→加工→レポート生成)を並列化しようとすると、各エージェントが不完全な情報で処理を進めてしまい、最終結果の品質が大幅に低下します。「分割して独立に処理できるか?」を事前に確認してください。

Q. Google論文の45%ルールは、どんなタスクにも当てはまりますか?

A. 45%ルールは180パターンの実験に基づく経験則であり、すべてのタスクに完全に一般化できるわけではありません。ただし「シングルエージェントである程度解けるタスクでは、エージェントを増やしても劇的な改善は見込めない」という傾向自体は、多くの実務でも実感できるものです。厳密な閾値として45%を使うのではなく、「半分以上こなせるなら無理に分割しない」という目安として活用してください。

📒 NOTE で深掘り

AI鬼管理 × 経営者の本音は note でも発信中

ブログでは伝えきれない経営者目線の体験談・業界動向・社内エピソードを
note にて公開しています。フォローして最新情報をチェック!

note @genai_onikanri をフォロー →
AIAI鬼管理

AI鬼管理へのお問い合わせ

この記事を読んで気になった方へ。
AI鬼管理の専門スタッフが、御社に最適な
業務自動化プランを無料でご提案します。

会社名を入力してください
業種を選択してください
お名前を入力してください
正しいメールアドレスを入力してください

1つ以上選択してください
1つ以上選択してください
月額コストを選択してください

約1時間のオンライン面談(Google Meet)です

空き枠を取得中...
面談日時を選択してください

予約確定後、Google Calendarの招待メールをお届けします。
しつこい営業は一切ございません。

監修 最終更新日: 2026年5月12日
菅澤孝平
菅澤 孝平 株式会社GENAI 代表取締役
  • AI業務自動化サービス「AI鬼管理」を運営 — Claude Code を活用し、経営者の業務を「AIエージェントに任せる仕組み」へ転換するパーソナルトレーニングを 伴走構築 で提供。日報・採用・問い合わせ対応・経費精算・議事録・データ集計・営業リスト等の定型業務を、AIに代行させる体制を経営者と一緒に作り込む
  • Claude Code 実装ノウハウを 経営者・法人クライアント に直接指導。生成AIを「便利ツール」ではなく 「業務を任せる存在」 として運用する手法を体系化
  • 「やらせ切る管理」メソッドの開発者。シンゲキ株式会社(2021年設立・鬼管理専門塾運営)にて累計3,000名以上の学習者を志望校合格に導いた管理メソッドを、AI × 経営者支援 に転用
  • 著書『3カ月で志望大学に合格できる鬼管理』(幻冬舎)、『親の過干渉こそ、最強の大学受験対策である。』(講談社)
  • メディア出演: REAL VALUE / カンニング竹山のイチバン研究所 / ええじゃないかBiz 他
  • 明治大学政治経済学部卒
現在は AI鬼管理(Claude Code活用の伴走型パーソナルトレーニング)を主事業とし、経営者と二人三脚で「AIに業務を任せる仕組み」を実装。「実行を強制する環境」を AI で構築する手法を、自社の実運用知見をもとに発信している。