【2026年6月最新】サブエージェントはいつ使うべき？｜Google論文の"45%ルール"とClaude Code実践活用法3選

2026年5月12日 2026年6月1日

aikanri-admin

この記事の内容

01サブエージェントとは何か — 1人体制と"チーム体制"の違い
02マルチエージェントの4つの構造タイプを理解する
03Google論文が示した"45%ルール"— 使い分けの科学的根拠
04並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目
05実践活用法① 並列リサーチで情報収集を10倍速にする
06実践活用法② "忖度"を排除して客観的な評価を得る
07実践活用法③ 作成→検証ループで品質を自動的に高める
08AIエージェントで"会社経営"は本当に有効か？
09トークンコストと注意点 — サブエージェントの"経費"を把握する
10まとめ — サブエージェントは"万能薬"ではなく"適材適所の処方箋"
FAQよくある質問

Claude CodeやCodexを使っていると、「サブエージェント」という言葉を耳にする機会が増えてきました。1つのAIだけで処理するのではなく、複数のAIを同時に動かして仕事をさせるという仕組みです。

しかし、こんな疑問を持っている方も多いのではないでしょうか。

✔️「そもそもサブエージェントって何？マルチエージェントと何が違うの？」

✔️「いつ使えばいいのか分からない。使わなくても十分じゃないの？」

✔️「使うとトークンが消費されるって聞いたけど、コスパは大丈夫？」

結論からお伝えすると、サブエージェントは"万能薬"ではありません。Googleの研究チームが180パターンの実験で明らかにしたデータによれば、シングルエージェントで45%以上の正答率が出るタスクでは、サブエージェントを追加しても逆効果になることが分かっています。

つまり、「いつでもマルチエージェントにすれば良い」わけではなく、適切なタイミングを見極めることが最も重要なのです。

代表菅澤

弊社（株式会社GENAI）でも、Claude CodeのMax 20xプランを使って日々の業務を回しています。サブエージェントも積極的に活用していますが、「何でもかんでもサブエージェントに振ればいい」わけではないと実感しています。この記事では、使い分けの判断基準と3つの具体的な活用法をお伝えします。

AI鬼管理山崎

今日は、Google研究者が出した論文のデータを噛み砕きながら、「じゃあ経営の現場でどう使うの？」というところまで落とし込んでいきます。非エンジニアの方でもすぐ実践できる内容ですので、ぜひ最後まで読んでみてください。

📌 この記事の結論

【2026年6月最新】サブエージェントはいつ使うべき？｜Google論文の"45%ルール"とClaude Code実践活用法3選

この記事の内容 01サブエージェントとは何か — 1人体制と"チーム体制"の違い 02マルチエージェントの4つの構造タイプを理解する 03Google論文が示した"45%ルール"— 使い分けの科学的根拠 04並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目 05実践活用法① 並列リサーチで情報収集を10倍速にする 06実践活用法② "忖度"を排除して客観的な評価を得る 07実践活用法

01 WHAT IS SUB-AGENT サブエージェントとは何か — 1人体制と"チーム体制"の違いまずは基本概念を経営者の言葉で整理する

サブエージェントを理解するには、まず「シングルエージェント」と「マルチエージェント」の違いを押さえましょう。難しい技術用語は一切不要です。会社組織に例えると、一瞬で理解できます。

📚 用語解説

シングルエージェント：1つのAIモデル（Claude CodeやChatGPTなど）が、すべてのタスクを1人で処理する方式。あなたがチャットで指示を出し、AIが調べて・考えて・作って・返す——これが一般的な使い方です。いわば「何でも屋の優秀な社員が1人で全部やる」イメージです。

普段、ChatGPTやClaudeのWebアプリを使う場合、ほとんどの方はこのシングルエージェントで作業しています。1つのAIに質問して、答えをもらう。この1対1の関係が基本形です。

1-1. マルチエージェントとは — "チーム"で仕事をする構造

一方、マルチエージェントは、メインのAI（メインエージェント）が複数の部下AI（サブエージェント）に仕事を振り分け、それぞれの結果を統合して返す仕組みです。

📚 用語解説

マルチエージェント：複数のAIモデルが連携してタスクを処理する構造。メインエージェントが司令塔となり、サブエージェントに個別のタスクを割り当てる。会社に例えれば「部長（メインエージェント）が、課員（サブエージェント）にそれぞれ担当業務を振って、報告を集約する」イメージです。

あなたの指示

→

メインエージェント
（司令塔）

→

サブエージェントA
サブエージェントB
サブエージェントC

→

結果を統合
して返答

たとえば、Claude Codeで「この日本語を英語に翻訳してください。サブエージェントを使って処理してください」と指示すると、メインエージェントが自動的にサブエージェントを起動します。サブエージェントは翻訳タスクだけに集中して処理し、結果をメインエージェントに返します。メインエージェントはその結果をまとめて、あなたに最終回答を伝えます。

AI鬼管理山崎

分かりやすく言えば、シングルエージェントは「社長が全部自分でやる1人会社」。マルチエージェントは「社長がチームに仕事を振って成果を取りまとめる組織」。どちらが良いかは、タスクの性質によって決まるんです。

1-2. Claude CodeとCodexでの使い方

実際のツールでの使い方を確認しておきましょう。

ツール	サブエージェントの起動方法	特徴
Claude Code	指示文に「サブエージェントを使って」と書くだけ。自動判断で起動する場合もある	Ctrl+Oで処理履歴を確認でき、どのサブエージェントが何をしたか追跡可能
Codex	同じく指示文ベースで起動。バックグラウンドエージェントとして名前付きで管理される	エージェントごとに独立した履歴が確認できる

重要なのは、ユーザーが難しいコードを書く必要はないという点です。「サブエージェントを使って調べてください」と自然言語で指示するだけで、AIが自動的にチーム体制を組んでくれます。

💡 Claude Code最新機能

Claude Codeでは「エージェントチームズ」という機能がリリースされています。これはメインエージェントとサブエージェントの構造に加え、サブエージェント同士が直接コミュニケーションできるハイブリッド型のアーキテクチャです。後述する4つの構造タイプの中で、最も高度な形態にあたります。

02 FOUR ARCHITECTURES マルチエージェントの4つの構造タイプを理解する会社組織に例えて直感的に把握する

マルチエージェントと一口に言っても、実は4つの異なる構造が存在します。Googleの研究論文でも、この4つの構造を使い分けて実験が行われています。

ここでは、会社組織に例えて各構造を整理します。

📚 用語解説

エージェントアーキテクチャ：AIエージェントの設計構造のこと。シングルかマルチか、マルチの場合どのような連携方式を採るかを指します。会社で言えば「組織図」に相当するもの。どの構造を選ぶかで、処理の効率も精度も大きく変わります。

2-1. シングルエージェント — "1人社長"の全部自前方式

最もシンプルな構造です。1つのAIがすべてを処理します。ChatGPTに質問する、Claude Codeでサブエージェントなしにタスクをこなす——普段のAI利用は、ほぼこの形態です。

強み：全体の文脈を1つのAIが一貫して把握しているため、情報のロスが発生しません。
弱み：処理が直列になるので、複数の調査を同時に進めたいときに時間がかかります。

2-2. インディペンデント型 — "全員バラバラに調べて最後に報告会"

複数のサブエージェントが互いに連絡を取らず、それぞれ独立に同じ問題を解きます。最後に全員の答えを集めて、多数決や統合で最終回答を決める方式です。

会社に例えれば、「4人の調査員にそれぞれ同じテーマで調べさせて、最後に報告をまとめる」イメージ。選挙の出口調査を複数の調査会社に発注するようなものです。

2-3. セントラライズ型 — "部長がタスクを振って報告を受ける"

これがClaude Codeの基本的なサブエージェント構造です。中央にメインエージェント（部長）がいて、各サブエージェント（課員）にタスクを振ります。課員はそれぞれの担当を処理して部長に報告し、部長が結果を統合して最終回答を作ります。

メイン
エージェント

→

サブA
（調査担当）

→

サブB
（分析担当）

→

サブC
（評価担当）

2-4. ディセントラライズ型 — "全員が会議室で議論する"

メインの司令塔がおらず、エージェント同士が自由に議論しながらタスクを進めます。最終的にはエージェント間の合意や投票で結論を出す方式です。

会社に例えれば「管理職不在で、メンバー全員がブレストしながら結論を出す」イメージ。合議制の意思決定に近い構造です。

2-5. ハイブリッド型 — "部長がいて、課員同士も連携する"

セントラライズ型とディセントラライズ型の合わせ技です。メインエージェントがタスクを振りつつ、サブエージェント同士も直接やり取りできる構造。Claude Codeの「エージェントチームズ」がこの型に該当します。

構造タイプ	会社に例えると	向いている場面
シングル	1人社長が全部やる	単純で文脈が重要なタスク
インディペンデント	バラバラ調査→報告会	同一テーマの多角的検証
セントラライズ	部長→課員→報告	明確に分担できるタスク
ディセントラライズ	全員で議論	クリエイティブな合議が必要な場面
ハイブリッド	部長指揮＋課員間連携	複雑で相互依存のあるタスク

代表菅澤

弊社の実務では、圧倒的に使用頻度が高いのは「セントラライズ型」です。部長が仕事を振って、報告を受けて取りまとめる——これが最も自然で、経営者にとっても感覚的に理解しやすい構造ですね。

03 THE 45% RULE Google論文が示した"45%ルール"— 使い分けの科学的根拠マルチエージェントは万能ではないことを180パターンの実験が証明

ここからが本記事の核心です。「サブエージェントを使えば性能が上がる」と思い込んでいる方は、ぜひこのセクションを注意深く読んでください。

Googleの研究チームが発表した論文「When and Why Do Multi-Agent Systems Work?」（マルチエージェントシステムはいつ、なぜ有効なのか）は、この問いに対して大規模な実験データで答えを出しています。

📚 用語解説

ベンチマーク：AIの能力を測定するための標準化されたテスト問題集。学校の「全国模試」のようなもので、異なるAIモデルの性能を客観的に比較するために使われます。Google論文では、Webブラウジング、金融分析、ゲーム内プランニング、日常業務の4つのベンチマークが使用されました。

3-1. 実験の概要 — 180パターンの網羅的検証

この研究は、以下の条件を組み合わせた180パターンの実験を行っています。

✔️ベンチマーク：Webブラウジング / 金融分析 / Minecraftプランニング / 日常業務ワークフローの4種類

✔️構造：シングルエージェント＋4種のマルチエージェント（合計5パターン）

✔️AIモデル：GoogleのGemini / OpenAIのGPT / AnthropicのClaude など9モデル

つまり、「どのAIで」「どの構造で」「どんなタスクを解いたら」「精度がどう変わるのか」を網羅的に調べた研究です。

3-2. 衝撃の結果 — "The Myth of More Agents"

論文のタイトルの一部には「The Myth of More Agents」（エージェントが多いほど良いという神話）というフレーズが含まれています。つまり、「エージェントを増やせば性能が上がる」は神話に過ぎないという結論です。

⚠️ Google論文の核心的発見

シングルエージェントで45%以上の精度が出るタスクについては、エージェントを追加するとむしろ精度が低下する傾向が見られました。これは「損益分岐点」のようなもので、ある程度AIが1人でこなせる仕事に対して無理にチーム体制を組むと、伝達コストが精度向上を上回ってしまうのです。

具体的な結果を見てみましょう。

ベンチマーク	マルチエージェントの効果	理由
金融分析（Financial Agent）	精度が向上した	調査対象（売上/コスト/競合）を並列に分担できるため
Minecraftプランニング	全ケースで精度低下	木を集める→板にする→家を建てるなど、順序が決まっているため
日常業務ワークフロー	ほぼ精度低下	シングルエージェントで十分な精度が出ていたため
Webブラウジング	モデルによりばらつき	タスクの性質がケースバイケースのため

AI鬼管理山崎

つまり、「とりあえずサブエージェント使っておけば間違いない」は完全に誤りなんです。タスクの性質を見極めて、使うかどうかを判断する必要がある。これが今日のメッセージの核心です。

3-3. なぜ45%なのか — 統計モデルによる損益分岐点

では、なぜ「45%」という数字なのでしょうか。研究チームは180パターンの実験結果を統計的にモデル化し、「エージェント数」「シングルエージェント精度」などの変数からパフォーマンスを予測する式を構築しました。

この予測モデルを数学的に解くと、エージェントを追加することで得られるプラス効果と、伝達コストによるマイナス効果が釣り合う点が見えてきます。その損益分岐点が、シングルエージェントの精度で約45%だったのです。

📚 用語解説

表現税（Representation Tax）：マルチエージェントにおいて、各サブエージェントの作業結果を圧縮してメインエージェントに伝える際に発生する情報ロスのこと。論文で使われた用語です。経営の言葉に置き換えれば「報告書を書く手間」「中間管理職を通すことによる情報の劣化」に相当します。

シングルエージェント
精度45%未満

→

マルチエージェント
検討の価値あり

→

並列分割可能か？

→

可能なら
精度向上の余地

経営者の感覚で言えば、こういうことです。

45%ルールの経営的解釈

「今の担当者が1人で仕事をして、半分以上まともにこなせている業務」は、わざわざチーム体制にしても改善は見込めない。むしろ、連絡コストが増える分だけ効率が下がる可能性がある。「1人では手に負えない」「情報源が多すぎる」「判断基準が複雑すぎる」——そういう業務こそ、マルチエージェントの出番です。

04 PARALLEL VS SEQUENTIAL 並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目あなたの業務は"並列化"の恩恵を受けられるか？

Google論文の結果をさらに深掘りすると、マルチエージェントが有効かどうかを決める最大の要因は「そのタスクを並列に分割できるか」です。

4-1. 並列化が効くタスク — 金融分析の例

たとえば「Apple社の業績を総合的に分析してほしい」というタスクを考えます。

売上分析
エージェント

→

コスト分析
エージェント

→

競合比較
エージェント

→

市場動向
エージェント

このタスクは、4人の調査員がそれぞれ独立に調べられる構造になっています。売上を調べる人はコストの結果を待つ必要がありません。だからこそ、並列で動かすことで「1人で全部調べるより多くの情報を短時間で集められる」のです。

4-2. 並列化が効かないタスク — Minecraftの例

一方、Minecraftで「家を建てる」タスクはどうでしょうか。

木を切る

まず材料を集める工程が必要。板がないと次に進めない。

木材を板にする

切った木を加工する。切っていない木は加工できない。

壁を組む

板がないと壁は作れない。順番が決まっている。

屋根を乗せる

壁がないと屋根は乗せられない。

各工程が前の工程の結果に依存しているため、分割して並列に処理することができません。こういうタスクでマルチエージェントを使うと、「連絡コスト（表現税）」だけが増えて、精度は下がります。

4-3. あなたの業務は並列化できるか？ — 判定チェックリスト

自社の業務にサブエージェントが使えるかどうか、以下のチェックリストで判断してみてください。

判定基準	並列化OK（サブエージェント向き）	並列化NG（シングル向き）
タスクの独立性	各調査項目が独立している	前の結果がないと次に進めない
情報源の多さ	3つ以上の情報源から同時に調べたい	情報源が1つ（社内DB等）
合否判定	複数の観点で独立に評価できる	1つの基準で順番に処理する必要がある
所要時間	1つ1つの調査に数分以上かかる	各処理が数秒で終わる

代表菅澤

弊社での経験則ですが、「情報源が3つ以上あるリサーチ業務」は、ほぼ確実にサブエージェントの恩恵を受けられます。逆に「1つのファイルを順番に処理する」タスクは、シングルエージェントの方が早くて正確です。

📚 用語解説

コンテキストウィンドウ：AIが一度に処理できるテキストの量。本で言えば「同時に開けるページ数」。サブエージェントを使うと、各エージェントが独自のコンテキストウィンドウを持つため、全体として扱える情報量が増えます。ただし、エージェント間で情報を伝達する際にロスが発生するのが課題です。

05 USE CASE 1: PARALLEL RESEARCH 実践活用法① 並列リサーチで情報収集を10倍速にする複数の情報源を同時に調べて一気にまとめる

ここからは、サブエージェントの具体的な実践活用法を3つ紹介します。いずれも弊社で実際に運用しているパターンです。

1つ目は「並列リサーチ」です。これは最もシンプルで効果が高い使い方です。

5-1. 使い方 — 複数の情報源をサブエージェントに振り分ける

たとえば「最新のAIニュースを網羅的に調べたい」という場面を考えます。情報源は以下のように多岐にわたります。

✔️学術論文：arXiv（アーカイブ）に掲載される最新研究

✔️SNS：X（旧Twitter）での業界関係者の投稿

✔️ニュースサイト：Hacker Newsや日本語のAI系メディア

✔️公式ブログ：OpenAI、Google、Anthropicの公式発表

✔️YouTube：解説動画のサマリー

これを1人のエージェントに全部やらせると、順番に1つずつ調べるので時間がかかります。しかし、サブエージェントを使えば、5つの情報源を5つのエージェントが同時に調査できます。

あなた
「AI最新ニュース
を調べて」

→

メイン
エージェント

→

論文担当
SNS担当
ニュース担当
公式ブログ担当

→

重複除去
→統合レポート

5-2. 指示の出し方 — コピペで使えるプロンプト例

Claude Codeでの指示は、こんな感じで出します。

実践プロンプト例

「最新のAIニュースについて調べたいです。Hacker News、X、公式ブログ、arXivの論文などを調べるためのサブエージェントをそれぞれ作成して最新の情報を調べてください。それぞれのサブエージェントが調べ終わったら、重複などを確認してフィルタリングして私に教えてください。」

ポイントは3つです。

情報源を明示する

どこを調べてほしいか具体的に指定します。AIに丸投げで「最新ニュース調べて」だと、1つの情報源しか見ないことがあります。

「サブエージェントを使って」と明記する

Claude Codeは指示がなくても自動でサブエージェントを使うことがありますが、明示した方が確実です。

最後の統合方法を指示する

「重複を除去してフィルタリング」のように、最終出力の品質条件を伝えておきます。

AI鬼管理山崎

この並列リサーチは、弊社でも毎朝の情報収集に使っています。以前は5つのサイトを順番に回って30分かかっていたのが、サブエージェントに任せると5分程度で5倍の情報量が集まります。まさに「並列化の恩恵」の典型です。

5-3. 経営での応用シーン

並列リサーチは、経営の現場では以下のような場面で威力を発揮します。

業務	調査する情報源	サブエージェントの使い方
競合調査	各社の公式サイト、プレスリリース、求人情報	競合ごとにサブエージェントを割り当て、同時並行で調査
採用候補者リサーチ	LinkedIn、個人ブログ、GitHub、出版物	情報源ごとにサブエージェントを割り当て、候補者のプロファイルを構築
市場動向の把握	業界レポート、ニュース、SNS、学術論文	分野ごとにサブエージェントを割り当て、トレンドを網羅
商品企画の情報収集	顧客レビュー、競合製品、技術トレンド	視点ごとにサブエージェントを割り当て、企画のインプットを集約

06 USE CASE 2: AVOIDING SYCOPHANCY 実践活用法② "忖度"を排除して客観的な評価を得る AIの"お世辞体質"をサブエージェントで解消する

2つ目の活用法は、忖度（そんたく）の回避です。これは多くの方が見落としがちな、しかし極めて重要な使い方です。

6-1. AIの忖度問題 — シコファンシーとは

📚 用語解説

シコファンシー（Sycophancy）：AIがユーザーの機嫌を損なわないように、事実よりも相手の期待に合わせた回答を生成する傾向のこと。日本語で言えば「忖度」や「お世辞」に近い現象です。研究対象にもなっており、AIの構造的な課題として知られています。

たとえば、あなたが自分で作った資料をAIに「どう思う？」と聞くとします。高い確率で「素晴らしいですね」「よくまとまっています」という返答が返ってきます。

なぜこうなるかというと、AIはユーザーとの対話履歴から「この人はこの成果物に満足している」という文脈を汲み取り、ネガティブなフィードバックを抑えてしまうのです。部下が社長に「この資料、出来が悪いですね」と言いにくいのと同じ心理構造です。

代表菅澤

AIが忖度するなんて信じられない、と思うかもしれません。しかし実際に「よくできたと思うのだけど、評価して」と聞くと、ほぼ確実に好意的な評価が返ってきます。これでは自分の成果物が本当に良いのか悪いのか、判断がつきません。

6-2. サブエージェントで忖度を軽減する仕組み

ここでサブエージェントの出番です。メインエージェントに「サブエージェントを使って評価して」と指示すると、サブエージェントはあなたとの対話履歴を直接持っていません。そのため、「この人が作ったもの」という情報が薄まり、より中立的な評価が返ってきやすくなります。

あなた
「評価して」

→

メインエージェント
（忖度しがち）

→

サブエージェントA
（内容の正確性）
サブエージェントB
（構成の論理性）
サブエージェントC
（読みやすさ）

→

中立的な
総合評価

6-3. 比較実験 — シングル評価 vs サブエージェント評価

実際に同じ成果物をシングルエージェントとサブエージェントで評価させると、こんな違いが出ます。

評価方法	結果の傾向	具体例
シングル（直接評価）	好意的、改善点は「あえて言えば」レベル	「相当よくできています。強いて言えば、ここを微調整しても良いかもしれません」
サブエージェント評価	10点満点で具体的なスコア、事実誤認を明確に指摘	「10点中8点。事実の誤りが2箇所、構成で改善すべき点が3箇所あります」

完璧に忖度を排除できるわけではありませんが、サブエージェントの方が具体的で辛口なフィードバックをくれるのは、弊社での経験からも確かです。

💡 忖度回避のコツ

サブエージェントに評価を依頼する際、「批判的に評価してください」「スコアをつけてください」と明確に伝えると、さらに中立的な結果が得られます。「10点満点で何点か」「減点理由は何か」のように、定量評価を求めるのが効果的です。

AI鬼管理山崎

弊社では提案書や記事を社外に出す前に、必ずサブエージェント評価を挟んでいます。自分のチェックだけでは見落とす誤りを拾ってくれるので、品質管理の「ダブルチェック担当」として非常に頼りになります。

07 USE CASE 3: BUILD-VERIFY LOOP 実践活用法③ 作成→検証ループで品質を自動的に高める「作る担当」と「チェックする担当」を分離して自動PDCAを回す

3つ目の活用法は、「作成→検証ループ」です。これは前述の忖度回避と関連していますが、もう一歩進んだ使い方になります。

7-1. 1人で作って1人でチェックする問題

AIに何かを作らせて、同じAIにチェックさせるとどうなるでしょうか。答えは明白です——自分で書いたレポートを自分で採点するようなもので、甘くなります。

たとえばコードを書かせた後に「バグがないかチェックして」と同じAIに頼むと、自分が書いたコードなので致命的なバグも見逃しがちです。人間でも「自分で書いたメールの誤字は、他人に読んでもらわないと見つからない」という経験は誰にでもあるはずです。

7-2. 作成担当と検証担当を分ける

この問題を解決するのが、メインエージェントを「作成担当」、サブエージェントを「検証担当」に分ける方法です。

作成担当
（メイン）

→

成果物を出力

→

検証担当
（サブ）

→

フィードバック
→修正指示

具体的な運用フローは以下の通りです。

メインエージェントが成果物を作成する

まずは通常通り、AIにタスクを実行させます。

サブエージェントが検証・採点する

「サブエージェントを使って、以下の基準で評価してください」と指示。各観点で独立に採点させます。

フィードバックを元にメインエージェントが修正する

検証結果をメインエージェントに渡して修正させます。

最大3回のループで収束させる

無限ループを防ぐため「最大3ラウンド」のような上限を設けます。

7-3. 実践プロンプトとスコア推移

実践プロンプト例

「先ほどの記事を、サブエージェントを使って以下の基準で評価してください。(1)事実の正確性 (2)論理構成 (3)読みやすさ。10点満点で各項目を採点し、改善点を具体的に指摘してください。スコアが9点以上になるか、最大3ラウンドに達するまで修正→再評価を繰り返してください。」

このプロンプトで実行すると、以下のようなスコア推移が確認できます。

ラウンド	正確性	論理構成	読みやすさ	総合
ラウンド1	7点	6点	7点	6.7点
ラウンド2	8点	8点	8点	8.0点
ラウンド3	9点	9点	9点	9.0点（目標達成）

3ラウンドの間に、事実の誤りが修正され、論理構成が改善され、表現も磨かれていきます。人間が手をかけなくても、AIが自動的に品質を高めてくれるのがこの手法の魅力です。

代表菅澤

弊社ではブログ記事の品質管理にこの手法を使っています。作成AIが書いた初稿を検証AIがチェックし、修正を繰り返す。最終的に人間の私が確認するのですが、その時点で既にかなり高いレベルに仕上がっているので、チェック工数が大幅に減りました。

⚠️ 注意：トークン消費に要注意

このループ手法は品質向上に効果的ですが、3ラウンド回すとトークン消費が3倍になります。品質が最重要な成果物（提案書、公開コンテンツなど）に限定して使い、社内メモなどカジュアルなタスクにはシングルエージェントで十分です。

📚 用語解説

トークン：AIが処理するテキストの最小単位。日本語の場合、おおよそ1文字=1〜2トークン程度。Claude Codeの利用プラン（ProやMax）では、一定期間内に使えるトークン量に上限があります。サブエージェントを使うと、各エージェントのシステムプロンプトやツール定義にもトークンが消費されるため、コストが増加します。

08 AI COMPANY MANAGEMENT AIエージェントで"会社経営"は本当に有効か？ SNSで話題の「AI社員」運用を冷静に評価する

最近のSNSでは、「AIエージェントで会社を経営する」という投稿が話題になっています。営業部、経理部、マーケティング部——それぞれにAIエージェントを配置して、まるで人間の組織のように運用するというコンセプトです。

コンセプトとしては非常に面白いのですが、ここまでの内容を踏まえると、冷静な評価が必要です。

8-1. 人間の組織論をAIにそのまま適用できるか？

人間の組織では、1人の能力に限界があるから分業します。営業のプロ、経理のプロ、開発のプロ——それぞれの専門性を持つ人材を配置するのは合理的です。

しかし、AIは違います。Claude CodeやGPTは「1人で全部できる万能社員」です。営業資料も作れるし、経理もできるし、コードも書ける。わざわざプロンプトで「あなたは営業担当です」と役割を分けても、能力そのものが制限されるわけではありません。

AI鬼管理山崎

ここがポイントなんです。人間の組織は「1人の能力の限界」を補うために分業する。でもAIは能力が広いので、分業する意味が人間ほどないんですよね。むしろ、分業させることで連絡コスト（表現税）が発生して効率が落ちるケースがある。

8-2. AI社員運用が向いている場面・向いていない場面

場面	向き/不向き	理由
完全に独立した並列タスク	向いている	営業リサーチと経理処理を同時並行させるのは合理的
情報共有が必要な業務	不向き	エージェント間の情報伝達にロスが発生する
1つのAIで十分こなせる業務	不向き	わざわざ分けるメリットがない（45%ルール）
デモンストレーションやPR目的	向いている	「AIで会社を回している」というブランディング効果はある

Google論文の結果を踏まえれば、「エージェントを増やせば増やすほど良い」は神話です。SNSで見栄えが良いからといって、実務に適用する際は慎重に判断する必要があります。

💡 弊社の使い分け

弊社（株式会社GENAI）では、基本的にClaude Codeのシングルエージェントで業務を回しています。サブエージェントを使うのは、この記事で紹介した3つの場面（並列リサーチ・忖度回避・作成検証ループ）に限定しています。月間160時間相当の業務削減は、サブエージェントの「量」ではなく「使いどころの精度」で実現しています。

09 TOKEN COST & TIPS トークンコストと注意点 — サブエージェントの"経費"を把握する使えば使うほど良いわけではない、コスト意識が大事

サブエージェントには明確なコストがあります。トークン消費が増えるのです。これは、エージェントの数が増えるとサーバー側の処理が増えるためです。

9-1. なぜサブエージェントはトークンを多く消費するのか

サブエージェントを起動すると、各エージェントに対して以下のような情報がロードされます。

✔️システムプロンプト：各サブエージェントに「あなたの役割は〇〇です」という指示

✔️ツール定義：Web検索、ファイル読み書きなど、使えるツールの説明

✔️コンテキスト共有：メインエージェントからの引き継ぎ情報

これらすべてがトークンとして消費されます。つまり、サブエージェントを3体起動すれば、シングルの3倍以上のトークンが使われる計算です。

9-2. コストを抑える運用ルール

弊社では以下のルールを設けてコスト管理しています。

日次の定型業務はシングルエージェントで処理する

毎日のレポート作成、メール下書きなど、確立された業務はシングルで十分。

週1〜2回のリサーチ業務でサブエージェントを活用する

並列リサーチは効果が高いが、毎日やるとトークン消費が過大に。週1回にまとめるのが現実的。

品質検証ループは公開コンテンツに限定する

社内メモにまで検証ループを回すのは過剰。社外に出す提案書・記事・報告書に限定。

ループ回数に上限を設ける

作成→検証ループは「最大3ラウンド」を厳守。無制限に回すとコストが青天井に。

NEXT STEP

この記事の内容を、あなたのビジネスで
実践してみませんか？

AI活用を自社で回せるようになりたい方へ

AI鬼管理

Claude Code・Cowork導入支援から業務設計・社内浸透まで実践ベースで伴走。「自社で回せる組織」を90日で作る経営者向けトレーニング。

AI鬼管理を詳しく見る →

よくある質問

Q. サブエージェントは無料プランでも使えますか？

A. Claude Codeのサブエージェント機能自体は、プランを問わず利用可能です。ただし、サブエージェントはトークンを多く消費するため、無料プランやProプランではリミットに達しやすくなります。本格的に活用する場合は、Max 5xプラン以上をおすすめします。

Q. サブエージェントを使うと結果が安定しなくなることはありますか？

A. 各サブエージェントが独立に処理するため、毎回の出力にばらつきが生じることはあります。ただし、メインエージェントが結果を統合・フィルタリングする工程があるので、最終出力の品質は概ね安定します。結果の安定性を求める場合は、評価基準を明確に指定すると効果的です。

Q. ChatGPTでもサブエージェント機能は使えますか？

A. ChatGPT単体（Web版）では、Claude Codeのようなサブエージェント機能は現時点では提供されていません。ただし、OpenAIのCodex（API経由）やカスタムGPTsでマルチエージェント的な構成は可能です。手軽にサブエージェントを使いたい場合は、Claude Codeが最も導入しやすい選択肢です。

Q. サブエージェントを使って失敗するパターンは何ですか？

A. 最も多い失敗パターンは「直列タスクに無理やりサブエージェントを適用する」ケースです。前工程の結果に依存するタスク（例：データ取得→加工→レポート生成）を並列化しようとすると、各エージェントが不完全な情報で処理を進めてしまい、最終結果の品質が大幅に低下します。「分割して独立に処理できるか？」を事前に確認してください。

Q. Google論文の45%ルールは、どんなタスクにも当てはまりますか？

A. 45%ルールは180パターンの実験に基づく経験則であり、すべてのタスクに完全に一般化できるわけではありません。ただし「シングルエージェントである程度解けるタスクでは、エージェントを増やしても劇的な改善は見込めない」という傾向自体は、多くの実務でも実感できるものです。厳密な閾値として45%を使うのではなく、「半分以上こなせるなら無理に分割しない」という目安として活用してください。

ABOUT AI鬼管理

Claude Codeで業務自動化を90日で叩き込む

経営者向けの伴走型パーソナルトレーニング

⚖

他社サービスとの違い

ツール提供型・コンサル型・動画教材型と比較

詳しく見る →

料金プラン

STANDARD / COMMIT 2プランをご用意

■ RELATED SERVICE

Claude Code を業務に落とし込む
専門研修コース一覧

受講者本人の業務を題材に、「使いこなせる」状態になるまで伴走する研修プログラム。1対1特化型・ハンズオン・法人講座の3コースを展開中。業務特化・実装まで踏み込むタイプのClaude Code研修です。

1対1 特化型ハンズオン法人講座

研修コース一覧を見る →

監修最終更新日: 2026年6月1日

菅澤孝平株式会社GENAI 代表取締役

AI業務自動化サービス「AI鬼管理」を運営 — Claude Code を活用し、経営者の業務を「AIエージェントに任せる仕組み」へ転換するパーソナルトレーニングを 伴走構築 で提供。日報・採用・問い合わせ対応・経費精算・議事録・データ集計・営業リスト等の定型業務を、AIに代行させる体制を経営者と一緒に作り込む
Claude Code 実装ノウハウを経営者・法人クライアントに直接指導。生成AIを「便利ツール」ではなく 「業務を任せる存在」 として運用する手法を体系化
「やらせ切る管理」メソッドの開発者。シンゲキ株式会社（2021年設立・鬼管理専門塾運営）にて累計3,000名以上の学習者を志望校合格に導いた管理メソッドを、AI × 経営者支援に転用
著書『3カ月で志望大学に合格できる鬼管理』(幻冬舎)、『親の過干渉こそ、最強の大学受験対策である。』(講談社)
メディア出演: REAL VALUE / カンニング竹山のイチバン研究所 / ええじゃないかBiz 他
明治大学政治経済学部卒

現在は AI鬼管理（Claude Code活用の伴走型パーソナルトレーニング）を主事業とし、経営者と二人三脚で「AIに業務を任せる仕組み」を実装。「実行を強制する環境」を AI で構築する手法を、自社の実運用知見をもとに発信している。

▸ 代表菅澤孝平のプロフィール詳細を見る

カテゴリー: AI業務自動化、Claude活用法

01 WHAT IS SUB-AGENT サブエージェントとは何か — 1人体制と"チーム体制"の違い まずは基本概念を経営者の言葉で整理する

1-1. マルチエージェントとは — "チーム"で仕事をする構造

1-2. Claude CodeとCodexでの使い方

02 FOUR ARCHITECTURES マルチエージェントの4つの構造タイプを理解する 会社組織に例えて直感的に把握する

2-1. シングルエージェント — "1人社長"の全部自前方式

2-2. インディペンデント型 — "全員バラバラに調べて最後に報告会"

2-3. セントラライズ型 — "部長がタスクを振って報告を受ける"

2-4. ディセントラライズ型 — "全員が会議室で議論する"

2-5. ハイブリッド型 — "部長がいて、課員同士も連携する"

03 THE 45% RULE Google論文が示した"45%ルール"— 使い分けの科学的根拠 マルチエージェントは万能ではないことを180パターンの実験が証明

3-1. 実験の概要 — 180パターンの網羅的検証

3-2. 衝撃の結果 — "The Myth of More Agents"

3-3. なぜ45%なのか — 統計モデルによる損益分岐点

04 PARALLEL VS SEQUENTIAL 並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目 あなたの業務は"並列化"の恩恵を受けられるか？

4-1. 並列化が効くタスク — 金融分析の例

4-2. 並列化が効かないタスク — Minecraftの例

4-3. あなたの業務は並列化できるか？ — 判定チェックリスト

05 USE CASE 1: PARALLEL RESEARCH 実践活用法① 並列リサーチで情報収集を10倍速にする 複数の情報源を同時に調べて一気にまとめる

5-1. 使い方 — 複数の情報源をサブエージェントに振り分ける

5-2. 指示の出し方 — コピペで使えるプロンプト例

5-3. 経営での応用シーン

06 USE CASE 2: AVOIDING SYCOPHANCY 実践活用法② "忖度"を排除して客観的な評価を得る AIの"お世辞体質"をサブエージェントで解消する

6-1. AIの忖度問題 — シコファンシーとは

6-2. サブエージェントで忖度を軽減する仕組み

6-3. 比較実験 — シングル評価 vs サブエージェント評価

07 USE CASE 3: BUILD-VERIFY LOOP 実践活用法③ 作成→検証ループで品質を自動的に高める 「作る担当」と「チェックする担当」を分離して自動PDCAを回す

7-1. 1人で作って1人でチェックする問題

7-2. 作成担当と検証担当を分ける

7-3. 実践プロンプトとスコア推移

08 AI COMPANY MANAGEMENT AIエージェントで"会社経営"は本当に有効か？ SNSで話題の「AI社員」運用を冷静に評価する

8-1. 人間の組織論をAIにそのまま適用できるか？

8-2. AI社員運用が向いている場面・向いていない場面

09 TOKEN COST & TIPS トークンコストと注意点 — サブエージェントの"経費"を把握する 使えば使うほど良いわけではない、コスト意識が大事

9-1. なぜサブエージェントはトークンを多く消費するのか

9-2. コストを抑える運用ルール

よくある質問

Q. サブエージェントは無料プランでも使えますか？

Q. サブエージェントを使うと結果が安定しなくなることはありますか？

Q. ChatGPTでもサブエージェント機能は使えますか？

Q. サブエージェントを使って失敗するパターンは何ですか？

Q. Google論文の45%ルールは、どんなタスクにも当てはまりますか？

関連記事 — 関連記事カテゴリから

Claude Codeで業務自動化を90日で叩き込む

Claude Code を業務に落とし込む専門研修コース一覧

AI鬼管理へのお問い合わせ

【2026年6月最新】AIとITの違いをわかりやすく解説｜DX・IoTとの関係と業務活用の実践ガイド

【2026年6月最新】AIエージェントおすすめ比較｜業務自動化ツール10選と失敗しない選び方

YouTubeで実践事例を配信中

SERVICE

INFORMATION

INDUSTRY CASES

CONTACT

COMPANY

AI鬼管理3〜6ヶ月で業務自動化を実現する

現状分析・課題特定

AI実装・業務自動化

定着・自走支援

01 WHAT IS SUB-AGENT サブエージェントとは何か — 1人体制と"チーム体制"の違いまずは基本概念を経営者の言葉で整理する

02 FOUR ARCHITECTURES マルチエージェントの4つの構造タイプを理解する会社組織に例えて直感的に把握する

03 THE 45% RULE Google論文が示した"45%ルール"— 使い分けの科学的根拠マルチエージェントは万能ではないことを180パターンの実験が証明

04 PARALLEL VS SEQUENTIAL 並列タスク vs 直列タスク — 分割できるかが勝負の分かれ目あなたの業務は"並列化"の恩恵を受けられるか？

05 USE CASE 1: PARALLEL RESEARCH 実践活用法① 並列リサーチで情報収集を10倍速にする複数の情報源を同時に調べて一気にまとめる

07 USE CASE 3: BUILD-VERIFY LOOP 実践活用法③ 作成→検証ループで品質を自動的に高める「作る担当」と「チェックする担当」を分離して自動PDCAを回す

09 TOKEN COST & TIPS トークンコストと注意点 — サブエージェントの"経費"を把握する使えば使うほど良いわけではない、コスト意識が大事

Claude Code を業務に落とし込む
専門研修コース一覧

AI鬼管理
3〜6ヶ月で
業務自動化を実現する