【2026年5月最新】Claude Codeハーネスエンジニアリング入門|3つのサブエージェントで自律開発する設計術

【2026年5月最新】Claude Codeハーネスエンジニアリング入門|3つのサブエージェントで自律開発する設計術

「Claude Codeにコードを書かせたけど、思った通りのものが出てこない」「指示を出すたびに手直しが必要で、結局自分で書いた方が早い」——AIコーディングに触れた経営者・管理職の方なら、一度はこの壁にぶつかったことがあるはずです。

その壁を突破する鍵が、ハーネスエンジニアリングという新しい設計思想です。これは「AIに仕事を丸投げする」のではなく、人間の組織と同じように役割分担されたAIチームを設計し、自律的に仕事を回す仕組みのこと。馬を操る「ハーネス(手綱)」の比喩から来ており、Claude Codeを自在にコントロールして業務を回す設計術です。

この記事では、ハーネスエンジニアリングの基本概念から、Planner(企画)・Generator(実装)・Evaluator(評価)の3つのサブエージェント設計、自己改善ループの仕組み、そして弊社GENAIでの実運用データまでを網羅的に解説します。

代表菅澤 代表菅澤
弊社ではこのハーネス設計を業務全体に適用しています。営業資料の作成、ブログ記事の執筆、広告レポートの生成——すべてにおいて「企画→実行→レビュー」の3エージェント構成を組んで、人間は最終チェックだけ。月間160時間相当の業務をClaude Codeに委任できています。
AI鬼管理山崎 AI鬼管理山崎
今日の記事を読めば、ハーネスエンジニアリングの全体像と、自分の業務にどう組み込めばいいかが明確になります。専門的なプログラミング知識がなくても理解できるよう、経営の比喩を交えながら解説していきます。

この記事を読み終えると、次の7つが身につきます。

✔️ハーネスエンジニアリングの概念と、プロンプトエンジニアリングとの違い
✔️Planner・Generator・Evaluatorの3エージェント構成と役割分担
✔️自己改善ループが品質を劇的に高める仕組み
✔️CLAUDE.MDによるオーケストレーション(エージェントの統制)の方法
✔️Playwright MCPを使った視覚テストの組み込み方
✔️弊社GENAIの実運用事例と、月間削減時間の具体数値
✔️非エンジニアの経営者がハーネス設計を業務に取り入れるステップ
📌 この記事の結論
【2026年5月最新】Claude Codeハーネスエンジニアリング入門|3つのサブエージェントで自律開発する設計術
ハーネスエンジニアリングは、AIを企画・実装・評価の3役に分けて自律運用し、人間は最終チェックだけを担当する仕組みです。営業資料やブログ記事を自動生成でき、月160時間の業務削減を実現しました。専門知識がなくても組織全体で即導入でき、経営効率を劇的に高められます。

01 ハーネスエンジニアリングとは何か 馬のハーネスの比喩で理解する、AI自律制御の設計思想

ハーネスエンジニアリングとは、AIエージェントが自律的に業務を遂行できるように、役割・手順・フィードバックの仕組みを設計する技術です。

「ハーネス」は英語で、馬を操るための手綱や装具一式を指します。馬そのものの能力は高いのに、ハーネスがなければどこに走るか分からない。適切なハーネスがあれば、馬は人間の望む方向に全力で走ってくれます。

Claude Codeもまったく同じです。AIの能力は十分に高いのに、指示の出し方(ハーネスの設計)が悪ければ、期待とズレた成果物が出てくる。逆に、適切なハーネスを設計すれば、2〜3時間放置しておくだけで驚くほど高品質なアプリケーションが完成します。

📚 用語解説

ハーネスエンジニアリング:AIエージェントを自律的に動かすための設計技術。役割ごとにサブエージェントを分けて、フィードバックループを組み込み、人間が介入しなくても品質が担保される仕組みを作ること。Anthropic社が公式ブログで推奨している概念。

1-1. 経営の言葉に置き換えると

ハーネスエンジニアリングは、経営でいう「組織設計」そのものです。例えば、あなたが新しい事業を立ち上げるとき、一人で企画・開発・品質チェック・営業の全てを回すでしょうか? 普通は、企画担当・開発担当・品質管理担当と役割を分けて、それぞれの専門家に任せるはずです。

ハーネスエンジニアリングは、これと同じことをAIエージェントの世界で実現します。企画エージェント(Planner)、開発エージェント(Generator)、品質管理エージェント(Evaluator)を用意して、それぞれに専門の指示を与え、自律的に連携させるのです。

代表菅澤 代表菅澤
会社の組織設計を考えたことがある経営者なら、ハーネスエンジニアリングの概念はすぐに腹落ちするはずです。「誰に何を任せるか」「どうやって品質チェックするか」——人間の組織でやっていることを、AIの組織にも適用するだけですから。

1-2. 従来のAI活用との決定的な違い

従来のClaude Code活用は、いわば「社長が一人で全部指示を出し、一人の社員に全て任せる」状態でした。チャット形式で「これを作って」と指示し、出来上がったものをチェックして、ダメなら「ここを直して」とまた指示を出す。

ハーネスエンジニアリングでは、複数のエージェントが自動的に連携し、レビューまで完結するため、人間の介入回数が劇的に減ります。Anthropic社の公式ブログで紹介されたこの設計思想は、2026年以降のAI活用の主流になりつつあります。

項目従来のAI活用ハーネスエンジニアリング
指示の出し方人間が都度チャットで指示最初にゴールを設定、あとは自動
品質チェック人間が毎回レビューEvaluatorエージェントが自動レビュー
修正サイクル人間→AI→人間の往復AI→AI間のフィードバックループ
人間の役割指示出し+レビュー(都度介入)ゴール設定+最終承認のみ
放置できる時間数分(次の指示が必要)数時間(自律稼働)

📚 用語解説

サブエージェント:Claude Code内で起動される、特定の役割に特化した子プロセスのAI。メインのClaude Codeから呼び出されて、独立したコンテキスト(記憶領域)で作業を行う。人間の組織でいう「部下」や「専門チーム」に相当する。

02 プロンプト→コンテキスト→ハーネスの進化 AI活用の「エンジニアリング」は3段階で進化している

AI活用の「設計技術」は、この2年間で大きく3段階の進化を遂げています。この進化の流れを理解すると、ハーネスエンジニアリングがなぜ今注目されているのかが明確になります。

2-1. 第1世代:プロンプトエンジニアリング

プロンプトエンジニアリングは、AIへの指示文(プロンプト)を工夫することで出力品質を上げる技術です。「ステップバイステップで考えて」「専門家の立場で回答して」といった指示の仕方を研究する分野で、2023〜2024年に爆発的に広まりました。

プロンプトエンジニアリングの限界は、1回のやり取りで完結しようとする点にあります。どれだけ良いプロンプトを書いても、複雑な業務を1回の指示で完璧にこなせるAIはまだ存在しません。

📚 用語解説

プロンプトエンジニアリング:AIに適切な指示文(プロンプト)を設計する技術。例えば「箇条書きで5つ挙げてください」「あなたは○○の専門家です」といった指示テクニック全般を指す。AI活用の第1段階であり、現在も基礎スキルとして重要。

2-2. 第2世代:コンテキストエンジニアリング

コンテキストエンジニアリングは、AIに渡す「文脈情報」を設計する技術です。単にプロンプトを工夫するのではなく、仕様書・タスクリスト・設計ドキュメントなどの背景情報を構造化して渡すことで、AIの出力精度を飛躍的に高めます。

Claude Codeでは、CLAUDE.MDファイルに業務ルールを書いておく、タスク分割した仕様書を作成して渡す、といった使い方がコンテキストエンジニアリングに該当します。しかしこの段階でも、AIが自律的に改善を繰り返す仕組みは含まれていませんでした。

📚 用語解説

コンテキストエンジニアリング:AIに渡す文脈情報(仕様書、ルール、過去の実績データなど)を設計・構造化する技術。Claude CodeではCLAUDE.MDファイルやタスク分割文書がこれに該当する。プロンプトエンジニアリングの上位概念。

2-3. 第3世代:ハーネスエンジニアリング

そして今、第3世代として登場したのがハーネスエンジニアリングです。プロンプトやコンテキストの設計に加えて、複数のAIエージェントの役割分担・連携フロー・自己改善ループまで設計対象に含める点が、従来の2つと根本的に異なります。

イメージとしては、プロンプトエンジニアリングは「社員への指示の出し方を工夫する」技術、コンテキストエンジニアリングは「社員にマニュアルや資料を渡して精度を上げる」技術、ハーネスエンジニアリングは「組織そのものを設計して、社員同士が自律的に連携する仕組みを作る」技術です。

第1世代
プロンプト
エンジニアリング
指示の仕方を工夫
第2世代
コンテキスト
エンジニアリング
文脈情報を設計
第3世代
ハーネス
エンジニアリング
組織全体を設計
AI鬼管理山崎 AI鬼管理山崎
プロンプトが「会話術」、コンテキストが「マニュアル作成」だとすると、ハーネスは「組織設計」です。経営者なら組織設計は本業のはず。AIの世界でも同じ考え方が必要になってきているんです。
💡 3世代の使い分け

ハーネスエンジニアリングは第1・第2世代を「包含」しています。良いプロンプト設計、良いコンテキスト設計は引き続き重要で、その上にエージェント間の連携設計を加えたのがハーネスです。どれかを捨てるのではなく、3つの層を全て使うのが最強の構成です。

03 3つのサブエージェント設計の全体像 Planner・Generator・Evaluator の役割と連携フロー

ハーネスエンジニアリングの核となるのが、3つのサブエージェントの設計です。Anthropic社の公式ブログで推奨されているこの構成は、人間の開発組織を忠実に模倣した設計になっています。

Planner
仕様書作成
要件定義
タスク分割
Generator
実装
コーディング
テスト作成
Evaluator
レビュー
品質評価
合否判定

3-1. Planner(プランナー):企画・仕様書の自動生成

Plannerは、人間が出した「こういうものを作りたい」というざっくりした要望を受け取り、詳細な仕様書を自動生成するエージェントです。人間の組織でいうプロダクトマネージャーやプロジェクトマネージャーに相当します。

Plannerの重要な特徴は、「何を作るか」に集中し、「どう作るか」には踏み込まない点です。技術的な実装方法はGeneratorに任せ、Plannerは要件定義とタスク分割に徹します。この役割分担が、出力品質を高める鍵です。

✔️1〜4行程度の短い指示から、詳細な製品仕様書を自動生成する
✔️スプリント計画(どの順番で何を実装するか)を自動で設計する
✔️要件の抜け漏れを自分で検出し、不足部分を補完する
✔️技術的な実装詳細には踏み込まず、Generatorに委任する

経営の比喩でいうと、Plannerは「就業規則」を書いてくれる総務部長のような存在です。社長が「うちも在宅勤務制度を作りたい」と言えば、細かいルール・運用手順・例外処理まで全部考えて仕様書にまとめてくれます。

📚 用語解説

スプリント計画:ソフトウェア開発で使われる用語で、1〜2週間の短い期間に区切って開発を進める手法(アジャイル開発)の計画のこと。ハーネスエンジニアリングでは、Plannerが「まず基本機能を作り、次にデザインを整え、最後にテストを行う」といった段階的な計画を自動で設計する。

代表菅澤 代表菅澤
Plannerのすごさは、「ざっくり伝えるだけで仕様書が出てくる」ところです。弊社では新しい業務ツールを作るとき、最初の5分で要望を伝えるだけ。Plannerが仕様書を仕上げてくれる間に、私は別の仕事をしています。

3-2. Generator(ジェネレーター):実装・コーディング

Generatorは、Plannerが作成した仕様書に基づいて実際のコードを書き、テストコードも自動生成するエージェントです。人間の組織でいうフルスタックエンジニアに相当します。

Generatorが処理するのは、仕様書のタスクを1つずつ順番に実装していく作業です。例えば「スプリント1:基本UI作成」「スプリント2:API連携」「スプリント3:デザイン調整」という仕様書が渡された場合、Generatorはスプリント1から順に実装を進めます。

重要なポイントは、GeneratorにはOpus(最上位モデル)を使うのが推奨されている点です。実装タスクは推論の精度がそのまま品質に直結するため、最も賢いモデルに任せることで、バグの少ないコードが生成されます。

✔️Plannerの仕様書を読み取り、タスクごとに段階的に実装する
✔️実装と同時にテストコードも自動生成する
✔️自己評価を行い、基本的な品質チェックをクリアしたものをEvaluatorに引き渡す
✔️Evaluatorからフィードバックを受けた場合は修正を自動で反映する

3-3. Evaluator(エバリューエーター):レビュー・品質評価

Evaluatorは、Generatorが実装したコードをレビューし、品質を評価し、合否を判定するエージェントです。人間の組織でいうシニアエンジニアや品質管理(QA)チームに相当します。

EvaluatorはClaude Codeのサブエージェントとして、テストの実行、コードの可読性チェック、仕様書との整合性チェックなどを自動で行います。さらに、Playwright MCPを接続することで、実際のブラウザを起動してUIの見た目や動作を視覚的にテストすることも可能です。

📚 用語解説

Playwright MCP:ブラウザを自動操作するためのツール(Playwright)をClaude Codeに接続するサーバー。AIに「目」を持たせる役割を果たし、Webアプリケーションの画面表示や操作テストを自動化できる。Evaluatorに組み込むことで、視覚的な品質チェックまでAIが自律的に行える。

Evaluatorのもう一つの重要な役割は、「不合格」の判定を出す権限を持っていることです。人間の組織でも、品質管理チームが「この品質ではリリースできない」と差し戻す仕組みがありますが、同じ仕組みをAI間で実現しています。

AI鬼管理山崎 AI鬼管理山崎
Evaluatorが肝です。人間がレビューしなくても、AIが自動で品質チェックしてくれる。不合格ならGeneratorに差し戻して修正させる。この「レビューの自動化」こそが、ハーネスエンジニアリングの最大の価値です。

3-4. 3エージェント構成と実組織の対応表

この3つのエージェントが、実際の人間組織でどのポジションに対応するかを整理すると、以下のようになります。

エージェント人間組織の対応担当領域使用推奨モデル
Plannerプロダクトマネージャー / PM要件定義・仕様書・タスク分割Opus(精度重視)
Generatorフルスタックエンジニアコーディング・テスト作成Opus(品質重視)
Evaluatorシニアエンジニア / QAチームコードレビュー・品質判定Opus + Playwright MCP
💡 フロントエンド/バックエンドの分離

Generatorを1つの「フルスタックエンジニア」にしていますが、プロジェクトの規模に応じてフロントエンドエンジニア・バックエンドエンジニア・UIデザイナーなどに分割することも可能です。人間の組織と同じで、チーム規模は業務の複雑さに応じて調整します。

04 自己改善ループが品質を劇的に上げる仕組み 「AIがAIをレビューする」フィードバックループの設計

ハーネスエンジニアリングの真の価値は、自己改善ループ(フィードバックループ)にあります。これは、GeneratorとEvaluatorの間で自動的に品質改善が繰り返される仕組みです。

4-1. フィードバックループの具体的な動き

自己改善ループは、以下の流れで動きます。

1
Generatorが1機能を実装するスプリント計画に基づいて、1つのタスクを完了させます。テストコードも同時に生成します。
2
Evaluatorが品質を評価する実装されたコードをレビューし、テストを実行し、仕様書との整合性を確認します。Playwright MCPが設定されている場合は、ブラウザ上の動作確認も行います。
3
合格/不合格を判定する品質基準を満たしていれば「合格」。バグやデザイン崩れがあれば「不合格」と判定し、修正指示を出します。
4
不合格の場合はGeneratorに差し戻す具体的な修正ポイントをフィードバックとしてGeneratorに渡します。Generatorは修正を行い、再度Evaluatorに提出します。
5
合格するまでループが回る品質基準を満たすまで、このフィードバックループが自動的に繰り返されます。合格したら、次のスプリント(次の機能)に進みます。
Generator
実装完了
テスト作成
Evaluator
レビュー
合否判定
不合格?
修正指示を
Generatorへ
合格!
次のスプリント
に進む

4-2. なぜ1回でもループを回すだけで品質が変わるのか

実際にハーネスエンジニアリングを導入してみると、フィードバックループを1回でも回すだけで、出力品質が大きく向上することに驚かされます。その理由は明快です。

従来の「人間がClaude Codeに指示→出力を確認→修正指示」というフローでは、人間のレビュー精度と指示の的確さがボトルネックになっていました。人間は疲れたり、細かいバグを見逃したり、修正指示が曖昧になったりします。

一方、Evaluatorエージェントは毎回同じ基準で、疲れずに、網羅的にチェックします。コードの一行一行を機械的に検査し、テストも自動実行するので、人間より見落としが少ない場面も多いのです。

代表菅澤 代表菅澤
弊社で実験したところ、フィードバックループなしの1回実行と、1回ループを回した場合では、デザインの完成度、機能の動作精度、コードの可読性すべてにおいて明確な差が出ました。「1回レビューを入れるだけ」でこれだけ変わるのかと正直驚きました。

4-3. ループ回数とコストのトレードオフ

フィードバックループは品質を上げる一方で、ループを回すたびにAIのトークンを消費します。つまり、Claudeのプラン契約の使用量を消費するということです。

Anthropic社のMax 20xプラン(月$200)であれば、2〜3時間の自律開発でもストレスなく動かせます。しかし、Proプラン(月$20)やMax 5xプラン(月$100)の場合、長時間のフィードバックループは途中で使用量上限に達する可能性があるため注意が必要です。

プランループ回数の目安自律開発の適性
Pro ($20)1〜2回(簡易チェック向き)小規模タスクのみ
Max 5x ($100)3〜5回(標準的な開発向き)中規模プロジェクトまで
Max 20x ($200)10回以上(品質追求向き)大規模自律開発に最適
⚠️ コスト管理の注意点

フィードバックループは回せば回すほど品質が上がりますが、コストも比例して増加します。実運用では「合格基準」を明確に設定して、無限にループが回り続けない設計にすることが重要です。弊社では「3回不合格が続いたら人間に判断を仰ぐ」というルールを設定しています。

📚 用語解説

トークン消費:AIが文章を処理する際に使われる「処理量」の単位。フィードバックループでは、Generator→Evaluator→Generatorとやり取りが発生するたびにトークンが消費される。ループ1回あたり数千〜数万トークンを消費するため、プランの使用量枠との兼ね合いが重要。

05 ハーネスをゼロから構築する手順 サブエージェントの作成からCLAUDE.MDによる統制まで

ここからは、実際にハーネスを構築する手順を解説します。Claude Codeのサブエージェント機能を使って、Planner・Generator・Evaluatorの3エージェントをゼロから作り、自律開発を動かすまでの流れです。

5-1. サブエージェントの作成方法

Claude Codeのサブエージェントは、プロジェクトフォルダ内の.claude/agents/ディレクトリにマークダウンファイルとして定義します。各ファイルが1つのサブエージェントに対応し、そのエージェントの役割・使えるツール・使用モデルなどを記述します。

作成方法は2通りあります。

✔️手動作成.claude/agents/に自分でマークダウンファイルを作成する。細かい制御が可能
✔️Claude Codeに作らせる:「この3つのサブエージェントを作ってください」と指示するだけで、Claude Codeが自動的にファイルを生成してくれる。簡単で推奨

各サブエージェントのファイルには、以下の情報を記述します。

設定項目説明推奨値
役割(Role)エージェントの担当領域と責任範囲「仕様書を作成する」等の明確な記述
ツール(Tools)エージェントが使えるツール一覧Planner:Read/Write、Generator:全ツール、Evaluator:Read/Bash/MCP
モデル(Model)使用するAIモデル3エージェントとも Opus 推奨
MCP連携接続するMCPサーバーEvaluatorにPlaywright MCP推奨

📚 用語解説

MCPサーバー(Model Context Protocol):Claude Codeに外部ツールの機能を追加する仕組み。例えば、Playwright MCPを接続するとブラウザ操作が可能になり、GitHub MCPを接続するとPull Request操作が可能になる。サブエージェントごとに異なるMCPを接続できるため、役割に応じた機能拡張が実現する。

5-2. CLAUDE.MDでオーケストレーションを定義する

3つのサブエージェントを作っただけでは、まだ連携は自動化されません。CLAUDE.MDファイルにオーケストレーション(エージェント間の連携ルール)を記述することで、Planner→Generator→Evaluatorの連携フローが自動的に動くようになります。

📚 用語解説

オーケストレーション:複数のエージェントの連携順序や受け渡しルールを設計・管理すること。音楽のオーケストラ(管弦楽団)の指揮者のように、各エージェントが適切なタイミングで適切な作業を行うよう統制する仕組み。CLAUDE.MDファイルがこの「指揮者」の役割を果たす。

CLAUDE.MDに記述するオーケストレーションのポイントは以下の通りです。

✔️Plannerが仕様書を完成させたら、自動的にGeneratorに引き渡すフローを定義
✔️Generatorが1機能の実装を完了したら、Evaluatorに自動的にレビュー依頼するフローを定義
✔️Evaluatorが不合格を出した場合、Generatorに修正指示と共に差し戻すフローを定義
✔️Evaluatorが合格を出した場合、次のスプリントに自動的に進むフローを定義
✔️全スプリントが完了したら「完成」として終了する条件を定義
AI鬼管理山崎 AI鬼管理山崎
CLAUDE.MDは経営でいう「業務マニュアル」や「標準作業手順書(SOP)」に相当します。一度書いておけば、Claude Codeは毎回このルールを参照して動くので、何度実行しても同じフローで高品質な成果物が出せるようになります。

5-3. バイパスパーミッションモードで自律稼働させる

通常、Claude Codeはファイルの作成や編集のたびに人間の許可を求めます。ハーネスエンジニアリングでは数十〜数百回のファイル操作が自動的に発生するため、毎回許可を出していては自律開発になりません。

そこで使うのがバイパスパーミッションモードです。Claude Codeの起動時に特定のオプションを付けることで、ファイル操作やコマンド実行の許可を自動的にスキップし、完全に自律的に稼働させることができます。

📚 用語解説

バイパスパーミッション:Claude Codeがファイル操作やコマンド実行を行う際の「許可確認」を省略するモード。自律開発では必須だが、意図しないファイル変更のリスクがあるため、専用のプロジェクトフォルダで使うことを推奨。本番環境での使用は非推奨。

⚠️ バイパスモードの注意事項

バイパスパーミッションモードでは、Claude Codeが自由にファイルを作成・編集・削除できるようになります。本番環境のコードがあるフォルダや、重要なデータが保存されているディレクトリでは使用を避けてください。必ず専用の開発フォルダを用意し、その中で実行するようにしましょう。

5-4. 構築の全体フロー(まとめ)

ハーネスをゼロから構築する全体フローを図解すると、以下の4ステップになります。

Step 1
3つのサブ
エージェントを
.claude/agents/に作成
Step 2
CLAUDE.MDに
オーケストレーション
ルールを記述
Step 3
Playwright MCP等
必要なMCPを
接続
Step 4
バイパスモードで
起動して
自律開発開始
代表菅澤 代表菅澤
弊社でハーネスを初めて構築したとき、準備に30分、自律開発が2〜3時間、人間のレビューに15分。合計3時間弱で、通常なら1〜2日かかるレベルのWebアプリケーションが完成しました。最初は「本当に放置していいのか」と不安でしたが、Evaluatorが品質を担保してくれるので、結果的には人間がレビューするより精度が高い場面もありました。

06 【独自データ】GENAI社内のハーネス活用実績 Max 20xプランでハーネスを回した際の実績数値と業務適用例

ここでは、弊社(株式会社GENAI)がハーネスエンジニアリングを実業務に適用した実績を、具体的な数値とともに公開します。

6-1. 弊社のハーネス導入状況

項目内容
契約プランClaude Max 20x(月$200 / 約30,000円)
ハーネス導入範囲開発・記事執筆・広告レポート・営業資料作成
使用エージェント構成Planner + Generator + Evaluator の基本3構成(業務により拡張)
平均ループ回数1タスクあたり2〜4回(品質基準到達まで)
1回の自律稼働時間1〜3時間(プロジェクト規模による)

6-2. ハーネス導入による業務別の削減効果

ハーネスエンジニアリングを導入する前と後で、業務ごとの所要時間がどう変わったかを比較します。

業務従来(ハーネスなし)ハーネス導入後削減率
Webアプリ開発(中規模)8〜16時間(人間がClaude Codeに都度指示)2〜3時間(自律開発+最終レビュー)約75%削減
ブログ記事執筆1本8時間1本1時間(構成設計→執筆→校正を自動化)約87%削減
営業資料作成1件4時間1件30分(テンプレ+カスタマイズ自動生成)約87%削減
広告週次レポート週10時間週1時間(データ取得→分析→レポート作成を自動化)約90%削減
LP(ランディングページ)制作2日半日(デザイン→実装→テストを自動化)約75%削減
⚠️ 数値についての注意

上記は弊社のMax 20xプラン環境での概算値であり、業務の複雑さ・AIプランの使用量上限・担当者のスキルによって結果は変動します。あくまで「ハーネスの効果感」の参考情報としてご覧ください。

6-3. 開発以外へのハーネス適用

ハーネスエンジニアリングは「ソフトウェア開発」のための技術と思われがちですが、弊社では開発以外の業務にも同じ3エージェント構成を適用しています。

例えば、ブログ記事の執筆であれば以下のように役割を割り当てます。

エージェント開発の場合記事執筆の場合営業資料の場合
Planner仕様書を作る記事構成・見出し設計提案書の構成・論点整理
Generatorコードを書く本文を執筆する提案書の本文を作成
Evaluatorコードレビュー校正・ファクトチェック論理構成・説得力のチェック

このように、「企画→実行→レビュー」という構造はどの業務にも共通しています。ハーネスエンジニアリングの本質は「コーディング技術」ではなく「業務設計技術」であり、だからこそ非エンジニアの経営者にも価値があるのです。

AI鬼管理山崎 AI鬼管理山崎
弊社では最初は開発チームだけで使っていたハーネスを、今では営業資料・ブログ記事・広告レポートにまで横展開しています。3エージェント構成の応用範囲は想像以上に広い。「自分の業務に使えるかな?」と思ったら、まず「企画→実行→レビュー」に分解できるかを考えてみてください。

07 【独自】非エンジニアがハーネス設計を業務に活かす方法 プログラミング経験ゼロでも始められる3つのステップ

「ハーネスエンジニアリングは分かったけど、自分にはプログラミングの知識がない」——ここまで読んだ経営者・管理職の方の中には、そう感じている方もいるかもしれません。しかし、ハーネス設計にプログラミングの専門知識は必須ではありません

7-1. ハーネスの「設計」に必要なのは業務理解

ハーネスエンジニアリングで最も重要なのは、「どの業務を、どう分割するか」を考えることです。これはプログラミングの問題ではなく、業務設計の問題です。

「この業務は企画→実行→チェックの3段階で構成されている」「企画段階では要件の抜け漏れチェックが必要」「チェック段階ではこの5つの品質基準を満たすべき」——こうした判断は、その業務を実際にやっている経営者・管理職の方が最もよく分かるはずです。

代表菅澤 代表菅澤
私自身、プログラマではありません。しかし、業務の流れは熟知しています。ハーネス設計は「AIにどう指示するか」より「自分の業務をどう分解するか」が重要なので、業務理解の深い経営者にこそ向いている技術だと思っています。

7-2. 非エンジニアが始める3ステップ

1
自動化したい業務を1つ選ぶ週に1時間以上かかっている繰り返し業務を1つだけ選びます。「毎週の営業レポート作成」「議事録の要約」「顧客への提案書作成」など、定型的で繰り返しが多い業務ほど効果が大きい。
2
その業務を「企画→実行→チェック」に分解する選んだ業務を3つの段階に分けます。例えば営業レポートなら、「①データ収集と要点整理(企画)」「②レポート本文の作成(実行)」「③数値の整合性チェック(品質確認)」となります。
3
Claude Codeに「この3つのエージェントを作って」と指示する分解した3段階をClaude Codeに伝えるだけで、サブエージェントの作成からCLAUDE.MDの設定まで自動で行ってくれます。プログラミングの知識は一切不要です。
💡 最初は「1業務だけ」で試す

最初から全社的に導入しようとせず、1つの業務だけでハーネスを試してください。1ヶ月運用してみて、効果が実感できたら他の業務にも横展開する——この段階的なアプローチが成功率を最大化します。

7-3. 意思決定と責任は人間の仕事

ハーネスエンジニアリングの進化により、「企画→実行→レビュー」の一連の流れをAIが自律的にこなせるようになりました。しかし、意思決定と最終的な責任は、依然として人間の領域です。

AIが自律的に開発したアプリケーションを本番リリースするかどうか、営業資料の最終承認、ブログ記事の公開判断——これらは人間が行うべき判断です。ハーネスエンジニアリングは人間の仕事を「なくす」のではなく、人間の仕事を「意思決定に集中させる」ための設計技術です。

経営者や管理職にとっては、実務作業がAIに委任され、自分は判断と意思決定に集中できる——これこそがハーネスエンジニアリングの最大の価値であり、今後の「AIを使える経営者」と「使えない経営者」を分ける分水嶺になると考えています。

AI鬼管理山崎 AI鬼管理山崎
エンジニアの仕事がAIに置き換わる時代に、人間に残されるのは「意思決定」と「責任」です。ハーネスエンジニアリングは、まさにその「人間にしかできない仕事に集中する」ための仕組みづくりなんです。

7-4. エンジニアの役割も「マネジメント」に変わる

ハーネスエンジニアリングの普及により、エンジニアの役割も大きく変化しています。従来の「自分でコードを書く」から、「AIチームをマネジメントする」へとシフトしつつあります。

これは経営者にとって朗報です。なぜなら、AIのマネジメントに必要なスキルは、人間のチームマネジメントと本質的に同じだからです。「誰に何を任せるか」「品質基準をどう設定するか」「フィードバックをどう回すか」——これらは経営者が普段からやっていることです。

観点従来のエンジニアハーネス時代のエンジニア
主な作業自分でコードを書くAIエージェントの設計・管理
必要なスキルプログラミング言語の習熟業務設計・品質基準設定・マネジメント
経営者との距離遠い(技術と経営の分断)近い(共通言語が「組織設計」)
生産性1人が1人分の仕事1人がAIチーム全体を指揮

08 まとめ ── AIを「組織」として運用する時代へ ハーネスエンジニアリングが変える経営の未来

この記事では、Claude Codeのハーネスエンジニアリングについて、基本概念から実践手順、弊社GENAIの実運用データまでを網羅的に解説しました。最後にポイントを振り返ります。

✔️ハーネスエンジニアリングは、AIエージェントに「役割分担・連携フロー・自己改善ループ」を設計する第3世代のAI活用技術
✔️Planner(企画)・Generator(実装)・Evaluator(評価)の3エージェント構成が基本形
✔️自己改善ループにより、AIが自律的に品質を高めるため、人間の介入回数が劇的に減る
✔️CLAUDE.MDにオーケストレーションルールを書くことで、エージェント間の連携が自動化される
✔️弊社GENAIではMax 20xプラン(月$200)でハーネスを全社運用し、1名分の業務量を吸収
✔️開発だけでなく記事執筆・営業資料・広告レポートにも同じ3エージェント構成を適用できる
✔️非エンジニアでも「業務を3段階に分解してClaude Codeに伝える」だけでハーネスが構築できる
✔️人間に残る仕事は意思決定と責任。ハーネスはその「集中」を可能にする設計技術

ハーネスエンジニアリングの登場により、AIの活用は「一問一答のチャット」から「組織としての自律運用」へと進化しました。この変化は、経営者にとって大きなチャンスです。なぜなら、AIを「組織」として設計・運用する能力は、まさに経営者が日常的に鍛えているスキルそのものだからです。

「自分の業務にハーネスエンジニアリングを導入してみたい」「Claude Codeを組織として動かしたい」——そう感じた方は、ぜひ弊社のAI鬼管理にご相談ください。業務の棚卸しからハーネス設計、運用定着まで一貫して伴走します。

代表菅澤 代表菅澤
ハーネスエンジニアリングは、AIを「ツール」から「チーム」に昇格させる設計思想です。弊社AI鬼管理では、あなたの業務に最適なハーネスの設計を一緒に考え、導入から運用まで伴走します。まずは無料相談で、どの業務から始めるべきかを一緒に見つけましょう。

Claude Codeのハーネス設計を、AI鬼管理が一緒に構築します

あなたの業務に最適なサブエージェント構成は? CLAUDE.MDにはどんなルールを書くべき?
弊社のハーネス運用ノウハウをベースに、個別の導入設計をご支援します。

AI鬼管理山崎 AI鬼管理山崎
「自社でハーネスを構築してみたいが、どの業務から手をつければいいか分からない」という方に最適です。まずは無料相談で、あなたの業務の中で最もインパクトが大きい適用領域を一緒に見つけましょう。

NEXT STEP

この記事の内容を、あなたのビジネスで
実践してみませんか?

AI活用を自社で回せるようになりたい方

AI鬼管理

Claude CodeやCoworkの導入支援から、業務設計・ルール作成・社内浸透まで実践ベースで伴走します。「自分たちで回せる組織」を作りたい経営者向け。

学ぶ時間はない、とにかく結果がほしい方

爆速自動化スグツクル

業務ヒアリングから設計・開発・納品まで丸投げOK。ホームページ、LP、業務自動化ツールを最短即日で構築します。

AI鬼管理爆速自動化スグツクル
こんな方向け社内で回せる状態を作りたい
外注に依存しない組織を作りたい
学ばなくていいから結果だけ欲しい
とにかく早く自動化したい
内容AIの使い方・業務設計・自動化の作り方を
実践ベースで叩き込む
業務をヒアリングし、設計から
ツール・システムを丸ごと納品
一言で言うと自分で作れるようになる全部任せられる
AI鬼管理を詳しく見るスグツクルを詳しく見る

よくある質問

Q. ハーネスエンジニアリングにプログラミングの知識は必要ですか?

A. 基本的なハーネス設計にはプログラミングの知識は不要です。サブエージェントの作成自体もClaude Codeに「この3つのエージェントを作って」と指示するだけで自動生成されます。ただし、より高度なカスタマイズ(独自のMCP接続や評価基準の微調整)を行う場合は、基本的なファイル操作の知識があると便利です。

Q. ハーネスエンジニアリングを始めるのに最低限必要なClaude Codeのプランは?

A. Proプラン(月$20)から始められます。ただし、2時間以上の自律開発や頻繁なフィードバックループを回す場合は使用量上限に達する可能性があるため、Max 5x(月$100)以上を推奨します。弊社GENAIではMax 20x(月$200)を使用しています。

Q. 3つのサブエージェント以外にエージェントを追加できますか?

A. はい。例えば「UIデザイナーエージェント」「セキュリティ監査エージェント」「テスト専任エージェント」など、業務の必要に応じて自由にエージェントを追加できます。人間の組織設計と同じで、業務の複雑さに応じてチーム構成を調整するのが正解です。

Q. フィードバックループが無限に回り続けることはありませんか?

A. CLAUDE.MDに「合格基準」と「最大ループ回数」を明記しておくことで防止できます。弊社では「3回不合格が続いたら人間に判断を仰ぐ」というルールを設定しており、無限ループは発生しません。

Q. ハーネスエンジニアリングはClaude Code以外のAIツールでもできますか?

A. 概念的には他のAIツールでも応用可能ですが、サブエージェント機能とMCP連携をネイティブに備えているのは2026年5月時点ではClaude Codeが最も充実しています。GitHub Copilotなど他のツールでは、同等の自律開発体験を実現するのは現時点では困難です。

Q. ハーネスで自律開発させたアプリをそのまま本番リリースしても大丈夫ですか?

A. 最終リリース判断は人間が行うことを強く推奨します。Evaluatorが品質チェックを行いますが、ビジネス上の判断(リリースタイミング、顧客影響の評価など)は人間の責任領域です。弊社でも、自律開発で生成されたコードは必ず人間が最終レビューしてからリリースしています。

Q. コンテキストエンジニアリングとハーネスエンジニアリングは併用できますか?

A. むしろ併用が前提です。ハーネスエンジニアリングは第3世代ですが、第1世代(プロンプト設計)と第2世代(コンテキスト設計)の上に構築されています。良いCLAUDE.MD(コンテキスト)と良い指示文(プロンプト)があった上で、エージェント間の連携設計(ハーネス)を加えるのが最強の構成です。

AI鬼管理爆速自動化スグツクル
こんな方向け社内で回せる状態を作りたい
外注に依存しない組織を作りたい
学ばなくていいから結果だけ欲しい
とにかく早く自動化したい
内容AIの使い方・業務設計・自動化の作り方を
実践ベースで叩き込む
業務をヒアリングし、設計から
ツール・システムを丸ごと納品
一言で言うと自分で作れるようになる全部任せられる
AI鬼管理を詳しく見るスグツクルを詳しく見る

📒 NOTE で深掘り

AI鬼管理 × 経営者の本音は note でも発信中

ブログでは伝えきれない経営者目線の体験談・業界動向・社内エピソードを
note にて公開しています。フォローして最新情報をチェック!

note @genai_onikanri をフォロー →
AIAI鬼管理

AI鬼管理へのお問い合わせ

この記事を読んで気になった方へ。
AI鬼管理の専門スタッフが、御社に最適な
業務自動化プランを無料でご提案します。

会社名を入力してください
業種を選択してください
お名前を入力してください
正しいメールアドレスを入力してください

1つ以上選択してください
1つ以上選択してください
月額コストを選択してください

約1時間のオンライン面談(Google Meet)です

空き枠を取得中...
面談日時を選択してください

予約確定後、Google Calendarの招待メールをお届けします。
しつこい営業は一切ございません。

監修 最終更新日: 2026年5月4日
菅澤孝平
菅澤 孝平 株式会社GENAI 代表取締役
  • AI業務自動化サービス「AI鬼管理」を運営 — Claude Code を活用し、経営者の業務を「AIエージェントに任せる仕組み」へ転換するパーソナルトレーニングを 伴走構築 で提供。日報・採用・問い合わせ対応・経費精算・議事録・データ集計・営業リスト等の定型業務を、AIに代行させる体制を経営者と一緒に作り込む
  • Claude Code 実装ノウハウを 経営者・法人クライアント に直接指導。生成AIを「便利ツール」ではなく 「業務を任せる存在」 として運用する手法を体系化
  • 「やらせ切る管理」メソッドの開発者。シンゲキ株式会社(2021年設立・鬼管理専門塾運営)にて累計3,000名以上の学習者を志望校合格に導いた管理メソッドを、AI × 経営者支援 に転用
  • 著書『3カ月で志望大学に合格できる鬼管理』(幻冬舎)、『親の過干渉こそ、最強の大学受験対策である。』(講談社)
  • メディア出演: REAL VALUE / カンニング竹山のイチバン研究所 / ええじゃないかBiz 他
  • 明治大学政治経済学部卒
現在は AI鬼管理(Claude Code活用の伴走型パーソナルトレーニング)を主事業とし、経営者と二人三脚で「AIに業務を任せる仕組み」を実装。「実行を強制する環境」を AI で構築する手法を、自社の実運用知見をもとに発信している。