【2026年5月最新】生成AIの種類一覧|テキスト・画像・動画・音声・コード生成の特徴と選び方を徹底解説
この記事の内容
「生成AIって、ChatGPTのことでしょ?」——もしそう思っているなら、この記事を最後まで読む価値があります。
2026年現在、生成AIはテキスト・画像・動画・音声・音楽・コードの6カテゴリに分かれ、それぞれに複数の主要ツールがひしめき合っています。ChatGPTはその中の「テキスト生成AI」というカテゴリの1ツールに過ぎません。画像を作るMidjourney、動画を生成するSora、コードを自律的に書くClaude Code——生成AIの全体像を把握しないまま1つのツールだけ使っていると、業務改善のチャンスを大量に見逃します。
この記事では、生成AI全6種類の特徴・主要ツール・業務での使い分けを、弊社(株式会社GENAI)がMax 20xプラン(月額$200)で全社運用している実データをもとに徹底解説します。
この記事を最後まで読むと、次の6つが明確になります。
01 OVERVIEW 生成AIとは?6つのカテゴリの全体像 「生成AI=ChatGPT」ではない。まず全体地図を頭に入れる
生成AI(Generative AI)とは、テキスト・画像・動画・音声・音楽・コードなど、新しいコンテンツを自動で生成するAIの総称です。従来のAIが「データを分類する」「異常を検知する」といった分析型だったのに対し、生成AIは「人間のようにゼロからコンテンツを作り出す」点が決定的な違いです。
📚 用語解説
生成AI(Generative AI):大量のデータを学習し、テキスト・画像・動画・音声・コードなどの新しいコンテンツを自律的に生成するAI技術の総称。2022年後半のChatGPT登場をきっかけに一般に広まり、2026年現在は6つの主要カテゴリに分化しています。
2026年時点で、生成AIは以下の6つのカテゴリに大別できます。
| カテゴリ | 何を生成するか | 代表ツール | 業務実用度 |
|---|---|---|---|
| テキスト生成AI | 文章・要約・翻訳・対話 | ChatGPT / Claude / Gemini | ★★★★★ |
| 画像生成AI | イラスト・写真風画像・デザイン素材 | Midjourney / Stable Diffusion / Adobe Firefly | ★★★★☆ |
| 動画生成AI | 短尺動画・アニメーション・映像 | Runway / Sora / Pika | ★★★☆☆ |
| 音声生成AI | ナレーション・音声合成・音声クローン | CoeFont / Amazon Polly / ElevenLabs | ★★★☆☆ |
| 音楽生成AI | BGM・楽曲・効果音 | Soundraw / MusicFX / Suno | ★★☆☆☆ |
| コード生成AI | プログラム・スクリプト・自動化 | Claude Code / GitHub Copilot / Cursor | ★★★★★ |
ここで注目してほしいのは、業務実用度に大きな差があるという点です。テキスト生成とコード生成は既に「使わないと損」レベルで実用化が進んでいますが、動画生成や音楽生成はまだ「使えるシーンが限定的」な段階です。
📚 用語解説
LLM(Large Language Model):大規模言語モデル。テキスト生成AIの中核技術で、膨大なテキストデータを学習して自然な文章を生成する。ChatGPT(GPT-5)、Claude(Opus 4.6)、Gemini(Ultra)などがLLMの代表例です。
1-1. 生成AIと従来AIの違い
「AI」と一口に言っても、生成AI以前の従来型AIと生成AIでは目的がまったく異なります。従来AIが「既存データから答えを見つける」のに対し、生成AIは「新しいものを作り出す」のが本質です。
| 項目 | 従来型AI | 生成AI |
|---|---|---|
| 主な目的 | データ分析・分類・予測 | コンテンツの新規生成 |
| 入力 | 構造化データ(数値・カテゴリ) | 自然言語(テキストプロンプト) |
| 出力 | スコア・ラベル・数値予測 | テキスト・画像・動画・コード等 |
| 操作の敷居 | 専門知識が必要(Python/統計) | 日本語で指示するだけ |
| 代表例 | 需要予測・異常検知・レコメンド | ChatGPT・Midjourney・Claude Code |
つまり、生成AIの最大の特徴は「日本語で指示するだけで使える」という操作の敷居の低さです。従来AIはデータサイエンティストが必要でしたが、生成AIは非エンジニアの経営者や営業担当者でも即日使い始められます。
📚 用語解説
プロンプト:生成AIに対する指示文のこと。「この会議録を箇条書きで要約して」「青い空の写真を生成して」のように、日本語でやりたいことを伝える文章がプロンプトです。プロンプトの書き方次第で出力の品質が大きく変わります。
1-2. なぜ「種類」を知ることが重要なのか
生成AIの種類を知ることが重要な理由は、自社の業務課題に「最も効くAI」を正確に選べるようになるからです。
よくある失敗パターンは、「生成AI=ChatGPT」と思い込んで、本来は画像生成AIやコード生成AIで解決すべき課題をChatGPTに無理やり押し込むケースです。ChatGPTに「ロゴを作って」と言っても実用レベルの画像は出てきませんし、「業務を自動化して」と言っても実際にファイルを操作してくれるわけではありません。
生成AIを業務に導入するとき、最初にやるべきことは「どのカテゴリのAIが自社の課題に効くか」を見極めることです。テキスト?画像?コード?——カテゴリの見極めを間違えると、どれだけプロンプトを工夫しても成果は出ません。
業務課題を
書き出す
6カテゴリで
分類する
該当カテゴリの
ツールを選ぶ
1業務で
試す
02 TEXT GENERATION テキスト生成AI — ChatGPT・Claude・Geminiの比較 最も業務インパクトが大きいカテゴリ。3大ツールの違いを整理
テキスト生成AIは、生成AI全6カテゴリの中で最も業務活用が進んでいる分野です。文章作成、要約、翻訳、メール下書き、議事録整理、企画書作成——ほぼすべてのホワイトカラー業務に直接効きます。
2026年現在、テキスト生成AIの3大ツールはChatGPT(OpenAI)、Claude(Anthropic)、Gemini(Google)です。それぞれの特徴を比較していきます。
| ツール | 開発元 | 最新モデル | 月額料金 | 特徴 |
|---|---|---|---|---|
| ChatGPT | OpenAI | GPT-5 | $20〜$200 | 知名度No.1。画像生成も統合。汎用性が高い |
| Claude | Anthropic | Opus 4.6 | $20〜$200 | 長文処理と日本語精度に優位。Claude Codeでエージェント実行可 |
| Gemini | Ultra | $20〜$250 | Google Workspace連携。検索との統合が強み |
📚 用語解説
ChatGPT:OpenAI社が開発したテキスト生成AI。2022年11月の公開以来、世界で最も利用者が多い生成AIチャットボット。GPT-5モデルを搭載し、テキスト生成に加えて画像生成・音声対話にも対応しています。
2-1. ChatGPT — 世界最大のユーザー基盤
ChatGPTは生成AIの代名詞とも言える存在です。2022年末の登場以降、世界で数億人が利用しており、テキスト生成AIとしての知名度は圧倒的です。
強みは汎用性の高さです。文章作成、翻訳、要約、ブレインストーミング、さらには画像生成(DALL-E統合)まで1つのインターフェースで完結します。プラグインやGPTs(カスタムAI)の仕組みも充実しており、特定業務に特化させたAIを自分で作ることもできます。
一方、業務自動化・エージェント実行の領域ではClaude Codeに後れを取っています。ChatGPTはあくまで「チャット」がベースなので、ファイル操作・複数ステップの自動実行・ターミナル連携といった「実行系」のタスクには限界があります。
2-2. Claude — 長文処理とエージェント実行の王者
Claude(クロード)はAnthropic社が開発したテキスト生成AIで、長文処理の精度とClaude Codeによるエージェント実行の2点でChatGPTとの差別化を打ち出しています。
最上位モデルのOpus 4.6は、20万トークン(約15万字)のコンテキストウィンドウを持ち、大量の資料を一括で読み込んで分析するようなタスクに強みがあります。また、日本語の自然さについてもChatGPTより一段上と評価するユーザーが多いのが実情です。
最大の強みはClaude Codeです。ターミナル上で動くエージェント型AIで、ファイル操作・コード編集・コマンド実行まで自律的に行えます。「AIに業務を丸ごと任せたい」という経営者にとって、ChatGPTにはない決定的な武器です。
📚 用語解説
Claude Code:Anthropicが提供するターミナル上で動くAIコーディングエージェント。チャット形式ではなく、ファイル操作・コード編集・コマンド実行まで自律的に行える。Pro以上のプラン(月$20〜)に追加料金なしで含まれます。
2-3. Gemini — Google Workspaceとの深い統合
Gemini(ジェミニ)はGoogle社が開発したテキスト生成AIで、Gmail・Googleドキュメント・スプレッドシート・Googleカレンダーとの統合が最大の差別化ポイントです。
Google Workspaceをメインの業務基盤にしている企業にとっては、既存のワークフローにAIを自然に組み込めるため、導入のハードルが最も低い選択肢と言えます。また、Google検索との統合により、最新情報へのアクセス精度ではChatGPTやClaudeより優位な場面もあります。
ただし、Claude Codeのような自律型エージェント機能はGeminiにはまだありません。ファイル操作や複数ステップの自動化を行うには、自作のスクリプトやGemini API経由の開発が必要です。
3大ツールはいずれも月$20前後の有料プランで実用レベルになります。無料版で比較しても性能差は見えにくいため、判断するなら1ヶ月だけ有料プランを契約して実業務で試すのがベストです。無料版の比較で「大差ない」と判断するのは早計です。
03 IMAGE GENERATION 画像生成AI — Midjourney・Stable Diffusion・Adobe Firefly 視覚コンテンツの自動生成。商用利用の可否に要注意
画像生成AIは、テキストで「こんな画像がほしい」と指示するだけで、イラスト・写真風画像・デザイン素材を自動生成するカテゴリです。2024年頃から品質が急速に向上し、2026年現在はプロのデザイナーが使う実用ツールとして定着しています。
| ツール | 開発元 | 月額料金 | 商用利用 | 特徴 |
|---|---|---|---|---|
| Midjourney | Midjourney社 | $10〜$120 | 有料プランで可 | 高品質なアート寄り画像。Discord経由で操作 |
| Stable Diffusion | Stability AI | 無料〜 | ライセンス依存 | オープンソース。ローカル実行で完全カスタマイズ可 |
| Adobe Firefly | Adobe | Creative Cloud内 | 商用安全 | Adobe Stock学習で著作権リスク最小。Photoshop統合 |
| DALL-E 3 | OpenAI | ChatGPT内包 | 有料プランで可 | ChatGPT上で直接生成。テキスト理解力が高い |
| ChatGPT Image Gen | OpenAI | ChatGPT内包 | 有料プランで可 | GPT-4oベース。会話の文脈を踏まえた画像生成 |
📚 用語解説
Stable Diffusion:Stability AI社が公開したオープンソースの画像生成AI。モデルの重みが無料で公開されており、自分のPCやサーバーで動かせるのが最大の特徴。カスタムモデル(LoRA等)で独自のスタイルを学習させることも可能です。
3-1. Midjourney — アート品質ならNo.1
Midjourneyは画像の美しさ・芸術性で突出しており、イラスト・コンセプトアート・広告ビジュアルの分野で最も人気のあるツールです。Discord上のチャットボット経由で操作するという独特のUIが特徴ですが、2026年にはWebアプリ版も提供されています。
有料プランでは商用利用が認められており、広告バナー、Webサイトのヒーロー画像、プレゼン資料の挿絵などの用途で実際に使われています。ただし、特定の著名人やブランドに似た画像を生成することには利用規約上の制限があります。
3-2. Stable Diffusion — カスタマイズ自由度最大
Stable Diffusionはオープンソースで提供されており、自分のPCにインストールして動かせるのが最大の強みです。モデルのカスタマイズ(ファインチューニング)が可能なので、自社ブランドのスタイルに合った画像を安定的に生成できます。
ただし、ローカルで動かすには高性能なGPU(VRAM 8GB以上推奨)が必要で、セットアップにも技術的な知識が求められます。非エンジニアが自力で導入するにはハードルが高く、社内にインフラ担当がいない場合はMidjourneyやFireflyの方が現実的です。
3-3. Adobe Firefly — 商用リスク最小の安全牌
Adobe Fireflyは著作権上のリスクが最も低い画像生成AIです。Adobe Stockのライセンス済み素材で学習しているため、生成画像を商用利用しても著作権侵害のリスクが極めて低い設計になっています。
企業のマーケティング部門やデザインチームが安心して商用利用できるのが最大の訴求ポイントで、Photoshop・Illustratorとの統合もスムーズです。一方、Midjourneyほどのアート品質は出にくく、「きれいだけど無難」な印象の画像が多い傾向があります。
📚 用語解説
Adobe Firefly:Adobe社が提供する画像生成AI。Adobe Stockのライセンス済みデータのみで学習している点が他社との差別化ポイント。生成画像に対する知的財産の補償プログラム(IP Indemnity)を提供しており、企業利用で最も安全。
「商用利用の安全性」を最優先するならAdobe Firefly。「アート品質」を最優先するならMidjourney。「完全カスタマイズ」が必要ならStable Diffusion。業務用途では、まずFireflyかMidjourneyから試すのが無難です。
04 VIDEO / AUDIO / MUSIC 動画・音声・音楽生成AI 急速に進化中だが、業務での本格利用はまだこれから
動画・音声・音楽の3カテゴリは、テキストや画像と比べてまだ発展途上の段階です。品質は日進月歩で向上していますが、「そのまま業務で使える」レベルには課題が残っています。ここでは各カテゴリの現状と主要ツールを整理します。
4-1. 動画生成AI — Runway・Sora・Pika
動画生成AIは、テキストや画像から短尺動画(5〜60秒程度)を自動生成するカテゴリです。2024年にOpenAIが発表した「Sora」が大きな話題を呼び、一気に注目度が上がりました。
| ツール | 開発元 | 特徴 | 現時点の限界 |
|---|---|---|---|
| Runway Gen-3 | Runway AI | 先行者。テキスト→動画、画像→動画の両対応 | 長尺動画は不安定。手や顔の崩れが頻発 |
| Sora | OpenAI | 高品質な物理演算。リアルな映像生成 | 一般公開は限定的。商用利用の制約あり |
| Pika | Pika Labs | 軽量で手軽。リップシンク機能あり | 画質・解像度はRunwayに劣る |
📚 用語解説
Sora:OpenAI社が開発した動画生成AI。テキストプロンプトから最大1分間のリアルな動画を生成できる。物理法則を理解した映像生成が特徴だが、2026年現在も一般ユーザーへの完全公開には至っていません。
動画生成AIは「SNS用の短い素材を作る」「商品のイメージ動画のプロトタイプを作る」といった初期段階のクリエイティブ制作に向いています。ただし、本格的なプロモーション動画やYouTube動画の制作には、まだ人間のクリエイターが不可欠です。
2026年5月現在、動画生成AIは「5〜15秒の短尺」であれば実用レベルに近づいていますが、1分以上の連続した映像を安定的に生成することは困難です。人物の手や顔の描写が崩れる、物理法則に反する動きが出るなど、品質の安定性に課題が残ります。
4-2. 音声生成AI — CoeFont・Amazon Polly・ElevenLabs
音声生成AIは、テキストから自然な音声ナレーションを自動生成するカテゴリです。eラーニングの音声、社内研修の読み上げ、動画のナレーションなど、「人の声が必要だが、収録コストをかけたくない」シーンで威力を発揮します。
| ツール | 開発元 | 特徴 | 日本語対応 |
|---|---|---|---|
| CoeFont | CoeFont社 | 日本語に特化。豊富な日本語話者ボイス | ◎ 最も自然 |
| Amazon Polly | AWS | クラウドAPI。60以上の言語に対応 | ○ 実用レベル |
| ElevenLabs | ElevenLabs | 音声クローニングが強力。感情表現が豊か | ○ 英語が最も自然 |
📚 用語解説
音声クローニング:特定の人物の声を数秒〜数分のサンプル音声から学習し、その人の声で任意のテキストを読み上げさせる技術。経営者の声でeラーニングコンテンツを量産する、といった活用が可能ですが、倫理面・法律面での注意が必要です。
日本語のナレーション品質を重視するならCoeFontが最有力です。日本語に特化した学習データを使っているため、イントネーションや間の取り方が最も自然です。英語中心のコンテンツならElevenLabsが品質で勝ります。
4-3. 音楽生成AI — Soundraw・MusicFX・Suno
音楽生成AIは、テキストの指示やパラメータ設定からBGM・楽曲・効果音を自動生成するカテゴリです。YouTube動画のBGM、社内イベントの音楽、プレゼンテーションのバックミュージックなど、「オリジナルBGMが欲しいが作曲はできない」というニーズに応えます。
| ツール | 開発元 | 特徴 | 商用利用 |
|---|---|---|---|
| Soundraw | Soundraw社 | ジャンル・テンポ・楽器を細かく指定可能 | 有料プランで可 |
| MusicFX | テキストプロンプトから楽曲生成。無料利用可 | 制限あり | |
| Suno | Suno AI | 歌詞+メロディまで一気に生成。ボーカル付き楽曲 | 有料プランで可 |
📚 用語解説
MusicFX:Google社が提供する音楽生成AI。Google AI Test Kitchenの一部として公開されている。テキストプロンプト(例:「明るいポップなBGM、テンポ120」)で短い楽曲を生成できます。
音楽生成AIは6カテゴリの中で最も業務実用度が低いのが正直なところです。BGM生成は便利ですが、「音楽生成AIがないと業務が回らない」という企業はまだほとんどありません。動画やポッドキャストを制作している企業以外は、優先度を下げて問題ない領域です。
この3カテゴリは「今すぐ全社導入すべき」ではなく「必要なシーンが来たら使う」スタンスで十分です。テキスト生成AIとコード生成AIで業務基盤を固めてから、余裕があればこれらの領域にも手を広げる——この優先順位が最も合理的です。
05 CODE GENERATION コード生成AI — Claude Code・GitHub Copilot・Cursor テキスト生成と並ぶ業務インパクト。「コードが書ける」の意味が変わった
コード生成AIは、テキスト生成AIと並んで業務実用度が最も高いカテゴリです。自然言語の指示からプログラムコードを自動生成し、ファイル操作やコマンド実行まで自律的に行うツールが登場しています。
「自分はエンジニアじゃないから関係ない」——そう思った方、ちょっと待ってください。2026年のコード生成AIは、「プログラミングの知識がなくても、AIに業務を丸ごと自動化させる」ところまで来ています。コードを書くのはAIであり、人間はやりたいことを日本語で伝えるだけです。
| ツール | 開発元 | 月額料金 | 対象 | 特徴 |
|---|---|---|---|---|
| Claude Code | Anthropic | $20〜$200(プラン内包) | 全レベル | ターミナルで自律実行。ファイル操作・マルチステップ対応 |
| GitHub Copilot | GitHub (Microsoft) | $10〜$39 | 開発者中心 | エディタ内でのコード補完。VS Code統合 |
| Cursor | Cursor社 | $20〜$40 | 開発者中心 | AIネイティブのコードエディタ。Chat+Composer機能 |
| Amazon CodeWhisperer | AWS | 無料〜$19 | AWS開発者 | AWS SDK/APIに最適化。セキュリティスキャン付き |
📚 用語解説
GitHub Copilot:GitHub(Microsoft傘下)が提供するAIコーディングアシスタント。VS Codeなどのエディタに統合され、コードの続きをリアルタイムで予測・補完する。「次に書くべきコード」を自動提案してくれるため、開発速度が2〜3倍になるという調査結果もあります。
5-1. Claude Code — 非エンジニアでも業務自動化できるエージェント
Claude Codeは、コード生成AIの中で唯一「非エンジニアが業務自動化に使える」レベルのツールです。ターミナル(またはデスクトップアプリ)上で動き、ファイル操作・コード編集・コマンド実行まで自律的に行います。
他のコード生成AI(CopilotやCursor)が「エディタ内でコードの続きを補完する」ツールであるのに対し、Claude Codeは「日本語で指示を出すと、複数のステップを自分で計画して実行する」エージェント型のAIです。プログラミングの知識は不要で、「この売上データを集計して、グラフにして、PDFで出力して」と言えば、必要なコードを自動生成して実行まで行います。
5-2. GitHub Copilot — 開発者のコード補完ツール
GitHub Copilotはエディタ内でコードの続きを予測・補完するツールです。VS CodeやJetBrains系のIDEに統合されており、コードを書いている途中でAIが「次に書くべき行」を灰色のテキストで提案してくれます。
開発者の生産性向上には非常に効果的ですが、「非エンジニアの業務自動化」には向いていません。あくまで「コードを書いている人」を補助するツールであり、Claude Codeのように「コードを知らない人が日本語で指示して自動化する」使い方はできません。
5-3. Cursor — AIネイティブのコードエディタ
CursorはAIをエディタの中核に据えた「AIネイティブ」のコーディング環境です。VS Codeをベースに、Chat機能(コードについて質問)とComposer機能(AIにコード変更を依頼)を統合しています。
Claude Codeとの違いは、Cursorはエディタ内の体験を重視している点です。画面上でコードの差分をビジュアルに確認しながら作業できるため、開発者にとっては快適な環境です。ただし、ターミナルでの自律実行やファイル操作の自動化は、Claude Codeの方が一段上の体験を提供します。
📚 用語解説
Cursor:VS Codeをフォーク(分岐)して開発されたAIネイティブのコードエディタ。Chat機能でコードについてAIに質問し、Composer機能でAIに直接コードを書かせられる。月$20〜のサブスクリプションモデル。
「プログラミング経験がない・業務自動化したい」→ Claude Code 一択。「既にVS Codeで開発している・コード補完が欲しい」→ GitHub Copilot。「AIとの対話ベースで開発したい」→ Cursor。エンジニアならCopilot/Cursorを試し、非エンジニアならClaude Codeから始めてください。
06 SELECTION FRAMEWORK 【独自】業務に最適な生成AIの選び方フレームワーク 3ステップで「自社に効くAI」を特定する
ここからがこの記事の核心です。6カテゴリの生成AIを知ったところで、「自社にはどのAIが効くのか」を判断できなければ意味がありません。弊社(株式会社GENAI)が導入支援で実際に使っている3ステップの選定フレームワークを公開します。
6-1. ステップ1:業務を「生成物の種類」で分類する
まず、自社の業務を「何を作っているか」で分類します。この時点で、6カテゴリのどれが効くかはほぼ自動的に決まります。
| 生成物の種類 | 該当する業務例 | 対応するAIカテゴリ |
|---|---|---|
| 文章を書く | メール・企画書・議事録・報告書・ブログ記事 | テキスト生成AI |
| 画像を作る | 広告バナー・SNS投稿画像・プレゼン挿絵 | 画像生成AI |
| 動画を作る | SNS動画・商品紹介・社内研修動画 | 動画生成AI |
| 音声を作る | ナレーション・eラーニング音声・IVR | 音声生成AI |
| 音楽を作る | BGM・効果音・ジングル | 音楽生成AI |
| 自動化する | 経費処理・データ集計・レポート生成・ファイル操作 | コード生成AI |
ほとんどの企業では、「文章を書く」と「自動化する」の2つが業務時間の大半を占めているはずです。つまり、テキスト生成AIとコード生成AIが最優先になるケースが圧倒的に多い、ということです。
6-2. ステップ2:「時間×頻度」で投資対効果を見積もる
次に、ステップ1で分類した業務ごとに「1回あたりの所要時間」×「月の発生頻度」を掛け算します。この数字が大きい業務から順にAIを導入すると、投資対効果が最大化されます。
Step 1で
分類した業務
月の合計時間を
算出
時間が大きい
順に並べる
まず1業務で
試す
例えば、「メール下書き(1回15分 × 月80回 = 月20時間)」と「広告バナー作成(1回2時間 × 月5回 = 月10時間)」なら、メール下書きの方が月間削減ポテンシャルが大きいため、テキスト生成AIを先に導入すべきだと判断できます。
6-3. ステップ3:「専門知識の要否」で導入難度を判定する
最後に、選んだAIカテゴリが自社のメンバーだけで導入・運用できるかを判断します。
| AIカテゴリ | 導入難度 | 必要な専門知識 | 非エンジニアだけで運用可能? |
|---|---|---|---|
| テキスト生成AI | 低 | 日本語でプロンプトが書ければOK | ○ 可能 |
| 画像生成AI | 低〜中 | 基本操作は簡単。品質追求にはプロンプト技術 | ○ 基本利用なら可能 |
| 動画生成AI | 中 | 動画編集の基礎知識があると有利 | △ 限定的に可能 |
| 音声生成AI | 中 | API連携には開発知識が必要な場合あり | △ ツールによる |
| 音楽生成AI | 低 | ジャンル・テンポを指定するだけ | ○ 可能 |
| コード生成AI | 低(Claude Code) | 日本語で指示するだけ | ○ Claude Codeなら可能 |
テキスト生成AI、画像生成AI(基本利用)、コード生成AI(Claude Code限定)は、非エンジニアだけでも導入・運用が可能です。逆に、音声合成APIの組み込みや動画生成のワークフロー構築は、エンジニアのサポートがあった方がスムーズです。
Step 1で「何を作る業務か」を分類し、Step 2で「時間×頻度」の大きい業務から優先順位をつけ、Step 3で「自社だけで導入できるか」を判定する。この3ステップだけで、最初に手を出すべきAIカテゴリが1つに絞られます。
📚 用語解説
ROI(投資対効果):Return On Investmentの略。投資に対してどれだけのリターン(利益・削減効果)があったかを示す指標。生成AIの場合、月額料金(投資)に対して何時間の業務削減(リターン)が得られたかで計算します。
07 GENAI CASE STUDY 【独自データ】GENAI社の生成AI活用事例 Max 20xプラン(月$200)で、どのAIをどこに使っているか
ここでは、弊社(株式会社GENAI)が実際に使っている生成AIの構成と、カテゴリ別の活用実態を公開します。「種類を知った後、実際にどう使えばいいのか」の参考情報です。
7-1. 弊社の生成AI利用構成
| AIカテゴリ | 使用ツール | 月額コスト | 利用頻度 | 主な用途 |
|---|---|---|---|---|
| テキスト生成 | Claude(Max 20xプラン内) | $200に含まれる | 毎日 | メール・企画書・記事・議事録・営業資料 |
| コード生成 | Claude Code(Max 20xプラン内) | $200に含まれる | 毎日 | 業務自動化・レポート生成・経理処理 |
| 画像生成 | ChatGPT画像生成 / Unsplash | $20(ChatGPT Plus) | 週2〜3回 | LP画像・ブログサムネイル |
| 動画生成 | —(未導入) | $0 | — | 現時点では人力で対応 |
| 音声生成 | CoeFont(試験導入中) | 約$10 | 月2〜3回 | 社内研修ナレーション |
| 音楽生成 | —(未導入) | $0 | — | BGMはフリー素材で対応 |
ポイントは、6カテゴリ中、テキスト生成とコード生成の2つだけで月のAI利用時間の9割以上を占めているという点です。画像生成は必要なときだけスポットで使い、動画生成と音楽生成は現時点で未導入です。
月のトータルコストは約$230(約35,000円)です。これで月160時間以上(フルタイム1名分)の業務をAIが吸収しています。時給換算すると1時間あたり約220円。人を雇うのと比べて10分の1以下のコストです。
7-2. カテゴリ別の業務削減効果
| AIカテゴリ | 導入前の月間工数 | 導入後の月間工数 | 削減時間 | 削減率 |
|---|---|---|---|---|
| テキスト生成 | 100時間 | 20時間 | 80時間 | 80% |
| コード生成 | 80時間 | 10時間 | 70時間 | 87.5% |
| 画像生成 | 15時間 | 5時間 | 10時間 | 67% |
| 音声生成 | 5時間 | 3時間 | 2時間 | 40% |
| 合計 | 200時間 | 38時間 | 162時間 | 81% |
上記は弊社の肌感ベースの概算値です。業種・業態・担当者のスキルによって削減効果は変動します。特にコード生成AIの削減率は、弊社がClaude Codeを徹底的に使い込んでいるため高めに出ています。
7-3. 生成AI導入の4ステップ
弊社が実際に歩んだ導入ステップを図解します。
テキスト生成
Claude Pro契約
メール・議事録から
コード生成
Claude Code導入
経理・レポート自動化
画像生成
LP・ブログ用に
スポット利用開始
全社運用
Max 20xに移行
全業務にAI統合
この4ステップで重要なのは、Phase 1→2でテキスト+コードの基盤を固めてからPhase 3以降に進む順序です。画像や動画から先に手を出すと、「面白いけど業務インパクトが小さい」状態に陥りがちです。
08 CONCLUSION まとめ — 「種類を知る」から「業務に組み込む」へ 6カテゴリの全体像を踏まえて、自社の最適解を見つける
この記事では、生成AIの全6種類(テキスト・画像・動画・音声・音楽・コード)の特徴、主要ツール、業務での使い分けを整理し、弊社GENAIの実運用データと選定フレームワークを紹介しました。最後にポイントを振り返ります。
最も重要なメッセージをお伝えします。生成AIの種類を「知る」だけでは、業務は何も変わりません。変わるのは、実際に1つのカテゴリを選んで、1つの業務に使い始めたときです。
この記事で最も伝えたかったことは、「6種類すべてを使いこなせ」ではなく、「自社に効く1〜2種類を見極めて、深く使い倒せ」ということです。弊社もテキスト+コードの2種類を深く使い倒すことで、月160時間の削減を実現しています。
生成AIの選定・導入を、AI鬼管理が一緒に設計します
6カテゴリのうち、あなたの会社に最も効く生成AIはどれか。
弊社の実運用ノウハウをベースに、個別に選定・導入設計のご相談を承ります。
NEXT STEP
この記事の内容を、あなたのビジネスで
実践してみませんか?
AI活用を自社で回せるようになりたい方へ
AI鬼管理
Claude Code・Cowork導入支援から業務設計・社内浸透まで実践ベースで伴走。「自社で回せる組織」を90日で作る経営者向けトレーニング。
よくある質問
Q. 生成AIで最も業務に役立つ種類はどれですか?
A. 2026年現在、最も業務インパクトが大きいのはテキスト生成AIとコード生成AIの2種類です。メール・議事録・報告書のテキスト系業務と、経理・レポート・ファイル操作の自動化系業務の2つで、多くの企業の業務時間の大半をカバーできます。弊社でもこの2カテゴリだけで月160時間以上の削減を実現しています。
Q. 生成AIを業務で使うのに専門知識は必要ですか?
A. テキスト生成AI(ChatGPT・Claude等)とコード生成AI(Claude Code)は、日本語で指示するだけで使えるため、プログラミングやIT の専門知識は不要です。画像生成AI(Midjourney・Firefly等)も基本操作は直感的です。ただし、Stable Diffusionのローカル実行や音声合成APIの組み込みには技術的な知識が必要です。
Q. ChatGPTとClaudeの違いは何ですか?
A. ChatGPTは汎用性と知名度でNo.1、Claudeは長文処理の精度とClaude Codeによるエージェント実行で差別化しています。業務で「チャットしたい」ならChatGPT、「業務を丸ごと自動化したい」ならClaude Codeが適しています。弊社ではClaudeをメインに使い、ChatGPTは画像生成時に補助的に使っています。
Q. 画像生成AIを商用利用して著作権の問題はないですか?
A. ツールによります。Adobe Fireflyはライセンス済みデータのみで学習しており、商用利用時の著作権リスクが最も低い設計です。Midjourneyも有料プランでは商用利用が認められています。一方、Stable Diffusionは使用するモデルのライセンスによるため、商用利用前にモデルごとの利用規約を確認してください。
Q. 動画生成AIはもう実用レベルですか?
A. 2026年5月現在、5〜15秒の短尺動画であれば実用に近づいていますが、1分以上の安定した映像生成はまだ困難です。SNS用の短いクリップや商品イメージの初期プロトタイプには使えますが、プロモーション動画やYouTube動画の本格制作には人間のクリエイターが引き続き必要です。
Q. 生成AIの導入費用はどのくらいかかりますか?
A. テキスト生成AI(ChatGPT Plus / Claude Pro)は月$20(約3,000円)から始められます。コード生成AI(Claude Code)はClaude Proプラン内に含まれるため追加料金なし。弊社のように全社運用するMax 20xプランでも月$200(約30,000円)です。画像生成(Midjourney $10〜)やコード補完(Copilot $10〜)を足しても、月$300以内でほとんどの生成AIが使えます。
Q. 非エンジニアが生成AIで業務を自動化するには何から始めればいいですか?
A. Claude Codeのデスクトップ版をインストールして、「メールの返信下書きを作って」「この議事録を箇条書きで要約して」と話しかけることから始めてください。ターミナル操作は不要で、ChatGPTと同じ感覚で使えます。1つの業務で効果を実感したら、他の業務にも横展開していきます。
Q. 音楽生成AIは業務で使い道がありますか?
A. 動画やポッドキャストのBGM生成には使えますが、それ以外の業務では活用シーンが限定的です。Soundraw(有料)やMusicFX(無料)で簡単に試せるので、必要なシーンが出てきたらスポットで使うのが現実的です。テキスト・コードの2カテゴリで業務基盤を固めてから検討しても遅くありません。
Claude Codeで業務自動化を90日で叩き込む
経営者向けの伴走型パーソナルトレーニング
Claude Code を業務に落とし込む
専門研修コース一覧
受講者本人の業務を題材に、「使いこなせる」状態になるまで伴走する研修プログラム。1対1特化型・ハンズオン・法人講座の3コースを展開中。業務特化・実装まで踏み込むタイプのClaude Code研修です。
研修コース一覧を見る →AI鬼管理へのお問い合わせ
この記事を読んで気になった方へ。
AI鬼管理の専門スタッフが、御社に最適な
業務自動化プランを無料でご提案します。




