※ 本ページにはプロモーション（広告）が含まれています

ELEVEN V3 GA · 70+ LANGUAGES · REALTIME AGENTS

テクノロジーに、
命を吹き込む。

Q: Eleven v3 と Flash v2.5、どちらを使えばいい？

ナレーション・オーディオブック・吹替などオフライン生成は Eleven v3（最高品質・70+言語・感情タグ）。電話 AI や対話エージェントのリアルタイム用途は Flash v2.5（~75ms 推論・32言語）が現役です。v3 はリアルタイム不可な点に注意。

Q: 日本語の品質はどれくらいですか？

Eleven v3 でネイティブ話者と聞き分けが難しい品質に到達。Audio Tag で「ためらい」「驚き」「囁き」などを指示でき、対話・関西弁・落語調まで再現可能になっています。ニュース読み上げ、絵本朗読、CM、Podcast での実運用例多数。

Q: 商用利用は可能ですか？

Starter プラン（$6/月）以上で商用利用が可能です。Free プランは生成物の使用にクレジット表記が必要となります。Eleven Music の楽曲も Starter 以上で商用 OK。

Q: Voice Clone は誰の声でも使えますか？

原則として「ご自身の声、または明示的に許諾を得た声」のみクローン可能です。同意のない他者・著名人の声の無断クローンは利用規約で禁止されており、検知されるとアカウント停止になります。

Q: ElevenAgents（電話 AI）はどう違うの？

従来の Conversational AI を 2026 年に大幅刷新したプラットフォームで、価格が前世代比約 50% ダウン。Twilio / Vonage / SIP 接続、お好みの LLM（GPT / Claude / Gemini / カスタム）連携、RAG、ターンテイキング、Web/Mobile SDK まで揃った電話 AI フルスタックです。

Q: クレジット（文字数換算）の消費はどう計算？

プランごとに月間クレジットが付与され、生成時間や品質に応じて消費されます。Free 10,000 / Starter 30,000 / Creator 121,000 / Pro 600,000 / Scale 1.8M / Business 6M。年払いで約 17%（2ヶ月分）の割引があります。

Q: Creator プランの初月 50%OFF はいつまで？

公式ページに常時掲示されているキャンペーンで、Creator プランは初月 $22 → $11 で開始できます。期間明示は公式サイトをご確認ください。2 ヶ月目以降は通常価格 $22/月となります。

Q: Cartesia や OpenAI TTS、Hume と比べてどう？

総合品質（4,000+ voices / 70+言語）と感情表現で ElevenLabs がリード。リアルタイム最速は Cartesia ですが、ElevenLabs も Flash v2.5 の ~75ms で対応。Hume の感情双方向に対しては v3 の Audio Tag で応戦。クローン品質とプラットフォーム統合度はトップクラスです。

ElevenLabs は Eleven v3（2026 年 3 月 GA）で 70+ 言語・感情タグ・対話の自然さを刷新した、AI 音声生成の決定版。リアルタイム対話には Flash v2.5（~75ms）、電話 AI には ElevenAgents。ナレーション・吹替・楽曲・SFX・字幕までを 1 プラットフォームで。

無料で Eleven v3 を試すプランを見る

クレカ登録不要10,000 クレジット即付与日本語・関西弁・対話まで

narration_v3.mp3

Japanese · Eleven v3 · Audio Tag enabled

[whispers] こんにちは [sighs] 今日はね、ちょっと面白い話があるんだ [laughs]

70+

対応言語（v3）

~75 ms

Flash v2.5 推論

4,000+

プリセット音声

$11B

2026/2 時点評価額

MODEL LINEUP

用途別に、ベストなモデルが用意されている。

Flagship

Eleven v3

2026 年 3 月 GA の最新フラッグシップ。Audio Tag による感情指示、対話、囁き、笑いまで自然に再現。70+ 言語 対応で日本語も最高水準。複雑テキストのエラー率は前世代比 ▲68%。

◎ オーディオブック・吹替・動画ナレーション

△ 高遅延のためリアルタイム不可

Realtime

Flash v2.5

モデル推論 ~75ms の超低遅延モデル。電話 AI / 対話エージェントの「人と話している」体験を実現。32 言語 対応。ElevenAgents の中核モデル。

◎ 電話ボット・対話 AI・ゲーム NPC

△ ナレーション品質は v3 に譲る（使い分け推奨）

CAPABILITIES

音声の全レイヤーを、1 プラットフォームで。

新フラッグシップ

Eleven v3 — 感情まで再現

2026年3月にGA。[whispers] / [laughs] / [sighs] などの Audio Tag で感情・抑揚を細かく指示。日本語の対話・関西弁・落語調まで自然に再現。

2026 拡張

70+ 言語に対応

v3 が対応する言語は 70 を超え、1 つのクローン音声で多言語をしゃべらせるマルチリンガル運用が可能に。

リアルタイム

Flash v2.5 — リアルタイム

モデル推論 ~75ms の超低遅延モデル。電話 AI・対話エージェントのリアルタイム会話に最適。32 言語対応。

Conversational AI 2.0

ElevenAgents（電話AIプラットフォーム）

Twilio / Vonage / SIP に直接接続して電話 AI を構築。LLM は GPT / Claude / Gemini / Custom 自由、ターンテイキング、RAG 完備。価格は前世代比約 50% ダウン。

Voice Clone（クローン）

1 分のサンプルで Instant Clone、30 分以上で Professional Voice Clone。本人と聞き分け不能なレベルの自分の声をクラウドで運用。

Voice Design v3

テキストプロンプトから「20代女性・温かみのある低めの声」のように、世界に存在しないオリジナルキャラクター音声を新規生成。

新機能

Eleven Music

テキストプロンプトから楽曲を生成。Starter 以上で商用利用可。2026 年 4 月に iOS アプリ提供、ライブ配信や動画 BGM に直結。

Sound Effects v2

「雷雨のなかの足音」「SF のエンジン音」などプロンプトから SFX 生成。Studio 3.0 のタイムライン上で SFX トラックとして直接配置可能。

Dubbing Studio

動画ファイルをアップするだけで、別言語へ口パク同期で自動吹き替え。字幕の自動生成・編集にも対応。

Scribe v2（音声→テキスト）

多言語対応の高精度STT。会議録、ポッドキャストの文字起こし、字幕生成まで。Speech-to-Speech のループも構築可能。

Image & Video 生成

音声プラットフォームに統合された映像生成。音と映像をワンプロジェクトで揃えるショート動画ワークフローに最適。

WebSocket / API

低遅延ストリーミング API で対話 AI・ゲーム NPC・通話ボットへ組み込み。Business は低遅延 TTS が $0.05/分の固定料金。

PRICING

あなたの用途に、ぴったりのスケール

年払いで約 17%（2 ヶ月分）オフ。さらに Creator プランは初月 50%OFF（$11）のキャンペーン中。

まず触ってみる

Free

$0/月

10,000 クレジット / 月

Eleven v3 / Flash v2.5 を試用
70+ 言語の Text-to-Speech
Voice Design / SFX / Music も試せる
商用利用は不可（クレジット表記必須）

選ぶ

個人クリエイター

Starter

$6/月

30,000 クレジット / 月

Free の全機能
Instant Voice Clone（即時クローン）
Dubbing Studio（吹替）
商用利用 OK

選ぶ

Creator

$22/月

初月 50%OFF → $11

121,000 クレジット / 月

Starter の全機能
Professional Voice Clone（放送品質）
192 kbps 高解像度オーディオ
Studio 3.0（旧 Projects）
SFX タイムライントラック

選ぶ

プロダクション用途

Pro

$99/月

600,000 クレジット / 月

Creator の全機能
44.1 kHz PCM 出力（マスタリング用）
高優先度の生成キュー
API 利用枠の大幅拡大

選ぶ

事業会社・スタジオ

Scale

$299/月

1.8M クレジット / 月

Pro の全機能
3 シート / 3 Professional Voice Clone
より高い同時生成枠
ボリュームディスカウント

選ぶ

エージェント運用

Business

$990/月

6M クレジット / 月

Scale の全機能
10 シート / 10 Professional Voice Clone
低遅延 TTS（$0.05/分）
ElevenAgents 本番利用に最適

選ぶ

※ 価格は USD 月額。Enterprise はカスタム見積り（SSO / HIPAA BAA / SLA 等）。最新料金は公式サイトをご確認ください。

QUICK START

4 ステップで、AI 音声が完成

無料アカウント登録

メールアドレスだけで 1 分。クレカ登録不要で、10,000 クレジットの生成枠が即付与されます。

モデルと声を選ぶ

ナレーションは Eleven v3、リアルタイム対話は Flash v2.5。声はライブラリから選ぶか、Voice Clone / Voice Design で新規作成。

テキストを生成 or Studio で組み立て

短文なら TTS、長尺は Studio 3.0 のタイムラインで章立て編集。Audio Tag で感情を細かく指示可能。

ダウンロード or API / エージェント連携

MP3 / WAV / PCM でダウンロード、または API キーを発行してアプリ・電話 AI に組み込み。ElevenAgents なら数分で電話ボットが起動。

無料で Eleven v3 を試す

USE CASES

こんな制作で、使われています

YouTube・ショート動画ナレーション

顔出しなしの解説／VLOG／ニュース系チャンネル。Eleven v3 の感情タグで「驚き」「笑い」を入れて、地声に近い表現で長尺コンテンツを量産。

Podcast・オーディオブック

原稿をペーストして章ごとに章立て編集。Studio 3.0 で SFX をタイムラインに乗せ、配信プラットフォームへ直接アップ。

電話 AI / カスタマーサポート

ElevenAgents で電話番号に AI を直結。Flash v2.5 の ~75ms 推論＋エージェント全体 <100ms 応答で「人と話している」体験を提供。

ゲーム NPC・インディー開発

100 人の村人を別々の声で。Realtime API + Voice Design v3 で動的セリフを生成し、プロシージャル会話を実装。

教育・eラーニング

長文教材を疲れない品質で自動ナレーション。Dubbing Studio で海外向け多言語ローカライズも一気通貫。

BGM・ジングル制作

Eleven Music で動画用 BGM や Podcast オープニングを生成。Starter 以上なら商用利用 OK。SFX と組み合わせて完パケへ。

FAQ

よくある質問

Eleven v3 と Flash v2.5、どちらを使えばいい？