ELEVEN V3 GA · 70+ LANGUAGES · REALTIME AGENTS

テクノロジーに、
命を吹き込む。

ElevenLabs は Eleven v3(2026 年 3 月 GA)で 70+ 言語・感情タグ・対話の自然さを刷新した、AI 音声生成の決定版。 リアルタイム対話には Flash v2.5(~75ms)、電話 AI には ElevenAgents。 ナレーション・吹替・楽曲・SFX・字幕までを 1 プラットフォームで。

クレカ登録不要10,000 クレジット 即付与日本語・関西弁・対話まで
narration_v3.mp3
Japanese · Eleven v3 · Audio Tag enabled
[whispers] こんにちは [sighs] 今日はね、ちょっと面白い話があるんだ [laughs]
70+
対応言語(v3)
~75 ms
Flash v2.5 推論
4,000+
プリセット音声
$11B
2026/2 時点評価額
MODEL LINEUP

用途別に、ベストなモデルが用意されている。

Flagship

Eleven v3

2026 年 3 月 GA の最新フラッグシップ。Audio Tag による感情指示、対話、囁き、笑いまで自然に再現。70+ 言語 対応で日本語も最高水準。複雑テキストのエラー率は前世代比 ▲68%。

◎ オーディオブック・吹替・動画ナレーション
△ 高遅延のためリアルタイム不可
Realtime

Flash v2.5

モデル推論 ~75ms の超低遅延モデル。電話 AI / 対話エージェントの「人と話している」体験を実現。32 言語 対応。ElevenAgents の中核モデル。

◎ 電話ボット・対話 AI・ゲーム NPC
△ ナレーション品質は v3 に譲る(使い分け推奨)
CAPABILITIES

音声の全レイヤーを、1 プラットフォームで。

新フラッグシップ

Eleven v3 — 感情まで再現

2026年3月にGA。[whispers] / [laughs] / [sighs] などの Audio Tag で感情・抑揚を細かく指示。日本語の対話・関西弁・落語調まで自然に再現。

2026 拡張

70+ 言語に対応

v3 が対応する言語は 70 を超え、1 つのクローン音声で多言語をしゃべらせるマルチリンガル運用が可能に。

リアルタイム

Flash v2.5 — リアルタイム

モデル推論 ~75ms の超低遅延モデル。電話 AI・対話エージェントのリアルタイム会話に最適。32 言語対応。

Conversational AI 2.0

ElevenAgents(電話AIプラットフォーム)

Twilio / Vonage / SIP に直接接続して電話 AI を構築。LLM は GPT / Claude / Gemini / Custom 自由、ターンテイキング、RAG 完備。価格は前世代比約 50% ダウン。

Voice Clone(クローン)

1 分のサンプルで Instant Clone、30 分以上で Professional Voice Clone。本人と聞き分け不能なレベルの自分の声をクラウドで運用。

Voice Design v3

テキストプロンプトから「20代女性・温かみのある低めの声」のように、世界に存在しないオリジナルキャラクター音声を新規生成。

新機能

Eleven Music

テキストプロンプトから楽曲を生成。Starter 以上で商用利用可。2026 年 4 月に iOS アプリ提供、ライブ配信や動画 BGM に直結。

Sound Effects v2

「雷雨のなかの足音」「SF のエンジン音」などプロンプトから SFX 生成。Studio 3.0 のタイムライン上で SFX トラックとして直接配置可能。

Dubbing Studio

動画ファイルをアップするだけで、別言語へ口パク同期で自動吹き替え。字幕の自動生成・編集にも対応。

Scribe v2(音声→テキスト)

多言語対応の高精度STT。会議録、ポッドキャストの文字起こし、字幕生成まで。Speech-to-Speech のループも構築可能。

Image & Video 生成

音声プラットフォームに統合された映像生成。音と映像をワンプロジェクトで揃えるショート動画ワークフローに最適。

WebSocket / API

低遅延ストリーミング API で対話 AI・ゲーム NPC・通話ボットへ組み込み。Business は低遅延 TTS が $0.05/分の固定料金。

PRICING

あなたの用途に、ぴったりのスケール

年払いで約 17%(2 ヶ月分)オフ。さらに Creator プランは初月 50%OFF($11)のキャンペーン中。

まず触ってみる

Free

$0/月
10,000 クレジット / 月
  • Eleven v3 / Flash v2.5 を試用
  • 70+ 言語の Text-to-Speech
  • Voice Design / SFX / Music も試せる
  • 商用利用は不可(クレジット表記必須)
選ぶ
個人クリエイター

Starter

$6/月
30,000 クレジット / 月
  • Free の全機能
  • Instant Voice Clone(即時クローン)
  • Dubbing Studio(吹替)
  • 商用利用 OK
選ぶ
人気
もっとも人気

Creator

$22/月
初月 50%OFF → $11
121,000 クレジット / 月
  • Starter の全機能
  • Professional Voice Clone(放送品質)
  • 192 kbps 高解像度オーディオ
  • Studio 3.0(旧 Projects)
  • SFX タイムライントラック
選ぶ
プロダクション用途

Pro

$99/月
600,000 クレジット / 月
  • Creator の全機能
  • 44.1 kHz PCM 出力(マスタリング用)
  • 高優先度の生成キュー
  • API 利用枠の大幅拡大
選ぶ
事業会社・スタジオ

Scale

$299/月
1.8M クレジット / 月
  • Pro の全機能
  • 3 シート / 3 Professional Voice Clone
  • より高い同時生成枠
  • ボリュームディスカウント
選ぶ
エージェント運用

Business

$990/月
6M クレジット / 月
  • Scale の全機能
  • 10 シート / 10 Professional Voice Clone
  • 低遅延 TTS($0.05/分)
  • ElevenAgents 本番利用に最適
選ぶ

※ 価格は USD 月額。Enterprise はカスタム見積り(SSO / HIPAA BAA / SLA 等)。最新料金は公式サイトをご確認ください。

QUICK START

4 ステップで、AI 音声が完成

01

無料アカウント登録

メールアドレスだけで 1 分。クレカ登録不要で、10,000 クレジットの生成枠が即付与されます。

02

モデルと声を選ぶ

ナレーションは Eleven v3、リアルタイム対話は Flash v2.5。声はライブラリから選ぶか、Voice Clone / Voice Design で新規作成。

03

テキストを生成 or Studio で組み立て

短文なら TTS、長尺は Studio 3.0 のタイムラインで章立て編集。Audio Tag で感情を細かく指示可能。

04

ダウンロード or API / エージェント連携

MP3 / WAV / PCM でダウンロード、または API キーを発行してアプリ・電話 AI に組み込み。ElevenAgents なら数分で電話ボットが起動。

USE CASES

こんな制作で、使われています

YouTube・ショート動画ナレーション

顔出しなしの解説/VLOG/ニュース系チャンネル。Eleven v3 の感情タグで「驚き」「笑い」を入れて、地声に近い表現で長尺コンテンツを量産。

Podcast・オーディオブック

原稿をペーストして章ごとに章立て編集。Studio 3.0 で SFX をタイムラインに乗せ、配信プラットフォームへ直接アップ。

電話 AI / カスタマーサポート

ElevenAgents で電話番号に AI を直結。Flash v2.5 の ~75ms 推論+エージェント全体 <100ms 応答で「人と話している」体験を提供。

ゲーム NPC・インディー開発

100 人の村人を別々の声で。Realtime API + Voice Design v3 で動的セリフを生成し、プロシージャル会話を実装。

教育・eラーニング

長文教材を疲れない品質で自動ナレーション。Dubbing Studio で海外向け多言語ローカライズも一気通貫。

BGM・ジングル制作

Eleven Music で動画用 BGM や Podcast オープニングを生成。Starter 以上なら商用利用 OK。SFX と組み合わせて完パケへ。

FAQ

よくある質問

Eleven v3 と Flash v2.5、どちらを使えばいい?
ナレーション・オーディオブック・吹替などオフライン生成は Eleven v3(最高品質・70+言語・感情タグ)。電話 AI や対話エージェントのリアルタイム用途は Flash v2.5(~75ms 推論・32言語)が現役です。v3 はリアルタイム不可な点に注意。
日本語の品質はどれくらいですか?
Eleven v3 でネイティブ話者と聞き分けが難しい品質に到達。Audio Tag で「ためらい」「驚き」「囁き」などを指示でき、対話・関西弁・落語調まで再現可能になっています。ニュース読み上げ、絵本朗読、CM、Podcast での実運用例多数。
商用利用は可能ですか?
Starter プラン($6/月)以上で商用利用が可能です。Free プランは生成物の使用にクレジット表記が必要となります。Eleven Music の楽曲も Starter 以上で商用 OK。
Voice Clone は誰の声でも使えますか?
原則として「ご自身の声、または明示的に許諾を得た声」のみクローン可能です。同意のない他者・著名人の声の無断クローンは利用規約で禁止されており、検知されるとアカウント停止になります。
ElevenAgents(電話 AI)はどう違うの?
従来の Conversational AI を 2026 年に大幅刷新したプラットフォームで、価格が前世代比約 50% ダウン。Twilio / Vonage / SIP 接続、お好みの LLM(GPT / Claude / Gemini / カスタム)連携、RAG、ターンテイキング、Web/Mobile SDK まで揃った電話 AI フルスタックです。
クレジット(文字数換算)の消費はどう計算?
プランごとに月間クレジットが付与され、生成時間や品質に応じて消費されます。Free 10,000 / Starter 30,000 / Creator 121,000 / Pro 600,000 / Scale 1.8M / Business 6M。年払いで約 17%(2ヶ月分)の割引があります。
Creator プランの初月 50%OFF はいつまで?
公式ページに常時掲示されているキャンペーンで、Creator プランは初月 $22 → $11 で開始できます。期間明示は公式サイトをご確認ください。2 ヶ月目以降は通常価格 $22/月となります。
Cartesia や OpenAI TTS、Hume と比べてどう?
総合品質(4,000+ voices / 70+言語)と感情表現で ElevenLabs がリード。リアルタイム最速は Cartesia ですが、ElevenLabs も Flash v2.5 の ~75ms で対応。Hume の感情双方向に対しては v3 の Audio Tag で応戦。クローン品質とプラットフォーム統合度はトップクラスです。

声で勝負する時代の、
基盤を、今日持つ。

無料で 10,000 クレジット。Eleven v3 と Flash v2.5、両方すぐに試せます。

無料で ElevenLabs を始める

※ 本ページは ElevenLabs の紹介プログラム(アフィリエイト)を利用しています。リンク経由のご契約により当サイトが紹介報酬を受け取る場合があります。