
Veo 3 × Nano Banana:AIで「誰もいない街」の動画を作る方法
テキストを書くだけで映画のような映像が生まれる。Google Veo 3の動画生成AIとNano Bananaの映像スタイルを組み合わせて、無人の都市を描くAI映像制作の全工程を紹介します。
AIが変える映像制作
映画品質の映像を作るには、かつてはカメラ、照明、ロケーション、俳優、編集ソフト、そして膨大な時間と予算が必要でした。
2026年、状況は完全に変わりました。テキストプロンプトを書くだけで、映画のような映像が生成される時代になっています。
この記事では、GoogleのAI動画生成モデルVeo 3と、独特の映像スタイルNano Bananaを組み合わせて、「誰もいない街」をテーマにしたAI映像作品を制作する方法を解説します。
Veo 3とは
Veo 3は、Google DeepMindが開発した最新のAI動画生成モデルです。
主な特徴
- テキストから動画生成:プロンプトを入力するだけで最大60秒の動画を生成
- 1080p対応:フルHD品質の映像を出力
- 物理法則の理解:光の反射、影、流体の動きなど物理的に正確な表現
- カメラワーク指定:パン、チルト、ドリー、クレーンショットなどを指定可能
- 音声同時生成:環境音や音楽を映像と同時に生成
アクセス方法
Veo 3はGoogle Workspaceの一部として利用可能です。Google AIスタジオからもアクセスできます。
Nano Bananaスタイルとは
Nano Bananaは、AI動画生成コミュニティで生まれた映像スタイルの一つです。
特徴
- ミニチュア風の質感:実写なのにジオラマのように見える
- 鮮やかな色彩:彩度が高くポップな色使い
- 浅い被写界深度:ティルトシフトレンズで撮ったような強いボケ
- 非現実的な光:黄金時間のような柔らかい光が常にかかる
このスタイルをVeo 3のプロンプトに加えることで、独特の映像美を持つ動画が生成できます。
「誰もいない街」を作る
コンセプト
人間が突然消えた都市。車は止まったまま、信号は点滅し続け、風だけが通り過ぎる。日常の風景なのに誰もいない不気味さと美しさ。
この矛盾する感覚をAI動画で表現します。
プロンプト設計
Veo 3で高品質な動画を生成するには、プロンプトの書き方が重要です。
Nano banana style miniature tilt-shift cinematic shot.
An empty Tokyo intersection at golden hour.
No people, no movement except traffic lights cycling.
Wet asphalt reflecting neon signs.
Slow dolly forward movement.
Shallow depth of field, warm color grading.
8K quality, photorealistic, cinematic lighting.
プロンプトの構造
1. スタイル指定:nano banana style, miniature, tilt-shift
2. シーン説明:何が映っているか
3. 除外指定:人がいないことを明示
4. カメラワーク:slow dolly forward
5. 映像品質:8K, photorealistic, cinematic
制作ワークフロー
ステップ1:シーンの設計
まず、どのような「誰もいない街」の映像を作りたいか、シーンをリストアップします。
シーン1:交差点(俯瞰・ティルトシフト)
シーン2:商店街のアーケード(正面・ドリーイン)
シーン3:駅のホーム(横移動・パン)
シーン4:夜の繁華街(ネオン反射・静止)
シーン5:朝の住宅街(ゆっくりクレーンアップ)
ステップ2:プロンプトの作成と生成
各シーンに対して詳細なプロンプトを作成し、Veo 3で生成します。
シーン1のプロンプト:
Nano banana miniature tilt-shift overhead shot.
A Japanese city intersection seen from above.
All cars stopped at red lights but no drivers visible.
Crosswalk lines perfectly painted, traffic lights cycling.
Golden hour sunlight casting long shadows.
No people anywhere. Eerie silence implied.
Extremely shallow depth of field.
Slow subtle zoom in. Cinematic 8K quality.
ステップ3:バリエーション生成
同じシーンでも、時間帯や天候を変えてバリエーションを生成します。
- 早朝:青白い光、霧がかかる
- 昼間:影が短い、くっきりした描写
- 夕方:黄金色、長い影
- 夜:ネオン、濡れた路面の反射
- 雨天:水たまり、雨粒の描写
ステップ4:編集と仕上げ
生成した動画クリップを編集ソフトで繋ぎ合わせます。
推奨ツール:
- DaVinci Resolve(無料・高機能)
- Premiere Pro(業界標準)
- CapCut(手軽さ重視)
Veo 3のコツ
良いプロンプトの書き方
✗ 「街の動画」
→ 抽象的すぎて品質が安定しない
✓ 「Nano banana tilt-shift cinematic. Empty Tokyo street at dawn.
Wet cobblestone reflecting soft pink sky. Slow tracking shot.
No people. Cherry blossom petals falling slowly.
Shallow DOF, 8K photorealistic.」
→ 具体的で映像がイメージできる
避けるべきこと
- プロンプトの短すぎ:最低でも3〜4文は書く
- 矛盾する指示:「昼と夜」「動きと静止」など
- 人物の詳細描写:AI動画は人物の生成がまだ苦手
うまくいくパターン
- 風景・都市景観は非常に得意
- 水面の反射、光の表現が美しい
- ゆっくりしたカメラワークが安定
[PR] Google Workspaceのすすめ
Veo 3を含むGoogleのAIツール群は、Google Workspaceから利用できます。
Google Workspaceには動画生成AI以外にも:
- Gemini:テキスト生成・要約・翻訳
- NotebookLM:ドキュメントを読み込ませて対話するAI
- Google Meet AI:会議の自動要約・議事録作成
- Gmail AI:メールの自動下書き・返信提案
- Googleスライド AI:プレゼンの自動生成
クリエイターにとって、Google Workspaceは映像制作だけでなく、企画・リサーチ・プレゼンまでAIでカバーできる総合環境です。
完成作品のイメージ
最終的に、以下のような3〜5分の映像作品が完成します。
0:00 - 朝靄の中の交差点(俯瞰ティルトシフト)
0:30 - 商店街のシャッター通り(ドリーイン)
1:00 - 無人の駅ホーム(横パン)
1:30 - 公園の遊具が風で揺れる(フィックス)
2:00 - 夕暮れのビル群(クレーンアップ)
2:30 - ネオン煌めく夜の繁華街(スローモーション)
3:00 - 夜明けの交差点に戻る(ループ)
テキストだけで、この品質の映像が作れる時代になったことに驚かざるを得ません。
AI動画制作の未来
AI動画生成はまだ発展途上ですが、進化の速度は凄まじいものがあります。
2025年→2026年の進化
- 生成可能な長さ:10秒 → 60秒
- 解像度:720p → 1080p
- 一貫性:シーン間の整合性が大幅改善
- 物理表現:光・影・反射がよりリアルに
- 音声同時生成が実現
今後の展望
- 4K以上の高解像度
- 数分〜十数分の長尺動画
- キャラクターの一貫性保持
- リアルタイム生成
- インタラクティブな映像体験
まとめ
Veo 3とNano Bananaスタイルの組み合わせは、AI映像制作の新しい可能性を示しています。
- テキストだけで映画品質の映像を生成
- Nano Bananaスタイルで独特のミニチュア映像美
- **「誰もいない街」**という非現実的なシーンもAIなら簡単
- Google WorkspaceのAIツール群と統合された制作環境
- カメラもロケーションも俳優も不要
映像制作の民主化が加速しています。アイデアさえあれば、誰でも映像クリエイターになれる時代がすでに来ています。
参考動画
https://youtu.be/ne_a67zmolE?si=ZCgTERQp_KRzBZvb



