Manus は現在 Meta の一部となり、AIを世界中のビジネスに提供します。

その他·金曜日, 3月 06

Google Veo 3をテストしてみた正直なレビュー

Manusのコンテンツライターとして、新しいAIツールをテストすることは、基本的に仕事の一部です。Google Veo 3がリリースされたとき、インターネットはそのデモに夢中になりました。リアルな話す人物、同期された音声、映画のようなビジュアル、すべてが1つのテキストプロンプトから生成されます。私はこれまでに多くのAIの盛り上がりを見てきましたが、デモはキュレーションされており、実際の結果は全く別物であることを知っています。
そこで、実際にGoogle Veo 3を使い、限界を試すために4つの異なるプロンプトを実行し、すべてを正直に記録することにしました。
これはGoogleのマーケティング資料の要約ではありません。これは私の実際の体験に基づくGoogle Veo 3のハンズオンレビューであり、感動した部分、イライラした部分、そして全く機能しなかった部分を含めています。このレビューを読み終える頃には、Veo 3が得意とすること、欠点、価格に見合うかどうか、そして競合他社と比較してどうなのかが分かるでしょう。


Google Veo 3とは?(そしてVeo 3.1の新機能は?)

Google Veo 3は、1つのテキストプロンプトから高品質なビデオクリップを生成する高度なAIビデオ生成モデルです。同期されたダイアログ、環境音効果、背景音楽を1つのプロンプトからサポートし、最もリアルなAI生成の話す人物映像を生み出すことで評判を築いています。
Veo 3は2025年中頃のGoogle I/Oで初めて発表され、その年の最も話題となったAIビデオジェネレーターの1つとなりました。最新のアップデートであるVeo 3.1では、安定性の向上、より正確なリップシンク、一貫性のあるキャラクター生成、1080pおよび4Kへのアップスケーリングなど、意味のある改善が行われました。これはいくつかのGoogle製品を通じて利用可能で、Google Flow(長く複雑なシーンの編集とシーケンス作成のために構築されたプロフェッショナルな映画制作ツール)や、Google Whisk(迅速な画像からビデオ生成と短いクリップに焦点を当てた実験的なツール)で利用できます。このレビューでは、Geminiアプリを通じてテストを行い、「Create video」ツールピルを選択して4つのプロンプトをすべて実行しました。


私のハンズオンテストプロセス

適切にテストするために、単純なプロンプトを投げて終わりにするのではなく、Manusに協力を依頼し、ダイアログとリップシンク、映画的な雰囲気、製品の一貫性、そして高速なアクションを評価するための4つの具体的なプロンプトを設計しました。そのプロセスが実際にどのように進んだかをご紹介します。

アクセス方法(そしてあなたもアクセスする方法)

Veo 3へのアクセスは、最初は正直言って少し混乱します。この一般的な問題点を説明する価値があると思います。
Gemini無料アカウントインターフェースのスクリーンショット

私は無料アカウントから始めました。インターフェースは他のAIツールと似たようなもので、プロンプトボックスといくつかのツールピルが表示されます。しかし、どこにもビデオ生成オプションは見当たりませんでした。それでも最初のプロンプトを入力してみました。何が起こるか見てみたかったのです。
Geminiがビデオではなく画像を返したスクリーンショット

返ってきたのは画像で、ビデオではありませんでした。その画像は実際に印象的で、プロンプトにうまく合っていましたが、明らかに私が求めたものではありませんでした。そこで、Geminiに明示的にビデオを作成するよう依頼してみました。もしかしたら私の意図を誤解したのかもしれないと思ったのです。返ってきた応答は、「今日そのビデオを作成できますが、サブスクリプションをアップグレードする必要があります」というものでした。
アップグレードプロンプトのスクリーンショット

そこで、有料プランを調べてみました。
現在の各プランがビデオ生成に提供する内容は以下の通りです:
プラン
月額料金
AIクレジット
Veo 3.1アクセス
無料
$0
1日50クレジット
Flow、Animate、画像生成への限定アクセス
Google AI Plus
$7.99/月
月200クレジット
FlowおよびWhiskでの画像からビデオ生成へのより多くのアクセス
Google AI Pro
$19.99/月
月1,000クレジット
FlowおよびWhiskへのより高いアクセス
Google AI Ultra
$249.99/月
月25,000クレジット
FlowおよびWhiskへの最高のアクセス
プランの文言は曖昧です。Google AI Plusは「Veo 3を使用した画像からビデオ生成へのより多くのアクセス」と記載されており、Google AI Proは「より高いアクセス」と記載されています。実際に何が得られるのかはっきりしません。私は次のレベルのプランであるGoogle AI Plusを選びました。それが目的を果たすように思えたからです。有料登録を済ませ、いざスタート!Plusプランでは、無料プランでは利用できなかった「Create Video」オプションが追加されているのが確認できました。
Gemini Plusプランで「Create Video」オプションが表示されているスクリーンショット



Veo 3の限界を試すために使用した4つのプロンプト

以下は、Veo 3の能力の異なる側面をテストするために作成した4つのプロンプトです:
1.ダイアログ&リップシンクテスト — 同期されたダイアログを備えたコアネイティブオーディオ機能を評価するため。
2.映画的&雰囲気テスト — 複雑なビジュアルスタイルやカメラ演出をどれだけうまく処理できるかを評価するため。
3.製品&オブジェクト一貫性テスト — クリーンでプロフェッショナルな製品ビデオを作成できるかどうかを確認するため。
4.アクション&モーションテスト — 高速な動き、動的なカメラワーク、レイヤードオーディオをどれだけうまく処理できるかを確認するため。


結果:4つのVeo 3ビデオ例(良い点、悪い点、そしてグリッチ)

プrompt #1: ダイアログ&リップシンクテスト

使用したプロンプト: "暖かい照明の図書館に座り、カメラを直接見つめる40代の眼鏡をかけた女性歴史家の中間クローズアップショット。彼女は思慮深く魅力的な口調で話します。彼女はこう言います:『ローマ帝国について多くの人が気づいていないのは、その崩壊が単一の出来事ではなく、何世紀にもわたるゆっくりとした複雑な解体だったということです。』環境音:ページをめくる静かな音と図書館の空調の静かな音。スタイル:ドキュメンタリーインタビュー、高品質デジタルカメラで撮影。"

私の体験: 正直に言って、この結果には本当に驚かされました。プロセスはスムーズで、ビデオは数分で準備が整いました。本当の話ですが、生成中に他のタブに切り替えて別の作業をしていました。戻ってきて出力を見たとき、画面にランダムな広告が表示されたのかと思いました。それほどリアルに見えました。歴史家、照明、トーン…すべてが完璧でした。彼女は自然な抑揚、間、強調を伴って話しました。彼女の表情や手のジェスチャー?完璧でした。本当にドキュメンタリーインタビューにふさわしいものでした。
唯一気になったのは、日光に浮かぶ埃の粒子が少し気を散らす点でした。また、環境音として図書館の音を求めたのに対し、モデルは代わりに微妙な背景音楽トラックを提供しました。しかし正直なところ、それは賢明な判断でした。音楽はドキュメンタリースタイルに完璧にマッチしており、私が求めたものよりもむしろ良かったかもしれません。素晴らしいスタートです!
気に入った点
気に入らなかった点
信じられないほどリアルで自然なキャラクター
日光に浮かぶ埃の粒子が少し気を散らした
自然な話し方の抑揚と完璧なリップシンク
特定の環境音リクエストを無視した(ただし良い判断だった)
ドキュメンタリーインタビュースタイルを完璧に再現



プrompt #2: 映画的&雰囲気テスト

使用したプロンプト: "火星のクレーターの縁に立つ孤独な宇宙飛行士をゆっくりと後退しながら明らかにするドリーショット。空は赤みがかったオレンジ色で、小さな月が2つ見える。荒涼として静寂。スタイル:壮大なサイエンスフィクション、4K、広角レンズ、非常に詳細、畏敬の念を抱かせる憂鬱な雰囲気。"

私の体験: これは…賛否両論でした。最初に目に入ったのは宇宙飛行士のヘルメットの反射でした。地球のかすかな反射を求めたのに、得られたのは奇妙で歪んだ男性の顔の断片でした。それは完全に不自然で、透明性と次元のレイヤーがすべて間違っているように見えました。それが宇宙飛行士自身の顔だったのでしょうか?誰にも分かりません!ただ貼り付けられたように見えました。
その他の部分は悪くありませんでした。スーツ、クレーター、カメラの動きはすべて堅実でした。砂埃や霧の詳細は実際に非常にリアルでした。しかし、プロンプトでは小さな月が2つと指定したのに、空には異なるサイズの3つの惑星が見えました。ヘルメットの反射のグリッチがなければ、これは印象的だったでしょう。AIビデオ生成では、良い結果もあれば、悪い結果もあります。モデルは太陽、星、動く霧を追加しましたが、それはうまくいきました。余分な顔や惑星?それはあまり良くありませんでした。
気に入った点
気に入らなかった点
ドリーカメラの動きの良い実行
ヘルメットの反射に歪んだ顔の大きなグリッチ
リアルな砂埃と霧の詳細
"2つの月"の指示に従わなかった
荒涼とした壮大なサイエンスフィクションの雰囲気をうまく再現
宇宙飛行士のスーツに細部が欠けていた


プrompt #3: 製品&オブジェクト一貫性テスト

使用したプロンプト: "高級で美しくデザインされたセラミック製ティーポットのターンテーブルショット。ティーポットはミニマリストなマットホワイトで、シンプルなライトグレーの表面に置かれています。カメラはティーポットの周りを360度ゆっくりと回転します。スタイル:クリーンな製品コマーシャル、スタジオ照明、ソフトな影、マクロレンズ、非常にシャープなフォーカス、背景の干渉なし。"

私の体験: これはただ…普通でした。特に印象的ではありませんでした。モデルはプロンプトの最も基本的な解釈を提供しました。「高級で美しくデザインされた」ティーポットを求めたのに、返ってきたのはシンプルで伝統的なセラミック製ポットでした。カメラアングルは正しかったのですが、表面は指定したライトグレーではなく白でした。こんな簡単なプロンプトでどうして間違えるのでしょうか?
本当に気になったのはフォーカスです。「非常にシャープなフォーカス」を明確に求めたのに、ティーポットはぼやけていて、背景の一部のように見えました。製品コマーシャルでは、それは意味がありません。さらに悪いことに、ティーポットが回転する際に、ハンドルがフレームから切り取られていました。唯一のオブジェクトをショット内に完全に収めることすらできませんでした。製品デモとしては、大きな失敗です。
気に入った点
気に入らなかった点
正しいカメラアングルと回転の動き
ティーポットのデザインがシンプルで魅力に欠けていた
背景と照明の設定はほぼ正しかった
ビデオがぼやけていてフォーカスが合っていなかった
360度の回転はスムーズだった
回転中に製品がフレームから切り取られた


プrompt #4: アクション&モーションテスト

使用したプロンプト: "バンコクの賑やかな夜市を走り抜ける誰かの手持ちPOVショット。カメラは人々や屋台の間を縫うように揺れ動きます。中華鍋から蒸気が立ち上り、カラフルな提灯が頭上に吊るされています。SFX:市場の喧騒—人々の話し声、料理の音、遠くの音楽。ランナーは時折肩越しに振り返り、息を切らしています。スタイル:グリッティなアクション映画、リアルで没入感があり、ややぼやけた動き。"

私の体験: これは全く予想外で、しかも良い意味ではありませんでした。ビデオは「どけ!」と叫ぶキャラクターとランダムなパンチ音効果で始まり、すぐに私が求めていない攻撃的な逃走シーンになりました。市場は混雑していましたが、何かがおかしかったです。全員が完全にまっすぐな整列した列に立っており、誰も動いていませんでした。賑やかな市場がそんな風に見えたことがありますか?完全に不自然でした。
ランナーは一度も肩越しに振り返ることはなく、これは私が具体的に要求したアクションでした。音声も混乱していました。唯一正しかったのはランナーの息遣いの音だけでした。市場の音は遠くて静かすぎ、近くで没入感のある喧騒であるべきでした。看板はタイ語と中国語が混在しており、特定の「バンコク市場」というよりも、一般的な「アジア市場」のように感じられました。このビデオは完全に「AI生成」と叫んでいるようでした。
気に入った点
気に入らなかった点
ランナーの息遣いの音がリアルだった
不要なダイアログと音声効果が追加された
手持ちカメラの感覚が多少あった
群衆が静止していて完全に非現実的だった
市場の照明と色が鮮やかだった
設定がバンコク特有ではなく一般的だった


すべてを変える機能:ネイティブオーディオ&リップシンク

4つのテストで結果が一貫しなかったにもかかわらず、プロンプト#1の成功は、なぜVeo 3がこれほど注目されているのかを強調しています。リップシンクの品質は本当に際立っています。うまくいくと、歴史家のテストで見られたように、その結果は本物の映像と見間違えるほど説得力があります。このモデルは、単に口の動きを言葉に合わせるだけでなく、抑揚、間、強調を伴った自然な話し方を生成します。また、背景音楽を環境音よりも選ぶなど、シーンに適したオーディオについて創造的な判断を下します。このような文脈的なオーディオインテリジェンスが、AI生成のクリップと実際に通用するクリップとの差を生み出します。


イライラする部分:日次制限、遅いレンダリング、奇妙なグリッチ

ここで正直に言うと、いくつかのフustrationがありました。
日次生成制限は本当に問題でした。Google AI Plusプランでわずか2本のビデオを生成した後、壁にぶつかりました。このメッセージが表示されました。
日次制限に達したメッセージのスクリーンショット

これがプランページの「より多くのアクセス」や「より高いアクセス」という曖昧な言葉が実際に問題になるところです。テストを続けるために再びGoogle AI Proにアップグレードする必要がありました。4つのプロンプトを実行するために2回も有料アップグレードが必要でした。
そしてグリッチもあります。宇宙飛行士のヘルメットの反射に歪んだ顔、空に余分な惑星、バンコク市場のシーンに追加されたダイアログなど。これらは、印象的な出力を完全に使い物にならなくする視覚的および音声的なアーティファクトです。リアルな結果を求めている場合、Veo 3のこのような制限は、有料プランに加入する前に考慮する価値があります。


Google Veo 3は価格に見合うか?私の正直な評価

これらのテストを経て、Google Veo 3が価格に見合うかどうかについての私の結論は以下の通りです。
特にダイアログ中心のコンテンツ、具体的には話す人物のビデオ、ドキュメンタリースタイルのインタビュー、またはキャラクターがカメラに直接話しかけるシーンでは、Veo 3は現在利用可能な最高のツールの1つです。リップシンクの品質と自然なスピーチ生成は本当に印象的で、他に匹敵するものはほとんどありません。それが主な用途である場合、月額$19.99のGoogle AI Proプランは妥当な投資です。
それ以外の用途では、ややギャンブルになります。製品デモテストは期待外れで、アクションシークエンスは混乱しており、映画的なテストには使えないグリッチがありました。低価格帯のプランでは日次制限が煩わしく、レンダリング時間が遅いのも問題です。AIビデオを試してみたい個人クリエイターには価値がありますが、一貫した信頼性のある結果をスケールで必要とするエージェンシーや制作チームにとっては、現時点では制限が利点を上回る可能性があります。
結論:Veo 3は適切な条件下では本当に印象的ですが、デモが示唆するような信頼性の高い万能ビデオジェネレーターではまだありません。それは特定の得意分野を持つ強力なツールであり、その得意分野を事前に知っておくことで、多くのフustrationを避けることができます。


ManusがAIビデオワークフローを強化する方法

クリップを生成することはプロセスの一部に過ぎません。完成したビデオプロジェクトには、アイデアのブレインストーミング、スクリプトやプロンプトの作成、アセットの整理、そしてブログ投稿、ソーシャルキャプション、ビデオ説明など、コンテンツを実際に見てもらうための周辺コンテンツの作成が必要です。ここでManusが役立ちます。
私はこのレビューのプロセス全体でManusを使用しました:テストアプローチの計画、4つのプロンプトの構造化、そしてメモや発見をまとめて、執筆前に一貫性のあるものにするためです。ページに言葉を載せる前に思考を整理するのに役立つツールがあると、特に複数のテスト出力を比較しようとしている場合に大きな違いを生みます。ビデオコンテンツのワークフローを構築している場合、周辺作業のためにAIエージェントを活用する価値があります。Manusはmanus.imで無料で試すことができます。


よくある質問

Google Veo 3にアクセスするにはどうすればいいですか?

Googleの有料AIプランのいずれかに加入することで、Geminiアプリを通じてGoogle Veo 3にアクセスできます。Google AI Plusプラン($7.99/月)は限定的なアクセスを提供し、Google AI Proプラン($19.99/月)はVeo 3.1 Fastを使用したビデオ生成を解放します。最高の制限での完全アクセスはGoogle AI Ultraプラン($249.99/月)で利用可能です。

Google Veo 3の無料版はありますか?

Veo 3専用の無料版はありません。無料のGoogle AIプランでは非常に限定的なアクセスしか提供されず、Geminiアプリを通じた直接的なビデオ生成はサポートされていません。無料ユーザーはGoogle Flowを通じて限定的なアクセスを持つ可能性がありますが、実用的なビデオ生成には有料プランが必要です。

Google Veo 3の制限は何ですか?

主なVeo 3の制限には、日次生成制限(有料プランでも)、クリップあたり約3〜5分の遅いレンダリング時間、最大ビデオ長8秒、時折発生する視覚的なグリッチや不整合、複雑なマルチエレメントシーンでの困難さなどがあります。製品ショットでのオブジェクトの一貫性やアクションシークエンスでのキャラクターの挙動も、欠点となる場合があります。

Google Veo 3は8秒以上のビデオを作成できますか?

いいえ、現在のバージョンのGoogle Veo 3は最大8秒のクリップを生成します。より長いコンテンツを作成するには、複数のクリップを生成し、Google Flowや標準的なビデオエディターで編集する必要があります。

Google Veo 3はOpenAIのSoraより優れていますか?

必要なものによります。Veo 3はダイアログとリップシンクのリアリズムに明確な優位性があり、話す人物やインタビュースタイルのコンテンツには最適です。Sora 2は一般的に、より長いナラティブシーンで優れたパフォーマンスを発揮し、複雑なプロンプトにおけるキャラクターの挙動がより一貫しています。ほとんどのクリエイターにとって、選択は主な使用目的に依存します。
    Google Veo 3をテストしてみた正直なレビュー