Manus 现已成为 Meta 的一部分——将 AI 带给全球的企业

其他·星期五, 3月 06

我测试了 Google Veo 3,这是我的诚实评测

作为 Manus 的内容撰写人,测试新的 AI 工具基本上是工作描述的一部分。当 Google Veo 3 发布时,互联网因其演示而集体疯狂。逼真的说话头像、同步音频、电影级视觉效果,全部由一个文本提示生成。我已经见过足够多的 AI 热潮周期,知道演示是经过精心策划的,而现实世界的结果则完全是另一回事。
所以我决定花些时间实际使用 Google Veo 3,通过四个不同的提示来测试其极限,并诚实地记录下所有内容。
这不是 Google 的营销材料摘要。这是一篇基于我真实体验的 Google Veo 3 评测,包括让我印象深刻的部分、让我沮丧的部分以及完全无法工作的部分。读完这篇文章后,你将确切知道 Veo 3 擅长什么、它的不足之处、是否值得购买,以及它与竞争对手的比较。


什么是 Google Veo 3?(以及 Veo 3.1 有哪些新功能?)

Google Veo 3 是一个先进的 AI 视频生成模型,可以通过一个文本提示创建高质量的视频片段。它支持同步对话、环境音效和背景音乐,全部由一个提示生成,并迅速建立了生产一些最逼真的 AI 生成说话头像视频的声誉。
Veo 3 于 2025 年中旬在 Google I/O 上首次宣布,并迅速成为当年最受关注的 AI 视频生成器之一。最近的更新 Veo 3.1 带来了显著的改进:更好的稳定性、更准确的唇同步、更一致的角色生成,以及支持 1080p 和 4K 的升级。它可以通过一些 Google 产品访问——Google Flow,一个专业级电影制作工具,专为编辑和排列更长、更复杂的场景而设计;以及 Google Whisk,一个专注于快速图像到视频生成和短片的实验工具。在这次评测中,我通过 Gemini 应用进行了测试,在那里我只需选择“创建视频”工具选项并运行所有四个提示。


我的实际测试过程

为了进行适当的测试,我不想只是简单地输入提示然后草草了事。我请 Manus 帮助我设计了四个具体的提示来评估不同的能力:对话和唇同步、电影氛围、产品一致性以及快节奏动作。以下是实际过程。

我如何获得访问权限(以及你如何获得)

获得 Veo 3 的访问权限一开始确实有点令人困惑,我认为值得详细说明,因为这是一个常见的痛点。
Gemini 免费账户界面截图

我从免费账户开始。界面非常普通,与其他 AI 工具类似,有一个提示框和一些工具选项可供选择。没有任何视频生成选项可见。我还是尝试输入了我的第一个提示,看看会发生什么。
Gemini 返回了一个图像而不是视频截图

我得到的是一个图像,而不是视频。图像实际上很令人印象深刻,与提示非常匹配,但显然不是我要求的内容。我随后尝试明确要求 Gemini 为我创建一个视频,认为它可能只是误解了我的意图。我得到的回应是:“如果您升级订阅,我今天可以为您创建该视频。”
升级提示截图

于是我去查看了付费计划。
以下是每个计划提供的视频生成功能的当前细分:
计划
每月价格
AI 积分
Veo 3.1 访问权限
免费
$0
每日 50 积分
限制访问 Flow、Animate 和生成图像
Google AI Plus
$7.99/月
每月 200 积分
更多访问 Flow 和 Whisk 上的图像到视频生成
Google AI Pro
$19.99/月
每月 1,000 积分
更高访问 Flow 和 Whisk
Google AI Ultra
$249.99/月
每月 25,000 积分
最高访问 Flow 和 Whisk
计划中的措辞很模糊。Google AI Plus 说“更多访问 Veo 3 的图像到视频创建”,而 Google AI Pro 说“更高访问”。并不完全清楚你实际会得到什么。我首先选择了 Google AI Plus,因为它是下一个等级,看起来可以满足需求。付费、订阅,开始吧!在 Plus 计划中,我可以看到“创建视频”选项的增加,这在免费计划中是不可用的。
Gemini Plus 计划中“创建视频”选项现在可见



我用来测试 Veo 3 极限的 4 个提示

以下是我设计的四个提示,用来测试 Veo 3 的不同能力:
1.对话和唇同步测试 — 评估核心原生音频功能与同步对话。
2.电影和氛围测试 — 评估其处理复杂视觉风格和镜头方向的能力。
3.产品和物体一致性测试 — 检查它是否能生成干净、专业的产品视频。
4.动作和运动测试 — 查看它如何处理快速移动、动态镜头和分层音频。


结果:4 个 Veo 3 视频示例(好的、不好的和有问题的)

提示 #1:对话和唇同步测试

使用的提示:“中景特写镜头,一位 40 多岁的女性历史学家,戴着眼镜,坐在一个暖光照亮的图书馆里。她直视镜头,用深思熟虑且引人入胜的语气说话。她说:‘大多数人没有意识到罗马帝国的崩溃并不是一个单一事件,而是一个缓慢、复杂的世纪解体过程。’环境噪音:翻书的轻微沙沙声和图书馆空调的柔和嗡嗡声。风格:纪录片采访,使用高质量数字相机拍摄。”

我的体验: 好吧,这个真的让我震惊了。过程非常顺利,视频在几分钟内就准备好了。真实情况:在生成过程中,我切换到其他标签页做其他事情。当我回来看到输出时,我真的以为屏幕上弹出了一个随机广告。它看起来如此逼真。历史学家、灯光、语气……一切都非常到位。她的讲话自然流畅,带有自然的语调、停顿和强调。她的面部表情和手势?非常准确。真的达到了纪录片采访的水平。
唯一让我觉得有点不对劲的是阳光中的浮尘颗粒,它们有点分散注意力。虽然我要求环境图书馆声音,模型却给了我一个微妙的背景音乐轨道。但说实话?这是一个聪明的执行决定。音乐非常符合纪录片风格,甚至可能比我要求的更好。一个好的开始!
我喜欢的
我不喜欢的
极其逼真且自然的角色
阳光中的浮尘颗粒有点分散注意力
完美的唇同步和自然的语音语调
忽略了具体的环境声音请求(但做出了不错的选择)
完美捕捉了纪录片采访风格



提示 #2:电影和氛围测试

使用的提示:“镜头缓慢向后移动,揭示一个孤独的宇航员站在火星上的陨石坑边缘。天空是尘土飞扬的红橙色,有两颗小月亮可见。荒凉而寂静。风格:史诗科幻,4K,广角镜头,极其详细,令人敬畏且忧郁的氛围。”

我的体验: 这个……表现参差不齐。首先吸引我注意的是宇航员头盔中的反射。我要求一个地球的微弱反射,但我得到的是一个奇怪的、扭曲的男人脸的碎片。它看起来完全不对劲,就像一个奇怪的故障,透明度和维度的层次都错了。这应该是宇航员自己的脸吗?谁知道呢!它看起来就像被贴上去的一样。
其他部分还不错。宇航服、陨石坑、镜头移动都很扎实。尘土和沙雾的细节实际上非常逼真。但提示要求两颗小月亮,而天空显示的是三个不同大小的行星。头盔中的故障脸是个遗憾,因为没有它,这会很令人印象深刻。使用 AI 视频生成,有时会成功,有时会失败。模型添加了太阳、星星和移动的雾气,这些都很有效。额外的脸和行星?不太行。
我喜欢的
我不喜欢的
镜头移动执行得很好
头盔反射中的扭曲脸是个重大故障
尘土和沙雾细节逼真
没有遵循“两颗月亮”的指示
很好地捕捉了荒凉、史诗科幻的氛围
宇航员的宇航服缺乏一些精细细节


提示 #3:产品和物体一致性测试

使用的提示:“高端、设计精美的陶瓷茶壶的旋转镜头。茶壶是极简主义的哑光白色,放在一个简单的浅灰色表面上。镜头缓慢地围绕茶壶旋转 360 度。风格:干净的产品广告,工作室灯光,柔和的阴影,微距镜头,极其清晰的焦点,没有背景干扰。”

我的体验: 这个只是……还可以。没有特别令人印象深刻。模型给了我提示的最基本、最字面化的解释。我要求一个“高端、设计精美”的茶壶,它给了我一个普通的、传统外观的陶瓷壶。镜头角度是对的,但表面是白色而不是我指定的浅灰色。如此简单的提示怎么会出错?
真正让我困扰的是焦点。我明确要求“极其清晰的焦点”,但茶壶是模糊的,边缘不干净,仿佛是背景的一部分。对于产品广告来说,这毫无意义。更糟糕的是,当茶壶旋转时,手柄被完全切出了画面。模型甚至无法让唯一的物体在镜头中完全可见。对于产品演示来说,这是一个巨大的失败。
我喜欢的
我不喜欢的
正确的镜头角度和旋转运动
茶壶设计普通且缺乏灵感
背景和灯光设置大致正确
视频模糊且焦点不清晰
360 度旋转平稳
产品在旋转过程中被切出画面


提示 #4:动作和运动测试

使用的提示:“手持 POV 镜头,某人穿过曼谷拥挤、充满活力的夜市奔跑。镜头随着他们在人群和食品摊之间穿梭而摇晃。蒸汽从炒锅中升起,彩色灯笼悬挂在头顶。音效:市场声音的喧嚣——人们交谈、食物煎炸、远处的音乐。跑步者偶尔回头看,喘着粗气。风格:粗糙的动作电影,真实、沉浸式、略微模糊的运动。”

我的体验: 这完全不是我预期的,而且完全不是好的方面。视频开头有一个角色喊着“让开!”和一个随机的拳击音效,这立即将其变成了一个我从未要求的激烈逃跑场景。市场很拥挤,但有些地方非常不对劲。每个人都站得非常直,整齐地排成队,没有人移动。你见过这样的繁忙市场吗?完全不自然。
跑步者从未回头看,这是我明确要求的一个动作。音频也很混乱。唯一正确的声音是跑步者的喘气声。其他市场声音太远且太安静,而它们应该是近距离且沉浸式的喧嚣。标志是泰语和中文的混合,使其感觉像一个通用的“亚洲市场”,而不是具体的曼谷。这一段完全显得“AI 生成”。
我喜欢的
我不喜欢的
跑步者的喘气声音很真实
添加了不需要的对话和音效
手持镜头感稍微存在
人群静止且完全不真实
市场的灯光和颜色很鲜艳
场景感觉通用,而不是具体的曼谷


改变一切的功能:原生音频和唇同步

尽管我的四次测试结果不一致,但提示 #1 的成功确实突出了 Veo 3 为什么会受到如此多关注。唇同步质量是它真正的亮点。当它工作时,就像我的历史学家测试一样,结果令人信服到可以被误认为是真实的镜头。模型不仅将嘴部动作与单词匹配,还生成了带有语调、停顿和强调的自然语音模式。它还对音频做出了创造性的决策,比如在场景需要时选择背景音乐而不是环境噪音。这种上下文音频智能是区分看起来像 AI 生成的剪辑与真正能够经得起考验的剪辑的关键。


令人烦恼的部分:每日限制、缓慢渲染和奇怪的故障

以下是我必须诚实面对的挫折,因为确实有几个。
每日生成限制是一个真正的问题。在 Google AI Plus 计划中生成了两个视频后,我就遇到了瓶颈。出现了这条消息。
每日限制消息截图

这就是计划页面上模糊的“更多访问”和“更高访问”语言成为真正问题的地方。我不得不再次升级到 Google AI Pro 才能继续我的测试。这是两次付费升级,仅仅为了运行四个提示。
然后是故障。宇航员头盔反射中的扭曲脸、天空中的额外行星、曼谷市场场景中添加的对话。这些是视觉和音频伪影,可以使原本令人印象深刻的输出完全无法使用,如果你追求的是逼真效果的话。像这样的 Veo 3 限制在订阅付费计划之前值得注意。


Google Veo 3 值得购买吗?我的诚实结论

经过这些轮测试后,我对 Google Veo 3 是否值得购买的看法如下。
对于以对话为主的内容,特别是说话头像视频、纪录片风格的采访或任何角色直接对镜头说话的场景,Veo 3 是目前最好的工具之一。唇同步质量和自然语音生成确实令人印象深刻且难以匹敌。如果这是你的主要使用场景,Google AI Pro 计划每月 $19.99 是一个合理的投资。
对于其他所有内容,这更像是一场赌博。产品演示测试令人失望,动作场景一团糟,电影测试有一个故障使输出无法使用。每日限制令人沮丧,特别是在低级计划中,渲染时间也拖慢了进度。如果你是一个独立创作者在尝试 AI 视频,这值得一试。如果你是一个需要一致、可靠结果的代理机构或制作团队,这些限制可能会超过目前的好处。
底线:Veo 3 在合适的条件下确实令人印象深刻,但它还不是演示所暗示的可靠、全能的视频生成器。它是一个强大的工具,有一个特定的优势点,在订阅之前了解这个优势点可以为你节省很多挫折。


Manus 如何助力你的 AI 视频工作流程

生成剪辑只是过程的一部分。一个完整的视频项目需要头脑风暴想法、编写脚本和提示、组织资产,以及创建周边内容——博客文章、社交标题和视频描述,这些内容实际上让你的内容被看到。这就是 Manus 的作用。
在整个评测过程中,我使用了 Manus:来规划我的测试方法、结构化四个提示,并将我的笔记和发现整合成一个连贯的内容再进行撰写。在你处理多个测试输出并尝试公平比较时,有一个帮助你在写作之前组织思路的工具确实会有所不同。如果你正在构建一个视频内容工作流程,值得拥有一个 AI Agent 来处理周边工作。你可以在 manus.im 免费试用 Manus。


常见问题

我如何获得 Google Veo 3 的访问权限?

你可以通过订阅 Google 的付费 AI 计划,通过 Gemini 应用访问 Google Veo 3。Google AI Plus 计划($7.99/月)提供有限访问权限,而 Google AI Pro 计划($19.99/月)解锁 Veo 3.1 快速视频生成功能。最高限制的完整访问权限可通过 Google AI Ultra 计划($249.99/月)获得。

Google Veo 3 有免费版本吗?

Veo 3 没有专门的免费版本。免费的 Google AI 计划访问非常有限,并且不支持通过 Gemini 应用直接视频生成。免费用户可能通过 Google Flow 有有限访问权限,但对于实际的视频生成,你需要一个付费计划。

Google Veo 3 的限制是什么?

Veo 3 的主要限制包括每日生成限制(即使在付费计划中)、渲染时间缓慢(每个剪辑约 3-5 分钟)、最大视频长度为 8 秒、偶尔的视觉故障和不一致,以及处理复杂多元素场景的困难。产品镜头中的物体一致性和动作场景中的角色行为也是它可能不足的领域。

Google Veo 3 能生成超过 8 秒的视频吗?

不能,目前版本的 Google Veo 3 生成的剪辑最长为 8 秒。对于更长的内容,你需要生成多个剪辑并在 Google Flow 或标准视频编辑器中将它们编辑在一起。

Google Veo 3 比 OpenAI 的 Sora 更好吗?

这取决于你的需求。Veo 3 在对话和唇同步逼真度方面有明显优势,使其成为说话头像或采访风格内容的更好选择。Sora 2 通常在更长的叙事场景中表现更好,并且在复杂提示中的角色行为更一致。对于大多数创作者来说,选择取决于你的主要使用场景。