Manus 現已成為 Meta 的一部分——將 AI 帶給全球企業

其他·星期五, 3月 06

我測試了 Google Veo 3,這是我的誠實評測

作為 Manus 的內容撰寫人,測試新的 AI 工具基本上是工作描述的一部分。當 Google Veo 3 發布時,互聯網因其演示而集體瘋狂。逼真的說話頭像、同步音頻、電影級視覺效果,全部由一個文本提示生成。我已經見過足夠多的 AI 熱潮週期,知道演示是經過精心策劃的,而現實世界的結果則完全是另一回事。
所以我決定花些時間實際使用 Google Veo 3,通過四個不同的提示來測試其極限,並誠實地記錄下所有內容。
這不是 Google 的行銷材料摘要。這是一篇基於我真實體驗的 Google Veo 3 評測,包括讓我印象深刻的部分、讓我沮喪的部分以及完全無法工作的部分。讀完這篇文章後,你將確切知道 Veo 3 擅長什麼、它的不足之處、是否值得購買,以及它與競爭對手的比較。


什麼是 Google Veo 3?(以及 Veo 3.1 有哪些新功能?)

Google Veo 3 是一個先進的 AI 視頻生成模型,可以通過一個文本提示創建高品質的視頻片段。它支持同步對話、環境音效和背景音樂,全部由一個提示生成,並迅速建立了生產一些最逼真的 AI 生成說話頭像視頻的聲譽。
Veo 3 於 2025 年中旬在 Google I/O 上首次宣布,並迅速成為當年最受關注的 AI 視頻生成器之一。最近的更新 Veo 3.1 帶來了顯著的改進:更好的穩定性、更準確的唇同步、更一致的角色生成,以及支持 1080p 和 4K 的升級。它可以通過一些 Google 產品訪問——Google Flow,一個專業級電影製作工具,專為編輯和排列更長、更複雜的場景而設計;以及 Google Whisk,一個專注於快速圖像到視頻生成和短片的實驗工具。在這次評測中,我通過 Google Gemini 應用進行了測試,在那裡我只需選擇“創建視頻”工具選項並運行所有四個提示。


我的實際測試過程

為了進行適當的測試,我不想只是簡單地輸入提示然後草草了事。我請 Manus 幫助我設計了四個具體的提示來評估不同的能力:對話和唇同步、電影氛圍、產品一致性以及快節奏動作。以下是實際過程。

我如何獲得訪問權限(以及你如何獲得)

獲得 Veo 3 的訪問權限一開始確實有點令人困惑,我認為值得詳細說明,因為這是一個常見的痛點。
Gemini 免費帳戶介面截圖

我從免費帳戶開始。介面非常普通,與其他 AI 工具類似,有一個提示框和一些工具選項可供選擇。沒有任何視頻生成選項可見。我還是嘗試輸入了我的第一個提示,看看會發生什麼。
Gemini 返回了一個圖像而不是視頻截圖

我得到的是一個圖像,而不是視頻。圖像實際上很令人印象深刻,與提示非常匹配,但顯然不是我要求的內容。我隨後嘗試明確要求 Gemini 為我創建一個視頻,認為它可能只是誤解了我的意圖。我得到的回應是:“如果您升級訂閱,我今天可以為您創建該視頻。”
升級提示截圖

於是我去查看了付費計劃。
以下是每個計劃提供的視頻生成功能的當前細分:
計劃
每月價格
AI 積分
Veo 3.1 訪問權限
免費
$0
每日 50 積分
限制訪問 Flow、Animate 和生成圖像
Google AI Plus
$7.99/月
每月 200 積分
更多訪問 Flow 和 Whisk 上的圖像到視頻生成
Google AI Pro
$19.99/月
每月 1,000 積分
更高訪問 Flow 和 Whisk
Google AI Ultra
$249.99/月
每月 25,000 積分
最高訪問 Flow 和 Whisk
計劃中的措辭很模糊。Google AI Plus 說“更多訪問 Veo 3 的圖像到視頻創建”,而 Google AI Pro 說“更高訪問”。並不完全清楚你實際會得到什麼。我首先選擇了 Google AI Plus,因為它是下一個等級,看起來可以滿足需求。付費、訂閱,開始吧!在 Plus 計劃中,我可以看到“創建視頻”選項的增加,這在免費計劃中是不可用的。
Gemini Plus 計劃中“創建視頻”選項現在可見



我用來測試 Veo 3 極限的 4 個提示

以下是我設計的四個提示,用來測試 Veo 3 的不同能力:
1.對話和唇同步測試 — 評估核心原生音頻功能與同步對話。
2.電影和氛圍測試 — 評估其處理複雜視覺風格和鏡頭方向的能力。
3.產品和物體一致性測試 — 檢查它是否能生成乾淨、專業的產品視頻。
4.動作和運動測試 — 查看它如何處理快速移動、動態鏡頭和分層音頻。


結果:4 個 Veo 3 視頻示例(好的、不好的和有問題的)

提示 #1:對話和唇同步測試

使用的提示:“中景特寫鏡頭,一位 40 多歲的女性歷史學家,戴著眼鏡,坐在一個暖光照亮的圖書館裡。她直視鏡頭,用深思熟慮且引人入勝的語氣說話。她說:‘大多數人沒有意識到羅馬帝國的崩潰並不是一個單一事件,而是一個緩慢、複雜的世紀解體過程。’環境噪音:翻書的輕微沙沙聲和圖書館空調的柔和嗡嗡聲。風格:紀錄片採訪,使用高品質數字相機拍攝。”

我的體驗: 好吧,這個真的讓我震驚了。過程非常順利,視頻在幾分鐘內就準備好了。真實情況:在生成過程中,我切換到其他標籤頁做其他事情。當我回來看到輸出時,我真的以為螢幕上彈出了一個隨機廣告。它看起來如此逼真。歷史學家、燈光、語氣……一切都非常到位。她的講話自然流暢,帶有自然的語調、停頓和強調。她的面部表情和手勢?非常準確。真的達到了紀錄片採訪的水平。
唯一讓我覺得有點不對勁的是陽光中的浮塵顆粒,它們有點分散注意力。雖然我要求環境圖書館聲音,模型卻給了我一個微妙的背景音樂軌道。但說實話?這是一個聰明的執行決定。音樂非常符合紀錄片風格,甚至可能比我要求的更好。一個好的開始!
我喜歡的
我不喜歡的
極其逼真且自然的角色
陽光中的浮塵顆粒有點分散注意力
完美的唇同步和自然的語音語調
忽略了具體的環境聲音請求(但做出了不錯的選擇)
完美捕捉了紀錄片採訪風格



提示 #2:電影和氛圍測試

使用的提示:“鏡頭緩慢向後移動,揭示一個孤獨的宇航員站在火星上的隕石坑邊緣。天空是塵土飛揚的紅橙色,有兩顆小月亮可見。荒涼而寂靜。風格:史詩科幻,4K,廣角鏡頭,極其詳細,令人敬畏且憂鬱的氛圍。”

我的體驗: 這個……表現參差不齊。首先吸引我注意的是宇航員頭盔中的反射。我要求一個地球的微弱反射,但我得到的是一個奇怪的、扭曲的男人臉的碎片。它看起來完全不對勁,就像一個奇怪的故障,透明度和維度的層次都錯了。這應該是宇航員自己的臉嗎?誰知道呢!它看起來就像被貼上去的一樣。
其他部分還不錯。宇航服、隕石坑、鏡頭移動都很紮實。塵土和沙霧的細節實際上非常逼真。但提示要求兩顆小月亮,而天空顯示的是三個不同大小的行星。頭盔中的故障臉是個遺憾,因為沒有它,這會很令人印象深刻。使用 AI 視頻生成,有時會成功,有時會失敗。模型添加了太陽、星星和移動的霧氣,這些都很有效。額外的臉和行星?不太行。
我喜歡的
我不喜歡的
鏡頭移動執行得很好
頭盔反射中的扭曲臉是個重大故障
塵土和沙霧細節逼真
沒有遵循“兩顆月亮”的指示
很好地捕捉了荒涼、史詩科幻的氛圍
宇航員的宇航服缺乏一些精細細節


提示 #3:產品和物體一致性測試

使用的提示:“高端、設計精美的陶瓷茶壺的旋轉鏡頭。茶壺是極簡主義的啞光白色,放在一個簡單的淺灰色表面上。鏡頭緩慢地圍繞茶壺旋轉 360 度。風格:乾淨的產品廣告,工作室燈光,柔和的陰影,微距鏡頭,極其清晰的焦點,沒有背景干擾。”

我的體驗: 這個只是……還可以。沒有特別令人印象深刻。模型給了我提示的最基本、最字面化的解釋。我要求一個“高端、設計精美”的茶壺,它給了我一個普通的、傳統外觀的陶瓷壺。鏡頭角度是對的,但表面是白色而不是我指定的淺灰色。如此簡單的提示怎麼會出錯?
真正讓我困擾的是焦點。我明確要求“極其清晰的焦點”,但茶壺是模糊的,邊緣不乾淨,彷彿是背景的一部分。對於產品廣告來說,這毫無意義。更糟糕的是,當茶壺旋轉時,手柄被完全切出了畫面。模型甚至無法讓唯一的物體在鏡頭中完全可見。對於產品演示來說,這是一個巨大的失敗。
我喜歡的
我不喜歡的
正確的鏡頭角度和旋轉運動
茶壺設計普通且缺乏靈感
背景和燈光設置大致正確
視頻模糊且焦點不清晰
360 度旋轉平穩
產品在旋轉過程中被切出畫面


提示 #4:動作和運動測試

使用的提示:“手持 POV 鏡頭,某人穿過曼谷擁擠、充滿活力的夜市奔跑。鏡頭隨著他們在人群和食品攤之間穿梭而搖晃。蒸汽從炒鍋中升起,彩色燈籠懸掛在頭頂。音效:市場聲音的喧囂——人們交談、食物煎炸、遠處的音樂。跑步者偶爾回頭看,喘著粗氣。風格:粗糙的動作電影,真實、沉浸式、略微模糊的運動。”

我的體驗: 這完全不是我預期的,而且完全不是好的方面。視頻開頭有一個角色喊著“讓開!”和一個隨機的拳擊音效,這立即將其變成了一個我從未要求的激烈逃跑場景。市場很擁擠,但有些地方非常不對勁。每個人都站得非常直,整齊地排成隊,沒有人移動。你見過這樣的繁忙市場嗎?完全不自然。
跑步者從未回頭看,這是我明確要求的一個動作。音頻也很混亂。唯一正確的聲音是跑步者的喘氣聲。其他市場聲音太遠且太安靜,而它們應該是近距離且沉浸式的喧囂。標誌是泰語和中文的混合,使其感覺像一個通用的“亞洲市場”,而不是具體的曼谷。這一段完全顯得“AI 生成”。
我喜歡的
我不喜歡的
跑步者的喘氣聲音很真實
添加了不需要的對話和音效
手持鏡頭感稍微存在
人群靜止且完全不真實
市場的燈光和顏色很鮮豔
場景感覺通用,而不是具體的曼谷


改變一切的功能:原生音頻和唇同步

儘管我的四次測試結果不一致,但提示 #1 的成功確實突出了 Veo 3 為什麼會受到如此多關注。唇同步品質是它真正的亮點。當它工作時,就像我的歷史學家測試一樣,結果令人信服到可以被誤認為是真實的鏡頭。模型不僅將嘴部動作與單詞匹配,還生成了帶有語調、停頓和強調的自然語音模式。它還對音頻做出了創造性的決策,比如在場景需要時選擇背景音樂而不是環境噪音。這種上下文音頻智能是區分看起來像 AI 生成的剪輯與真正能夠經得起考驗的剪輯的關鍵。


令人煩惱的部分:每日限制、緩慢渲染和奇怪的故障

以下是我必須誠實面對的挫折,因為確實有幾個。
每日生成限制是一個真正的問題。在 Google AI Plus 計劃中生成了兩個視頻後,我就遇到了瓶頸。出現了這條消息。
每日限制消息截圖

這就是計劃頁面上模糊的“更多訪問”和“更高訪問”語言成為真正問題的地方。我不得不再次升級到 Google AI Pro 才能繼續我的測試。這是兩次付費升級,僅僅為了運行四個提示。
然後是故障。宇航員頭盔反射中的扭曲臉、天空中的額外行星、曼谷市場場景中添加的對話。這些是視覺和音頻偽影,可以使原本令人印象深刻的輸出完全無法使用,如果你追求的是逼真效果的話。像這樣的 Veo 3 限制在訂閱付費計劃之前值得注意。


Google Veo 3 值得購買嗎?我的誠實結論

經過這些輪測試後,我對 Google Veo 3 是否值得購買的看法如下。
對於以對話為主的內容,特別是說話頭像視頻、紀錄片風格的採訪或任何角色直接對鏡頭說話的場景,Veo 3 是目前最好的工具之一。唇同步品質和自然語音生成確實令人印象深刻且難以匹敵。如果這是你的主要使用場景,Google AI Pro 計劃每月 $19.99 是一個合理的投資。
對於其他所有內容,這更像是一場賭博。產品演示測試令人失望,動作場景一團糟,電影測試有一個故障使輸出無法使用。每日限制令人沮喪,特別是在低級計劃中,渲染時間也拖慢了進度。如果你是一個獨立創作者在嘗試 AI 視頻,這值得一試。如果你是一個需要一致、可靠結果的代理機構或製作團隊,這些限制可能會超過目前的好處。
底線:Veo 3 在合適的條件下確實令人印象深刻,但它還不是演示所暗示的可靠、全能的視頻生成器。它是一個強大的工具,有一個特定的優勢點,在訂閱之前了解這個優勢點可以為你節省很多挫折。


Manus 如何助力你的 AI 視頻工作流程

生成剪輯只是過程的一部分。一個完整的視頻項目需要頭腦風暴想法、編寫腳本和提示、組織資產,以及創建周邊內容——博客文章、社交標題和視頻描述,這些內容實際上讓你的內容被看到。這就是 Manus 的作用。
在整個評測過程中,我使用了 Manus:來規劃我的測試方法、結構化四個提示,並將我的筆記和發現整合成一個連貫的內容再進行撰寫。在你處理多個測試輸出並嘗試公平比較時,有一個幫助你在寫作之前組織思路的工具確實會有所不同。如果你正在構建一個視頻內容工作流程,值得擁有一個 AI Agent 來處理周邊工作。你可以在 manus.im 免費試用 Manus。


常見問題

我如何獲得 Google Veo 3 的訪問權限?

你可以通過訂閱 Google 的付費 AI 計劃,通過 Gemini 應用訪問 Google Veo 3。Google AI Plus 計劃($7.99/月)提供有限訪問權限,而 Google AI Pro 計劃($19.99/月)解鎖 Veo 3.1 快速視頻生成功能。最高限制的完整訪問權限可通過 Google AI Ultra 計劃($249.99/月)獲得。

Google Veo 3 有免費版本嗎?

Veo 3 沒有專門的免費版本。免費的 Google AI 計劃訪問非常有限,並且不支持通過 Gemini 應用直接視頻生成。免費用戶可能通過 Google Flow 有有限訪問權限,但對於實際的視頻生成,你需要一個付費計劃。

Google Veo 3 的限制是什麼?

Veo 3 的主要限制包括每日生成限制(即使在付費計劃中)、渲染時間緩慢(每個剪輯約 3-5 分鐘)、最大視頻長度為 8 秒、偶爾的視覺故障和不一致,以及處理複雜多元素場景的困難。產品鏡頭中的物體一致性和動作場景中的角色行為也是它可能不足的領域。

Google Veo 3 能生成超過 8 秒的視頻嗎?

不能,目前版本的 Google Veo 3 生成的剪輯最長為 8 秒。對於更長的內容,你需要生成多個剪輯並在 Google Flow 或標準視頻編輯器中將它們編輯在一起。

Google Veo 3 比 OpenAI 的 Sora 更好嗎?

這取決於你的需求。Veo 3 在對話和唇同步逼真度方面有明顯優勢,使其成為說話頭像或採訪風格內容的更好選擇。Sora 2 通常在更長的敘事場景中表現更好,並且在複雜提示中的角色行為更一致。對於大多數創作者來說,選擇取決於你的主要使用場景。