Manus agora faz parte de Meta — levando IA para empresas em todo o mundo

Outro·sexta-feira, março 06

Testei o Google Veo 3 e Aqui Está Meu Review Honesto

Como redator de conteúdo na Manus, testar novas ferramentas de AI é basicamente parte da descrição do trabalho. Quando o Google Veo 3 foi lançado, a internet coletivamente enlouqueceu com as demonstrações. Cabeças falantes realistas, áudio sincronizado, visuais cinematográficos, tudo a partir de um único prompt de texto. Já vi ciclos de hype de AI suficientes para saber que as demonstrações são curadas e os resultados no mundo real são uma história completamente diferente.
Então decidi passar algum tempo realmente usando o Google Veo 3, testando-o com quatro prompts distintos projetados para explorar seus limites e documentando tudo de forma honesta.
Este não é um resumo dos materiais de marketing do Google. Este é um review prático do Google Veo 3 baseado na minha experiência real, incluindo as partes que me impressionaram, as partes que me frustraram e as partes que simplesmente não funcionaram. Até o final deste artigo, você saberá exatamente no que o Veo 3 é bom, onde ele falha, se vale o preço e como ele se compara à concorrência.


O que é o Google Veo 3? (E o que há de novo no Veo 3.1?)

O Google Veo 3 é um modelo avançado de geração de vídeo por AI que cria clipes de vídeo de alta qualidade a partir de um único prompt de texto. Ele suporta diálogo sincronizado, efeitos sonoros ambientais e música de fundo, tudo a partir de um único prompt, e rapidamente construiu uma reputação por produzir algumas das filmagens de cabeças falantes geradas por AI mais realistas disponíveis.
O Veo 3 foi anunciado pela primeira vez no Google I/O por volta de meados de 2025 e rapidamente se tornou um dos geradores de vídeo por AI mais comentados do ano. A atualização mais recente, Veo 3.1, trouxe melhorias significativas: melhor estabilidade, sincronização labial mais precisa, geração de personagens mais consistente e upscaling para 1080p e 4K. Ele está acessível por meio de alguns produtos do Google — Google Flow, uma ferramenta de nível profissional para edição e sequenciamento de cenas mais longas e complexas, e Google Whisk, uma ferramenta experimental focada em geração rápida de imagem para vídeo e clipes curtos. Para este review, testei através do aplicativo Gemini, onde simplesmente selecionei a opção "Criar vídeo" e executei todos os quatro prompts a partir daí.


Meu Processo de Teste Prático

Para fazer um teste adequado, eu não queria apenas jogar prompts simples e encerrar o dia. Pedi à Manus que me ajudasse a criar quatro prompts específicos para avaliar diferentes capacidades: diálogo e sincronização labial, atmosfera cinematográfica, consistência de produto e ação acelerada. Aqui está como esse processo realmente aconteceu.

Como Consegui Acesso (e Como Você Pode Conseguir Também)

Conseguir acesso ao Veo 3 é honestamente um pouco confuso no início, e acho que vale a pena explicar porque é um ponto comum de frustração.
Captura de tela da interface da conta gratuita do Gemini

Comecei na conta gratuita. A interface é bem genérica, semelhante a outras ferramentas de AI, com uma caixa de prompt e algumas opções de ferramentas para escolher. Não havia nenhuma opção de geração de vídeo visível em lugar algum. Tentei inserir meu primeiro prompt mesmo assim, só para ver o que aconteceria.
Captura de tela do Gemini retornando uma imagem em vez de vídeo

O que recebi de volta foi uma imagem, não um vídeo. A imagem era realmente impressionante e correspondia bem ao prompt, mas claramente não era o que eu havia pedido. Então tentei pedir explicitamente ao Gemini para criar um vídeo para mim, pensando que talvez ele tivesse apenas interpretado mal minha intenção. A resposta que recebi foi: "Posso criar esse vídeo para você hoje se você atualizar sua assinatura."
Captura de tela do prompt de atualização

Então fui verificar os planos pagos.
Aqui está o resumo atual do que cada plano oferece para geração de vídeo:
Plano
Preço Mensal
Créditos de AI
Acesso ao Veo 3.1
Gratuito
$0
50 créditos diários
Acesso limitado ao Flow, Animate e geração de imagens
Google AI Plus
$7.99/mês
200 créditos mensais
Mais acesso ao Flow e geração de imagem para vídeo no Whisk
Google AI Pro
$19.99/mês
1.000 créditos mensais
Maior acesso ao Flow e Whisk
Google AI Ultra
$249.99/mês
25.000 créditos mensais
Maior acesso ao Flow e Whisk
A redação nos planos é vaga. O Google AI Plus diz "mais acesso à criação de imagem para vídeo com Veo 3" e o Google AI Pro diz "maior acesso." Não é exatamente claro o que você realmente está recebendo. Escolhi o Google AI Plus primeiro, já que era o próximo nível e parecia que resolveria o problema. Paguei, assinei e lá vamos nós! No plano Plus, pude ver a adição da opção "Criar Vídeo" que anteriormente não estava disponível no plano gratuito.
Plano Gemini Plus com a opção "Criar Vídeo" agora visível



Os 4 Prompts que Usei para Testar os Limites do Veo 3

Aqui estão os quatro prompts que elaborei para testar diferentes aspectos das capacidades do Veo 3:
1.O Teste de Diálogo e Sincronização Labial — Para avaliar o recurso nativo de áudio com diálogo sincronizado.
2.O Teste Cinematográfico e Atmosférico — Para avaliar como ele lida com estilos visuais complexos e direção de câmera.
3.O Teste de Consistência de Produto e Objeto — Para verificar se ele pode produzir vídeos de produtos limpos e profissionais.
4.O Teste de Ação e Movimento — Para ver como ele lida com movimentos rápidos, trabalho de câmera dinâmico e áudio em camadas.


Os Resultados: 4 Exemplos de Vídeo do Veo 3 (O Bom, O Ruim e O Problemático)

Prompt #1: O Teste de Diálogo e Sincronização Labial

Prompt Usado: "Plano médio de uma historiadora na casa dos 40 anos, com óculos, sentada em uma biblioteca iluminada de forma acolhedora. Ela olha diretamente para a câmera, falando com um tom reflexivo e envolvente. Ela diz: 'O que a maioria das pessoas não percebe sobre o Império Romano é que seu colapso não foi um único evento, mas um desmoronamento lento e complexo ao longo de séculos.' Ruído ambiente: o som suave de páginas sendo viradas e o leve zumbido do ar condicionado da biblioteca. Estilo: Entrevista documental, filmada com uma câmera digital de alta qualidade."

Minha Experiência: Ok, fiquei genuinamente impressionado com este. O processo foi tranquilo, e o vídeo ficou pronto em minutos. História real: enquanto estava gerando, mudei de aba para fazer outras coisas. Quando voltei e vi o resultado, realmente pensei que um anúncio aleatório tinha aparecido na minha tela. Parecia tão realista. A historiadora, a iluminação, o tom… tudo foi acertado. Ela falou com inflexões naturais, pausas e ênfase. Suas expressões faciais e gestos com as mãos? Perfeitos. Foi genuinamente digno de uma entrevista documental.
As únicas coisas que pareceram um pouco fora foram as partículas de poeira flutuando na luz do sol, que eram um pouco distrações. E enquanto pedi sons ambientes de biblioteca, o modelo me deu uma trilha sonora sutil em vez disso. Mas honestamente? Foi uma decisão executiva inteligente. A música combinou perfeitamente com o estilo documental, talvez até melhor do que o que eu havia pedido. Que começo!
O que Gostei
O que Não Gostei
Personagem incrivelmente realista e natural
Partículas de poeira na luz do sol foram um pouco distrações
Sincronização labial perfeita com inflexões naturais de fala
Ignorou o pedido específico de som ambiente (mas fez uma boa escolha)
Capturou perfeitamente o estilo de entrevista documental



Prompt #2: O Teste Cinematográfico e Atmosférico

Prompt Usado: "Movimento de câmera dolly lentamente para trás, revelando um astronauta solitário em pé na borda de uma cratera em Marte. O céu é empoeirado, avermelhado-laranja com duas pequenas luas visíveis. O ambiente é desolado e silencioso. Estilo: Ficção científica épica, 4K, lente grande angular, extremamente detalhado, atmosfera inspiradora e melancólica."

Minha Experiência: Este foi... uma mistura. A primeira coisa que chamou minha atenção foi o reflexo no capacete do astronauta. Eu havia pedido um reflexo sutil da Terra, mas o que recebi foi um estranho fragmento distorcido do rosto de um homem. Parecia completamente errado, como um glitch bizarro onde as camadas de transparência e dimensões estavam todas erradas. Era para ser o rosto do próprio astronauta? Quem sabe! Apenas parecia colado.
Todo o resto não estava ruim. O traje, a cratera, o movimento da câmera, tudo sólido. Os detalhes de poeira e neblina de areia eram realmente super realistas. Mas o prompt pedia duas pequenas luas, e o céu mostrava o que parecia ser três planetas de tamanhos diferentes. É uma pena sobre o rosto com glitch, porque sem isso, teria sido impressionante. Com geração de vídeo por AI, às vezes você ganha, às vezes perde. O modelo adicionou um sol, estrelas e neblina em movimento, o que funcionou. O rosto extra e o planeta? Nem tanto.
O que Gostei
O que Não Gostei
Boa execução do movimento de câmera dolly
Glitch importante com o rosto distorcido no reflexo do capacete
Detalhes realistas de poeira e neblina de areia
Não seguiu a instrução de "duas luas"
Capturou bem o clima desolado e épico de ficção científica
O traje do astronauta carecia de alguns detalhes finos


Prompt #3: O Teste de Consistência de Produto e Objeto

Prompt Usado: "Filmagem em turntable de um bule de cerâmica de design sofisticado e de alta qualidade. O bule é minimalista, branco fosco, posicionado em uma superfície cinza claro e lisa. A câmera gira lentamente 360 graus ao redor do bule. Estilo: Comercial de produto limpo, iluminação de estúdio, sombras suaves, lente macro, foco extremamente nítido, sem distrações no fundo."

Minha Experiência: Este foi apenas... ok. Não particularmente impressionante. O modelo me deu a interpretação mais básica e literal do prompt. Pedi um bule "sofisticado e de design bonito", e ele me deu um bule de cerâmica tradicional e simples. O ângulo da câmera estava correto, mas a superfície era branca em vez do cinza claro que eu havia especificado. Como ele erra isso com um prompt tão simples?
O que realmente me incomodou foi o foco. Pedi especificamente "foco extremamente nítido", mas o bule estava desfocado, com bordas pouco definidas, como se fosse parte do fundo. Para um comercial de produto, isso não faz sentido. Para piorar, quando o bule girava, a alça era cortada do quadro. O modelo não conseguiu nem manter o único objeto no vídeo totalmente visível. Para uma demonstração de produto, isso é um grande fracasso.
O que Gostei
O que Não Gostei
Ângulo de câmera e movimento de rotação corretos
Design do bule era simples e sem inspiração
Configuração de fundo e iluminação estava quase correta
Vídeo estava desfocado e fora de foco
A rotação de 360 graus foi suave
O produto foi cortado durante a rotação


Prompt #4: O Teste de Ação e Movimento

Prompt Usado: "Filmagem em POV de alguém correndo por um mercado noturno vibrante e lotado em Bangkok. A câmera está tremendo enquanto a pessoa desvia entre pessoas e barracas de comida. Vapor sobe de woks, e lanternas coloridas estão penduradas acima. Efeitos sonoros: uma cacofonia de sons do mercado — pessoas conversando, comida fritando, música distante. O corredor ocasionalmente olha por cima do ombro, respirando pesadamente. Estilo: Filme de ação realista, imersivo, com movimento ligeiramente borrado."

Minha Experiência: Isso não foi o que eu esperava, e não de uma maneira boa. O vídeo começou com um personagem gritando "Saia do caminho!" e um efeito sonoro de soco aleatório, o que imediatamente transformou a cena em uma fuga agressiva que eu nunca pedi. O mercado estava lotado, mas algo estava muito errado. Todos estavam parados em linhas perfeitamente retas e ordenadas, e ninguém estava se movendo. Você já viu um mercado movimentado que parece assim? Era completamente antinatural.
O corredor nunca olhou por cima do ombro, uma ação específica que solicitei. O áudio também estava uma bagunça. O único som que estava certo era a respiração pesada do corredor. O resto dos sons do mercado estavam muito distantes e baixos, quando deveriam ter sido uma cacofonia próxima e imersiva. As placas eram uma mistura de tailandês e chinês, fazendo parecer um "mercado asiático" genérico em vez de especificamente Bangkok. Este apenas gritava "gerado por AI."
O que Gostei
O que Não Gostei
O som da respiração do corredor era realista
Diálogo e efeitos sonoros indesejados foram adicionados
A sensação de câmera em mão estava um pouco presente
A multidão estava estática e completamente irrealista
A iluminação e as cores do mercado eram vibrantes
O cenário parecia genérico, não específico de Bangkok


O Recurso que Muda Tudo: Áudio Nativo e Sincronização Labial

Apesar dos resultados inconsistentes nos meus quatro testes, o sucesso do Prompt #1 realmente destaca por que o Veo 3 está recebendo tanta atenção. A qualidade da sincronização labial é onde ele realmente brilha. Quando funciona, como no meu teste da historiadora, o resultado é convincente o suficiente para ser confundido com filmagens reais. O modelo não apenas combina os movimentos da boca com as palavras; ele gera padrões de fala naturais com inflexões, pausas e ênfase. Ele também toma decisões criativas sobre áudio, como escolher música de fundo em vez de ruído ambiente quando isso serve melhor à cena. Esse tipo de inteligência contextual de áudio é o que faz a diferença entre um clipe que parece gerado por AI e um que realmente se sustenta.


As Partes Irritantes: Limites Diários, Renderização Lenta e Glitches Estranhos

Aqui é onde preciso ser honesto sobre as frustrações, porque houve várias.
Os limites diários de geração foram um problema real. Depois de gerar apenas dois vídeos no plano Google AI Plus, atingi o limite. Esta mensagem apareceu.
Mensagem de limite diário atingido

É aqui que a linguagem vaga de "mais acesso" e "maior acesso" nas páginas dos planos se torna um problema real. Tive que fazer outro upgrade para o Google AI Pro para continuar meus testes. Isso são dois upgrades pagos apenas para executar quatro prompts.
E então há os glitches. O rosto distorcido no reflexo do capacete do astronauta, o planeta extra no céu, o diálogo adicionado na cena do mercado de Bangkok. Esses são os tipos de artefatos visuais e de áudio que podem tornar um resultado impressionante completamente inutilizável se o realismo for o que você estava buscando. Limitações do Veo 3 como essas valem a pena serem consideradas antes de se comprometer com um plano pago.


Vale a Pena o Preço do Google Veo 3? Meu Veredito Honesto

Depois dessas rodadas de testes, aqui está minha conclusão sobre se o Google Veo 3 vale a pena.
Para conteúdo focado em diálogo, especificamente vídeos de cabeças falantes, entrevistas no estilo documental ou qualquer cena onde um personagem fala diretamente para a câmera, o Veo 3 é uma das melhores ferramentas disponíveis atualmente. A qualidade da sincronização labial e a geração de fala natural são genuinamente impressionantes e difíceis de igualar. Se esse for seu caso de uso principal, o plano Google AI Pro por $19.99 por mês é um investimento razoável.
Para todo o resto, é mais uma aposta. O teste de demonstração de produto foi decepcionante, a sequência de ação foi um desastre, e o teste cinematográfico teve um glitch que tornou o resultado inutilizável. Os limites diários são frustrantes, especialmente nos planos de nível inferior, e os tempos de renderização atrasam as coisas. Se você é um criador solo experimentando com vídeo por AI, vale a pena tentar. Se você é uma agência ou equipe de produção que precisa de resultados consistentes e confiáveis em escala, as limitações podem superar os benefícios por enquanto.
A conclusão: o Veo 3 é genuinamente impressionante nas condições certas, mas ainda não é o gerador de vídeo versátil e confiável que as demonstrações sugerem. É uma ferramenta poderosa com um ponto forte específico, e conhecer esse ponto forte antes de assinar economizará muita frustração.


Como a Manus Pode Potencializar Seu Fluxo de Trabalho com Vídeo por AI

Gerar clipes é apenas uma parte do processo. Um projeto de vídeo finalizado requer brainstorming de ideias, redação de roteiros e prompts, organização de ativos e criação do conteúdo ao redor — as postagens de blog, legendas sociais e descrições de vídeo que realmente fazem seu conteúdo ser visto. É aí que a Manus entra.
Usei a Manus durante todo este processo de review: para planejar minha abordagem de teste, estruturar os quatro prompts e consolidar minhas anotações e descobertas em algo coerente antes de escrever. Ter uma ferramenta que ajuda a organizar seu pensamento antes de colocar palavras no papel faz uma diferença real, especialmente quando você está lidando com múltiplas saídas de teste e tentando compará-las de forma justa. Se você está construindo um fluxo de trabalho de conteúdo em vídeo, vale a pena ter um agente de AI ao seu lado para o trabalho ao redor. Você pode experimentar a Manus gratuitamente em manus.im.


Perguntas Frequentes

Como posso obter acesso ao Google Veo 3?

Você pode acessar o Google Veo 3 através do aplicativo Gemini assinando um dos planos pagos de AI do Google. O plano Google AI Plus ($7.99/mês) oferece acesso limitado, enquanto o plano Google AI Pro ($19.99/mês) desbloqueia a geração de vídeo com o Veo 3.1 Fast. O acesso completo com os limites mais altos está disponível no plano Google AI Ultra ($249.99/mês).

Existe uma versão gratuita do Google Veo 3?

Não há uma versão gratuita dedicada do Veo 3. O plano gratuito do Google AI tem acesso muito limitado e não suporta geração direta de vídeo através do aplicativo Gemini. Usuários gratuitos podem ter acesso limitado via Google Flow, mas para geração prática de vídeo, você precisará de um plano pago.

Quais são as limitações do Google Veo 3?

As principais limitações do Veo 3 incluem limites diários de geração (mesmo em planos pagos), tempos de renderização lentos de cerca de 3-5 minutos por clipe, comprimento máximo de vídeo de 8 segundos, glitches visuais e inconsistências ocasionais, e dificuldade com cenas complexas de múltiplos elementos. Consistência de objetos em filmagens de produtos e comportamento de personagens em sequências de ação também são áreas onde ele pode falhar.

O Google Veo 3 pode criar vídeos com mais de 8 segundos?

Não, a versão atual do Google Veo 3 gera clipes de até 8 segundos de duração. Para conteúdos mais longos, você precisaria gerar múltiplos clipes e editá-los juntos em uma ferramenta como o Google Flow ou um editor de vídeo padrão.

O Google Veo 3 é melhor que o Sora da OpenAI?

Depende do que você precisa. O Veo 3 tem uma vantagem clara no realismo de diálogo e sincronização labial, tornando-o a melhor escolha para conteúdo no estilo de cabeças falantes ou entrevistas. O Sora 2 geralmente tem um desempenho melhor para cenas narrativas mais longas e apresenta comportamento de personagens mais consistente em prompts complexos. Para a maioria dos criadores, a escolha depende do seu caso de uso principal.