Pular para o conteúdo principal
Manus works with multiple media types—generating images, understanding video content, creating voice output, and transcribing speech. Combine text, images, video, and audio in your workflows seamlessly.

Visão Geral dos Recursos

RecursoO Que FazExemplo de Uso
Geração de ImagemCrie imagens personalizadas a partir de descriçõesMaquetes de produtos, ilustrações, diagramas
Entendimento de ImagemAnalise e extraia informações de imagensDigitalização de documentos, análise visual
Entendimento de VídeoAnalise o conteúdo do vídeo e extraia insightsTranscrições de reuniões, análise de conteúdo
Saída de VozConverta texto em fala naturalNarrações, conteúdo de áudio
Fala para TextoTranscreva áudio para textoNotas de reunião, transcrições de entrevistas

Geração de Imagem

Início Rápido

“Gere uma imagem de um espaço de trabalho de escritório minimalista moderno com iluminação natural e plantas”

Usos Comuns

Visuais de Produto:
  • Maquetes e protótipos de produtos
  • Ilustrações de recursos
  • Conceitos de UI/UX
Ativos de Marketing:
  • Gráficos de mídia social
  • Ilustrações para posts de blog
  • Criações de anúncios
Apresentações:
  • Fundos de slides personalizados
  • Ilustrações conceituais
  • Metáforas visuais
Diagramas & Gráficos:
  • Fluxos de processo
  • Arquiteturas de sistema
  • Infográficos

Dicas para Melhores Imagens

Seja específico sobre o estilo:
  • ✅ “Minimalista, moderno, fotografia profissional”
  • ✅ “Ilustração de design plano, cores vivas”
  • ❌ “Faça parecer bom”
Descreva a composição:
  • ✅ “Assunto centralizado, fundo desfocado, iluminação natural”
  • ❌ “Uma foto de…”
Especifique o caso de uso:
  • ✅ “Para postagem no Instagram, formato quadrado, sobreposição de texto em negrito”
  • ✅ “Para slide de apresentação, formato widescreen, fundo sutil”

Compreensão de Imagem

Início Rápido

(Carregar imagem) (Carregar imagem) (Carregar imagem)

Usos Comuns

Processamento de Documentos:
  • Extrair texto de capturas de tela
  • Ler notas manuscritas
  • Analisar recibos e faturas
Análise Visual:
  • Identificar objetos em fotos
  • Analisar gráficos e diagramas
  • Descrever o conteúdo da imagem
Controle de Qualidade:
  • Verificar problemas em fotos de produtos
  • Verificar o conteúdo da imagem
  • Comparar diferenças visuais

Exemplos de Tarefas


Compreensão de Vídeo

Início Rápido

(Carregue o arquivo de vídeo ou forneça a URL)

Usos Comuns

Processamento de Reuniões:
  • Transcrever reuniões
  • Extrair itens de ação
  • Resumir discussões
Análise de Conteúdo:
  • Analisar vídeos de concorrentes
  • Extrair pontos-chave de tutoriais
  • Revisar demonstrações de produtos
Documentação:
  • Converter tutoriais em vídeo para guias de texto
  • Criar resumos de vídeos longos
  • Extrair citações e carimbos de data/hora

Exemplos de Tarefas


Saída de Voz

Início Rápido

Usos Comuns

Criação de Conteúdo:
  • Scripts de podcast para áudio
  • Posts de blog para versões em áudio
  • Narrações de vídeo
Acessibilidade:
  • Versões em áudio de conteúdo escrito
  • Alternativas de leitor de tela
  • Guias de áudio
Marketing:
  • Narrações de anúncios
  • Narração de demonstração de produto
  • Conteúdo de áudio para mídia social

Opções de Voz

Tom: Profissional, amigável, casual, enérgico, calmoRitmo: Rápido, moderado, lentoEstilo: Conversacional, formal, educacional, promocional

Fala para Texto

Início Rápido

(Carregar arquivo de áudio)

Usos Comuns

Notas de Reunião:
  • Transcreva reuniões automaticamente
  • Crie arquivos de reunião pesquisáveis
  • Extraia itens de ação
Reaproveitamento de Conteúdo:
  • Converta podcasts em posts de blog
  • Crie notas de programa a partir de áudio
  • Gere citações para mídias sociais
Pesquisa:
  • Transcreva entrevistas
  • Analise chamadas de clientes
  • Processe gravações de grupos focais

Recursos

  • Identificação de falante: Distingue entre falantes
  • Carimbos de data/hora: Marca quando as coisas foram ditas
  • Formatação: Pontuação e parágrafos adequados
  • Precisão: Alta precisão mesmo com sotaques ou ruído de fundo

Combinando Múltiplos Modos

O Manus pode combinar estas capacidades em fluxos de trabalho únicos:

Exemplo 1: Vídeo para Post de Blog

Exemplo 2: Apresentação com Narração

Exemplo 3: Análise de Imagem para Relatório


Perguntas Comuns

Quais formatos de imagem são suportados? PNG, JPG, WEBP, GIF e mais. Para geração, você pode especificar o formato. Qual pode ser a duração dos vídeos? O Manus pode processar vídeos de até várias horas de duração. Vídeos mais longos levam mais tempo. Quais formatos de áudio funcionam para transcrição? MP3, WAV, M4A, WEBM e a maioria dos formatos de áudio comuns. Posso gerar imagens em tamanhos específicos? Sim. Especifique as dimensões: “Gerar uma imagem 1920x1080…” ou “Formato quadrado para Instagram…” Qual a precisão da transcrição de fala? Precisão muito alta, mesmo com sotaques, múltiplos falantes ou ruído de fundo. Posso gerar vídeos? Sim. Manus pode gerar clipes de vídeo curtos e animações. Existem limites para a geração? A geração usa Credits. Verifique seu plano para os limites.

Casos de Uso Rápido

Caso de UsoEntradaSaída
Maquetes de ProdutoDescriçãoImagens geradas
Anotações de ReuniãoGravação de vídeoTranscrição + resumo
Áudio de BlogArtigo de textoNarração em áudio
Digitalização de DocumentosFoto de documentoTexto extraído
Análise de VídeoVídeo de concorrenteComparação de recursos
Notas de Episódio de PodcastArquivo de áudioTranscrição + resumo
Gráficos SociaisDescriçãoImagens personalizadas

Conclusão: Manus lida com múltiplos tipos de mídia perfeitamente. Gere imagens, entenda vídeos, crie saída de voz e transcreva fala—tudo integrado aos seus fluxos de trabalho.