Passer au contenu principal
Manus fonctionne avec plusieurs types de médias : génération d’images, compréhension de contenu vidéo, création de sortie vocale et transcription de la parole. Combinez le texte, les images, la vidéo et l’audio dans vos flux de travail de manière transparente.

Aperçu des capacités

CapacitéCe qu’elle faitExemple d’utilisation
Génération d’imagesCrée des images personnalisées à partir de descriptionsMaquettes de produits, illustrations, diagrammes
Compréhension d’imagesAnalyse et extrait des informations des imagesNumérisation de documents, analyse visuelle
Compréhension vidéoAnalyse le contenu vidéo et extrait des informationsTranscriptions de réunions, analyse de contenu
Sortie vocaleConvertit le texte en parole naturelleVoix off, contenu audio
Discours en texteTranscrit l’audio en texteNotes de réunion, transcriptions d’entretiens

Génération d’images

Démarrage rapide

“Générer une image d’un espace de travail de bureau moderne et minimaliste avec un éclairage naturel et des plantes”

Utilisations courantes

Visuels de produits:
  • Maquettes et prototypes de produits
  • Illustrations de fonctionnalités
  • Concepts UI/UX
Ressources marketing:
  • Graphiques pour les réseaux sociaux
  • Illustrations d’articles de blog
  • Créations publicitaires
Présentations:
  • Arrière-plans de diapositives personnalisés
  • Illustrations de concepts
  • Métaphores visuelles
Diagrammes & Graphiques:
  • Flux de processus
  • Architectures système
  • Infographies

Conseils pour de meilleures images

Soyez précis sur le style:
  • ✅ “Minimaliste, moderne, photographie professionnelle”
  • ✅ “Illustration de conception plate, couleurs vives”
  • ❌ “Faites en sorte que cela ait l’air bien”
Décrivez la composition:
  • ✅ “Sujet centré, arrière-plan flou, éclairage naturel”
  • ❌ “Une image de…”
Spécifiez l’utilisation:
  • ✅ “Pour publication Instagram, format carré, superposition de texte en gras”
  • ✅ “Pour diapositive de présentation, format écran large, fond doux”

Compréhension d’images

Démarrage rapide

(Télécharger l’image) (Télécharger l’image) (Télécharger l’image)

Utilisations courantes

Traitement de documents:
  • Extraire du texte des captures d’écran
  • Lire des notes manuscrites
  • Analyser les reçus et les factures
Analyse visuelle:
  • Identifier des objets dans des photos
  • Analyser des tableaux et des graphiques
  • Décrire le contenu d’une image
Contrôle qualité:
  • Vérifier les photos de produits pour détecter des problèmes
  • Valider le contenu de l’image
  • Comparer les différences visuelles

Exemples de tâches


Compréhension vidéo

Démarrage rapide

(Télécharger le fichier vidéo ou fournir l’URL)

Utilisations courantes

Traitement des réunions:
  • Transcrire des réunions
  • Extraire les éléments d’action
  • Résumer les discussions
Analyse de contenu:
  • Analyser les vidéos des concurrents
  • Extraire les points clés des tutoriels
  • Examiner les démonstrations de produits
Documentation:
  • Convertir des tutoriels vidéo en guides textuels
  • Créer des résumés de longues vidéos
  • Extraire des citations et des horodatages

Exemples de tâches


Sortie vocale

Démarrage rapide

Utilisations courantes

Création de contenu:
  • Transformer des scripts de podcast en audio
  • Convertir des articles de blog en versions audio
  • Voix off vidéo
Accessibilité:
  • Versions audio de contenu écrit
  • Alternatives aux lecteurs d’écran
  • Guides audio
Marketing:
  • Voix off publicitaires
  • Narration de démonstration de produit
  • Contenu audio pour les réseaux sociaux

Options vocales

Ton: Professionnel, Amical, Décontracté, Énergique, CalmeRythme: Rapide, Modéré, LentStyle: Conversationnel, Formel, Éducatif, Promotionnel

Discours en texte

Démarrage rapide

(Télécharger le fichier audio)

Utilisations courantes

Procès-verbaux de réunion:
  • Transcription automatique de réunions
  • Créer des archives de réunions consultables
  • Extraire les éléments d’action
Réutilisation de contenu:
  • Transformer des podcasts en articles de blog
  • Créer des notes d’émission à partir de l’audio
  • Générer des citations pour les réseaux sociaux
Recherche:
  • Transcrire des entretiens
  • Analyser les appels clients
  • Traiter les enregistrements de groupes de discussion

Fonctionnalités

  • Identification du locuteur: Distingue les locuteurs
  • Horodatages: Marque le moment où la parole a eu lieu
  • Mise en forme: Ponctuation et segmentation correctes
  • Précision: Grande précision même avec des accents ou du bruit de fond

Combinaison de modalités

Manus peut combiner ces capacités dans un seul flux de travail :

Exemple 1 : Vidéo en article de blog

Exemple 2 : Présentation avec voix off

Exemple 3 : Analyse d’images en rapport


FAQ

Quels formats d’image sont pris en charge ? PNG, JPG, WEBP, GIF, etc. Pour la génération, vous pouvez spécifier le format. Quelle peut être la durée des vidéos ? Manus peut traiter des vidéos d’une durée allant jusqu’à plusieurs heures. Les vidéos plus longues nécessitent plus de temps. Quels formats audio sont disponibles pour la transcription ? MP3, WAV, M4A, WEBM et la plupart des formats audio courants. Puis-je générer des images de dimensions spécifiques ? Oui. Spécifiez les dimensions : “Générer une image 1920x1080…” ou “Format carré pour Instagram…” Quelle est la précision de la transcription vocale ? La précision est très élevée, même avec des accents, plusieurs locuteurs ou du bruit de fond. Puis-je générer des vidéos ? Oui. Manus peut générer de courts clips vidéo et des animations. Y a-t-il des limites à la génération ? La génération utilise des crédits. Vérifiez votre plan pour connaître les limites.

Cas d’utilisation rapide

Cas d’utilisationEntréeSortie
Maquette de produitDescriptionImage générée
Procès-verbal de réunionEnregistrement vidéoTranscription + Résumé
Audio de blogArticle textuelNarration audio
Numérisation de documentsPhoto de documentTexte extrait
Analyse vidéoVidéo concurrenteComparaison de fonctionnalités
Notes d’émission de podcastFichier audioTranscription + Résumé
Image socialeDescriptionImage personnalisée

Résumé: Manus gère de manière transparente plusieurs types de médias. Générez des images, comprenez des vidéos, créez des sorties vocales et transcrivez la parole, le tout intégré à votre flux de travail.