Manus fonctionne avec plusieurs types de médias : génération d’images, compréhension de contenu vidéo, création de sortie vocale et transcription de la parole. Combinez le texte, les images, la vidéo et l’audio dans vos flux de travail de manière transparente.Documentation Index
Fetch the complete documentation index at: https://manus.im/docs/llms.txt
Use this file to discover all available pages before exploring further.
Aperçu des capacités
| Capacité | Ce qu’elle fait | Exemple d’utilisation |
|---|---|---|
| Génération d’images | Crée des images personnalisées à partir de descriptions | Maquettes de produits, illustrations, diagrammes |
| Compréhension d’images | Analyse et extrait des informations des images | Numérisation de documents, analyse visuelle |
| Compréhension vidéo | Analyse le contenu vidéo et extrait des informations | Transcriptions de réunions, analyse de contenu |
| Sortie vocale | Convertit le texte en parole naturelle | Voix off, contenu audio |
| Discours en texte | Transcrit l’audio en texte | Notes de réunion, transcriptions d’entretiens |
Génération d’images
Démarrage rapide
“Générer une image d’un espace de travail de bureau moderne et minimaliste avec un éclairage naturel et des plantes”
Utilisations courantes
Visuels de produits:- Maquettes et prototypes de produits
- Illustrations de fonctionnalités
- Concepts UI/UX
- Graphiques pour les réseaux sociaux
- Illustrations d’articles de blog
- Créations publicitaires
- Arrière-plans de diapositives personnalisés
- Illustrations de concepts
- Métaphores visuelles
- Flux de processus
- Architectures système
- Infographies
Conseils pour de meilleures images
Soyez précis sur le style:- ✅ “Minimaliste, moderne, photographie professionnelle”
- ✅ “Illustration de conception plate, couleurs vives”
- ❌ “Faites en sorte que cela ait l’air bien”
- ✅ “Sujet centré, arrière-plan flou, éclairage naturel”
- ❌ “Une image de…”
- ✅ “Pour publication Instagram, format carré, superposition de texte en gras”
- ✅ “Pour diapositive de présentation, format écran large, fond doux”
Compréhension d’images
Démarrage rapide
(Télécharger l’image) (Télécharger l’image) (Télécharger l’image)Utilisations courantes
Traitement de documents:- Extraire du texte des captures d’écran
- Lire des notes manuscrites
- Analyser les reçus et les factures
- Identifier des objets dans des photos
- Analyser des tableaux et des graphiques
- Décrire le contenu d’une image
- Vérifier les photos de produits pour détecter des problèmes
- Valider le contenu de l’image
- Comparer les différences visuelles
Exemples de tâches
Compréhension vidéo
Démarrage rapide
(Télécharger le fichier vidéo ou fournir l’URL)Utilisations courantes
Traitement des réunions:- Transcrire des réunions
- Extraire les éléments d’action
- Résumer les discussions
- Analyser les vidéos des concurrents
- Extraire les points clés des tutoriels
- Examiner les démonstrations de produits
- Convertir des tutoriels vidéo en guides textuels
- Créer des résumés de longues vidéos
- Extraire des citations et des horodatages
Exemples de tâches
Sortie vocale
Démarrage rapide
Utilisations courantes
Création de contenu:- Transformer des scripts de podcast en audio
- Convertir des articles de blog en versions audio
- Voix off vidéo
- Versions audio de contenu écrit
- Alternatives aux lecteurs d’écran
- Guides audio
- Voix off publicitaires
- Narration de démonstration de produit
- Contenu audio pour les réseaux sociaux
Options vocales
Ton: Professionnel, Amical, Décontracté, Énergique, CalmeRythme: Rapide, Modéré, LentStyle: Conversationnel, Formel, Éducatif, PromotionnelDiscours en texte
Démarrage rapide
(Télécharger le fichier audio)Utilisations courantes
Procès-verbaux de réunion:- Transcription automatique de réunions
- Créer des archives de réunions consultables
- Extraire les éléments d’action
- Transformer des podcasts en articles de blog
- Créer des notes d’émission à partir de l’audio
- Générer des citations pour les réseaux sociaux
- Transcrire des entretiens
- Analyser les appels clients
- Traiter les enregistrements de groupes de discussion
Fonctionnalités
- Identification du locuteur: Distingue les locuteurs
- Horodatages: Marque le moment où la parole a eu lieu
- Mise en forme: Ponctuation et segmentation correctes
- Précision: Grande précision même avec des accents ou du bruit de fond
Combinaison de modalités
Manus peut combiner ces capacités dans un seul flux de travail :Exemple 1 : Vidéo en article de blog
Exemple 2 : Présentation avec voix off
Exemple 3 : Analyse d’images en rapport
FAQ
Quels formats d’image sont pris en charge ? PNG, JPG, WEBP, GIF, etc. Pour la génération, vous pouvez spécifier le format. Quelle peut être la durée des vidéos ? Manus peut traiter des vidéos d’une durée allant jusqu’à plusieurs heures. Les vidéos plus longues nécessitent plus de temps. Quels formats audio sont disponibles pour la transcription ? MP3, WAV, M4A, WEBM et la plupart des formats audio courants. Puis-je générer des images de dimensions spécifiques ? Oui. Spécifiez les dimensions : “Générer une image 1920x1080…” ou “Format carré pour Instagram…” Quelle est la précision de la transcription vocale ? La précision est très élevée, même avec des accents, plusieurs locuteurs ou du bruit de fond. Puis-je générer des vidéos ? Oui. Manus peut générer de courts clips vidéo et des animations. Y a-t-il des limites à la génération ? La génération utilise des crédits. Vérifiez votre plan pour connaître les limites.Cas d’utilisation rapide
| Cas d’utilisation | Entrée | Sortie |
|---|---|---|
| Maquette de produit | Description | Image générée |
| Procès-verbal de réunion | Enregistrement vidéo | Transcription + Résumé |
| Audio de blog | Article textuel | Narration audio |
| Numérisation de documents | Photo de document | Texte extrait |
| Analyse vidéo | Vidéo concurrente | Comparaison de fonctionnalités |
| Notes d’émission de podcast | Fichier audio | Transcription + Résumé |
| Image sociale | Description | Image personnalisée |
Résumé: Manus gère de manière transparente plusieurs types de médias. Générez des images, comprenez des vidéos, créez des sorties vocales et transcrivez la parole, le tout intégré à votre flux de travail.