Zum Hauptinhalt springen
Manus arbeitet mit mehreren Medientypen – Bilder generieren, Videoinhalte verstehen, Sprachausgabe erstellen und Sprache transkribieren. Kombinieren Sie Text, Bilder, Video und Audio nahtlos in Ihren Workflows.

Funktionsübersicht

FunktionWas es tutAnwendungsbeispiel
BilderzeugungErstellen Sie benutzerdefinierte Bilder aus BeschreibungenProdukt-Mockups, Illustrationen, Diagramme
BildverständnisAnalysieren und Extrahieren von Informationen aus BildernDokumentenscan, visuelle Analyse
VideoverständnisVideoinhalte analysieren und Erkenntnisse extrahierenBesprechungsprotokolle, Inhaltsanalyse
SprachausgabeText in natürliche Sprache umwandelnVoiceovers, Audioinhalte
Sprache zu TextAudio in Text transkribierenBesprechungsnotizen, Interviewprotokolle

Bilderzeugung

Schnellstart

“Erzeuge ein Bild eines modernen, minimalistischen Büroraums mit natürlichem Licht und Pflanzen”

Häufige Anwendungsfälle

Produkt-Visuals:
  • Produkt-Mockups und Prototypen
  • Feature-Illustrationen
  • UI/UX-Konzepte
Marketing-Assets:
  • Social-Media-Grafiken
  • Blog-Post-Illustrationen
  • Werbemittel
Präsentationen:
  • Benutzerdefinierte Folienhintergründe
  • Konzeptillustrationen
  • Visuelle Metaphern
Diagramme & Grafiken:
  • Prozessabläufe
  • Systemarchitekturen
  • Infografiken

Tipps für bessere Bilder

Seien Sie spezifisch beim Stil:
  • ✅ “Minimalistisch, modern, professionelle Fotografie”
  • ✅ “Flat Design Illustration, helle Farben”
  • ❌ “Lass es gut aussehen”
Beschreiben Sie die Komposition:
  • ✅ “Motiv zentriert, Hintergrund unscharf, natürliches Licht”
  • ❌ “Ein Bild von…”
Geben Sie den Verwendungszweck an:
  • ✅ “Für Instagram-Post, quadratisches Format, fette Textüberlagerung”
  • ✅ “Für Präsentationsfolie, Breitbildformat, weicher Hintergrund”

Bildverständnis

Schnellstart

(Bild hochladen) (Bild hochladen) (Bild hochladen)

Häufige Anwendungsfälle

Dokumentenverarbeitung:
  • Text aus Screenshots extrahieren
  • Handschriftliche Notizen lesen
  • Belege und Rechnungen parsen
Visuelle Analyse:
  • Objekte in Fotos identifizieren
  • Diagramme und Grafiken analysieren
  • Bildinhalte beschreiben
Qualitätskontrolle:
  • Produktfotos auf Fehler prüfen
  • Bildinhalte verifizieren
  • Visuelle Unterschiede vergleichen

Beispielaufgaben


Videoverständnis

Schnellstart

(Video-Datei hochladen oder URL angeben)

Häufige Anwendungsfälle

Besprechungs-Verarbeitung:
  • Besprechungen transkribieren
  • Aktionspunkte extrahieren
  • Diskussionen zusammenfassen
Inhaltsanalyse:
  • Konkurrenzvideos analysieren
  • Wichtige Punkte aus Tutorials extrahieren
  • Produkt-Demos überprüfen
Dokumentation:
  • Video-Tutorials in Textanleitungen umwandeln
  • Zusammenfassungen langer Videos erstellen
  • Zitate und Zeitstempel extrahieren

Beispielaufgaben


Sprachausgabe

Schnellstart

Häufige Anwendungsfälle

Content-Erstellung:
  • Podcast-Skripte in Audio umwandeln
  • Blogbeiträge in Audioversionen umwandeln
  • Video-Voiceovers
Barrierefreiheit:
  • Audioversionen von schriftlichem Inhalt
  • Alternative zu Screenreadern
  • Audioführungen
Marketing:
  • Werbe-Voiceovers
  • Produkt-Demo-Kommentare
  • Audioinhalte für soziale Medien

Sprachoptionen

Tonfall: Professionell, freundlich, lässig, energisch, ruhigSprechtempo: Schnell, mittel, langsamStil: Konversation, formell, lehrreich, werblich

Sprache zu Text

Schnellstart

(Audio-Datei hochladen)

Häufige Anwendungsfälle

Besprechungsdokumentation:
  • Automatisches Transkribieren von Besprechungen
  • Erstellen eines durchsuchbaren Besprechungsarchivs
  • Aktionspunkte extrahieren
Inhaltswiederverwendung:
  • Podcasts in Blogbeiträge umwandeln
  • Shownotes aus Audio erstellen
  • Zitate für soziale Medien generieren
Forschung:
  • Interviews transkribieren
  • Kundenanrufe analysieren
  • Fokusgruppen-Aufnahmen verarbeiten

Funktionen

  • Sprecheridentifikation: Unterscheidet zwischen Sprechern
  • Zeitstempel: Markiert, wann gesprochen wurde
  • Formatierung: Korrekte Zeichensetzung und Segmentierung
  • Genauigkeit: Hohe Genauigkeit auch bei Akzenten oder Hintergrundgeräuschen

Kombination mehrerer Modalitäten

Manus kann diese Funktionen in einem einzigen Workflow kombinieren:

Beispiel 1: Video zu Blogbeitrag

Beispiel 2: Präsentation mit Voiceover

Beispiel 3: Bildanalyse zu Bericht


Häufig gestellte Fragen

Welche Bildformate werden unterstützt? PNG, JPG, WEBP, GIF und mehr. Für die Generierung können Sie das Format angeben. Wie lang dürfen Videos sein? Manus kann Videos von bis zu mehreren Stunden verarbeiten. Längere Videos benötigen mehr Zeit. Welche Audioformate können transkribiert werden? MP3, WAV, M4A, WEBM und die meisten gängigen Audioformate. Kann ich Bilder in bestimmten Abmessungen generieren? Ja. Geben Sie die Abmessungen an: „Erzeuge ein Bild in 1920x1080…“ oder „Quadratisches Format für Instagram…“ Wie genau ist die Sprachtranskription? Die Genauigkeit ist sehr hoch, auch bei Akzenten, mehreren Sprechern oder Hintergrundgeräuschen. Kann ich Videos generieren? Ja. Manus kann kurze Videoclips und Animationen generieren. Gibt es Einschränkungen für die Generierung? Die Generierung verbraucht Credits. Bitte überprüfen Sie Ihren Plan auf Einschränkungen.

Kurze Anwendungsbeispiele

AnwendungsfallEingabeAusgabe
Produkt-MockupBeschreibungGeneriertes Bild
BesprechungsprotokollVideoaufzeichnungTranskript + Zusammenfassung
Blog-AudioTextartikelAudiokommentar
DokumentenscanFoto des DokumentsExtrahierter Text
VideoanalyseKonkurrenzvideoFunktionsvergleich
Podcast ShownotesAudio-DateiTranskript + Zusammenfassung
Social GraphicBeschreibungBenutzerdefiniertes Bild

Zusammenfassung: Manus verarbeitet nahtlos mehrere Medientypen. Bilder generieren, Videos verstehen, Sprachausgabe erstellen und Sprache transkribieren – alles in Ihren Workflow integriert.