Chuyển đến nội dung chính
Manus hoạt động với nhiều loại phương tiện—tạo hình ảnh, hiểu nội dung video, tạo đầu ra giọng nói và phiên âm lời nói. Kết hợp văn bản, hình ảnh, video và âm thanh vào quy trình làm việc của bạn một cách liền mạch.

Tổng quan về Khả năng

Khả năngChức năngVí dụ Sử dụng
Tạo Hình ảnhTạo hình ảnh tùy chỉnh từ mô tảBản mô phỏng sản phẩm, hình minh họa, sơ đồ
Hiểu Hình ảnhPhân tích và trích xuất thông tin từ hình ảnhQuét tài liệu, phân tích trực quan
Hiểu VideoPhân tích nội dung video và trích xuất thông tin chi tiếtBản ghi cuộc họp, phân tích nội dung
Đầu ra Giọng nóiChuyển đổi văn bản thành lời nói tự nhiênLồng tiếng, nội dung âm thanh
Chuyển Giọng nói thành Văn bảnPhiên âm âm thanh thành văn bảnGhi chú cuộc họp, bản ghi phỏng vấn

Tạo Hình ảnh

Bắt đầu Nhanh

“Tạo một hình ảnh về không gian làm việc văn phòng tối giản hiện đại với ánh sáng tự nhiên và cây xanh”

Các Trường hợp Sử dụng Phổ biến

Hình ảnh Sản phẩm:
  • Bản mô phỏng và nguyên mẫu sản phẩm
  • Hình minh họa tính năng
  • Khái niệm UI/UX
Tài sản Tiếp thị:
  • Đồ họa truyền thông xã hội
  • Hình minh họa bài đăng blog
  • Tài liệu quảng cáo sáng tạo
Bài thuyết trình:
  • Hình nền slide tùy chỉnh
  • Hình minh họa khái niệm
  • Ẩn dụ trực quan
Sơ đồ & Biểu đồ:
  • Luồng quy trình
  • Kiến trúc hệ thống
  • Đồ họa thông tin

Mẹo để có Hình ảnh Tốt hơn

Cụ thể về phong cách:
  • ✅ “Tối giản, hiện đại, chụp ảnh chuyên nghiệp”
  • ✅ “Minh họa thiết kế phẳng, màu sắc tươi sáng”
  • ❌ “Làm cho nó trông đẹp”
Mô tả bố cục:
  • ✅ “Chủ thể ở trung tâm, nền mờ, ánh sáng tự nhiên”
  • ❌ “Một bức ảnh về…”
Chỉ định mục đích sử dụng:
  • ✅ “Dành cho bài đăng Instagram, định dạng vuông, lớp phủ văn bản đậm”
  • ✅ “Dành cho slide thuyết trình, định dạng màn hình rộng, nền dịu nhẹ”

Hiểu Hình ảnh

Bắt đầu Nhanh

(Tải lên hình ảnh) (Tải lên hình ảnh) (Tải lên hình ảnh)

Các Trường hợp Sử dụng Phổ biến

Xử lý Tài liệu:
  • Trích xuất văn bản từ ảnh chụp màn hình
  • Đọc ghi chú viết tay
  • Phân tích hóa đơn và biên lai
Phân tích Trực quan:
  • Nhận dạng đối tượng trong ảnh
  • Phân tích biểu đồ và đồ thị
  • Mô tả nội dung hình ảnh
Kiểm soát Chất lượng:
  • Kiểm tra ảnh sản phẩm xem có vấn đề gì không
  • Xác minh nội dung hình ảnh
  • So sánh sự khác biệt trực quan

Ví dụ về Nhiệm vụ


Hiểu Video

Bắt đầu Nhanh

(Tải lên tệp video hoặc cung cấp URL)

Các Trường hợp Sử dụng Phổ biến

Xử lý Cuộc họp:
  • Phiên âm cuộc họp
  • Trích xuất các mục hành động
  • Tóm tắt các cuộc thảo luận
Phân tích Nội dung:
  • Phân tích video của đối thủ cạnh tranh
  • Trích xuất các điểm chính từ hướng dẫn
  • Xem lại bản demo sản phẩm
Tài liệu hóa:
  • Chuyển đổi hướng dẫn video thành hướng dẫn bằng văn bản
  • Tạo bản tóm tắt các video dài
  • Trích xuất trích dẫn và dấu thời gian

Ví dụ về Nhiệm vụ


Đầu ra Giọng nói

Bắt đầu Nhanh

Các Trường hợp Sử dụng Phổ biến

Sáng tạo Nội dung:
  • Chuyển đổi kịch bản podcast thành âm thanh
  • Biến bài đăng blog thành phiên bản âm thanh
  • Lồng tiếng video
Khả năng Tiếp cận:
  • Phiên bản âm thanh của nội dung viết
  • Các lựa chọn thay thế cho trình đọc màn hình
  • Hướng dẫn âm thanh
Tiếp thị:
  • Lồng tiếng quảng cáo
  • Lời kể cho bản demo sản phẩm
  • Nội dung âm thanh truyền thông xã hội

Tùy chọn Giọng nói

Giọng điệu: Chuyên nghiệp, Thân thiện, Thường ngày, Mạnh mẽ, Bình tĩnhTốc độ: Nhanh, Vừa phải, ChậmPhong cách: Đàm thoại, Trang trọng, Giáo dục, Quảng bá

Chuyển Giọng nói thành Văn bản

Bắt đầu Nhanh

(Tải lên tệp âm thanh)

Các Trường hợp Sử dụng Phổ biến

Ghi chú Cuộc họp:
  • Tự động hóa phiên âm cuộc họp
  • Tạo kho lưu trữ cuộc họp có thể tìm kiếm
  • Trích xuất các mục hành động
Tái sử dụng Nội dung:
  • Biến podcast thành bài đăng blog
  • Tạo ghi chú chương trình từ âm thanh
  • Tạo trích dẫn truyền thông xã hội
Nghiên cứu:
  • Phiên âm các cuộc phỏng vấn
  • Phân tích các cuộc gọi của khách hàng
  • Xử lý các bản ghi nhóm tập trung

Tính năng

  • Nhận dạng Người nói: Phân biệt giữa những người nói
  • Dấu thời gian: Đánh dấu thời điểm người nói phát biểu
  • Định dạng: Dấu câu và phân đoạn chính xác
  • Độ chính xác: Độ chính xác cao ngay cả khi có giọng điệu hoặc tiếng ồn xung quanh

Kết hợp Nhiều Phương thức

Manus có thể kết hợp các khả năng này trong một quy trình làm việc duy nhất:

Ví dụ 1: Video thành Bài đăng Blog

Ví dụ 2: Bài thuyết trình có Lồng tiếng

Ví dụ 3: Phân tích Hình ảnh thành Báo cáo


Câu hỏi Thường gặp

Các định dạng hình ảnh nào được hỗ trợ? PNG, JPG, WEBP, GIF, và nhiều định dạng khác. Đối với việc tạo, bạn có thể chỉ định định dạng. Video có thể dài bao lâu? Manus có thể xử lý các video dài đến vài giờ. Video dài hơn cần nhiều thời gian hơn. Các định dạng âm thanh nào có sẵn để phiên âm? MP3, WAV, M4A, WEBM và hầu hết các định dạng âm thanh phổ biến. Tôi có thể tạo hình ảnh với kích thước cụ thể không? Có. Chỉ định kích thước: “Tạo hình ảnh 1920x1080…” hoặc “Định dạng vuông cho Instagram…” Độ chính xác của phiên âm giọng nói như thế nào? Rất chính xác, ngay cả khi có giọng điệu, nhiều người nói hoặc tiếng ồn xung quanh. Tôi có thể tạo video không? Có. Manus có thể tạo các clip video ngắn và hoạt ảnh. Có giới hạn nào đối với việc tạo không? Việc tạo sử dụng Tín dụng. Kiểm tra gói của bạn để biết giới hạn.

Các Trường hợp Sử dụng Nhanh

Trường hợp Sử dụngĐầu vàoĐầu ra
Bản Mô phỏng Sản phẩmMô tảHình ảnh Được tạo
Ghi chú Cuộc họpBản ghi VideoPhiên âm + Tóm tắt
Âm thanh BlogBài viết Văn bảnLời kể Âm thanh
Quét Tài liệuẢnh Tài liệuVăn bản Được trích xuất
Phân tích VideoVideo Đối thủ cạnh tranhSo sánh Tính năng
Ghi chú Chương trình PodcastTệp Âm thanhPhiên âm + Tóm tắt
Đồ họa Xã hộiMô tảHình ảnh Tùy chỉnh

Tóm tắt: Manus xử lý liền mạch nhiều loại phương tiện. Tạo hình ảnh, hiểu video, tạo đầu ra giọng nói và phiên âm lời nói—tất cả đều được tích hợp vào quy trình làm việc của bạn.