Manus hiện đã là một phần của Meta — mang AI đến với doanh nghiệp trên toàn thế giới

Tài nguyên·Thứ Ba, tháng 05 05

Hầu hết mọi người bỏ qua Browser Operator. Đây là cách vượt ra ngoài nghiên cứu hời hợt.

Hãy yêu cầu một AI nghiên cứu điều gì đó cho bạn và xem nó đụng phải bức tường. Nó gọi một API tìm kiếm, cào vài trang công khai, rồi trả lại cho bạn một bản tóm tắt lịch sự về bất cứ thứ gì Google quyết định hiển thị. Tín hiệu thực sự, loại định hình một quyết định thực sự, lại nằm sau các trang đăng nhập, bảng điều khiển và các gói đăng ký mà bạn đã trả tiền, không cái nào trong số đó mà một chatbot thông thường có thể tiếp cận được.
Manus Browser Operator thu hẹp khoảng cách đó, nhưng chỉ theo điều kiện của bạn. Không có gì xảy ra cho đến khi bạn cấp quyền rõ ràng. Khi bạn bật connector My Browser và cấp quyền, Manus hoạt động bên trong phiên Chrome hoặc Edge cục bộ của bạn, thấy những gì bạn thấy và tiếp cận những gì bạn có thể tiếp cận. Sự thay đổi duy nhất đó, làm việc từ chính môi trường trình duyệt của bạn với sự đồng thuận của bạn, mở khóa toàn bộ một loại nghiên cứu mà trước đây đơn giản là không thể thực hiện được.


Tại sao Browser Operator đi sâu hơn

Đôi khi thông tin có giá trị cao nằm sau các gói đăng ký mà bạn đã trả tiền, bên trong các hệ thống doanh nghiệp của bạn và trên các cổng thông tin yêu cầu xác thực. Không có gì trong số đó có thể truy cập được từ đám mây. Khi bạn cấp quyền cho Browser Operator, nó hoạt động bên trong môi trường trình duyệt cục bộ của bạn trên mọi tác vụ, cho phép nó thao tác trên các trang web bạn đã sử dụng.
Kịch bản
Không có Manus
Có Manus Browser Operator
Đọc một gói đăng ký mà bạn đã trả tiền
Bạn lướt qua vài bản xem trước miễn phí và ghép nối những gì có thể từ các đoạn trích.
Manus sử dụng thông tin đăng nhập hiện có của bạn để đọc các bài viết đầy đủ mà bạn đã đăng ký.
Du lịch & Đặt chỗ
Bạn nhảy qua lại giữa Maps và Booking.com, so sánh các lựa chọn theo cách thủ công.
Manus áp dụng các bộ lọc của bạn, so sánh các lựa chọn, điền vào biểu mẫu và tạm dừng tại bước thanh toán để bạn hoàn tất.
Mua sắm thiết bị
Bạn mở hàng chục tab, sao chép giá và lướt qua các đánh giá để tìm dấu hiệu cảnh báo.
Manus đọc mọi trang sản phẩm và đánh giá, gắn cờ các vấn đề và xuất ra một bảng so sánh sẵn sàng để ra quyết định.
Đọc thông tin tuyển dụng đối thủ cạnh tranh
Hiển thị các tin tuyển dụng công khai rời rạc.
Điều hướng thông tin việc làm, phân loại các vị trí đang mở và xây dựng một bảng tính xu hướng tuyển dụng.
Khả năng tương tự được mở rộng sang tự động hóa chuyên nghiệp. Browser Operator có thể được kích hoạt thông qua Manus API để điều khiển các thao tác web từ đầu đến cuối. Điều này đặc biệt hữu ích cho các công cụ nội bộ của công ty chưa bao giờ xây dựng API công khai, như các cổng HR cũ, hệ thống tài chính hoặc các trang web của chính phủ.


Người hướng dẫn xuyên qua web đuôi dài

Ngoài nghiên cứu, Browser Operator đã âm thầm trở thành người hướng dẫn để điều hướng những góc khó hiểu nhất của web. Giả sử bạn cần lấy một tài liệu thuế bị chôn vùi sâu ba menu bên trong một cổng thông tin chính phủ như IRIS. Manus có thể đi qua quy trình từng cú nhấp chuột và đưa ra chính xác tệp bạn cần. Hoặc hãy tưởng tượng việc điền đơn xin visa: Manus có thể định vị các tài liệu mẫu chính xác, đi qua biểu mẫu từng phần và gắn cờ các trường cần bạn nhập. Thay vì đưa cho bạn một đoạn hướng dẫn chung chung, Manus thực sự ở bên trong trình duyệt của bạn, nhấp chuột qua quy trình cùng với bạn.
Khả năng quan sát đó rất quan trọng. Bạn có thể ngắt và tiếp quản bất cứ lúc nào, thấy chính xác Manus đang ở trang nào và truy ngược lại từng bước sau khi tác vụ hoàn tất. Nếu Manus gặp một bước nhạy cảm như màn hình thanh toán, nó sẽ tạm dừng và chờ bạn xác nhận. Bạn vẫn nắm quyền kiểm soát trong toàn bộ thời gian.

Chạy ở mọi nơi, tiếp quản bất cứ lúc nào

Browser Operator không bị ràng buộc với một máy duy nhất. Nếu bạn bắt đầu một tác vụ trên máy tính xách tay làm việc, sau này bạn có thể tiếp tục trên thiết bị cá nhân và tiếp tục từ chỗ đã dừng. Để bật tính năng này, hãy mở connector My Browser trong cài đặt Manus của bạn, nhấp Configure và bật Allow Cross-Browser Tasks. Khi đã bật, Manus có thể điều khiển bất kỳ phiên trình duyệt được cấp quyền nào liên kết với tài khoản của bạn, điều này hữu ích khi bạn xác thực vào một cổng nhà cung cấp trên một máy nhưng muốn chạy nghiên cứu thực tế trên máy khác, hoặc khi bạn muốn giữ tự động hóa nặng tránh xa máy làm việc chính.
Bạn cũng có thể kích hoạt Browser Operator từ điện thoại của mình. Gửi một lệnh từ ứng dụng di động Manus khi bạn đang đi làm, và Manus sẽ khởi tạo một phiên trình duyệt trên máy tính để bàn được cấp quyền của bạn và chạy tác vụ trong nền. Quay lại bàn làm việc và công việc đã hoàn thành.


Cấp quyền cho trình duyệt của bạn trước

Trước khi bạn có thể yêu cầu Manus duyệt web thay bạn, bạn cần cấp cho nó quyền sử dụng phiên cục bộ của bạn. Việc này mất chưa đến một phút và giúp bạn hoàn toàn kiểm soát được những gì nó có thể truy cập.
1.Mở không gian làm việc Manus của bạn và điều hướng đến tab Connectors.
2.Bật connector "My Browser" và cài đặt tiện ích mở rộng trình duyệt cho Chrome hoặc Edge.
3.Bắt đầu một prompt mới yêu cầu Manus sử dụng trình duyệt của bạn.
4.Nhấp vào "Authorize" khi Manus yêu cầu quyền tiếp quản một tab mới.


3 cách để đưa Browser Operator vào hoạt động

Sau khi được cấp quyền, bạn có thể giao phó các quy trình làm việc đa tab thường ngốn cả buổi chiều của bạn. Dưới đây là ba cách tôi sử dụng Browser Operator để thực hiện nghiên cứu của mình, được sắp xếp từ một quy trình đặt phòng đơn giản đến một bảng điều khiển đọc đăng ký đầy đủ.


1. Lập kế hoạch du lịch nhóm và điền vào biểu mẫu đặt phòng

Việc lên kế hoạch cho một chuyến offsite sắp tới của nhóm thường đòi hỏi phải mở Google Maps trên một màn hình trong khi chuyển tab giữa Booking.com hoặc Airbnb trên màn hình còn lại. Bạn phải cân đối ngân sách, đánh giá và khoảng cách đến một địa điểm cụ thể, đồng nghĩa với việc đối chiếu chéo không ngừng.
Tôi giao công việc phân trang đó cho Manus. Tôi nhập prompt: "Tôi đang đặt phòng khách sạn thay cho một đồng nghiệp, vì vậy hãy bỏ qua bất kỳ thông tin tài khoản nào có thể đã được điền sẵn trên Booking.com và chỉ sử dụng thông tin khách mà tôi cung cấp sau. Sử dụng My Browser để tìm kiếm khách sạn ở trung tâm Chicago từ ngày 12-15 tháng 10 trên Booking.com. Lọc theo 4 sao trở lên, dưới 300 USD một đêm. Đối với 3 kết quả hàng đầu, hãy dùng Google Maps để kiểm tra khoảng cách đi bộ đến trung tâm hội nghị McCormick Place. Tóm tắt 3 lựa chọn hàng đầu ở đây trong cuộc trò chuyện cùng với giá, xếp hạng và thời gian đi bộ để tôi có thể chọn một."

Manus mở trang đặt phòng, thiết lập ngày và bộ lọc của tôi, sau đó điều hướng đến Maps để xác minh thời gian di chuyển, trả lại bản tóm tắt 3 lựa chọn hàng đầu gọn gàng ngay trong cuộc trò chuyện Manus. Sau khi tôi chọn một khách sạn, tôi gửi một prompt tiếp theo yêu cầu Manus bắt đầu đặt phòng và điền thông tin khách. Nó dừng lại ở màn hình thẻ tín dụng cuối cùng, cho phép tôi tiếp quản trình duyệt và hoàn tất thanh toán một cách an toàn.


2. Xây dựng danh sách rút gọn cho việc mua sắm mà không bị rối loạn tab

Khi bạn cần tìm nguồn cung cấp thiết bị với số lượng lớn, giai đoạn nghiên cứu thường ngốn nửa ngày. Bạn nhấp qua các danh sách của nhà bán lẻ, né tránh các vị trí được tài trợ, sao chép giá vào bảng tính và lướt qua hàng trăm đánh giá để cố gắng phát hiện các dấu hiệu cảnh báo về độ bền hoặc lắp ráp trước khi quyết định đặt hàng.
Tôi giao toàn bộ giai đoạn nghiên cứu cho Manus. Tôi nhập prompt: "Tôi đang tìm nguồn cung cấp bàn đứng-ngồi cho việc xây dựng văn phòng của chúng tôi. Sử dụng My Browser để tìm kiếm trên Walmart, bỏ qua các kết quả được tài trợ, và mở 4 danh sách tự nhiên hàng đầu. Đối với mỗi danh sách, hãy lấy giá và xếp hạng trung bình, và tóm tắt 3 đánh giá tiêu cực hàng đầu để tôi có thể đánh dấu bất kỳ vấn đề nào về độ bền hoặc lắp ráp trước khi chúng tôi đặt hàng số lượng lớn. Đặt tất cả vào một bảng so sánh gọn gàng mà tôi có thể đưa vào một bản tóm tắt mua sắm."

Manus mở trang bán lẻ trong tab trình duyệt đang hoạt động của tôi, lọc bỏ các danh sách được tài trợ và duyệt qua từng trang sản phẩm. Nó sử dụng khả năng 广泛研究 tự nhiên để đọc mọi đánh giá, sau đó cấu trúc giá cả, xếp hạng và các điểm đáng lưu ý thành một bảng so sánh gọn gàng. Tôi nhận được một danh sách rút gọn sẵn sàng để quyết định, có thể dán thẳng vào bản tóm tắt mua sắm mà không cần tự mở một tab nào.


3. Trích xuất bản tóm tắt nghiên cứu từ một bản tin bạn đọc trên Substack

Những phân tích thông minh nhất về các chủ đề tôi quan tâm thường nằm trong các bản tin tôi theo dõi trên Substack. Lenny's Newsletter là một trong số đó đối với tôi. Kho lưu trữ đầy ắp các bài viết về AI agents, kiếm tiền và chiến lược sản phẩm mà tôi muốn tham khảo, nhưng tôi gần như không bao giờ có thời gian ngồi xuống, mở từng bài một và rút ra những gì thực sự liên quan đến câu hỏi tôi đang giải quyết ngay lúc này.
Tôi để Manus thực hiện vòng nghiên cứu giúp mình. Tôi nhập prompt: "Tôi đang cố gắng xây dựng quan điểm về cách AI đang định hình lại việc kiếm tiền từ sản phẩm và chiến lược Agent. Hãy dùng My Browser để mở Substack, vào Lenny's Newsletter, tìm các bài đăng phù hợp nhất được xuất bản trong 30 ngày qua, đọc toàn bộ và rút ra các luận điểm chính. Tôi muốn một Dashboard trình bày các luận điểm mạnh nhất, bằng chứng hỗ trợ mà mỗi tác giả sử dụng, và các câu hỏi mở xuất hiện xuyên suốt các bài viết."

Vì Manus chạy bên trong phiên trình duyệt được ủy quyền của tôi, nó tiếp nhận từ nơi tôi đã đăng nhập. Nếu một bản tin là cái tôi đã đăng ký, Manus có thể mở các bài đăng đầy đủ giống như cách tôi sẽ làm khi bấm vào từ hộp thư riêng của mình. Nó đọc từng bài từ đầu đến cuối, sau đó tổng hợp các luận điểm thành một Dashboard gọn gàng, sắp xếp các luận điểm mạnh nhất, bằng chứng đằng sau chúng và các câu hỏi đáng đào sâu tiếp theo. Tôi nhận được một bản tóm tắt cấp độ nghiên cứu về một chủ đề tôi quan tâm, được tổng hợp từ những bài viết tôi đã theo dõi.


Một Agent Có Tay

Một AI Agent thực thụ không thuộc về bên trong một cửa sổ trò chuyện. Một Agent có năng lực cần một môi trường làm việc: một sandbox để chạy mã, một trình duyệt để điều hướng web, và các 连接器 để cắm vào các dịch vụ bên ngoài. Đây là đôi tay của Agent. Khi một Agent có thể sử dụng trình duyệt, nó có khả năng hành động dựa trên thông tin thay vì chỉ tóm tắt nó.
Vì Browser Operator hoạt động trực tiếp trong môi trường trình duyệt cục bộ của bạn, nó cũng tôn trọng các giới hạn của bạn. Không có gì nhạy cảm rời khỏi máy của bạn, và Agent chỉ truy cập những gì bạn cho phép nó thấy. Mô hình cộng tác được xây dựng trên sự minh bạch: bạn có thể xem nó làm việc, ngắt nó bất cứ lúc nào, và tiếp quản khi nó gặp một bước nhạy cảm như màn hình thanh toán. Tự động hóa không bao giờ nên là một hộp đen. Nó nên là một đối tác mà bạn tin tưởng đủ để giao công việc thực sự, biết rằng bạn luôn nắm quyền kiểm soát.

Tải xuống ứng dụng trên máy tính và thiết bị di động

Truy cập Manus mọi lúc, mọi nơi.

Tải xuống ứng dụng Manus trên máy tính và di động