大多數人都忽略了 Browser Operator。這裡告訴你如何超越表層研究。

讓 AI 幫你做研究,你會發現它很快撞牆。它呼叫搜尋 API、抓取幾個公開頁面,然後給你遞回一份基於 Google 呈現內容的禮貌摘要。而真正能影響決策的關鍵訊號,藏在登入頁、儀表板和你已經付費訂閱的服務背後,這些都是普通聊天機器人觸及不到的。
Manus 瀏覽器操作員彌合了這一差距,但完全由你掌控。在你明確授權之前,什麼都不會發生。一旦你啟用「我的瀏覽器」連接器並授予權限,Manus 就會在你本機的 Chrome 或 Edge 工作階段中執行,看到你所看到的,觸及你所能觸及的。這一關鍵轉變,即在你授權下從你自己的瀏覽器環境中工作,解鎖了一整類此前根本無法實現的研究場景。
為什麼瀏覽器操作員能挖得更深
有時,高價值的資訊就藏在你已經付費訂閱的服務背後、企業內部系統中,以及需要身分驗證的入口網站裡。這些都無法從雲端觸及。一旦你授權瀏覽器操作員,它就會在每個任務中於你本機的瀏覽器環境內工作,從而能夠操作你日常使用的網站。
場景 | 沒有 Manus | 使用 Manus 瀏覽器操作員 |
閱讀你已付費訂閱的內容 | 你只能瀏覽幾段免費預覽,從片段中拼湊資訊。 | Manus 使用你既有的登入憑證,完整閱讀你已訂閱的全部文章。 |
旅行與預訂 | 你在 Maps 和 Booking.com 之間反覆切換,手動比較各種選項。 | Manus 套用你的篩選條件,比較選項,填寫表單,並在付款環節暫停等你完成。 |
設備採購 | 你開啟數十個分頁,複製價格,瀏覽評論尋找潛在問題。 | Manus 閱讀每個產品頁面和評論,標記問題,輸出可直接用於決策的對比表格。 |
競爭對手招聘洞察 | 呈現零散的公開職缺資訊。 | 瀏覽職缺資訊,對開放職位進行分類,並產生招聘趨勢試算表。 |
同樣的能力也延伸到專業自動化領域。瀏覽器操作員可以透過 Manus API 觸發,端對端地驅動網頁操作。這對那些從未建立過公開 API 的企業內部工具尤其有用,比如老舊的 HR 入口網站、財務系統或政府網站。
長尾網路的導覽嚮導
除了研究之外,瀏覽器操作員悄然成為了導覽網路中最令人困惑角落的嚮導。比如你需要從 IRIS 這樣的政府入口網站三層選單深處取得一份稅務文件,Manus 可以一步步點擊操作,精準呈現你所需的那份文件。又或者你要填寫簽證申請:Manus 可以找到正確的範本文件,逐節引導你完成表單,並標註出需要你填寫的欄位。Manus 不再只是給你一段籠統的說明文字,而是真正進入你的瀏覽器,陪著你一起點擊完成整個流程。
這種可見性至關重要。你可以隨時打斷並接管,清楚地看到 Manus 目前所在的頁面,並在任務完成後回溯每一個步驟。如果 Manus 遇到付款介面這類敏感步驟,它會暫停並等待你確認。整個過程中你始終掌握控制權。
隨處執行,隨時接管
瀏覽器操作員不綁定單一裝置。如果你在工作筆電上啟動了一項任務,稍後可以在個人裝置上接續,從中斷處繼續。要啟用此功能,請在 Manus 設定中開啟「我的瀏覽器」連接器,點擊「設定」,然後啟用「允許跨瀏覽器任務」。開啟後,Manus 即可驅動任何與你账户關聯的已授權瀏覽器工作階段。這在你於一台裝置上登入供應商入口網站、但想在另一台裝置上執行實際研究時非常有用,或者當你希望讓繁重的自動化任務遠離主工作裝置時也很方便。
你也可以從手機上觸發瀏覽器操作員。通勤途中透過 Manus 行動應用發送一個提示詞,Manus 就會在你已授權的桌面裝置上啟動一個瀏覽器工作階段,在背景執行任務。等你回到工位時,工作已經完成。
先授權你的瀏覽器
在讓 Manus 代你瀏覽之前,你需要授予它使用本機工作階段的權限。整個過程不到一分鐘,並能讓你完全掌控它可以存取的內容。
1.開啟你的 Manus 工作區,並導覽到連接器標籤頁。
2.開啟「My Browser」連接器,並為 Chrome 或 Edge 安裝瀏覽器擴充功能。
3.發起一個新的提示詞,要求 Manus 使用你的瀏覽器。
4.當 Manus 請求接管一個新分頁的權限時,點擊「授權」。
讓瀏覽器操作員工作的 3 種方式
授權後,你就可以把那些常常占去你整個下午的多分頁工作流程交給它處理。下面是我使用瀏覽器操作員進行研究的三種方式,從簡單的預訂工作流程到完整的訂閱閱讀儀表板,依複雜度排序。
1. 規劃團隊出遊並填寫預訂表單
規劃即將到來的團隊外出活動通常需要在一個顯示器上開啟 Google Maps,同時在另一個顯示器上切換瀏覽 Booking.com 或 Airbnb。你必須在預算、評價和與特定場地的距離之間權衡,這意味著無止境的交叉比對。
我把這種翻頁工作交給 Manus。我的提示詞是:「我在代同事預訂飯店,所以請忽略 Booking.com 上可能預填的任何帳戶資訊,只使用我稍後提供的入住人資訊。使用 My Browser 在 Booking.com 上搜尋 10 月 12-15 日芝加哥市中心的飯店。篩選 4 星以上、每晚低於 300 美元的飯店。對於前 3 個結果,使用 Google Maps 查看步行到 McCormick Place 會展中心的距離。請在聊天中總結這前 3 個,附上價格、評分和步行時間,以便我挑選。」
Manus 開啟預訂網站,設定我的日期和篩選條件,然後導覽到 Maps 驗證通勤時間,並直接在 Manus 聊天中回傳一份簡潔的前 3 名總結。我選好飯店後,傳送一條後續提示詞請 Manus 開始預訂並填入入住人資訊。它會在最後的信用卡付款頁面暫停,讓我接管瀏覽器,自己安全地完成付款。
2. 在不被混亂分頁折磨的情況下建立採購候選清單
當你需要批次採購設備時,研究階段通常要占去半天時間。你需要點擊各零售商的商品列表、避開贊助廣告、把價格複製到試算表裡,並在下單前瀏覽數百條評價,試圖發現耐用性或組裝方面的隱患。
我把整個研究階段交給 Manus。我的提示詞是:「我在為我們辦公室裝修採購升降式辦公桌。使用 My Browser 搜尋 Walmart,跳過贊助結果,開啟前 4 個自然排名的商品。對每一個,擷取價格和平均評分,並總結前 3 條差評,以便我們在批次下單前發現任何耐用性或組裝問題。把所有內容整理成一份簡潔的對比表,我可以直接放進採購簡報裡。」
Manus 在我使用中的瀏覽器分頁裡開啟零售商網站,過濾掉贊助商品,並逐一處理每個產品頁面。它運用原生的廣泛研究能力閱讀每一則評論,然後將價格、評分和警示資訊整理成一張清晰的對比表。我得到了一份可直接決策的精選清單,無需親自開啟任何分頁,即可貼到採購簡報中。
3. 從你在 Substack 上閱讀的電子報中取得研究簡報
我關心的話題中最有見地的分析通常都來自我在 Substack 上追蹤的電子報。Lenny's Newsletter 就是其中之一。該封存中充滿了關於 AI Agent、變現和產品策略的文章,我希望能借鑑這些內容,但我幾乎從來沒有時間坐下來,逐一打開它們,並擷取出與我目前正在研究的問題真正相關的內容。
我讓 Manus 替我完成研究環節。我的提示詞是:「我正在嘗試形成一個關於 AI 如何重塑產品變現和 Agent 策略的觀點。使用 My Browser 開啟 Substack,前往 Lenny's Newsletter,找出過去 30 天內發布的最相關文章,完整閱讀它們,並擷取出關鍵論點。我想要一個 Dashboard,列出最有力的主張、每位作者使用的佐證,以及這些文章中出現的待解問題。」
由於 Manus 在我授權的瀏覽器工作階段中執行,它能從我已經登入的狀態繼續操作。如果是我訂閱的電子報,Manus 可以像我從自己的收件匣點擊進入時那樣,開啟完整的文章。它從頭到尾閱讀每一篇,然後將論點綜合成一個清晰的 Dashboard,整理出最有力的主張、其背後的證據,以及值得進一步深入探究的問題。我從我已經在追蹤的寫作中,得到了一份關於我所關心話題的研究級簡報。
擁有雙手的 Agent
一個真正的 AI Agent 不應被困在聊天視窗裡。一個有能力的 Agent 需要一個工作環境:一個用於執行程式碼的沙盒、一個用於瀏覽網頁的瀏覽器,以及一個用於接入外部服務的連接器。這些就是 Agent 的雙手。當一個 Agent 能夠使用瀏覽器時,它就獲得了對資訊採取行動的能力,而不僅僅是總結資訊。
由於 Browser Operator 直接在你的本地瀏覽器環境中執行,它也尊重你的界線。任何敏感資訊都不會離開你的裝置,Agent 僅存取你授權它查看的內容。這種協作模式建立在透明的基礎之上:你可以觀察它的工作過程、隨時打斷它,並在它遇到付款頁面等敏感步驟時接管控制權。自動化絕不應是一個黑盒子。它應該是一個你足夠信任、可以放心交付真正工作的夥伴,而你始終掌握著控制權。
