Manus 现已成为 Meta 的一部分——将 AI 带给全球的企业

资源·星期二, 5月 05

大多数人都忽略了 Browser Operator。这里告诉你如何超越表层研究。

让 AI 帮你做研究,你会发现它很快撞墙。它调用搜索 API、抓取几个公开页面,然后给你递回一份基于谷歌呈现内容的礼貌摘要。而真正能影响决策的关键信号,藏在登录页、仪表板和你已经付费订阅的服务背后,这些都是普通聊天机器人触及不到的。
Manus 浏览器操作员弥合了这一差距,但完全由你掌控。在你明确授权之前,什么都不会发生。一旦你启用「我的浏览器」连接器并授予权限,Manus 就会在你本地的 Chrome 或 Edge 会话中运行,看到你所看到的,触及你所能触及的。这一关键转变,即在你授权下从你自己的浏览器环境中工作,解锁了一整类此前根本无法实现的研究场景。


为什么浏览器操作员能挖得更深

有时,高价值的信息就藏在你已经付费订阅的服务背后、企业内部系统中,以及需要身份验证的门户网站里。这些都无法从云端触及。一旦你授权浏览器操作员,它就会在每个任务中于你本地的浏览器环境内工作,从而能够操作你日常使用的网站。
场景
没有 Manus
使用 Manus 浏览器操作员
阅读你已付费订阅的内容
你只能浏览几段免费预览,从片段中拼凑信息。
Manus 使用你已有的登录凭证,完整阅读你已订阅的全部文章。
旅行与预订
你在 Maps 和 Booking.com 之间反复切换,手动比较各种选项。
Manus 应用你的筛选条件,比较选项,填写表单,并在付款环节暂停等你完成。
设备采购
你打开几十个标签页,复制价格,浏览评论寻找潜在问题。
Manus 阅读每个产品页面和评论,标记问题,输出可直接用于决策的对比表格。
竞争对手招聘洞察
呈现零散的公开职位信息。
浏览职位信息,对开放岗位进行分类,并生成招聘趋势电子表格。
同样的能力也延伸到专业自动化领域。浏览器操作员可以通过 Manus API 触发,端到端地驱动网页操作。这对那些从未构建过公开 API 的企业内部工具尤其有用,比如老旧的 HR 门户、财务系统或政府网站。


长尾网络的导航向导

除了研究之外,浏览器操作员悄然成为了导航网络中最令人困惑角落的向导。比如你需要从 IRIS 这样的政府门户三层菜单深处获取一份税务文件,Manus 可以一步步点击操作,精准呈现你所需的那份文件。又或者你要填写签证申请:Manus 可以找到正确的模板文档,逐节引导你完成表单,并标注出需要你填写的字段。Manus 不再只是给你一段笼统的说明文字,而是真正进入你的浏览器,陪着你一起点击完成整个流程。
这种可见性至关重要。你可以随时打断并接管,清楚地看到 Manus 当前所在的页面,并在任务完成后回溯每一个步骤。如果 Manus 遇到付款界面这类敏感步骤,它会暂停并等待你确认。整个过程中你始终掌握控制权。

随处运行,随时接管

浏览器操作员不绑定单台设备。如果你在工作笔记本上启动了一项任务,稍后可以在个人设备上接续,从中断处继续。要启用此功能,请在 Manus 设置中打开「我的浏览器」连接器,点击「配置」,然后启用「允许跨浏览器任务」。开启后,Manus 即可驱动任何与你账户关联的已授权浏览器会话。这在你于一台设备上登录供应商门户、但想在另一台设备上执行实际研究时非常有用,或者当你希望让繁重的自动化任务远离主工作设备时也很方便。
你也可以从手机上触发浏览器操作员。通勤途中通过 Manus 移动应用发送一个提示词,Manus 就会在你已授权的桌面设备上启动一个浏览器会话,在后台运行任务。等你回到工位时,工作已经完成。


先授权你的浏览器

在让 Manus 代你浏览之前,你需要授予它使用本地会话的权限。整个过程不到一分钟,并能让你完全掌控它可以访问的内容。
1.打开你的 Manus 工作区,并导航到连接器标签页。
2.开启 "My Browser" 连接器,并为 Chrome 或 Edge 安装浏览器扩展。
3.发起一个新的提示词,要求 Manus 使用你的浏览器。
4.当 Manus 请求接管一个新标签页的权限时,点击 "授权"。


让浏览器操作员工作的 3 种方式

授权后,你就可以把那些常常占去你整个下午的多标签页工作流交给它处理。下面是我使用浏览器操作员进行研究的三种方式,从简单的预订工作流到完整的订阅阅读仪表板,按复杂度排序。


1. 规划团队出行并填写预订表单

规划即将到来的团队外出活动通常需要在一个显示器上打开 Google Maps,同时在另一个显示器上切换浏览 Booking.com 或 Airbnb。你必须在预算、评价和与特定场地的距离之间权衡,这意味着无止境的交叉对照。
我把这种翻页工作交给 Manus。我的提示词是:"我在代同事预订酒店,所以请忽略 Booking.com 上可能预填的任何账户信息,只使用我稍后提供的入住人信息。使用 My Browser 在 Booking.com 上搜索 10 月 12-15 日芝加哥市中心的酒店。筛选 4 星及以上、每晚低于 300 美元的酒店。对于前 3 个结果,使用 Google Maps 查看步行到 McCormick Place 会展中心的距离。请在聊天中总结这前 3 个,附上价格、评分和步行时间,以便我挑选。"

Manus 打开预订网站,设置我的日期和筛选条件,然后导航到 Maps 验证通勤时间,并直接在 Manus 聊天中返回一份简洁的前 3 名总结。我选好酒店后,发送一条后续提示词请 Manus 开始预订并填入入住人信息。它会在最后的信用卡支付页面暂停,让我接管浏览器,自己安全地完成付款。


2. 在不被混乱标签页折磨的情况下建立采购候选清单

当你需要批量采购设备时,研究阶段通常要占去半天时间。你需要点击各零售商的商品列表、避开赞助广告、把价格复制到电子表格里,并在下单前浏览数百条评价,试图发现耐用性或组装方面的隐患。
我把整个研究阶段交给 Manus。我的提示词是:"我在为我们办公室装修采购升降式办公桌。使用 My Browser 搜索 Walmart,跳过赞助结果,打开前 4 个自然排名的商品。对每一个,提取价格和平均评分,并总结前 3 条差评,以便我们在批量下单前发现任何耐用性或组装问题。把所有内容整理成一份简洁的对比表,我可以直接放进采购简报里。"

Manus 在我活动的浏览器标签页中打开零售商网站,过滤掉赞助商品,并逐一处理每个产品页面。它使用原生的广泛研究能力阅读每一条评论,然后将价格、评分和警示信息整理成一张清晰的对比表。我得到了一份可直接决策的精选清单,无需亲自打开任何标签页,即可粘贴到采购简报中。


3. 从你在 Substack 上阅读的简报中获取研究简报

我关心的话题中最有见地的分析通常都来自我在 Substack 上关注的简报。Lenny's Newsletter 就是其中之一。该归档中充满了关于 AI Agent、变现和产品策略的文章,我希望能借鉴这些内容,但我几乎从来没有时间坐下来,逐一打开它们,并提取出与我目前正在研究的问题真正相关的内容。
我让 Manus 替我完成研究环节。我的提示词是:"我正在尝试形成一个关于 AI 如何重塑产品变现和 Agent 策略的观点。使用 My Browser 打开 Substack,前往 Lenny's Newsletter,找到过去 30 天内发布的最相关文章,完整阅读它们,并提取出关键论点。我想要一个 Dashboard,列出最有力的主张、每位作者使用的支持证据,以及这些文章中出现的待解问题。"

由于 Manus 在我授权的浏览器会话中运行,它能从我已经登录的状态继续操作。如果是我订阅的简报,Manus 可以像我从自己的收件箱点击进入时那样,打开完整的文章。它从头到尾阅读每一篇,然后将论点综合成一个清晰的 Dashboard,梳理出最有力的主张、其背后的证据,以及值得进一步深入探究的问题。我从我已经在关注的写作中,得到了一份关于我所关心话题的研究级简报。


拥有双手的 Agent

一个真正的 AI Agent 不应被困在聊天窗口里。一个有能力的 Agent 需要一个工作环境:一个用于运行代码的沙盒、一个用于浏览网页的浏览器,以及一个用于接入外部服务的连接器。这些就是 Agent 的双手。当一个 Agent 能够使用浏览器时,它就获得了对信息采取行动的能力,而不仅仅是总结信息。
由于 Browser Operator 直接在你的本地浏览器环境中运行,它也尊重你的边界。任何敏感信息都不会离开你的设备,Agent 仅访问你授权它查看的内容。这种协作模式建立在透明的基础之上:你可以观察它的工作过程、随时打断它,并在它遇到支付页面等敏感步骤时接管控制权。自动化绝不应是一个黑箱。它应该是一个你足够信任、可以放心交付真正工作的伙伴,而你始终掌握着控制权。

下载桌面端和移动端应用

随时随地访问 Manus。

下载 Manus 的桌面端和移动端应用