IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    通用 Agent 向左,Agentic Browser 向右

    特工宇宙发表于 2025-05-27 09:28:49
    love 0

    在AI技术浪潮下,通用Agent与Agentic Browser成为两大热门方向。Manus作为通用Agent的代表,专注于打造智能代理完成任务;而Fellou则开创了Agentic Browser的新路径,致力于构建智能浏览器新生态。本文将深入探讨这两者的发展差异、技术特点及未来潜力,揭示AI浏览器领域的创新与变革。

    “没有人相信的事物,才不会有那么多的竞争。”

    由于 Agent 和 MCP 的爆火,整个四月都处于一种非常繁忙的状态,学习、测评、分享…以至于 Fellou 团队邀请我们前往北京线下发布会,也未能抽出身。

    我们此前曾深度测试过 Fellou 团队开源的 Eko 框架,也跟 Fellou 创始人谢扬有许多共同好友,不过和他本人交流较少。

    在我的印象里,谢扬非常符合我认为的投资人眼里的“小天才”形象:13 岁开始编程,长期专注于云计算、身份认证、AI 等领域,入选福布斯亚洲 30 Under 30,早年曾任字节跳动核心技术人员,阿里云 MVP,连续创业者…

    最近 Fellou 发布后,又从许多朋友那儿,包括王登科的文章中,看到了谢扬和 Fellou 背后更加丰盈的创业故事和理念。

    五一假期终于得空,深度体验了下 Fellou,下面是我的一些体验和理解。

    01

    很多人会拿 Manus 来对比,尽管解决的都是一些通用任务,技术实现方式也很相近,但在我看来 Manus 和 Fellou 走的是不同的两条路。

    Manus 是全球首个通用 Agent,Genspark 和扣子空间等是这个方向;Fellou 是全球首个 Agentic Browser,Dia 和 Browser Operator 等是这个方向。

    Manus 团队此前的分享中,有三条结论让我印象深刻。

    1. AI 浏览器不是在浏览器里加 AI,而是做给 AI 用的浏览器;

    2. 操作 GUI 不应该抢夺用户的控制权,而是让 AI 有自己的虚拟机;

    3. Attention 不是 all you need,解放用户的 Attention 才能重新定义 DAU。

    Manus 专注的是做 Agent 本身,做浏览器不过也只是为了给 Agent 配了个工具,本质上是为了让 Agent 更好的完成任务,正如官网 slogan 所说:“在你安心休息的同时,一切都能妥善完成。”

    Manus 和 Fellou 都做了 Browser、Agent、Workflow 这几件事情,其中 Manus 把 Browser 和 Workflow 作为 Agent 执行 Action 的工具。

    而 Fellou 的产品故事会更宏大一些,做的是下一代智能的浏览器,更准确的说,是基于浏览器的全新系统。更详细来说,是融合了各种 Agent 和 Workflow 的 AI 能力,构建于浏览器之上的人机协同的新环境。

    全球每个月有超过 50 亿人在使用浏览器,并且深入我们生活各处。我们很难去颠覆掉这种用户习惯,但可以用 AI 去重塑浏览器,Fellou 做的就是这样一件事情。

    02

    最近看到一些人吹捧 Dia 浏览器,着实觉得有些尴尬。我们在 Dia 刚刚内测时就进行了体验,现在版本功能跟装个 Monica 插件体验差距不大,产品完成度不如豆包浏览器。

    不是说 Dia 不好,而官网视频里介绍的真正厉害的 Agentic 功能,还只是期货没有上线。但 Fellou 先做了出来。

    目前核心功能包括:

    1. 跨平台深度搜索

    在侧边栏 Agent 会进行任务拆解和规划,待你确认后即可进行并行批量搜索,大大加快了研究速度,并且可生成可共享的可视化报告网页。

    其中 Fellou 研发了一个 Shadow window(影子窗口),即给 Agent 的虚拟工作环境。在 Search 任务下触发,不会影响用户其他操作。

    Deep Search 功能比较常规,但得益于 Shadow window,Fellou 既可以像 Genspark 那样快速的并行搜索,又能像 Manus 那样访问许多需要登陆网站账号才能进行的操作。

    最后也可以将报告生成永久链接进行分享。

    2. 跨网页执行任务

    Fellou 做了 GUI Agent,可以自动规划任务、调用工具并执行操作,从而协调多个 Web 界面内功能,实现各种浏览器内的任务。

    包括购物、预约会议、发送电子邮件和发布文章等。比如让它上小红书给「特工少女」最近的更新内容点个赞,Fellou 精准的实现了这一需求。

    此外,Fellou 官方还给出了许多 showcase,包括打开亚马逊将商品添加到购物车、打开 Linkedin 发布文章等等。

    https://fellou.ai/blog/post/fellou-introduction/3. 智能感知浏览器环境Fellou 可以在对话过程中自动识别打开的网页作为上下文。还允许用户通过@标记来比较和分析多个网页。

    此外,用户可以将图片直接拖放到聊天窗口中,无需复制粘贴,从而实现无缝交互。4. 支持异步操作Fellou Agent 执行分配的任务时,用户可以在底部切换标签组以继续处理其他任务。

    03

    说实话,Fellou 不是完美的。首先,上手门槛还挺高的,对于从来没用过 AI 浏览器的用户来说肯定是懵的。开局一个搜索框,剩下全靠自己折腾。

    什么时候会操作影子空间?什么时候会调用本地浏览器?什么时候会基于现有网页内容来回答?很多功能我们也是体验了很久才摸清。

    Fellou 不能像 Dia 一样无缝同步现有浏览器的 Cookie 数据,各个网站还需要手动登录有些麻烦。此外,Fellou 能力很强,就是很多任务执行的很慢…Agentic Browser 用户体验不佳?现在下结论还为时尚早。

    事实上,Fellou 做的 GUI Agent 已经是行业领先水平,此前开源的 Eko 框架也是在业内饱受好评。整一个 Agentic Browser 的发展还处于早期,与其急于评判,不如共同期待这场浏览器范式转变中的更多可能。

    无论是 Fellou 还是 Dia,官方都已经预告了后续更加智能的能力,可以一起期待一下。BTW,创始人谢扬本周六在奇绩创坛有个关于 Agentic System 的分享,如果想了解 Fellou 背后故事的可以报名。

    本文由人人都是产品经理作者【缱绻怡然】,微信公众号:【特工宇宙】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

    题图来自Unsplash,基于 CC0 协议。



沪ICP备19023445号-2号
友情链接