一个可以操控浏览器的AI Agent诞生了,智谱新出的AutoGLM沉思有点东西。
这个流程可以说,相当繁琐,现在用 AutoGLM 沉思,只需要轻轻输入:“我要去香港玩3天,请帮我设计旅游攻略,注意每个景点都要从小红书上查看网友的真实评论。这么说,你可能不够直观,举个栗子,我们人类可以一边思考,一边动手,比如我一边脑子里想着接下来要写啥,一边手在狂敲键盘,有了文字的输出。AutoGLM 沉思就会自动打开浏览器,搜索目的地小红书上的种草攻略,甚至帮我翻看评论区,然后帮我做一波整理
大家好,我是苍何。
你或许玩过 AI,但你有体验过 AI 帮你自动操控浏览器完成需求的丝滑吗?
刚体验完智谱新出的 AutoGLM 沉思,我终于解放了双手,这是一个会自动打开并浏览网页,自动检索分析数据,然后直接给精准结果的 Agent。
这么说,你可能不够直观,举个栗子,我们人类可以一边思考,一边动手,比如我一边脑子里想着接下来要写啥,一边手在狂敲键盘,有了文字的输出。
而 AI 不缺思考能力,比如 DeepSeek R1、Deep Research 等都可以做到深度思考,但却缺少真实的动手能力。
AutoGLM 沉思能一边进行复杂思考,一边执行操作。真正做到边想边干。

比方说,我要做旅游规划,通常需要我在小红书上搜索后进行整理,为了防止踩坑,我还要特意看看大家评论(一刷就是一个下午)。

这个流程可以说,相当繁琐,现在用 AutoGLM 沉思,只需要轻轻输入:“我要去香港玩3天,请帮我设计旅游攻略,注意每个景点都要从小红书上查看网友的真实评论。”
AutoGLM 沉思就会自动打开浏览器,搜索目的地小红书上的种草攻略,甚至帮我翻看评论区,然后帮我做一波整理,直接给我想要的结果。
而我全程只需要喝咖啡吃面包,全程无需动手,体验葛优躺的同时很快就拿到了结果🐶。

让我想不到的是,他连笔记里面的图片视频也一顿给我总结分析。比如这里提醒我要带充电宝这一点:

是出自于这一条笔记图片中的这一小点:

妈呀,太细了吧,爱了爱了。
甚至他还会去搜刮评论,一旦出现有避坑建议,会迅速搜集并分析,最终给到我一分超高质量的旅行攻略。
![[香港三日游.mp4]]
据智谱表示,AutoGLM 沉思背后是智谱自主研发的全栈大模型技术,融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力,以及AutoGLM的自动执行能力。

其中新的深度思考模型 GLM-Z1-Air 在性能表现上,可以与DeepSeek-R1(671B,激活37B)媲美。
看了下官方提供的在GPQA 等基准测试中的评估结果,展现了较为强大的数理推理能力。这堆复杂任务处理来说提供了很大的底座支持。

看了下推理速度上和 R1 的对比,GLM-Z1-Air相比 R1 提升了8倍,成本可以降低至1/30。

而且啊,GLM-Z1-Air可在消费级显卡上运行,这让我的心又开始蠢蠢欲动了。

最为关键的是,智谱称上述模型将于4月14日开源。你没听错,开源。悄悄点了个👍🏻。
很有意思,让机器不仅能够思考,还能主动行动,实现“边想边干”的目标。能像人一样深度思考及感知世界,最后调用和操作工具,完成复杂任务。
现在大家可以直接去体验一波 AutoGLM 沉思,方法也很简单,搜索智谱清言,点击下载桌面客户端。

打开客户端直接安装。
这个时候需要注意关闭 chrome 浏览器,而且确保电脑已安装最新 chrome,因目前AutoGLM沉思版仅支持 chrome 的控制并在安装时会自动安装一个浏览器插件。
安装后会自动给您安装智谱清言插件,首次安装插件后,需要手动开启一次chrome浏览器,启用插件,并重启浏览器。

当然如果自动安装失败,你也可以直接手动安装。不出意外的话,打开客户端,你就可以看到AutoGLM沉思,直接就可以使用啦。

为了让你更直观感受他的动手能力,我做了个 case,我让他给我寻找对标账号并帮我生成最近三天的小红书文案选题。
提示词如下:
我现在要新做一个小红书账号,定位为职场博主.
请帮我找出10个小红书对标账号,对标账号要求是近期一个月内有过爆款的账号.
然后分析评论区,整理用户的评论,结合对标账号选题和评论区痛点问题,帮我规划未来3天的选题。
先是进行了一轮思考,然后就开始按照要求来小红书上搜索对标热门博主了。(关键还给我分析了用户的各种评论,这操作真骚,哈哈哈!)
+视频。
最终一顿输出后,直接给我生成了我要的结果。10个小红书对标职场博主账号:

接下来还有对标账号的内容特点分析,这分析直戳要害啊有没有。

好家伙,最为绝的是他给我整了了对标账号下面的评论,梳理了用户痛点问题,大家感受一下:

最后直接帮我订好了未来 3 天的选题,有了这,做小红书好像也没那么难了吧:

我的天,这一波操作下来,节省下来不少摸鱼的时间啊。
官方还提供了一些很有意思的 case,比如让 AutoGLM 沉思来进行行业研究分析:
请挖掘当前 A 股市场中与具身智能相关的热点主题。
搜集最近三个月内的实时行业新闻、公开数据、权威报道和专家评论,结合关键财务和经营指标进行量化分析,形成一份主题投资深度研报,包括趋势预测、竞争格局、投资策略和风险分析。
+视频
说实话,有了 AutoGLM 沉思,做研究报告,真的只需要动动嘴,一份完美的报告就蹭呈现在眼前了。
这还没结束,我们经常需要一系列的教程来辅助学习,比如现在想要给我那只有 10 岁的小侄子做个教程,让他也能快速快速做一个 AI 聊天机器人。
你只需要在 AutoGLM 中轻轻输入这个提示词:
请设计一个详细的教程,教导有一定 Python 基础的 10 岁儿童用 Python 调用智谱的免费大模型。
最好能让这名儿童能做出一个图形化界面的 AI 聊天机器人
一顿噼里啪啦各种操作,一份教程就写好了?
+视频
太省事了,真的太省事了。
动手能力是 AutoGLM 沉思与 Deep Research 最大的区别。它能够像人类一样自动操作和浏览网页,查看如知网、小红书、公众号、京东、巨潮资讯等优质但不对外开放API的信源。同时还具有多模态理解能力,能够理解网页上的图文信息,使研究更充分。
讲真,体验完 AutoGLM 沉思,我陷入了沉思。
我在想,一个从内到外所有模型技术都是国产自研的产品,硬是给了我很多的震撼。
要知道,OpenAI 的 Deep Research 每月会员价格 200 刀,只能提问 120 个问题。
而智谱的 AutoGLM 沉思免费不限量。而且除了Deep Research,还拥有动手能力,能够补充更多重要、高质量信源。
这谁顶得住阿?
感谢智谱,真是让我们普通人也能用的上用的起 Deep Research,真正的AI Agent究竟是怎样的,也许这也正是我们期待已久的破晓时刻。
好啦,以上全文 4200 字,20 张图,如果这篇文章对你有用,可否点个关注,给我个三连击:点赞、转发和再看。若可以再给我加个⭐️。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)