一、开始用的时候:确实厉害

我第一次用是Opus 4.0。当时我有个老项目,代码乱,文档也没了,重构起来头疼。我把整个代码库扔给它,让它看看怎么整理。它居然真的接下了这个活,一步一步地生成计划、改代码、写注释,搞了好几个小时没乱。这让我觉得,它和别的AI不太一样,更像一个能长时间专注干一件复杂活的搭档。后来看到它在那什么SWE-bench测试里排第一,我觉得挺合理,就是那个感觉。

二、升级之后:更强了,但也有点不一样

后来它更新到了4.1,又到了现在的4.6。感觉很明显,它在往“专业工具”那个方向猛跑。

  • 好的方面:让它干正经专业活,它更稳了。比如我让它看一份公司的财务数据,它后来给我的不是简单总结,而是一个有分析、有图表、还带了点风险提示的PPT草稿,像模像样的。写一些复杂的算法或者处理法律条文,也更少出低级错误,像个懂行的新手

  • 奇怪的方面:但我也发现,以前让它帮忙写个产品介绍或者想句广告词,它偶尔还能冒出点让人眼前一亮的句子。现在4.6版本写出来的东西,特别规范、准确,但也特别平淡,没啥意思了。我猜是开发团队故意这么调的,为了让它更靠谱,牺牲了点“文采”。这对干正事可能是好事,但有时候我需要点创意,就得找别的帮手了。

三、我用下来的优缺点总结

直接列个单子吧,比较清楚:

优势(为什么我愿意付钱用):

  1. 复杂任务最能打:目前我觉得,需要长时间思考、多步骤的编程和数据分析,它是最靠谱的。能连续认真工作几小时,这一点别的模型比不了。

  2. 学新领域很快:我不太懂金融法律,但它能很快明白我要什么,给出一个专业框架里的东西,帮我省了大量查资料的时间。

  3. 结果稳定,安全方面操心少:输出不太会突然抽风,而且听说安全标准高,处理敏感信息时相对放心点。

麻烦的地方(你得忍着点):

  1. :它的API调用费用明显比其他模型高。我现在就只把最难、最值钱的任务给它,普通的活都用便宜模型。

  2. :想得仔细就得花时间,处理大任务时你得等,而且等的过程中它还在“烧钱”(算token)。

  3. 不是所有事都最强:有点反直觉,但在一些非常具体的小任务上(比如写某种特定格式的脚本),我用免费的Claude Sonnet试过,结果可能差不多,甚至更快。所以,别迷信“最贵的就是最好的”

四、我是怎么用它干活的

我自己摸索出一个用法,不一定对,仅供参考:

  • Opus 4.6当“专家”用:对付系统架构设计、老代码重构、深度技术调研这些最费脑子的核心难题,我就派它上。把它当成一个水平很高、不要工资、也不会累的同事。

  • Sonnet当“助手”用:日常的debug、解释代码、写简单文档、查资料这些零碎活,都用Claude Sonnet,速度快,成本低,效果足够。

  • 自己当“老板”:它再厉害,输出来的东西我也得仔细检查一遍。它是个超级辅助,但做决定和负责的人必须是我自己。

最后说两句

总的来说,Claude Opus 4系列,特别是4.6,是我用过在严肃、复杂的专业工作上最能帮上忙的AI。它从一个好用的工具,变成了一个在特定领域(比如编程、金融分析)能力很强的“专业伙伴”。代价可能就是,它没那么有趣、没那么天马行空了。

如果你经常要处理那种需要烧脑几小时的专业任务,并且觉得提升效率比省钱更重要,那它值得一试。但最好了解一下它的脾气,把它用在刀刃上。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐