超越Manus幻想:我造了个真·小说Agent,实测Claude零AI率登顶

做了一个小说生成的 Agent,一句话即可生成100w字或者更多的小说,一句话即可生成小说大纲、风格、提示词等,自动生成每一章内容且进行自我的迭代优化内容(AI的左脑和右脑也是博弈上了)。

  • 一句话即可生成一百你需要字数的小说
    在这里插入图片描述

一个在尽可能优化(提示词、温度、内容参数迭代以及动态优化等)情况下的AI,对于文本的生成也是出乎预料的,但是Token的消耗确实有些大了。

  • Tokens的消耗(截取一小段)
    在这里插入图片描述

以下该程序一些ui和生成工程中的截图

  • 控制页面
    在这里插入图片描述

  • 质量评分(AI左右脑互博)
    在这里插入图片描述

  • 生成的内容
    在这里插入图片描述

  • 打印的生成日志,实时跟随
    在这里插入图片描述

四大模型实测结果

也做了三个国外和一个国内AI的实测结果:

  • Claude 依旧是这方面和代码方面的顶级,不敢相信的我找了两个平台测试,AI率居然为 0%
    在这里插入图片描述
    在这里插入图片描述

  • grok-3 也是不逊色

在这里插入图片描述

  • 接下来是 ChatGPT 使用的是 gpt-4o,效果中规中矩,但是他仍然是AI界的标杆

在这里插入图片描述

  • 接下来就是 kimi 了,因为它支持的上下文是国内目前比较适合用在小说上的,但是效果略显不足
    在这里插入图片描述
    在这里插入图片描述

没有用到 DeepSeek 的原因是它支持的上下文较短、以及思考版本耗时较长不太适合做小说,但是他仍然是深度思考界的扛把子。对于 Gemini、gpt-4.5、grok-4(刚刚发布的)只恨财力不足了。

国内模型的残酷现实

其实对比下来我们国内的AI大模型还有很长的路要走,并且我们在走的时候,别人也在前进,但愿能有多个 DeepSeek 这样的企业脱颖而出。而国内其他的一些大模型没有用的原因,有过了解的都知道,比如前几天的一个 Github 的 XX 之殇。

以至于国内AI的发展就不展开说了,即使你可能看得眼花缭乱,但是在我这我还是一只手就能数完了,懂的都懂。

关于Agent元年的思考

做这个小说的 Agent 的初衷可能和 Manus 有关吧。在 Manus 之前我知道会有 Agent 的出现,但是没想过这么早(可能更多是因为炒作吧),其实我以为 25 年会是 Agent 元年,好像为时过早了。

关于 Manus 来说,现在国内账号也清空了所有的文章,总部还迁移了,这也可能是资本的一场作秀吧,从炒到高价的邀请码,到我早期实测(效果属实也不理想)。

所以我认为 25 年似乎已经不能成为 Agent 元年了,即使有了 MCP,但是路还很长,一起期待一个真正的 Agent 元年吧!

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐