超越Manus幻想:我造了个真·小说Agent,实测Claude零AI率登顶
做了一个小说生成的 Agent,一句话即可生成100w字或者更多的小说,一句话即可生成小说大纲,自动生成每一章内容且进行自我的迭代优化内容,AI的左脑和右脑也是博弈上了。
超越Manus幻想:我造了个真·小说Agent,实测Claude零AI率登顶
做了一个小说生成的 Agent,一句话即可生成100w字或者更多的小说,一句话即可生成小说大纲、风格、提示词等,自动生成每一章内容且进行自我的迭代优化内容(AI的左脑和右脑也是博弈上了)。
- 一句话即可生成一百你需要字数的小说

一个在尽可能优化(提示词、温度、内容参数迭代以及动态优化等)情况下的AI,对于文本的生成也是出乎预料的,但是Token的消耗确实有些大了。
- Tokens的消耗(截取一小段)

以下该程序一些ui和生成工程中的截图
-
控制页面

-
质量评分(AI左右脑互博)

-
生成的内容

-
打印的生成日志,实时跟随

四大模型实测结果
也做了三个国外和一个国内AI的实测结果:
-
Claude 依旧是这方面和代码方面的顶级,不敢相信的我找了两个平台测试,AI率居然为 0%


-
grok-3 也是不逊色

- 接下来是 ChatGPT 使用的是 gpt-4o,效果中规中矩,但是他仍然是AI界的标杆

- 接下来就是 kimi 了,因为它支持的上下文是国内目前比较适合用在小说上的,但是效果略显不足


没有用到 DeepSeek 的原因是它支持的上下文较短、以及思考版本耗时较长不太适合做小说,但是他仍然是深度思考界的扛把子。对于 Gemini、gpt-4.5、grok-4(刚刚发布的)只恨财力不足了。
国内模型的残酷现实
其实对比下来我们国内的AI大模型还有很长的路要走,并且我们在走的时候,别人也在前进,但愿能有多个 DeepSeek 这样的企业脱颖而出。而国内其他的一些大模型没有用的原因,有过了解的都知道,比如前几天的一个 Github 的 XX 之殇。
以至于国内AI的发展就不展开说了,即使你可能看得眼花缭乱,但是在我这我还是一只手就能数完了,懂的都懂。
关于Agent元年的思考
做这个小说的 Agent 的初衷可能和 Manus 有关吧。在 Manus 之前我知道会有 Agent 的出现,但是没想过这么早(可能更多是因为炒作吧),其实我以为 25 年会是 Agent 元年,好像为时过早了。
关于 Manus 来说,现在国内账号也清空了所有的文章,总部还迁移了,这也可能是资本的一场作秀吧,从炒到高价的邀请码,到我早期实测(效果属实也不理想)。
所以我认为 25 年似乎已经不能成为 Agent 元年了,即使有了 MCP,但是路还很长,一起期待一个真正的 Agent 元年吧!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)