刚刚以主创身份在 GOSIM 大会上做了个报告《MarkdownFlow,下一代 HTML》,获得国内外专家不错的反响,尤其还引起了 W3C 的关注。

MarkdownFlow 推出才一个月,靠自然流量,已经吸引了超过 1000 名用户,展现了一些价值。在这里,系统总结下 MarkdownFlow 的来龙去脉,能做什么,有哪些已经验证的使用场景,和还有哪些待探索的领域。期待更多人能来接入、开发这个开源项目。

1

MarkdownFlow 是什么

设计 MarkdownFlow 的初衷是,让我们在使用软件、游戏,阅读小说、新闻、课程,观看影视、音乐等等内容的时候,得到的不再是所有人千篇一律,而是千人千面个性化生成的。并且,我们还可以与内容互动,提供我们的反馈,让接下来的生成更个性化。

ChatGPT 这样的纯对话机器人现在就提供纯个性化的内容。但只有我们的提示词和模型的参数能影响输出,所以我们不会有观赏他人作品的同等感受。比如,让 AI 给我们讲个故事,我们无法和朋友一起讨论这个故事,因为朋友的 AI 不能输出同样的故事。

所以,我们认为未来的内容模式应该是「人类创作,AI 演绎」。也就是仍然由人做创作(当然,可以让 AI 辅助创作),但创作的产出物并不是直接给人看的,而是指挥 AI 如何把自己的创作更好地个性化演绎给每个人。

这就像曹雪芹写了个剧本,定义了大观园的世界观、核心人物和主线剧情,然后 AI 就像一个说书人或导演,为读者、观众搞二创:

  • 你不喜欢那么多看不懂的诗?没问题,全是现代白话。

  • 你不喜欢苦情喜欢爽文?那就缩小林黛玉的篇幅,增加王熙凤的戏份。

  • 你爱武斗不爱文斗?那就把「菊花诗会」改成「菊花比武大会」。

  • 你喜欢大团圆结局?抱歉,曹雪芹要求贾宝玉和林黛玉就是不能结婚,贾家必须没落。但可以把你嵌入故事情节,成为一个原创角色,尽享大观园抄家的好处。

  • 影视演员更是可以尽情挑选。谁美谁丑随便指派,让自己上去演都行。

一切内容,包括软件、游戏,都可以这么来,实现「一次创作,千人千面」。

如果套用流行概念的话,MarkdownFlow 就是一种生成式 UI(GenUI)。但与传统软件工程的软件设计理念不同,我们认为数据和 UI 不应该分开来,而是一起融合为内容,才能最具表现力。

内容 = 数据 + UI。UI 是数据的表达,数据是 UI 的灵魂。

2

MarkdownFlow 能干什么

最直观的,请访问https://play.mdflow.run/share?id=3c71cf4e48d25d27c5d73fc319909ee7。这个页面就是用 MarkdownFlow 制作的,能基于你的背景,针对性介绍 MarkdownFlow 能干什么。

作为可以类比为 HTML 的内容格式标准,MarkdownFlow 能承载的可能性非常多。但初代版本只有文本和最基础的交互能力,更多能力还在开发中。可是即便如此,已经有很多成功的案例了,这里列举几个比较受欢迎的。

  • https://ai-shifu.cn - 用 MarkdownFlow 制作了三门课:AI 通识、AI 编程和 AI 绘画。

  • 娄嘉鹏老师制作的 openEular 作业,可以匹配学生学习程度提供不同难度的项目,即便相同难度内容也会不一样,彻底杜绝抄袭:https://play.mdflow.run/share?id=97c4f7333773e25fb3b190d9df962dc1

  • 未具名网友制作的旅行规划智能体:https://play.mdflow.run/share?id=314c56fe17ae029804e894fdb7e5e03a

  • 未具名网友制作的基于心情推荐奶茶智能体:https://play.mdflow.run/share?id=a4dcd48b477f7893ee8a45cf5fb9dd22

  • 未具名网友制作的 RTGO 提示词生成助手:https://play.mdflow.run/share?id=b43e4efce5acce740f154809d89bf67c

  • 未具名网友制作的用热点话题撰写各种形式的剧本:https://play.mdflow.run/share?id=20ed93fce46d971d4f78971979f8535b

  • 晓玲制作的给孩子讲故事:https://play.mdflow.run/share?id=4d1019df57510b88da8dbcc659a639d1

  • 晓玲制作的可以基于你的背景个性化介绍 MarkdownFlow 能干什么:https://play.mdflow.run/share?id=3c71cf4e48d25d27c5d73fc319909ee7 (值得一提的是,这个介绍所用的知识,只是 MarkdownFlow 发布会语音识别的文字稿,而且没做任何精校,就能呈现非常好的效果。到 play.mdflow.run 可以看到 MarkdownFlow 源码)

3

为什么是 MarkdownFlow?

必须用以终为始的理念,才能讲清楚 MarkdownFlow 的价值。

假想未来(可能就是2-5年后)的应用形态。即便还没有机器人常伴左右,我们和手机、电脑、眼镜或别的新型硬件设备的交互,应该都不再是来来回回切换 App 了,而是统一到一种私人智能助理。

Siri 就是这个助理的基本形态。ChatGPT、Kimi 甚至美团的小美,都在想成为这个助理。我们说话、打字都是发给 ta,ta 也控制着屏幕和喇叭,管理着我们看到听到的一切。

这个助理并非万能,而是懂得怎样当好包工头,把任务分解派发给智能体互联网上(Agentic Web)上最合适的智能体们,再综合大家的执行结果,生成最终的内容,呈现给主人。

这种逻辑下,需要智能体们能高效的对话(通讯),就需要有连接协议和内容格式标准。

MCP、ANP、A2A 等是连接协议,MarkdownFlow 就是内容格式。

这种内容的源头由人类撰写,但通过智能体互联网进行传播和加工,最后呈现给人类。所以它需要具备如下特性:

  • 人和 AI 皆可读写。HTML、JSON 都不满足人可以方便地读写,所以我们选择了 Markdown 作为基底。AI 也天然对 Markdown 非常友好。

  • 在确定性和不确定性之间提供最佳平衡。AI 有很大的不确定性,但这是智能的特点;代码有很强的确定性,所以很机械。需要能把 AI 的不确定性发挥为智能和创造力,但也在需要确定性的场景里提供100% 靠谱的处理能力。所以我们扩展了 Markdown 的语法,提供了确定内容输出和确定的交互控制。

  • 多模态的终端呈现。借助 AI 的能力,这一点并不难达到。而且,随着 AI 越来越强,效果会越来越好,成本会越来越低。

这里最难的,是找到确定和不确定之间的最佳平衡。因为有 AI 师傅一年的课程制作和授课经验,所以我们可以非常自信地说,在纯文本场景,只要提供最基本的交互控件(按钮和输入框),和必须完全遵从创作者原文的输出能力,就可以满足 95% 以上的场景。所以,在这两个方面,我们定义了非常简单的语法:

  1. ?[%{{选择}} 是 | 否 ]就是两个按钮

  2. ?[%{{爱好}} 游戏 || 读书 || 电影 || 旅行 ]就是 4 个复选框

  3. ?[%{{姓名}}...你的名字?]就是输入框

  4. ===一次创作,千人千面===就是确定内容输出

其中{{选择}}是和 Dify、Coze 等一样的变量。

以上语法之外的部分,就全部是提示词,靠提示词工程来控制模型的发挥。

4

后续计划

AI 会越来越强,成本越来越低,让文字、声音和视频的个性化生成效果越来越好。让每个人看到的数字世界都是为自己量身定制的,很快就会实现。

人人都用MarkdownFlow 表达世界的共同内核,再经个人助理做个性化演绎,是我们的目标。为此,我们会继续开发如下能力:

  1. 对接 MCP。这样 MarkdownFlow 就是一个自带记忆,可以调用工具的智能体了

  2. 受控的 HTML。通过某种方式,让 MarkdownFlow 的界面生成意图匹配实际终端的预设。也就是 MarkdownFlow 定义数据和能力,具体场景定义 UI 规则,靠模型实时生成界面。这一点,是我们和很多 GenUI 方案最大的不同

  3. 实时音频流。没有声音,再好的戏也出不来

  4. 对接世界模型。世界模型可能会成为未来数字世界的基底。现在还很不成熟,但未来可期

总之,MarkdownFlow 抓住了提示词是控制 AI 唯一手段这个关键点,用提示词来表达创作者意图,用简单的语法提升确定性,降低创作门槛,向消费者提供千人千面的个性化体验,更有机会借力语言模型进化、多模态模型的成熟和智能体互联网的建设,成为未来一切内容创作的格式标准。

访问 https://markdownflow.ai/ 可以了解更多。欢迎到 https://github.com/ai-shifu/markdown-flow 加星!

点击阅读原文了解 MarkdownFlow 能为你做什么。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐