一、背景

高考结束,暑假即将到来,高中生旅行规划面临三大痛点:​​预算有限(2000元内)、安全保障需求高、行程需兼顾舒适与趣味性​​。传统手工制作旅游计划耗时耗力,而大模型生成HTML界面可快速输出可视化方案。刚好AiPy(0.2.1)的官方大模型广场——Trustoken接入了豆包大模型,所以本次评测使用​​AiPy​​调用三大主流模型API,围绕​​代码质量、内容适配性、视觉设计​​三大维度展开横向对比。

评测对象:

📌 ​​deepseek/deepseek-r1-0528​​(深度求索开源模型)

📌 ​​qwen3-235b-a22b​​(阿里云通义千问)

📌 doubao-seed-1.6-250615​​(字节跳动旗下AI产品)

大模型配给网站:https://www.trustoken.cn/

二、综合评分

提示词:你是一位专业的旅游规划师,擅长为预算有限的年轻人制定经济实用的旅游方案。 你的任务是为一名刚结束高考、预算仅 2000 元、住在成都的学生制定详细的旅游攻略,并以美观的 HTML 界面展示。

一次成功率

准确度

美观度

文本概括

总分

Deepseek

100%

90

80

80

87.5

豆包

100%

70

60

60

72.5

千问

100%

60

40

50

62.5

三、模型输出横向测评

1、DeepSeek-R1表现​

DeepSeek以500为目标,直接安排了三个地方

每到一个地方都安排了三天的行程,并有详细的介绍,包括推荐理由、行程安排、省钱小贴士、总预算以及安全注意事项。

对于安全注意事项和必备清单的设置也很合理。

输出总结​​:

✅ 预算控制:1519元(精确列出学生证优惠)

✅ 安全提示:包含10余项具体建议,以及地方旅游服务电话

✅ 界面设计:商务简约的界面设计,可以直观的看到关键信息

2、豆包表现

豆包首先给了对于预算的总体安排。

可以看到豆包给出的是一个2+2的行程,先对两个旅游目的地进行了简介再是对其详细行程的安排,时间精确到小时,非常精确。

最后补充的建议并不局限于前面规划的目的地,对于四川境内的其他景点情况也做了说明。

输出总结:

⚠ 预算控制:985元(豆包还是太节约了,但把钱用完也是一种技术活),极致性价比导致旅游体验不是很好,预期上下浮动不超过10%

✅ 详细时间:每一天的行程都精确到小时

✅ 物品清单:设置为可交互的选择页面,收拾起来更方便

⚠ 缺陷:布局有点混乱,主要信息不突出,同一目的地的信息没放在一起

3、千问表现

千问模型生成的内容,无论是信息密度、准确度包括最后的页面展示都远远比不上前面两者。

输出总结:

❌ 严重缺陷:完全没有排版

✅ 特色之处:设定多个旅游方案对比

❌ 清单确实:仅3条必备物品

四、总结​​

从信息检索效能维度审视,DeepSeek 与豆包均展现出卓越的搜索实力。其中,DeepSeek 在内容呈现时更注重逻辑链条的完整性,通过严谨的层次架构构建知识脉络;豆包则以高密度的信息聚合为特色,在有限篇幅内集成多元视角与详实数据,二者形成鲜明互补。

需求类型

推荐模型

原因

教学/标准化开发

✅ ​​DeepSeek​

代码规范/架构清晰

本地实时信息整合

✅ ​豆包

数据检索覆盖更广

创意原型设计

⚠ 千问

可视化效果实现不稳

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐