AiPy实战(4):一键生成暑假旅游计划,AI模型(DeepSeek-R1、千问、豆包)大比拼
从信息检索效能维度审视,DeepSeek 与豆包均展现出卓越的搜索实力。其中,DeepSeek 在内容呈现时更注重逻辑链条的完整性,通过严谨的层次架构构建知识脉络;豆包则以高密度的信息聚合为特色,在有限篇幅内集成多元视角与详实数据,二者形成鲜明互补。需求类型推荐模型原因教学/标准化开发✅ DeepSeek代码规范/架构清晰本地实时信息整合✅ 豆包数据检索覆盖更广创意原型设计⚠

一、背景
高考结束,暑假即将到来,高中生旅行规划面临三大痛点:预算有限(2000元内)、安全保障需求高、行程需兼顾舒适与趣味性。传统手工制作旅游计划耗时耗力,而大模型生成HTML界面可快速输出可视化方案。刚好AiPy(0.2.1)的官方大模型广场——Trustoken接入了豆包大模型,所以本次评测使用AiPy调用三大主流模型API,围绕代码质量、内容适配性、视觉设计三大维度展开横向对比。
评测对象:
📌 deepseek/deepseek-r1-0528(深度求索开源模型)
📌 qwen3-235b-a22b(阿里云通义千问)
📌 doubao-seed-1.6-250615(字节跳动旗下AI产品)
大模型配给网站:https://www.trustoken.cn/
二、综合评分
提示词:你是一位专业的旅游规划师,擅长为预算有限的年轻人制定经济实用的旅游方案。 你的任务是为一名刚结束高考、预算仅 2000 元、住在成都的学生制定详细的旅游攻略,并以美观的 HTML 界面展示。
|
一次成功率 |
准确度 |
美观度 |
文本概括 |
总分 |
|
|
Deepseek |
100% |
90 |
80 |
80 |
87.5 |
|
豆包 |
100% |
70 |
60 |
60 |
72.5 |
|
千问 |
100% |
60 |
40 |
50 |
62.5 |
三、模型输出横向测评
1、DeepSeek-R1表现
DeepSeek以500为目标,直接安排了三个地方

每到一个地方都安排了三天的行程,并有详细的介绍,包括推荐理由、行程安排、省钱小贴士、总预算以及安全注意事项。

对于安全注意事项和必备清单的设置也很合理。

输出总结:
✅ 预算控制:1519元(精确列出学生证优惠)
✅ 安全提示:包含10余项具体建议,以及地方旅游服务电话
✅ 界面设计:商务简约的界面设计,可以直观的看到关键信息
2、豆包表现
豆包首先给了对于预算的总体安排。

可以看到豆包给出的是一个2+2的行程,先对两个旅游目的地进行了简介再是对其详细行程的安排,时间精确到小时,非常精确。

最后补充的建议并不局限于前面规划的目的地,对于四川境内的其他景点情况也做了说明。

输出总结:
⚠ 预算控制:985元(豆包还是太节约了,但把钱用完也是一种技术活),极致性价比导致旅游体验不是很好,预期上下浮动不超过10%
✅ 详细时间:每一天的行程都精确到小时
✅ 物品清单:设置为可交互的选择页面,收拾起来更方便
⚠ 缺陷:布局有点混乱,主要信息不突出,同一目的地的信息没放在一起
3、千问表现
千问模型生成的内容,无论是信息密度、准确度包括最后的页面展示都远远比不上前面两者。

输出总结:
❌ 严重缺陷:完全没有排版
✅ 特色之处:设定多个旅游方案对比
❌ 清单确实:仅3条必备物品
四、总结
从信息检索效能维度审视,DeepSeek 与豆包均展现出卓越的搜索实力。其中,DeepSeek 在内容呈现时更注重逻辑链条的完整性,通过严谨的层次架构构建知识脉络;豆包则以高密度的信息聚合为特色,在有限篇幅内集成多元视角与详实数据,二者形成鲜明互补。
|
需求类型 |
推荐模型 |
原因 |
|
教学/标准化开发 |
✅ DeepSeek |
代码规范/架构清晰 |
|
本地实时信息整合 |
✅ 豆包 |
数据检索覆盖更广 |
|
创意原型设计 |
⚠ 千问 |
可视化效果实现不稳 |
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)