当AI用代码作画,谁才是真正的艺术家?
国内多款AI大模型在代码绘图能力测试中表现各异,其中字节豆包凭借出色的美学处理能力脱颖而出。测试要求AI用HTML/CSS代码还原"冰墩墩"并设计新吉祥物,考察其将艺术创意转化为代码的能力。豆包不仅代码规范,还通过渐变、阴影等技巧完美呈现冰壳质感和动态效果。KimiK2和ClaudeSonnet4代码扎实但缺乏艺术性,智谱Z1生成抽象风格作品,DeepSeekR1则因计算错误产
上周,月之暗面(Moonshot AI)的 Kimi K2 模型甫一发布,便以其惊人的长文本处理能力和据称的 SOTA 性能,在技术圈掀起了一场风暴。作为一名热衷于“压榨”AI能力的探索者,我没有让它去写诗或总结报告,而是进行了一场更为“苛刻”的考验:让AI用 HTML 和 CSS 代码来“绘制”视觉形象。
我召集了 Kimi K2、Claude Sonnet 4、DeepSeek R1、智谱 Z1,以及字节的豆包,向它们发出了两个挑战:
-
用代码还原经典的“冰墩墩”形象。
-
基于此能力,设计一个全新的吉祥物。
这项任务不仅考验模型的代码生成能力,更是在检验它们是否拥有将“美学”和“创意”翻译成逻辑化代码的独特“感性”。
在展示那些或惊艳或惊悚的作品前,请允许我先揭晓结论:
这场“代码视觉艺术”大赛的桂冠,出人意料地被国内的豆包摘得。免费版的 ChatGPT 在这项任务上生成的代码过于基础,无法形成有效视觉,故不参与最终角逐。新王 Kimi K2 表现中规中矩,代码扎实但缺乏艺术感。而智谱 Z1 和 DeepSeek R1 则分别用代码演绎了何为“抽象艺术”与“代码事故”。
下面,让我们一同鉴赏这些由0和1构成的艺术品。
Kimi K2:代码优等生,审美中规中矩
作为万众瞩目的新星,Kimi K2 首先接受了挑战。当我下达“用 HTML 和 CSS 构建一个冰墩墩”的指令后,K2 迅速生成了一整套代码。
代码层面,它的表现堪称优等生。HTML 结构清晰,使用了语义化的 <div> 标签来划分冰墩墩的各个部分(如头部、身体、四肢),CSS 类名也相当规范。
审美层面,最终渲染出的视觉效果,只能说“达意”但未“传神”。它准确地呈现了熊猫的黑白元素和冰壳轮廓,但实现方式比较“朴素”,大多使用基础的 border-radius 和 background-color。对于冰壳的晶莹剔透、脸部彩虹圈的光晕等需要运用高级 CSS 技巧(如多重渐变、滤镜、复杂阴影)的细节,K2 并未给出很好的解决方案。整体观感略显扁平,像一幅儿童简笔画。


总的来说,Kimi K2 是一个优秀的“前端代码生成器”,但似乎还未完全点亮“CSS 艺术家”的技能树。
豆包:代码与美学的完美合奏
如果说 Kimi 是优等生,那么豆包就是那个既能拿编程竞赛金牌,又能在艺术节上大放异彩的“六边形战士”。
代码层面,豆包生成的代码同样结构清晰,更难能可贵的是,它加入了详尽的注释,解释了每一段 CSS 是为了实现哪个视觉效果,对开发者极其友好。
审美层面,豆包的表现堪称惊艳。它不仅准确还原了冰墩墩的形态,更在细节上大做文章:
-
冰壳质感:通过叠加多个
box-shadow和linear-gradient,巧妙地模拟出冰壳的厚度、高光和环境反光,立体感十足。 -
彩虹光环:使用了
conic-gradient(锥形渐变) 来精准还原脸部那圈标志性的彩色光环,色彩过渡自然。 -
动态效果:在设计新吉祥物时,它甚至还贴心地加入了一些
transform和transition效果,让吉祥物有了“呼吸感”。


豆包的表现在于,它不仅理解了“画一个冰墩墩”,更理解了如何用 CSS 的语言去表达“晶莹剔透”、“可爱”和“动感”,这是代码能力与设计审美结合的绝佳体现。
智谱 Z1:代码界的抽象派大师
智谱 Z1 的作品,证明了AI也懂“先锋艺术”。在设计新吉祥物的任务中,Z1 的代码生成了一幅让人无法用常理度量的图像。
代码层面,它的 HTML 结构可能非常简单,甚至有些混乱,但其 CSS 的运用却天马行空。它可能会用 clip-path 裁剪出怪异的形状,用 position: absolute 将元素以一种不合逻辑的方式堆叠,再配上饱和度极高且对比强烈的配色方案。
审美层面,结果就是一幅极具视觉冲击力的“抽象画”。它完全脱离了“吉祥物”的常规形态,但这种由代码构建的、充满不确定性的视觉组合,却意外地吸睛,让人忍不住想去研究它的代码究竟是如何“发疯”的。这是一种“算法之美”,混乱但自成一派。


如果你想快速搭建一个符合规范的页面,别找Z1。但如果你想在项目中寻找一些出其不意的视觉灵感,Z1 或许能给你打开新世界的大门。
DeepSeek R1:当代码审美出现“Bug”
如果说 Z1 的作品是艺术,那 DeepSeek R1 的作品就是一场“代码事故”。它生动地展示了当代码逻辑出错时,视觉呈现会有多么“猥琐”。
当我让它生成冰墩墩时,问题显而易见:
代码层面,它生成的 CSS 在定位和尺寸计算上出现了严重偏差。很可能是对元素的 width, height, top, left 等属性给出了完全错误的值,导致各个身体部件发生了严重的移位和变形。
审美层面,这种代码上的“Bug”直接导致了视觉上的“崩坏”。眼睛被拉伸成了诡异的椭圆,嘴巴被定位到了脸颊之外,身体和四肢的比例严重失调。最终渲染出的那个形象,与其说是冰墩墩,不如说是一个因代码扭曲而诞生的、令人不适的“克苏鲁”风格生物。


DeepSeek R1 的案例警示我们,AI生成代码的质量直接决定了最终的视觉效果。一个微小的定位错误,就可能将“可爱”扭曲为“惊悚”。
Claude Sonnet 4:稳健可靠的国际工程师
最后登场的 Claude Sonnet 4,表现如同一位经验丰富的硅谷工程师,可靠、高效、专业。
它的代码质量非常高,结构和 Kimi K2 一样清晰,但在 CSS 的运用上比 Kimi 更成熟一些,懂得使用一些伪元素(:before, :after)和更复杂的选择器来减少 HTML 的冗余。在视觉还原度上,它和豆包不相上下,尤其是在色彩的准确性上表现很好。但在创意的边界上,它同样显得比较保守,给出的新吉祥物方案非常“标准”,符合大众审美,但缺少了豆包那种灵光一现的惊喜。


结语:代码为笔,审美为魂
这场特殊的比拼,让我们看到了大模型在“代码视觉艺术”这一交叉领域的不同面貌。
-
豆包 向我们证明了,顶级的AI不仅是代码的生成器,更是美学的转译器。
-
Kimi K2 和 Claude Sonnet 4 是值得信赖的“代码工程师”,能高效完成你布置的任务,但需要你亲自注入艺术灵魂。
-
智谱 Z1 是一个灵感缪斯,它的价值不在于交付成品,而在于打破你的思维定式。
-
DeepSeek R1 则是一个反面教材,提醒我们时刻要对 AI 生成的代码进行审查和调试。
最终,这场对决没有绝对的赢家。它更像是一次对我们未来工作方式的预演:AI 负责将创意快速转化为可执行的代码草案,而我们人类,则作为最终的“艺术总监”,负责注入审美、修正偏差,并赋予作品真正的灵魂。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)