讯飞星辰MaaS平台

引发我一个IDEA:如何进行大模型评测,可以自己编写LLM的评估代码


1-参考网址

  • 讯飞星辰MaaS平台:https://maas.xfyun.cn/modelEvaluate/evaluateTaskAddEdit
  • 从零开始构建AI Agent评估体系:12种LangSmith评估方法详解:https://zhuanlan.zhihu.com/p/1935065663346544823

2-页面截图

3-内容创作

4-内容匹配

5-文本翻译

6-旅游出行

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐