oneapi本地部署接口测试(curl命令方式+postman方式)
本文展示了两种AI模型API的测试方法:1)基础对话模型测试,通过curl命令调用本地3001端口的QwQ-32B模型进行简单对话;2)嵌入模型测试,使用GLM-Embedding-2模型获取文本"你好,世界"的向量表示。文中提供了完整的curl请求示例和响应截图,并附带了获取授权令牌的方法图示。测试结果表明两个模型均能正常响应请求,适用于本地开发环境下的AI应用集成。
·
1. 基础对话模型测试
curl --location 'http://localhost:3001/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer sk-3WksewG53qmvyHmQF3EcC2CfBfE443109c0a556704Ba760b' \
--data '{
"model": "QwQ-32B",
"stream": false,
"messages": [
{"role": "user", "content": "你好,你是谁?"}
]
}'


2. 嵌入模型测试
curl --location 'http://localhost:3001/v1/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer sk-lTq3hlf8Usjov9g1A2617f29FdE24a6c9dCc8649BdF6A542' \
--data '{
"model": "GLM-Embedding-2",
"input": ["你好,世界"]
}'


令牌值获取方式:

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐

所有评论(0)