先说结论

deepseek的联网搜索结果准确率更高。

该观点仅支持到截止发文日期,后续功能更新可能会有所改观。

最迫切的需求背景

AI对话的功能不应该仅仅是提供解决问题的思路,更多是需要能够代替联网人工筛选信息,“给答案”才是减少工作量的关键,但由于AI幻觉的不可控,对于需要精准或趋向更可靠结果的AI问答(仅考虑文本),一般需要RAG配合配合最新预料数据以配合提示词,大模型结合网络搜索也是一种变相实现方式。例如deepseek联网搜索、千问联网搜索等。

但是工作中确实需要更准确的问题答案,例如询问“XXX产品的上市日期”,如果不能实时联网,以及获取更有效的联网数据筛选,那么答案往往不尽人意。这里对比qwen3千问系列和deepseek的联网问答api,看看谁更准确,对结果要求较高的生产环境就用哪个……

需求示例

需求是计算车辆SOH,但SOH计算依赖用户车辆上市日期,根据上市日期后的一段时间充电总电量或其他数据做为计算基准,来推算使用一段时间后车辆的SOH。但是车辆上市日期,根据车辆VIN码是难以解析的或者解析不准确(仅可拿到车型年份),其他解析VIN的接口可能费用过高或者解析结果缺失(占一半可不用)。所以通过AI在线搜索拿到一个结果值,是比较经济和可行的办法,让AI代替人工搜索,人工工作量大幅减少……

api测试

标准查询和验证

例如查询车型 “岚图梦想家 2025款 EV 四驱旗舰乾崑版” 的上市日期,通过ds的在线搜索,得到结果比较真实可靠,有理有据有侧重来源。

或点开其他参考链接,能查到确实是该答案。

使用千问qwen-plus、qwen3-max等系列测试

这里使用python 标准api调用以支持联网搜索 enable_search 参数的设置。

# 本文以该调用方式(官方建议)做验证测试
from openai import OpenAI

if __name__ == "__main__":
    client = OpenAI(
        api_key="sk-xxx",
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    )
    car = "岚图梦想家 2025款 EV 四驱旗舰乾崑版"
    completion = client.chat.completions.create(
        model="qwen3-max",
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "请使用互联网在线搜索车型 " + car + " ,生产日期是什么时候,答案仅输出日期 yyyy-MM-dd"},
        ],
        extra_body={"enable_search": True},
    )
    print(completion.model_dump_json())

或者接口调用 (注:使用官方说明的配置,该联网参数似乎无效)

### 联网搜索 注:使用该方式联网参数似乎无效
POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
Authorization: Bearer sk-xxxx
Content-Type: application/json

{
  "model": "qwen3-max",
  "messages": [
    {
      "role": "system",
      "content": "你是一个支持联网搜索的AI助手,简洁回答输入的问题"
    },
    {
      "role": "user",
      "content": "请使用互联网在线搜索车型 “岚图梦想家 2025款 EV 四驱旗舰乾崑版”,获取该车型生产日期是什么时候,答案仅输出日期 yyyy-MM-dd"
    }
  ],
  "parameters": {
    "enable_search": true
  }
}

得到结果,很显然这是不对的

"content": "2025-04-18"

即按照官方的python和curl调用方式,联网搜索结果都一样,切换qwen模型,结果也不准确。

使用deepseek(腾讯原子能力)api测试

###
POST https://api.lkeap.cloud.tencent.com/v1/chat/completions
Authorization: Bearer sk-xxxxx
Content-Type: application/json

{
  "model": "deepseek-v3",
  "messages": [
    {
      "role": "user",
      "content": "请使用互联网在线搜索车型 “岚图梦想家 2025款 EV 四驱旗舰乾崑版”,获取该车型生产日期是什么时候,答案仅输出日期 yyyy-MM-dd"
    }
  ],
  "enable_search": true,
  "stream": false
}

能得到和deepseek官方或腾讯元宝的搜索一致的结果

"content": "2024-09-19"

可能数据量或者知识库或搜索逻辑存在偏差,部分知识不对齐,可以理解,我们多做几次验证,这里以下列数据做了验证测试,

车型 阿里通义千问max qwen3参考url可访问 腾讯原子能力DeepSeek ds参考url可访问
岚图梦想家 2025款 EV 四驱旗舰乾崑版 2024/9/1 2025/2/19
尊界S800 2025款 增程 星辉尊享版 5座 2025/4/15 2025/6/26
小鹏P7+ 2024款 长续航 Max 2024/10/15 2024/11/7
银河E5 2024款 530km 探索+版 2024/8/1 是 但不相关 2024/8/3
零跑B10 2025款 510悦享版 2024/8/3 是 但不相关 2025/4/10
星愿 2025款 410km 自由版 2024/9/15 是 但不相关 2024/10/9

部分场景下,qwen3的结果是准确的,但加大测试量能说明问题,DS的实时搜索能力确实更强,qwen3的在线搜索可能根据官方给的参数不正确或者知识分析实时度有欠缺,一般能满足需求,DS可能由于搜索关键词匹配问题,拿到其他相似对象词结果导致部分结果不准,但整体正确度更高,更符合线上要求。综上,在需要联网搜索获取问题结果的时候,DS更胜一筹。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐