使用TavilySearchAPIRetriever进行实时互联网搜索

Tavily’s Search API是一个专为AI代理优化的搜索引擎。它的设计目的是为大模型提供准确且实时的搜索结果，使得开发者可以将搜索能力整合到更大的AI工作流中。

shuoac

672人浏览 · 2025-03-24 05:44:13

shuoac · 2025-03-24 05:44:13 发布

在人工智能领域，获取实时、准确的信息是至关重要的。Tavily的Search API专为AI代理(如LLMs)设计，能够快速提供实时的、准确的和事实性的搜索结果。本文将带您了解如何将TavilySearchAPI集成到您的项目中，并展示实际的代码示例。

技术背景介绍

核心原理解析

TavilySearchAPIRetriever通过langchain_community包提供了一种简单的方式来进行互联网搜索。通过该reducer，我们可以从网络中检索出相关的文档并将其用于进一步的分析或任务。

代码实现演示

接下来的代码示例将引导您如何在Python中设置和使用TavilySearchAPIRetriever。

首先，确保安装必要的包：

%pip install -qU langchain-community tavily-python

1. 设置API密钥

为了使用Tavily的服务，您需要设置API密钥。以下是如何在代码中进行设置：

import getpass
import os

# 安全地设置Tavily API密钥
os.environ["TAVILY_API_KEY"] = getpass.getpass("Enter your Tavily API key: ")

2. 实例化TavilySearchAPIRetriever

实例化reducer以进行查询：

from langchain_community.retrievers import TavilySearchAPIRetriever

# 实例化reducer，设定参数k控制返回的文档数量
retriever = TavilySearchAPIRetriever(k=3)

3. 使用实例进行查询

进行一次简单的查询，获取文档：

query = "what year was breath of the wild released?"

# 调用reducer进行查询
results = retriever.invoke(query)

# 打印返回的文档列表
for doc in results:
    print(doc.metadata['title'], doc.page_content[:200], "...")

4. 在Chain中使用

我们还可以将这个搜索功能集成到更大的AI任务链中：

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_template(
    """Answer the question based only on the context provided.

    Context: {context}

    Question: {question}"""
)

llm = ChatOpenAI(model="gpt-3.5-turbo-0125")

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# 使用chain进行复杂查询
response = chain.invoke("how many units did breath of the wild sell in 2020")
print(response)

应用场景分析

TavilySearchAPIRetriever可用于在AI应用中调用最新的互联网数据。这对于需要及时获取最新信息的应用场景，如新闻分析、市场趋势预测以及科学研究等，都是极为实用的。

实践建议

密钥安全：始终通过安全的方式存储和使用API密钥，避免泄露。
性能调优：根据需求调整k的值，以平衡性能和结果的全面性。
结果处理：根据具体应用需求设计结果的处理逻辑，确保信息质量。

如果遇到问题欢迎在评论区交流。

—END—

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla