模型初始化常用参数设置

文海鸥

173人浏览 · 2026-06-28 18:58:07

文海鸥 · 2026-06-28 18:58:07 发布

模型初始化参数

- temperature 参数练习
- max_tokens 参数练习

在LangChain中，Model Class 和init_chat_model初始化模型共同的参数及解释。
API参考文档:
https://docs.langchain.org.cn/oss/python/langchain/models#parameters
在这里插入图片描述

temperature 参数使用场景选择:
0.0-0.3：需要一致性、准确性的任务（数学计算、数据提取、分类、代码生成）
0.5-0.7：平衡创造性和一致性（聊天、问答）
0.8-1.5：创造性任务（写作、头脑风暴）
1.5-2.0：高度创造性（诗歌、故事创作）

在这里插入图片描述
.env文件

#从DeepSeek官网获取的配置信息
DEEPSEEK_API_KEY =sk-31c9440dxxxxxfb91eeec513XXXXX
DEEPSEEK_BASE_URL=https://api.deepseek.com

temperature 参数练习

在这里插入图片描述
代码如下

# 模型初始化的参数使用情况
# temperature
# 在langChain中, Model Class和init_chat_model初始化模型共同的参数和解释
# API文档：https://docs.langchain.org.cn/oss/python/langchain/models#parameters
# model :使用的特定提供商的模型名称(必需)。比如：openai:gpt-4o、groq:gemma2-9b-it
# model_provider：模型提供商名称
# api_key :API 密钥。如果不提供，会从环境变量中读取（如DEEPSEEK_API_KEY ）
# base_url ：大模型供应商API请求地址。
# temperature : 控制输出随机性，范围 0.0-2.0，温度越高输出越随机。- 0.0 ：最确定性，输出几乎不 - 1.0 ：平衡创造性和一致性- 2.0 ：最随机，最有创造性
# max_tokens： 限制模型输出的最大 token 数量
# timeout :float  超时时间（秒），超时未响应，请求会被取消。
# max_retries:请求失败（如网络问题、速率限制）时的最大重试次数

# temperature 参数根据使用场景选择：
# 0.0-0.3：需要一致性、准确性的任务（数学计算、数据提取、分类、代码生成）
# 0.5-0.7：平衡创造性和一致性（聊天、问答）
# 0.8-1.5：创造性任务（写作、头脑风暴）
# 1.5-2.0：高度创造性（诗歌、故事创作）


from langchain.chat_models import init_chat_model
import os
from dotenv import load_dotenv

# 加载配置文件
load_dotenv(override=True)

DEEPSEEK_API_KEY = os.getenv("DEEPSEEK_API_KEY")
DEEPSEEK_BASE_URL = os.getenv("DEEPSEEK_BASE_URL")

# 获取大模型
model = init_chat_model(
    model="deepseek-v4-flash",
    model_provider="deepseek",
    temperature=1.5,
    api_key=DEEPSEEK_API_KEY,
    base_url=DEEPSEEK_BASE_URL,
)

#向模型发送单条数据
for i in range(3):
    response=model.invoke("帮我写一首易青娥的歌词")
    print(response.content)

max_tokens 参数练习

Token是什么？
基本单位 : 大模型通过分词器（Tokenizer）将文本拆分后的最小语义单元是token（相当于自然语言中
的词或字）。不同的模型采用不同的分词算法（如BPE、WordPiece），因此同一段文本在不同模型中
的Token数量可能不同。
收费依据：大语言模型通常也是以token的数量作为其计量（或收费）的依据。
1个中文Token≈1-1.8个汉字，1个英文Token≈3-4个字符
Token与字符转化的可视化工具：
OpenAI提供：https://platform.openai.com/tokenizer
百度智能云提供：https://console.bce.baidu.com/support/#/tokenizer
在这里插入图片描述
代码如下

# 模型初始化的参数使用情况
# Token:基本单位 : 大模型通过分词器（Tokenizer）将文本拆分后的最小语义单元是token（相当于自然语言中的词或字）。不同的模型采用不同的 分词算法 （如BPE、WordPiece），因此同一段文本在不同模型中的Token数量可能不同。
# 收费依据 ：大语言模型通常也是以token的数量作为其计量（或收费）的依据。 1个中文Token≈1-1.8个汉字，1个英文Token≈3-4个字符
# Token与字符转化的可视化工具：OpenAI提供：https://platform.openai.com/tokenizer ,百度智能云提供：https://console.bce.baidu.com/support/#/tokenizer
# max_tokens： 限制模型输出的最大 token 数量
from langchain.chat_models import init_chat_model
import os
from dotenv import load_dotenv

# 加载配置文件
load_dotenv(override=True)

DEEPSEEK_API_KEY = os.getenv("DEEPSEEK_API_KEY")
DEEPSEEK_BASE_URL = os.getenv("DEEPSEEK_BASE_URL")

# 获取大模型
model = init_chat_model(
    model="deepseek-v4-flash",
    model_provider="deepseek",
    # temperature=1.5,
    max_tokens=10,
    api_key=DEEPSEEK_API_KEY,
    base_url=DEEPSEEK_BASE_URL,
)

#向模型发送单条数据
response=model.invoke("学首歌")
print(response)

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

世界模型年薪250万仍缺人，可你的AI连翻转都算不准——2026下半年最该补的不是新框架是这条公理

本文指出当前AI Agent缺乏物理公理致旋转仿真/流体外推失效；《旋生万物》从"退化圆"出发构建旋子代数与螺旋联络统一旋转、平移及物理定律，为世界模型提供几何先验；《圆道与螺旋系列丛书》（22部·300万字·公理I²=-N）覆盖螺旋数论至生成式AI提示工程。适合Java/Python/嵌入式/算法工程师构建不可替代竞争力。下载：https://doi.org/10.5281/zenodo.20