一、大模型(Language Models)

大模型(Language Models)是指具备了强大的语言理解、生成和推理能力的深度学习模型。 比如GPT-4、Claude、DeepSeek-V3.1-Terminus、Qwen-3-Maxd、Doubao-Seed-1.6等等

大部分模型基于Transformer架构,

大模型可以按照不同的标准分类,比如按照参数量、技术架构、功能特性分类等。
我们常说的多模态模型,是指同一个模型能同时处理文本、图像、音频、视频等数据。(可能是以后发展的主流),
我们常说的通用大模型(General-Purpose Large Models),是指具备了强大的语言理解、生成和推理能力的模型,能够处理各种语言任务,主要专注于文本模态的处理。
我们常说的LLM(Large Language Model),是指专门设计用于理解和生成人类语言。

大模型可以用来内容生成(文本创作 :文章、故事、诗歌)、代码编写(程序开发、调试、优化)、翻译服务(多语言实时翻译)、知识推理(问答系统、数据分析)


二、智能体(Agent)

智能体(Agent),代表了人工智能从"被动响应"到"主动行动"的重大进化。能够自主决策,理解任务意图,拥有长期记忆,存储交互历史和用户偏好,可独立完成全流程任务,无需持续干预。

智能体很重要的特点是:随用户使用时间增长,服务越精准贴合用户需求,更加智能。

智能体通常采用"大模型 + 插件" 架构。大模型负责理解、推理和规划任务,记忆系统存储对话历史和上下文信息,工具集负责API接口和应用程序的调用能力,执行引擎来协调各模块工作。


三、模型上下文协议, MCP (Model Context Protocol)

MCP是统一模型(LM)与外部数据源和工具之间的通信协议,定义了一套规范输入,输出参数。工具集在负责API接口和应用程序的调用时,就需要遵循MCP协议。

协议细节:MCP (Model Context Protocol) 模型上下文协议


Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐