使用Spring AI 调用本地deepseek模型

Spring Web（构建RESTful接口）推荐使用Java 17+版本以获得最佳兼容性。配置JVM参数（推荐-Xmx512m）在宝塔「Java项目」模块添加新项目。Ollama（本地模型集成支持）上传生成的.jar文件。设置运行端口为9000。安全组放行9000端口。

Chelase

463人浏览 · 2025-02-28 22:32:31

Chelase · 2025-02-28 22:32:31 发布

本文使用deepseek进行文章润色

初始化Spring Boot项目

使用IDEA创建项目，需选择以下依赖项：

Spring Web（构建RESTful接口）
Ollama（本地模型集成支持）

推荐使用Java 17+版本以获得最佳兼容性

模型服务配置

在application.properties中添加以下配置：

# 服务端口设置
server.port=9000

# Ollama本地服务配置
spring.ai.ollama.base-url=http://localhost:11434
spring.ai.ollama.chat.model=deepseek-r1:1.5b

新建控制器

@RestController
@RequestMapping("/api/ai")
public class AiController {

    private final OllamaChatModel chatClient;
    
    // 构造器注入替代字段注入
    public AiController(OllamaChatModel chatClient) {
        this.chatClient = chatClient;
    }

    /**
     * 同步响应接口
     * @param message 用户输入内容
     * @return 完整模型响应
     */
    @CrossOrigin(origins = "*")
    @GetMapping("/sync/{message}")
    public String syncChat(@PathVariable String message) {
        return chatClient.call(message);
    }

    /**
     * 流式响应接口
     * @param message 用户输入内容
     * @return SSE流式数据
     */
    @CrossOrigin(origins = "*")
    @GetMapping(value = "/stream/{message}", 
               produces = MediaType.TEXT_EVENT_STREAM_VALUE)
    public Flux<String> streamChat(@PathVariable String message) {
        return chatClient.stream(new Prompt(message));
    }
}

前端示例（Vue3）

const processAIResponse = async () => {
  const userInput = prompt('请输入您的问题');
  if (!userInput?.trim()) return;

  try {
    const response = await fetch(`http://localhost:9000/api/ai/stream/${
      encodeURIComponent(userInput)
    }`);
    
    const reader = response.body.getReader();
    const decoder = new TextDecoder();
    let accumulatedResponse = '';

    while (true) {
      const { done, value } = await reader.read();
      if (done) break;
      
      const chunk = decoder.decode(value, { stream: true });
      accumulatedResponse += chunk;
      
      // 实时更新UI
      updateChatWindow(accumulatedResponse); 
    }
  } catch (error) {
    console.error('请求失败:', error);
    showErrorMessage('AI服务暂不可用');
  }
}

生产环境部署（宝塔面板）

项目打包：
```
mvn clean package -DskipTests
```
服务器部署：
- 在宝塔「Java项目」模块添加新项目
- 上传生成的.jar文件
- 设置运行端口为9000
- 配置JVM参数（推荐-Xmx512m）

网络配置：

安全组放行9000端口
Nginx反向代理配置：

location /api/ai {
    proxy_pass http://localhost:9000;
    proxy_http_version 1.1;
    proxy_set_header Connection "";
    proxy_buffering off; // 添加此命令以支持流式输出
}

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大