Spring AI 身份证识别，图片分析真牛啊!!

Spring AI 的 Message API（消息接口）为多模态大型语言模型（LLMs）提供了所有必要的抽象层支持，开发者可通过该接口实现跨模态数据的无缝整合与交互，无需底层适配即可构建支持文本、图像、音频等多输入源的AI应用。，在公众号中回复：笔记就可以获得蜗牛为你精心准备的java实战语雀笔记，回复面试、开发手册、有超赞的粉丝福利！以下示例将演示通过上传汽车图片方式分析图片，并由系统以结构

程序员蜗牛g

477人浏览 · 2025-05-07 21:27:18

程序员蜗牛g · 2025-05-07 21:27:18 发布

点击上方“程序员蜗牛g”，选择“设为星标”

跟蜗牛哥一起，每天进步一点点

程序员蜗牛g

大厂程序员一枚跟蜗牛一起每天进步一点点

31篇原创内容

公众号

Spring AI 的 Message API（消息接口）为多模态大型语言模型（LLMs）提供了所有必要的抽象层支持，开发者可通过该接口实现跨模态数据的无缝整合与交互，无需底层适配即可构建支持文本、图像、音频等多输入源的AI应用。

接下来，我们将通过实例演示有关图片识别的实例。

2.实战案例

准备环境

<dependency>  <groupId>org.springframework.ai</groupId>  <artifactId>spring-ai-starter-model-openai</artifactId></dependency>

配置文件

spring:  ai:    openai:      api-key: sk-xxxooo      base-url: https://api.xty.app      chat:        options:          model: gpt-4

图片分析

首先，我们准备如下的这张图片，我们对该图片进行分析，看看大模型能分析出什么内容来：

示例代码：

private final ChatClient chatClient ;@GetMapping("/image")public String image() {  return this.chatClient      .prompt()      .user(u -> u.text("你看到了什么?")          .media(MimeTypeUtils.IMAGE_PNG, new ClassPathResource("static/multimodal.test.png")))      .call()      .content() ;}

输出结果

正确的分析出图片中的内容。

身份证识别

准备一张身份证，看看是否能正确的读取出身份证中的内容信息。

示例代码：

@GetMapping("/sfz")public String sfz() {  String text = """        输出该身份证中的姓名(name), 性别(sex), 民族(nation), 出生(birth), 住址(address), 身份证号码(idNo)。        最终以json格式输出。      """;  return this.chatClient      .prompt()      .user(u -> {        u.text(text)            .media(MimeTypeUtils.IMAGE_PNG, new ClassPathResource("static/sfz.jpg"));      })      .call()      .content() ;}

输出结果

正确识别出身份证中的所有信息。

结构化输出

以下示例将演示通过上传汽车图片方式分析图片，并由系统以结构化 JSON 格式返回分析结果（例如各颜色，总数）。

定义数据模型

public record CarCount(List<CarColorCount> counts, int total) {}public record CarColorCount(String color, int count) {}

接着，定义如下Service 发送图片到OpenAI进行分析

@Servicepublic class CarCountService {  private final ChatClient chatClient;  public CarCountService(ChatClient.Builder chatClientBuilder) {    this.chatClient = chatClientBuilder.build();  }  public CarCount getCarCount(InputStream imageInputStream, String contentType, String colors) {    String text = """          1.统计图像中不同颜色车辆的数量          2.用户通过提示词（prompt）提供图像，并指定需统计的颜色          3.仅统计用户提示词中明确指定的颜色（忽略其他颜色）          4.过滤用户提示词中的非颜色信息（如无关文本或无效描述）          5.若用户提示词中未指定任何颜色，直接返回总数为 0        """ ;    return chatClient.prompt()        .system(systemMessage -> systemMessage            .text(text))        .user(userMessage -> userMessage            .text(colors)            .media(MimeTypeUtils.parseMimeType(contentType), new InputStreamResource(imageInputStream)))        .call()        .entity(CarCount.class);  }}

REST接口

@PostMapping("/count")public ResponseEntity<?> getCarCounts(@RequestParam("colors") String colors,    @RequestParam("file") MultipartFile file) {  try (InputStream inputStream = file.getInputStream()) {    var carCount = carCountService.getCarCount(inputStream, file.getContentType(), colors);    return ResponseEntity.ok(carCount) ;  } catch (IOException e) {    return ResponseEntity.status(HttpStatus.INTERNAL_SERVER_ERROR).body("图片上传失败");  }}

接下来，我们准备如下的图片

输出结果

如果这篇文章对您有所帮助，或者有所启发的话，求一键三连：点赞、转发、在看。

关注公众号：woniuxgg，在公众号中回复：笔记就可以获得蜗牛为你精心准备的java实战语雀笔记，回复面试、开发手册、有超赞的粉丝福利！

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大