主题

当逻辑遇见图像:多模态大模型能进行严谨的逻辑推理吗?

时间

2025.11.26 周三 20:00 北京时间
2025.11.26 周三 20:00 新加坡时间

b站直播间:

https://live.bilibili.com/27784098
(点击文末「阅读原文」即可跳转)  

内容介绍

严谨的逻辑推理能力是NLP领域衡量模型智能水平的关键指标之一。它要求模型能够严格遵循既定的前提,逐步执行符合逻辑规则的推断过程。在医疗、法律、金融等高风险的现实应用场景中,任何细微的逻辑偏差都可能导致严重后果,因此对推理的严谨性提出了极高要求。 这一任务的难点在于,推理中不能出现逻辑谬误、前提幻觉或前后不一致的问题。尽管目前已有不少纯文本逻辑推理评测基准,但现实中的许多任务往往融合了视觉与文本信息,亟需模型具备跨模态的严密推理能力。例如,在交通控制或自动驾驶系统中,模型不仅需要理解交通规则文本,还需结合实时驾驶场景的图像信息,通过可靠推理做出安全且合规的决策。 为此,这篇论文构建了首个基于严格逻辑规则的多模态推理数据集。实验发现,尽管大模型在纯文本逻辑任务上已表现优异,但在融合视觉与文本的推理场景中仍存在明显不足。为此,论文提出了一种名为 LogiCAM 的基线方法,旨在为未来研究提供技术思路与启发。此外,本文还系统分析了模型的典型错误类型,为后续探索指出了若干重要方向。

MuSLR: Multimodal Symbolic Logical Reasoning
项目地址:https://llm-symbol.github.io/MuSLR/

嘉宾

徐俊东,目前在新加坡国立大学计算机系读博士一年级。主要研究方向是大模型reasoning,致力于探索symbolic logical reasoning和一些neuro-symbolic用于reasoning任务的潜力。
个人主页:https://aiden0526.github.io/

主持人

罗盟,现为新加坡国立大学计算机系博士,主要研究方向包括认知驱动的多模态理解和推理、多模态情感分析、视频理解和生成等。
个人主页:https://eurekaleo.github.io/

入群

欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

备注【昵称-单位-方向-NICE入群】

NICE介绍

NICE(NLP Academic Exchange Platform)成立于2023.11.26,由国内外高校一线青年教师和学生共同组织。每周进行学术分享,形式包括圆桌会议、主题分享、单篇论文深度分享等,内容覆盖论文分享、科研小白入门、PhD择业等所有学术领域。至今已举办近百场分享、嘉宾150+人、全网拥有粉丝量13+万,b站和视频号一共大约70万播放量。详情见:
NICE主页
https://nice-nlp.github.io
NICE海外
https://nice-intl.github.io
b站
https://space.bilibili.com/507524288
Youtube
https://www.youtube.com/@NLPAcademicExchangePlatform

编辑:冯可蘅 华盛顿大学
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐