一、AI 大神新开源玩具

之前介绍过 AI 大神 Karpathy 的一个开源项目 nanoChat,现在他又开源了一个新的玩具:llm-council

这是一个多智能体协作的 Demo。

它的理念很简单,既然一个诸葛亮(AI 大模型)可能会犯错,那三个臭皮匠能不能顶个诸葛亮?

它搞了一个委员会,在这个委员会里,你可以邀请不同的 AI,例如 GPT-4、Claude 3.5、Gemini 坐在圆桌前。

当你提出一个问题时,它们不仅会分别回答,甚至可能互相通过讨论来达成共识或展示不同观点。

开源地址:https://github.com/karpathy/llm-council

二、云端浏览器自动化 MCP

这个叫 Browserbase 的 MCP 是一个浏览器自动化神器,通过 Browserbase 云浏览器和 Stagehand 工具,让 AI 大模型具备了直接操控网页的能力。

很多开源的 Browser Use 工具需要你在本地跑一个无头浏览器。这不仅吃内存,而且你的本地 IP 很容易被目标网站封禁。

Browserbase MCP 的后端是云浏览器。

自带指纹混淆、自动解决 CAPTCHA 验证码,轻松绕过反爬机制。而且不需要你在本地安装 Chrome,所有繁重的渲染都在云端完成,你的电脑风扇不会起飞。

支持 Context ID,这意味着 Agent 可以记住你的登录状态。这一轮对话登录了,下一轮对话还能接着操作,不用每次都重新登录。

开源地址:https://github.com/browserbase/mcp-server-browserbase

三、FLUX.2 正式发布

还记得几个月前横空出世、拳打 Midjourney、脚踢 Stable Diffusion 的 FLUX.1 吗?Black Forest Labs 当时以一己之力拉高了开源生图模型的上限。

现在 FLUX.2 正式发布,不仅升级了模型,更是直接改变了玩儿法。

FLUX.2 引入了视觉语言模型架构,支持多图参考,在保持角色一致性、文字渲染和画面细节上实现了质的飞跃。

开源地址:https://github.com/black-forest-labs/flux2

四、Soul 推出的 AI 博客功能

Google 的 NotebookLM 推出的 Audio Overview 功能火遍全网,两只 AI 互相调侃解读论文的场景让人印象深刻。

国内的 Soul AILab 团队推出了 SoulX-Podcast,让你也能一键生成高质量的 AI 播客。

是一个全流程的音频内容生成工具,现在有 2500+ 的 Star。

你只需要投喂文章、论文、小说等文本,它就能自动生成剧本,并利用高质量的语音合成技术,生成一段双人或多人对谈的播客音频。

生成的语音不是冷冰冰的机器音,而是带有语气、停顿和情感的拟人化声音。

而且还在朝着支持四川话、河南话和粤语多种中国方言努力,让播客风格语音生成更个性化。

河南话:

四川话:

粤语:

相比 NotebookLM 的黑盒,你可以自定义提示词、选择不同的声音模型,甚至调整对话风格,比如幽默、严肃、教学啥的。

而且他在 Hugging Face 上搞了一个 Demo,可以去玩一玩。

开源地址:https://github.com/Soul-AILab/SoulX-Podcast
地址:https://huggingface.co/spaces/Soul-AILab/SoulX-Podcast-1.7B

五、让 Claude Code 与 NotebookLM 对话

Google 的 NotebookLM 是目前最强的 RAG 工具之一,但它通常被限制在浏览器里。

如果你想通过 AI 控制它,可以瞧瞧这个 notebooklm-skill 开源项目。

开源地址:https://github.com/PleasePrompto/notebooklm-skill

部署这个开源项目非常简单,只需要下面几行命令。

# 1. 创建 skills 文件夹
mkdir -p ~/.claude/skills
# 2.克隆项目
cd ~/.claude/skills
git clone https://github.com/PleasePrompto/notebooklm-skill notebooklm
# 3. 打开 Claude Code 输入:
"What are my skills?"

当你发出指令,就能让 Claude Code 通过浏览器自动化的方式查询你的 Google NotebookLM 的内容。

它实际上是模拟了一个人打开网页、点击 notebook、输入问题、抓取答案的过程。

六、如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

请添加图片描述
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐