AI开源新发现:逛GitHub,探索5个不容错过的AI开源项目!
AI领域近期涌现多个创新项目:Karpathy开源多智能体协作工具llm-council,让不同AI模型协同解答问题;Browserbase推出云端浏览器自动化方案,解决本地爬虫痛点;图像生成模型FLUX.2发布,支持多图参考生成;Soul团队开发AI播客工具SoulX-Podcast,可生成方言对话音频;另有项目实现Claude与NotebookLM的交互功能。文末附赠104G大模型学习资源包,
一、AI 大神新开源玩具
之前介绍过 AI 大神 Karpathy 的一个开源项目 nanoChat,现在他又开源了一个新的玩具:llm-council

这是一个多智能体协作的 Demo。
它的理念很简单,既然一个诸葛亮(AI 大模型)可能会犯错,那三个臭皮匠能不能顶个诸葛亮?
它搞了一个委员会,在这个委员会里,你可以邀请不同的 AI,例如 GPT-4、Claude 3.5、Gemini 坐在圆桌前。
当你提出一个问题时,它们不仅会分别回答,甚至可能互相通过讨论来达成共识或展示不同观点。

开源地址:https://github.com/karpathy/llm-council
二、云端浏览器自动化 MCP
这个叫 Browserbase 的 MCP 是一个浏览器自动化神器,通过 Browserbase 云浏览器和 Stagehand 工具,让 AI 大模型具备了直接操控网页的能力。

很多开源的 Browser Use 工具需要你在本地跑一个无头浏览器。这不仅吃内存,而且你的本地 IP 很容易被目标网站封禁。
Browserbase MCP 的后端是云浏览器。
自带指纹混淆、自动解决 CAPTCHA 验证码,轻松绕过反爬机制。而且不需要你在本地安装 Chrome,所有繁重的渲染都在云端完成,你的电脑风扇不会起飞。
支持 Context ID,这意味着 Agent 可以记住你的登录状态。这一轮对话登录了,下一轮对话还能接着操作,不用每次都重新登录。

开源地址:https://github.com/browserbase/mcp-server-browserbase
三、FLUX.2 正式发布

还记得几个月前横空出世、拳打 Midjourney、脚踢 Stable Diffusion 的 FLUX.1 吗?Black Forest Labs 当时以一己之力拉高了开源生图模型的上限。
现在 FLUX.2 正式发布,不仅升级了模型,更是直接改变了玩儿法。
FLUX.2 引入了视觉语言模型架构,支持多图参考,在保持角色一致性、文字渲染和画面细节上实现了质的飞跃。





开源地址:https://github.com/black-forest-labs/flux2
四、Soul 推出的 AI 博客功能
Google 的 NotebookLM 推出的 Audio Overview 功能火遍全网,两只 AI 互相调侃解读论文的场景让人印象深刻。
国内的 Soul AILab 团队推出了 SoulX-Podcast,让你也能一键生成高质量的 AI 播客。

这是一个全流程的音频内容生成工具,现在有 2500+ 的 Star。
你只需要投喂文章、论文、小说等文本,它就能自动生成剧本,并利用高质量的语音合成技术,生成一段双人或多人对谈的播客音频。
生成的语音不是冷冰冰的机器音,而是带有语气、停顿和情感的拟人化声音。
而且还在朝着支持四川话、河南话和粤语多种中国方言努力,让播客风格语音生成更个性化。
河南话:
四川话:
粤语:
相比 NotebookLM 的黑盒,你可以自定义提示词、选择不同的声音模型,甚至调整对话风格,比如幽默、严肃、教学啥的。
而且他在 Hugging Face 上搞了一个 Demo,可以去玩一玩。

开源地址:https://github.com/Soul-AILab/SoulX-Podcast
地址:https://huggingface.co/spaces/Soul-AILab/SoulX-Podcast-1.7B
五、让 Claude Code 与 NotebookLM 对话
Google 的 NotebookLM 是目前最强的 RAG 工具之一,但它通常被限制在浏览器里。
如果你想通过 AI 控制它,可以瞧瞧这个 notebooklm-skill 开源项目。

开源地址:https://github.com/PleasePrompto/notebooklm-skill
部署这个开源项目非常简单,只需要下面几行命令。
# 1. 创建 skills 文件夹
mkdir -p ~/.claude/skills
# 2.克隆项目
cd ~/.claude/skills
git clone https://github.com/PleasePrompto/notebooklm-skill notebooklm
# 3. 打开 Claude Code 输入:
"What are my skills?"
当你发出指令,就能让 Claude Code 通过浏览器自动化的方式查询你的 Google NotebookLM 的内容。
它实际上是模拟了一个人打开网页、点击 notebook、输入问题、抓取答案的过程。
六、如何学习AI大模型?
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)