LLM赋能5—语音vs文字信息量:NotebookLM
LLM多模态之语音输出
参考我之前的博客:
LLM赋能1:https://blog.csdn.net/weixin_62528784/article/details/143290931?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522c9a42521ed4c01327d77241ac5d4bca3%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=c9a42521ed4c01327d77241ac5d4bca3&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2blogfirst_rank_ecpm_v1~rank_v31_ecpm-1-143290931-null-null.nonecase&utm_term=LLM&spm=1018.2226.3001.4450
LLM赋能2:https://blog.csdn.net/weixin_62528784/article/details/143715040?spm=1001.2014.3001.5502
LLM赋能3:https://blog.csdn.net/weixin_62528784/article/details/143823223?spm=1001.2014.3001.5502
LLM赋能4(cline+deepseek等LLM):https://blog.csdn.net/weixin_62528784/article/details/144873785?spm=1001.2014.3001.5502
文献阅读插件:
https://blog.csdn.net/weixin_62528784/article/details/144273276
https://blog.csdn.net/weixin_62528784/article/details/144328475
https://blog.csdn.net/weixin_62528784/article/details/144671393?spm=1001.2014.3001.5502

想不想学
扪心问:真想学吗
1,文档阅读QA:
这个应该是最传统的使用方式了,基本上所有的LLM都可以,早期的使用方式都这样

2,博客聊天对答:



3,复盘其他的AI工具:
learn about
NotebookLM


learn about 强调的是一站式教学,你能从这里开始一个完全不了解的领域的学习,渐进式地掌握相关技能并得到疑问的即时反馈,主打的是从0到1的过程。
而 NotebookLM 更偏向于研究场景,它本身不提供学习资料,而是帮你整理和总结你的资料,针对性更强,比如你在准备一场 pre 或者写论文,就能把收集到的资料投喂给 LM 来梳理和解答问题。NotebookLM 有个很牛的功能就是它能为当前主题生成一场播客

4,再次回到notebooklm上面来:
注意如果你是科学上网的话,一定一定要开全局代理,注意是全局Global而不是规则Rule




还是那一句话:
LLM生成的内容,其实本质上无论是语音还是文字形式(虽然内容或多或少可能有点区别),但是大差不差;
问题就在于人接受信息的方式除了视觉,还有听觉,你能利用多感官,来开放自己思考以及阅读学习潜力的多少呢?
我倒是觉得阅读如果仅仅只是传统的视觉一行一行的看LLM的输出内容,其实效率上是很低的,如果能并行使用听觉,绝对会将LLM应用的学习潜力开发得更高更好!
因为:人对信息的接受程度有多大主动,是很难说的,
我宁愿将我不在学习的时间拿来被动接受知识,也不想在我主动学习的时候都接受一些垃圾知识;
人对视频音频的信息接受程度绝对是比文字高的,
所以我们应该解放我们的双眼,用耳朵去学,如果在音频里加入高密度的信息以及知识,那这本质上就是被动学习,我既没有压力去做这件事(因为是听力是博客是被动的),又可以在其中获取和LLM文字生成一样的信息密度,何乐为不为呢!
(1)1个简单的例子,我传给它一篇生物信息学方面深度学习的science正刊的文章:



大概听了一下这段生成的语音对话博客,其实信息量比较少,大部分都是插科打诨,
可以试一下join功能:
左边的三角箭头是播放这段博客,然后点击中间的加入就是连接入自己的麦克风然后可以随时插话提问;
然后这个时候可以同时进行文字提问,与语音博客是并行的,不干扰












(2)类似产品:输出音频浓缩的知识:
豆包网页
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)