32 条回复  ·  3519 次点击
IndexOutOfBounds 楼主 初学 2025-5-23 11:31:56
@viazure 嗯可以的,后面我也正想做
blubzz 小成 2025-5-23 11:36:10
cool
set 初学 2025-5-23 11:39:27
很有意思的一个产品, 感谢 OP 关于 NotebookLM 的 TTS 部分技术方案,我之前也查过一些内容, 总结在这里 https://linux.do/t/topic/614236/10?u=jackqt 可以做个参考, 看下来应该是可以用的,只是收费比较贵
leewaytown 初学 2025-5-23 11:49:17
男音比女音自然,另外儿化音有点问题哈哈,但总体上是很不错啊。 值得研究研究。
IndexOutOfBounds 楼主 初学 2025-5-23 11:54:56
@set 逮捕佬友 我之前也看过其它厂商的 TTS ,只要是基于大模型的,效果都不错 https://linux.do/t/topic/648039 但核心还是太贵了 不过 Google 前天那个 TTS 是有免费 rpm 的,看 J 佬的 Gemini Balance 能不能支持一波了
valkyrjaE 初学 2025-5-23 12:16:01
这个网站挺有意思,算是类似知乎日报的总结了
Pony996 小成 2025-5-23 12:56:47
@Knights 语音一听就是 notebooklm 生成的
justdoitzZ 初学 2025-5-23 13:39:52
非常棒,收藏了,加油。有点牛,学习
Arvin567 小成 2025-5-23 13:59:15
有高中读书那会,听广播的感觉了
set 初学 2025-5-23 14:07:54
@IndexOutOfBounds 这都能遇到, 幸会幸会 确实有点贵, 等等吧,NotebookLM 效果这么好, 其他厂商很快会跟进的。 感觉 Gemini 是面向终端消费者的 AI 工具,我猜大概率在 Ai Studio 里会加进去
返回顶部