知名科技博主卡帕西强烈推荐了一款来自谷歌的实验性AI工具——Notebook LM,认为它可能带来如同ChatGPT那样的巨大变革机遇。
这款由谷歌最先进模型Gemini 1.5 Pro驱动的应用程序,正因其新推出的功能而备受关注。
这项功能允许用户上传文本、音频或视频文件,之后AI不仅能够提炼出关键信息,还能生成一段由两个AI模拟的真人对话形式的音频概述,围绕文件内容进行深入讨论并作出总结。
这种创新的交互方式受到了广泛的欢迎,不仅卡帕西本人给予了高度评价,许多网友也表达了他们的喜爱。
AI领域的意见领袖@elvis也在社交媒体上询问了关于如何使用Notebook LM的方法。
使用方法非常简单:只需访问其测试页面,将待处理的文件拖拽上传即可。
无论是Google Docs文档、网页链接、视频链接,甚至是大量纯文本,Notebook LM都能处理。
每个笔记本最多可以上传50个文件,每个文件的内容限制为50万个单词。
除了标准的文字输出选项外,如问答、小测验、目录、时间轴和摘要等,用户还可以自定义prompt以满足更加个性化的需要。
尽管Notebook LM目前尚不支持中文回复,但它确实能够理解中文指令。
生成音频内容的时间取决于文档的长度,可能需要几分钟到十几分钟不等。
值得一提的是,Gemini 1.5 Pro模型支持长达128K的上下文处理,这对于理解和处理长文档至关重要。
最近的更新进一步提升了Gemini 1.5 Pro在数学和逻辑推理方面的能力,使其超越了OpenAI的o1预览版。
此外,Notebook LM还支持超过100种语言的输入,极大地拓宽了其应用场景。
事实上,Notebook LM并非一出现就大受欢迎。
早在去年的Google I/O大会上,它就以Project Tailwind的身份首次亮相,当时仅限于美国部分地区用户使用,主要功能也较为基础。
直到今年,随着音频概述功能的加入,Notebook LM才真正迎来了全球用户的热烈反响。
谷歌官方将这一功能描述为:“一键将文档、演示文稿、图表等转变为引人入胜的对话体验。”
这种新颖的交互模式,加上逼真的AI语音,使得用户仿佛在聆听真实的播客节目,从而迅速吸引了大量的粉丝。
除了常规的文档处理功能,Notebook LM还被用户创造性地应用于课堂录音的整理,帮助学生在家复习课程重点,这一用法同样获得了广泛的好评。
对于那些在日常交流中感到困难的人来说,Notebook LM提供的AI播客功能尤为吸引人,因为它消除了与Chatbot互动时需要不断提问的障碍。
同时,在信息过载的时代背景下,通过听的方式获取信息比阅读更加便捷,这也成为了Notebook LM受到追捧的重要原因之一。
当然,也有一些用户提出了改进意见,比如希望Notebook LM能够处理文档中的图像信息,以及让用户有更多控制权去引导AI播客的内容方向。
面对这些反馈,开发者社区已经开始行动,推出了开源版本的Notebook LM,虽然目前仅支持PDF格式的文件。
从音频转文字再到文字转播客,技术的发展总是在不断突破我们的想象边界。