大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」

来自版块 问答
690
2
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

大神卡帕西墙裂保举!
乃至预言这个AI应用,有大概开启「和ChatGPT一样大的时机」。
它就是来自谷歌的实行性AI产物,Notebook LM,背后由谷歌如今最强盛的模子Gemini 1.5 Pro提供支持。



近来这应用要多火就有多火,全因上线了一项新功能——
上传文件(笔墨、音频、视频),AI不但能帮助用笔墨提炼要点,还可以通过音频概述(Audio Overview)功能,把文件转换成AI天生的对话播客,根据文档内容举行讨论。
2个AI,用真人般的语音和口气,围绕文件内容豪情讨论,末了总结陈词。
这真的很酷!
而且不是卡帕西一个人在夸。逛了下互联网几大平台,网友们对Notebook LM广泛照旧挺买账的。
AI界的KOL@elvis也在卡帕西批评区留言:

卡神称这“让人想起ChatGPT时候”,绝对不是过甚其辞!
真正让多种模子团结工作,会解锁Notebook LM如许独特的内容格式和用户体验。





Notebook LM怎么玩?


玩法很简朴,打开试玩页面,拖拽上传必要处置惩罚的文件。
可以是谷歌文档,可以是网站和视频链接,乃至干脆粘贴一大段文本都可以。
每个条记本支持上传50个文件,每个文件内容上限500000个单词。



这里昨们上传了OpenAI o1的System Card文档,接下来就可以选择必要创建的内容。
内置支持问答、小考试、目次、时间线、择要等笔墨版功能,以及两个主持人的深度对话音频内容。
假如有更个性化的需求也可以本身敲prompt。



昨们实验用中文提问,效果AI是可以明白的。
很惋惜的是Notebook LM不支持用中文答复,纵然刻意要求也不可。



选择创建音频的话,视文档长度必要等候几分钟到十几分钟。
趁这个时间来相识一下这背后的Gemini模子叭~
NotebookLM由Gemini 1.5 Pro来支持,也就是谷歌家现在旗舰级大模子。
Gemini 1.5 Pro支持超长128k上下文,这是能解读长文档的底子。
在近来的一次升级中,Gemini 1.5 Pro数学和推理本领还反超OpenAI o1预览版。



英语没那么好的朋侪,也可以看看套娃AI转写、翻译出来的AI播客笔墨版,感受一下。



单纯的上传文档,天生内容,还只是Notebook的实用玩法之一。
另有人先容了门生上课灌音,回家用AI整理重点的玩法,也广受好评。
(不是本身不听课了的意思)
详细来说,可以遵照以下步调:、

上课时用手机灌音;
上课期间不必要用电脑,只需(纸笔)记下简短的重点;
(下课后)把灌音和条记扫描上传到NotebookLM,让它根据灌音细节扩写条记。
别的,还可以每周创建一份对所学内容重点的复习音频。





一种与单纯Chat差别的交互范式


实在,NotebookLM并不是出道即爆火。
早在客岁5月的Google I/O大会上它就已经出现了,不外谁人时间,作为AI条记本项目标它还叫Project Tailwind
到了客岁7月,NotebookLM它才改成如今的名字。
早先,只支持美国局部地域的用户食用;功能也照旧围绕着底子的Chat模式睁开。
△NotebookLM主动天生文档指南(来自谷歌官网)
到了这个月11号,NotebookLM忽然公布面向环球玩家开放,而且新增了重磅功能,音频概述
谷歌给的官方先容是如许的:
“新的音频概述功能,可以一键将文档、幻灯片、图表等转化为引人入胜的讨论。”
由于交互情势很新、AI语音传神、讨论起来真的很像真人播客,各人一下就玩嗨了。



到这两天,Notebook LM不但已经可以或许把Youtube视频作为输入,还已经支持超100种语言。
如今,卡帕西的了局“示爱”,更为Notebook LM的热度添了一把火。
如卡帕西所说,Notebook LM爆火最重要的缘故原由,是它提供了一种与单纯Chat差别的交互范式。
卡帕西表现,Notebook LM消除了大模子的两大享受停滞:
第一点,谈天实在挺难的。
有些人在一样平常生存中跟人交换都费经心力,更别提要和Chatbot谈天,还得不绝提问、追问。
NotebookLM好就幸亏,天生的二AI播客,此中有一方就会处于提问、引导脚色。
咱把文档、音视频放进去,等候天生,美美听AI根据文件唠就是了。
第二点,阅读不是件轻易的事。
信息爆炸的碎片化期间,挑个惬意的姿势,大概开车时间听别人讨论我必要的东西,比本身费劲吧啦搁那儿看轻易得多。
——哪怕看的是AI已经帮昨们总结出来的凝练版本(哎,没错,咱就是这么懒!doge)。



本着字斟句酌的精力,也有网友表现了对Notebook LM更上一层楼的等待。
Hyperbolic Labs的联创兼CTO Yuchen Jin试玩事后,总结了两个范围性:
一个是它“看不到”,也就是没法处置惩罚文档里的图片信息。
不外背后的Gemini是多模态的嘛,相比Notebook LM长眼睛不会太晚。
另一个是用户无法引导AI播客的内容
Yuchen Jin喂给它两条推文,它就天生了近13分钟的音频内容,但它默认听众是平凡受众,以是讲了许多很根本的概念。
假如能指定天生播客的目的群体,大概评论主题、方向、角度,那真的是棒上加棒。
One More Thing
说时迟当时快,开辟者搞出开源版的NotebookLM了!
不外临时只能喂给它PDF嗷。



咱就是说,人类真故意思哈!
从前在音频转笔墨方面费劲,寻求把广播、集会灌音啥的转成笔墨。
如今又开始用大模子把笔墨转成播客了……
故意思哇故意思哇(狗头)。
[1]https://notebooklm.google/
[2]https://x.com/karpathy/status/1840112692910272898
[3]https://x.com/omarsar0/status/1840145774874898506
[4]https://x.com/Yuchenj_UW/status/1840203324571943403
[5]https://github.com/gabrielchua/open-notebooklm

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

使用道具 举报

全部评论 2

(华光大帝庙)发起尽快限定高频量化堵单,融券卖脱手续费按照累计超千股就翻倍递增限定做空,基金有红利才收管理费,减持股票只可回购注销促进分红,超募罚没归掩护基金,试行涨幅20%跌幅10%引导恒久投资,交易1手改为10股,不限投资门槛,一连涨跌停不绝牌只控制账户生意业务千股,事半功倍!
2024-10-4 22:49:04
昨们能利用不。
2024-10-4 22:58:06

热文

所属版块

您需要登录后才可以回帖 立即登录
说说你的想法......
0
2
0
返回顶部