在不久前結(jié)束的 Google I/O 上,Google 悄咪咪地在安卓和 iOS 同時(shí)上線了一款“舊”app——NotebookLM。發(fā)布當(dāng)日,不到 24 小時(shí),它就奪得蘋(píng)果 App Store 中生產(chǎn)工具類(lèi)別的第二名。
2023 年發(fā)布的 NotebookLM 此前只有桌面端
NotebookLM 于 2023 年發(fā)布,當(dāng)時(shí)人們只把它當(dāng)拆解文檔的知識(shí)庫(kù)使,等到了 2024 年新增“音頻概覽”后,NotebookLM 破圈了。
就連來(lái)自競(jìng)爭(zhēng)對(duì)手 OpenAI 的創(chuàng)始成員 Andrej Karpathy 在體驗(yàn) Google NotebookLM 后都難掩激動(dòng)地表示,這讓他想起了當(dāng)初的“ChatGPT 時(shí)刻”。
同我們這兩年已經(jīng)習(xí)慣的 AI 問(wèn)答機(jī)器人不同,當(dāng)我們輸入一個(gè)問(wèn)題,NotebookLM 會(huì)要求你先把掌握的多媒體素材上傳了,再提問(wèn)題,它是 source-grounded 的,只會(huì)根據(jù)你上傳的知識(shí)作答。就是這么一款由 AI 驅(qū)動(dòng)的筆記產(chǎn)品,翻紅了。
增加了音頻概覽功能后的 NotebookLM,可以將原本結(jié)構(gòu)化、線性表達(dá)的知識(shí)文本,生成 10 分鐘左右的 AI 雙人播客,而且音色、抑揚(yáng)頓挫,甚至包括調(diào)侃,都活人味十足。這還沒(méi)完,當(dāng)文本被轉(zhuǎn)化為音頻后,人們發(fā)現(xiàn) AI 非常會(huì)講故事、劃重點(diǎn),在聲音上都能做出高亮……繁雜的論文大概率是沒(méi)能看完,但相聲總是能在路上就聽(tīng)完的。
注:NotebookLM 支持生成中文播客,在生成之前將導(dǎo)出語(yǔ)言改為中文即可。相比中文播客,英文播客的呈現(xiàn)還會(huì)更加自然。
據(jù)流量分析平臺(tái) SimilarWeb 統(tǒng)計(jì),從去年 11 月開(kāi)始算,NotebookLM 半年時(shí)間月訪問(wèn)量漲了 56%,達(dá)到超四千八百萬(wàn)的量級(jí)。前陣子,Google 還推出了獨(dú)立的手機(jī)版, “聲音快餐”加上移動(dòng)場(chǎng)景,使用量有望再次翻倍。
AI 時(shí)代的筆記本長(zhǎng)啥樣
打開(kāi) NotebookLM,映入眼簾的一個(gè)個(gè)分門(mén)別類(lèi)的自建主題,每次新建都會(huì)被要求上傳素材,諸如會(huì)議記錄、課堂內(nèi)容、研究筆記,現(xiàn)在已經(jīng)支持各種格式的文本文檔、帶板書(shū)的幻燈片、PDF、網(wǎng)頁(yè)(中文網(wǎng)頁(yè)解析支持不佳,建議將其“網(wǎng)頁(yè)轉(zhuǎn) PDF”后再導(dǎo)入)、音頻,以及全互聯(lián)網(wǎng)智慧的結(jié)晶——YouTube!
一股腦兒都放進(jìn)去后,界面瞅著就像一個(gè)特定研究主題的問(wèn)答機(jī)器人,剛才上傳的不同媒介的資源,AI 全吸收了,且變成了你深入提問(wèn)的上下文。
如圖,AI 已經(jīng)將資料概括寫(xiě)好了,如果你這時(shí)就有明確的問(wèn)題要問(wèn),直接在輸入框激情問(wèn)答,但如果你和大部分人一樣,無(wú)從下手,AI 已經(jīng)貼心地?cái)M好了高質(zhì)量問(wèn)題,就懸浮在輸入框的下方,而且這些問(wèn)題你越問(wèn)越有,不斷更新生成。
NotebookLM 的回答,幾乎是每一句,都會(huì)做好索引,而且并不只是定位到某個(gè)素材,而是細(xì)化到某一個(gè)素材具體討論到當(dāng)前部分的位置。
如果你提的問(wèn)題,在庫(kù)里都沒(méi)有相關(guān)內(nèi)容,AI 就會(huì)直接說(shuō):答不了。
如果你上傳的素材非常多元,“思維導(dǎo)圖“能派上大用場(chǎng)。它會(huì)將不同內(nèi)容統(tǒng)統(tǒng)收整起來(lái),呈現(xiàn)邏輯和關(guān)聯(lián),如果你需要查看更細(xì)節(jié)的內(nèi)容,再逐層展開(kāi),當(dāng)找到你想具體研討的知識(shí)點(diǎn),點(diǎn)擊,AI 將會(huì)就這一個(gè)小點(diǎn)放置到整體語(yǔ)義和上下文中,再幫你劃出重點(diǎn)。
筆記區(qū)的“學(xué)習(xí)指南”“簡(jiǎn)報(bào)文檔”“常見(jiàn)問(wèn)題解答”和“時(shí)間軸”,也都能幫你做好各種形式的“劃重點(diǎn)”。這么看來(lái),NotebookLM 更像個(gè)學(xué)霸搭子,它一目十行后,再遞給你一本劃滿(mǎn)熒光筆跡的濃縮本,且對(duì)它說(shuō)的每句話都負(fù)責(zé)。
由于 source-grounded 的屬性,NotebookLM 的幻覺(jué)是降低了,但也意味著它并不能像 ChatGPT 那種生成式回答發(fā)散,不太能舉一反三。在用 NotebookLM 時(shí),我不太擔(dān)心 AI 胡編亂造,最大的幻覺(jué)可能在于我瞅了一眼展開(kāi)的思維導(dǎo)圖,覺(jué)得自己學(xué)到了太多……
文本生成“相聲”,他們都這么玩
真正讓 NotebookLM 在 AI 產(chǎn)品賽道跑出差異化的,是“音頻概覽”。用法也很簡(jiǎn)單,基于你上傳的資料,指定 AI 主播著重講哪個(gè)素材、哪個(gè)子主題,以及說(shuō)明你的角色、背景、職務(wù),明確你聽(tīng)待生成播客的目的是什么,prompt 寫(xiě)完,等幾分鐘,節(jié)目就開(kāi)播了。
科技博主@寶玉 xp 通過(guò)逆向推導(dǎo),總結(jié)出播客被系統(tǒng)要求“使用‘熱情講述者 + 冷靜分析者’雙聲部,只憑指定來(lái)源,為時(shí)間緊卻求深度的學(xué)習(xí)者,精編出既客觀中立又足夠有趣的洞見(jiàn),讓他 / 她收獲可立即行動(dòng)或引發(fā)頓悟的認(rèn)知價(jià)值?!边@種形式的知識(shí)攝取,并不直接替代閱讀,NotebookLM 在特定場(chǎng)景有它的實(shí)用意義。
NotebookLM 的產(chǎn)品負(fù)責(zé)人 Raiza Martin 最早在家里放這些播客,她的丈夫不滿(mǎn)一播就不帶停,Raiza 那時(shí)候卻在暗爽對(duì)方并沒(méi)有聽(tīng)出那是 AI 在說(shuō)相聲。
比如 AI 主播講到“3%”這么一個(gè)需要強(qiáng)調(diào)的百分比,就會(huì)著重在這個(gè)字眼上加重語(yǔ)氣,這種聲音上的高亮非常像活人,也加深了我們對(duì)重點(diǎn)的記憶。
這還沒(méi)算完,播客在放時(shí),你如果覺(jué)得 AI 并沒(méi)有講到你感興趣的點(diǎn)子上,直接按“加入”按鈕,打斷他們,直接提問(wèn)。
比如你在策劃一趟去巴厘島的行程,把一整本《孤獨(dú)星球》和各種攻略都導(dǎo)入庫(kù),開(kāi)始讓 AI 主播做景點(diǎn)推介了,聽(tīng)著聽(tīng)著你的小孩放學(xué)回家了,你這才意識(shí)到你把孩子這茬給忘了,那就可以打斷 AI 讓他們給你講點(diǎn)適合親子互動(dòng)的景點(diǎn)……等到真正到了旅游地,打斷主播,指定他們給你實(shí)時(shí)導(dǎo)覽,NotebookLM 直接化身耳機(jī)里的地陪。
也總有人使用工具不按套路。
有人把自己的簡(jiǎn)歷傳上去,那倆 AI 主播逮住你每條職業(yè)經(jīng)歷就是一頓贊美,仿佛拉了一個(gè)三人“夸夸群”,他們夸你前瞻,夸你深耕,即便教育背景和工作經(jīng)歷風(fēng)馬牛不相及,他們也會(huì)說(shuō)你底層能力遷移到位了……你聽(tīng)完只會(huì)笑盈盈地說(shuō)“AI 懂我”。
有人在工作會(huì)議上走神,把錄音傳給 AI 主播整理,在工位上聽(tīng)到生動(dòng)的會(huì)議概要,這可比枯燥的領(lǐng)導(dǎo)發(fā)言更易消化吸收。
有人擔(dān)心長(zhǎng)輩攝取太多二手信息,干脆收集可靠的出版物,做成 “10 分鐘聽(tīng)完一本書(shū)”系列,這樣的“聽(tīng)書(shū)”低幻覺(jué),零私貨。
以上都屬于內(nèi)容消費(fèi),也有人把生產(chǎn)搞起來(lái)了。
比如 OpenAI 的創(chuàng)始成員 Andrej Karpathy 就花了兩個(gè)小時(shí)做出了一檔十集的播客 Histories of Mysteries,先是用搜索引擎、ChatGPT、Claude 做好選題,然后再把諸如“亞特蘭蒂斯”的維基詞條傳給 NotebookLM,節(jié)目就算殺青了。
Histories of Mysteries 的其中一集,講述了“wow! 信號(hào)”的故事
又比如一位博主開(kāi)發(fā)了一款瀏覽器插件,可以把收集起來(lái)的 B 站視頻的字幕都給抓了,再導(dǎo)入 NotebookLM 分析,他對(duì)另一個(gè)博主非常感興趣,通過(guò)集中分析對(duì)方的文案特點(diǎn),為自己的創(chuàng)作提供靈感。
總結(jié)來(lái)說(shuō),NotebookLM 的對(duì)話交互和播客生成,都讓原本被動(dòng)接受知識(shí)的過(guò)程(比如聽(tīng)講座),變?yōu)橹鲃?dòng)收集、主動(dòng)交互。在傳統(tǒng)的教育中,要持續(xù)并隨時(shí)進(jìn)行高層次學(xué)習(xí)并不容易。
一個(gè)非常規(guī) Google 產(chǎn)品的誕生
在前不久的 Google I/O 上,Google 宣布他們專(zhuān)為教育場(chǎng)景優(yōu)化的 AI 模型 LearnLM 集成到了 Gemini 2.5 和 NotebookLM 中,持續(xù)優(yōu)化個(gè)性化、強(qiáng)互動(dòng)性的教學(xué)內(nèi)容的生成。值得一提的是,NotebookLM 之后,Google 就基于 LearnLM 推出了一個(gè)青少年科普交互式百科全書(shū) Learn About。
Learn About 界面
據(jù) TestingCatalog 報(bào)道,NotebookLM 還將上線“Sparks”視頻生成功能,90% 基于用戶(hù)提供素材,10% 為 AI 補(bǔ)充的信息。
而 Google 可是前不久剛端出 Veo 3。這個(gè) AI 視頻生成模型,你只需要撰寫(xiě)一段 prompt,它就能一鍵生成一個(gè)聲音、背景音跟視頻完美契合的完整成品。
如果拿 NotelookLM 的攢稿能力,結(jié)合 Veo 3,恐怕要沖擊一大波知識(shí)區(qū)博主。別不信,因?yàn)?Veo 3 現(xiàn)在的成片長(zhǎng)這樣:
NotebookLM 誕生的背后,也有不少說(shuō)頭。
NotebookLM 最早是一個(gè) “20% project”——這是 Google 的一個(gè)傳統(tǒng),即“員工可用 20% 的時(shí)間在業(yè)余項(xiàng)目上”。產(chǎn)品孵化自 Google Labs,相比大廠,Google Labs 更像創(chuàng)業(yè)小公司,流程更少,更迭和驗(yàn)證速度更快。
除了技術(shù)人和工程師,他們還雇了一位寫(xiě)科普暢銷(xiāo)書(shū)的作家——Steven Johnson,讓 AI 和真實(shí)的文字工作者交鋒和共創(chuàng),團(tuán)隊(duì)深入研究了這位作家組織信息以及書(shū)寫(xiě)的技藝。
NotebookLM 出圈后,Google Labs 負(fù)責(zé)人 Josh Woodward 也開(kāi)始兼任 Gemini 項(xiàng)目。他在接受紅衫采訪時(shí),表示“我確實(shí)認(rèn)為 prompt 已經(jīng)過(guò)時(shí)了”,他主張人們和 AI 交互不需要手搓那么長(zhǎng)的提示詞,他認(rèn)為多模態(tài)生成的超長(zhǎng)上下文,加上 AI 的推理能力,用戶(hù)的意圖會(huì)更容易被捕捉。
一個(gè)薅羊毛小貼士:
NotebookLM 免費(fèi)版支持上傳 50 個(gè)素材,對(duì)于一個(gè)你剛萌發(fā)好奇心的主題,可能用不到 50 個(gè),但如果是想反芻、回溫一個(gè)你曾花費(fèi)大心思鉆研過(guò)的課題,擴(kuò)容到了 Pro 版,就有意義了,將整本著作、長(zhǎng)視頻、長(zhǎng)音頻、內(nèi)容繁多的板書(shū),再加上這個(gè)課題的最新進(jìn)展,夯實(shí)自己對(duì)舊知識(shí)的認(rèn)知基礎(chǔ),還能引入新動(dòng)態(tài)的補(bǔ)充。
搜 Gemini Student,可以免費(fèi)領(lǐng) Google One 會(huì)員,包含所有 AI 服務(wù)會(huì)員,NotebookLM 也在內(nèi)。這樣,你的 NotebookLM 一下子就支持 500 個(gè)主題研究,每個(gè)主題最高可上傳 300 個(gè)素材。
作者:biu
編輯:臥蟲(chóng)
圖源:如無(wú)特別指出,圖片均來(lái)自 Google 應(yīng)用截圖
封面圖來(lái)源:Google