NotebookLM(生成AIの一種)でPodcast(音声解説)を作れる

ChatGPTやGeminiなどの生成AIは検索の代わりや人生相談の相手などなど・・・に広く使われるようになりましたが、GoogleのNotebookLMの便利さ、すごさはそれ程知られていないようです。今年の3月に「採点に使えるよ」という内容でNoteに書いたのですが、最近、学会に投稿した11ページの総説の音声解説をNotebookLMにやってもらったところ、出来すぎで、面白い。そこで、NotebookLMを使って、ペン粒卓球選手のナックルロングサービス対策の動画解説と音声解説を作ってみました。結果は以下のとおり。長め音声解説の後に、解説に対応したスライドを示しています。眺めながら音声解説を聴いて下さい。その後に、記事がありますので、こちらもお読みください。

NotebookLM自動作成の動画解説はこちら(7:26)

マニアックな内容が省略されていますが、分かりやすい動画です。

短めの音声解説(6分38秒)

基本的な内容の音声解説です。マニアックな部分の説明が省略されています。

長めの音声解説(20分38秒):マニアックなノウハウ含みます。下記のスライドを御覧になりながら聴いて下さい。

表 参考にしたYoutube動画

NotebookLM:アップロードした情報(ソース)をまとめてコンテンツを作る

NotebookLMは生成AIの一種で、大規模な言語情報を学習したモデルを使いますが、ユーザーが使うときには、入力データとしてユーザーがアップロードした情報(「ソース」)しか使わないことが特徴です。ChatGPTや普通のGeminiのように、情報が足りないと思ったら様々なホームページから情報を追加することはしません。情報を追加するのはユーザーだけなのです。どんな「ソース」を最初に与えたり追加したりすることが出来るか?下の図のとおりです。ウェッブサイトやyoutubeへのリンクも「ソース」にできるのです。という訳で、私が選び抜いた5つのyoutubeサイトをソースにして音声解説を作ってみることから始めましたが、そこから工夫して最終的な音声解説と動画解説を作りました。

AI生成音声解説の卓球業界初はWRMの極薄ラバー解説。技術解説の「業界初」をやろう!

さて、この「へん粒」ブログで使おうかな、と思っていたところ、9月6日のWRMさんからのメールのタイトルが「【WRM極薄】業界初!?AIを使って極薄ラバーの解説動画作りました!」だったので、「やられた!」と思いました。ただ、「技術解説としては業界初」はまだある。そうそう、ペン粒が一番嫌なナックルロングサーブ対策の音声解説を作ろう!という訳で、検索をかけたところ、大変勉強になるyoutube動画が5本見つかりました。この音声解説の作り方は、近日中にnoteに書く予定です。なお、音声解説で「時計回り、反時計回り」が逆になっている部分をスライドの画像で修正しています。

「意味あるの?もとの動画を見た方がいいんじゃない?」

ごもっとも。ただ、私自身、「ペン粒 ロングサーブ対策」で検索して見つかったyoutubeを見て「うん、うん」と言っていたときと、言語化しながら動画をコマ送りで見たとき、改めて音声解説を聴いてから動画を見たときで動画の見方が変わったことは事実です。本当のディープなコツは、動画の中の「画像の時間変化」にあって、その情報はNotebookLMでもGemini 2.5でも読み取れていないようです。今のところ、人間の方が優れているところです。そこで、今回の記事を作るときには、コマ送りして分かった情報を含めて、私自身が動画から読み取った重要なポイントをテキスト化して、NotebookLMが読み取って作ったまとめと比較して一つの情報(ソース)に作り直してから音声解説を作りました。結局、私たちがyoutube動画から得ている情報は、頭の中で上のような作業をしているのだろうと思っています。