
NotebookLMのインフォグラフィカ
NotebookLMの最大の特徴は、ユーザーがアップしたPDFや指定したWebのURL、動画などの資料だけを知識源とするので、不確かな情報が生成されるリスク、つまりハルシネーションが非常に少なく、回答の根拠が明確なことです。機能的には、資料の要約、質問応答、アイデア出しは当たり前ですが、「マインドマップ」の自動生成、Podcast風の対話型「音声解説」が無料で使えます。ちょっと目を離すと、どんどんバージョンアップして画像生成AIを利用したYouTube風の「動画解説」には驚いたのですが、解説を1枚の画像にまとめる「インフォグラフィカ(図版参照)」、多数の画像を使ったパワポのような「スライド」、勉強用の質問と回答のある「フラッシュカード」まであります。
へ~至れり尽くせりだな。NotebookLMだけで他のアプリが不要だから、これは仕事には便利だ。なんでも頼める部下みたいだな。
OpenAIはAGIに集中していますが、Googleは市場規模の大きいビジネスユースに特化するという戦略のようです。GoogleがAIを率先して開発していくと、Googleの収益の大半を占めるネット広告モデルが崩壊していくと、2年ほど前にこの講座で指摘しています。実際にブラウザでのAI要約サービスが始まると、世界中のWebサイトへのアクセス数が大幅に減少し、インターネットのトラフィックが減っています。特にアメリカで顕著ですね。GoogleはAIの活用方法を、ビジネスユースでやっと見つけたようです。
で、Gemini 3は?
そうでした。Gemini 3の主な特徴は次の通りです。
ユーザーの質問内容を自律的に判断し、最適な出力形式を選択する「生成インターフェース(generative interfaces)」という新機能が導入された。これにより、単なるテキストではなく、視覚的なレイアウトや動的なビューを自動的に構築ができる。例えば、旅行の提案を依頼すると、アプリ内にWebサイトのようなインターフェースが生成され、モジュールや画像、フォローアップの質問を含む構成を提示可能。また概念の説明が必要な場合には、図表を描いたり簡単なアニメーションを生成できる。
Googleは、複数ステップのタスクを直接処理する実験的機能「Gemini Agent」も導入している。これはGoogleカレンダーやGmailなどのサービスと連携し、アクセス権限が付与されると、受信トレイの整理やスケジュール管理などを実行可能。汎用エージェントへと次第に近づいている。
開発者向けには、コード・ツール・ワークフローを単一のプロンプトから作成・管理できる、オールインワン・プラットフォーム「Google Antigravity」が発表された,。Gemini 3はGoogleの既存製品とも深く統合され、検索では推論特化型のGemini 3 Proへの切り替えが可能となり、ショッピング分野ではGoogle Shopping Graphから情報を取得し、推奨ガイドを生成できる。
Gemini 3 Proをベースとする画像生成AI「Gemini 3 Pro Image (Nano Banana Pro)」も発表している。これは、インフォグラフィックや手書きメモの図表への変換といった、データの視覚化が可能。
・推論機能と言語対応の強化:
Gemini3の高度な推論機能により、画像に書き込まれる文字が正確となり、崩壊しにくくなっている。これにより、複数の言語でテキストを生成したり、文字を含む画像コンテンツを翻訳したりできるようになった。
・マルチモーダル理解:
テキストだけでなく、画像・音声・動画・コード等、複数の情報形式を、単一タック内で処理・統合ができる。手書きのレシピの翻訳や、動画の分析と改善点の提案が可能。
・エージェント機能:
情報提供だけでなく、自律的なエージェントとして機能し、複雑なタスクの計画・実行を自動化できる。
・コーディング能力:
コードベース全体の論理を理解し、レガシーコードの移行やソフトウェアテストを支援。
・コンテキストウィンドウ:
大規模なコンテキスト処理能力により、膨大な量のドキュメントやコード・動画などの情報を一度に読み込み、文脈を失うことなく処理が可能。
参考までに「だし巻き卵の作り方を1枚の図表で解説してください」というプロンプトを、GPT5とGemini 3に与えた結果を示します。
※図版:筆者作成「GPT5の生成図版」
ほー、図で説明できるんだ。あれ、1番が2つあるぞ。2番の鍋(玉子焼き器)と卵液の漢字が間違っているしバターを使うかな。3番はフォントが異なるし、フライパンの絵が変だ。4番は笹の葉をお皿にしているな。まぁこれじゃ使えないな。
※図版:筆者作成「Gemini 3の生成図版」
お!ちょっと見るとGPTよりGeminiはよくできてるな。このまま図を使えそうだと思ったけど、2番のだし汁の容器が卵の殻で、オプションが謎だな。1番に書いてあるキッチンペーパーの使い方が書いていないぞ。5番のまきすの巻き方がおかしいな。でも日本の料理を、日本語で指示するだけでここまで図解できるのだからたいしたもんだ。
私もこのGemini 3の能力には驚きました。テック業界でも絶賛されていて、Salesforce のCEO Marc Benioffは、ChatGPTからGeminiへの乗り換えを宣言しています。「3年間、毎日ChatGPTを使ってきたが、もう戻ることはない。飛躍がすごい。世界が再び変わったと感じる」とXへ投稿しているくらいです。
そうなんだ。じゃあライバル企業は大変だろうな。
12/2のウォール・ストリート・ジャーナルの記事によると、OpenAIのサム・アルトマンは、「コード・レッド」を宣言し、Geminiに対抗するため他の作業を後回しにして、ChatGPT改善を最優先にするよう指示しました。そしてなんと12/11には、GPT-5.2を発表して順次利用可能となっているようです。当然Gemini 3より性能が上だと主張してますが、まだ発表直後なので評価は不明です。
へ~、さすがOpenAIも素早い対応だ。圧倒的に優位だったOpenAIも、かなり焦りだしてるようだな。最近のGoogleは、Gemini2.5あたりから立て続けにニュータイプのAIを発表して、OpenAIより先行してきたイメージがあるけど、Gemini 3は噂よりかなり登場が遅れたんですよね、先生。
確かにGemini 2.5 Proの発表が5月だったので、Gemini 3が11月発表というのは最近のAIにしては遅いと言われていました。6か月過ぎただけで開発が遅いと非難されてしまうのは、あまりに過酷な業界ですね。ただ公開されている記事によると、最先端の推論能力とマルチモーダル対応という高い目標を設定したからだけでなく、従来の実験的モデルリリースという方式を変更したことにあるそうです。
どういうことですか?
この記事によると、今までは「実験的AIモデルを開発者コミュニティーに渡し、そのフィードバックを使ってモデルを改良し、そのテストのサイクルを何度も繰り返す、という開発方法だった。しかも数億人のユーザーがいる複数のGoogleサービスがあるので、そのローンチの調整が必要となり、追加の複雑さを生んだ」と語っています。
確かにGoogleは様々なサービスを数億人に提供している、世界最大級のネット企業だからな。その多数のサービスを止めずにバージョンアップするなんて、想像したくもない。で、どうしたんですか?
Geminiシニアディレクターの話では「寄せられたフィードバックの量は、正直言ってわれわれが適切に処理できる範囲を超えていた」ので、「Geminiモデルも幅広く利用して、品質を重視したクローズドなテスト環境で実施することを選んだ」のだそうです。さらに「Gemini 4はGemini 3によって作られる予定」なのだそうですよ。
以前から予想されていたように、やっぱりそうなるんだろうな。いや~AI界隈は、やっぱりとんでもない業界だ。
年末ギリギリまで開発競争しているので、AI界隈は目が離せませんね。この続きは次回にしましょう。
・Googleの新サービスNotebookLMは、GPTのようなチャット方式ではなく、ビジネスユースに適したGUIと機能を持ち、Googleの新たな戦略が見えてくるサービスである。
・Google Gemini 3の機能と能力は、テック業界のビジネスユースにおいて非常に好評で、GPTから乗り換える人も多く、OpenAIの地位を脅かしている。
・Gemini 3の開発は従来の開発者コミュニティーを利用した方式から、クローズド方式に変更することで品質を向上させ、Gemini 4開発ではGemini 3が開発する予定となっている。
図版・書き手:谷田部卓
AI講師、サイエンスライター、CGアーティスト、主な著書に、MdN社「アフターコロナのITソリューション」「これからのAIビジネス」、日経メディカル「医療AI概論」他、複数の美術展での入賞実績がある。
(図版・TEXT:谷田部卓 編集:藤冨啓之)
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!
前回、OpenAI の新サービス群の紹介と一緒に、GoogleのGemini 3を説明する予定でしたが、Googleの発表が遅れていたので今回になってしまいました。それでも待たせただけあって、デビュー直後からテック業界では大評判となっています。
前回のOpenAIもそうでしたが、今度はどこが凄いんですか?
まず、Anthropic、Meta、xAI、DeepSeekなどの最新モデルとの、匿名投票による比較結果であるLMArenaのリーダーボードで、ほぼ全てのカテゴリーでトップスコアを獲得しています。さらに博士号レベルの推論を評価するGPQA Diamondでは、GPT5が86%に対して91%という高得点を記録しました。これが基本版を無料で使えるのです。
なるほど。あらゆる指標で最高得点を出しているんだ。でも最新AIが常に記録更新をし続けるのは、いつものことですよね。AGIが完成するまでのチキンレースかな。いや、AIバブルが弾けたら資金ショートするから、競争はそれまでかな。
その話になると長くなるので話を戻します。世界的にはOpenAIのGPT利用者が圧倒的に多いのですが、私はGemini 2.5が登場してからGoogleのNotebookLMをメインに使っています。
ボクはスマホのChatGPTを愛用してますが。