AIエージェントの時代(第5回)‐OpenAI を焦らせるGoogle Gemini 3 | データで越境者に寄り添うメディア データのじかん
カテゴリー
キーワード
AIエージェントの時代(第5回)‐OpenAI を焦らせるGoogle Gemini 3

AIエージェントの時代(第5回)‐OpenAI を焦らせるGoogle Gemini 3

AIバブルの崩壊が迫る中で、2025年AI界隈の最後を締めくくったのは、GoogleのGemini 3 だ。その圧倒的使いやすさと性能で、OpenAIのサム・アルトマンでさえ称賛している。今回は、このGemini 3の機能説明とGoogleの戦略について考察する。

AIエージェントの時代(第1回)-ブームから実用化へ
AIエージェントの時代(第2回)-MCPとA2AがAIを変える
AIエージェントの時代(第3回)-AIエージェントのリスク
AIエージェントの時代(第4回)-誰にでも作れるAIエージェント

         

登場人物

大学講師の知久卓泉(ちくたくみ)
眼鏡っ娘キャラでプライバシーは一切明かさない。

サルくん
軽薄で口が達者だが怜悧な頭脳を持つ大学院生。

 

■ビジネスで活躍するGoogle NotebookLM

 チクタク先生

前回、OpenAI の新サービス群の紹介と一緒に、GoogleのGemini 3を説明する予定でしたが、Googleの発表が遅れていたので今回になってしまいました。それでも待たせただけあって、デビュー直後からテック業界では大評判となっています。

 サルくん

前回のOpenAIもそうでしたが、今度はどこが凄いんですか?

 チクタク先生

まず、Anthropic、Meta、xAI、DeepSeekなどの最新モデルとの、匿名投票による比較結果であるLMArenaのリーダーボードで、ほぼ全てのカテゴリーでトップスコアを獲得しています。さらに博士号レベルの推論を評価するGPQA Diamondでは、GPT5が86%に対して91%という高得点を記録しました。これが基本版を無料で使えるのです。

 サルくん

なるほど。あらゆる指標で最高得点を出しているんだ。でも最新AIが常に記録更新をし続けるのは、いつものことですよね。AGIが完成するまでのチキンレースかな。いや、AIバブルが弾けたら資金ショートするから、競争はそれまでかな。

 チクタク先生

その話になると長くなるので話を戻します。世界的にはOpenAIのGPT利用者が圧倒的に多いのですが、私はGemini 2.5が登場してからGoogleのNotebookLMをメインに使っています。

 サルくん

ボクはスマホのChatGPTを愛用してますが。

NotebookLMのインフォグラフィカ

 チクタク先生

NotebookLMの最大の特徴は、ユーザーがアップしたPDFや指定したWebのURL、動画などの資料だけを知識源とするので、不確かな情報が生成されるリスク、つまりハルシネーションが非常に少なく、回答の根拠が明確なことです。機能的には、資料の要約、質問応答、アイデア出しは当たり前ですが、「マインドマップ」の自動生成、Podcast風の対話型「音声解説」が無料で使えます。ちょっと目を離すと、どんどんバージョンアップして画像生成AIを利用したYouTube風の「動画解説」には驚いたのですが、解説を1枚の画像にまとめる「インフォグラフィカ(図版参照)」、多数の画像を使ったパワポのような「スライド」、勉強用の質問と回答のある「フラッシュカード」まであります。

 サルくん

へ~至れり尽くせりだな。NotebookLMだけで他のアプリが不要だから、これは仕事には便利だ。なんでも頼める部下みたいだな。

 チクタク先生

OpenAIはAGIに集中していますが、Googleは市場規模の大きいビジネスユースに特化するという戦略のようです。GoogleがAIを率先して開発していくと、Googleの収益の大半を占めるネット広告モデルが崩壊していくと、2年ほど前にこの講座で指摘しています。実際にブラウザでのAI要約サービスが始まると、世界中のWebサイトへのアクセス数が大幅に減少し、インターネットのトラフィックが減っています。特にアメリカで顕著ですね。GoogleはAIの活用方法を、ビジネスユースでやっと見つけたようです。

 サルくん

で、Gemini 3は?

■Gemini 3の機能

 チクタク先生

そうでした。Gemini 3の主な特徴は次の通りです。

1.自律的なインターフェースの構築

ユーザーの質問内容を自律的に判断し、最適な出力形式を選択する「生成インターフェース(generative interfaces)」という新機能が導入された。これにより、単なるテキストではなく、視覚的なレイアウトや動的なビューを自動的に構築ができる。例えば、旅行の提案を依頼すると、アプリ内にWebサイトのようなインターフェースが生成され、モジュールや画像、フォローアップの質問を含む構成を提示可能。また概念の説明が必要な場合には、図表を描いたり簡単なアニメーションを生成できる。

2.エージェント機能の導入

Googleは、複数ステップのタスクを直接処理する実験的機能「Gemini Agent」も導入している。これはGoogleカレンダーやGmailなどのサービスと連携し、アクセス権限が付与されると、受信トレイの整理やスケジュール管理などを実行可能。汎用エージェントへと次第に近づいている。

3.開発者向け統合と新ツール

開発者向けには、コード・ツール・ワークフローを単一のプロンプトから作成・管理できる、オールインワン・プラットフォーム「Google Antigravity」が発表された,。Gemini 3はGoogleの既存製品とも深く統合され、検索では推論特化型のGemini 3 Proへの切り替えが可能となり、ショッピング分野ではGoogle Shopping Graphから情報を取得し、推奨ガイドを生成できる。

4.画像生成モデル(Nano Banana Pro)の強化

Gemini 3 Proをベースとする画像生成AI「Gemini 3 Pro Image (Nano Banana Pro)」も発表している。これは、インフォグラフィックや手書きメモの図表への変換といった、データの視覚化が可能。

5.その他

・推論機能と言語対応の強化:
Gemini3の高度な推論機能により、画像に書き込まれる文字が正確となり、崩壊しにくくなっている。これにより、複数の言語でテキストを生成したり、文字を含む画像コンテンツを翻訳したりできるようになった。

・マルチモーダル理解:
テキストだけでなく、画像・音声・動画・コード等、複数の情報形式を、単一タック内で処理・統合ができる。手書きのレシピの翻訳や、動画の分析と改善点の提案が可能。

・エージェント機能:
情報提供だけでなく、自律的なエージェントとして機能し、複雑なタスクの計画・実行を自動化できる。

・コーディング能力:
コードベース全体の論理を理解し、レガシーコードの移行やソフトウェアテストを支援。

・コンテキストウィンドウ:
大規模なコンテキスト処理能力により、膨大な量のドキュメントやコード・動画などの情報を一度に読み込み、文脈を失うことなく処理が可能。

 チクタク先生

参考までに「だし巻き卵の作り方を1枚の図表で解説してください」というプロンプトを、GPT5とGemini 3に与えた結果を示します。

※図版:筆者作成「GPT5の生成図版」

 サルくん

ほー、図で説明できるんだ。あれ、1番が2つあるぞ。2番の鍋(玉子焼き器)と卵液の漢字が間違っているしバターを使うかな。3番はフォントが異なるし、フライパンの絵が変だ。4番は笹の葉をお皿にしているな。まぁこれじゃ使えないな。

※図版:筆者作成「Gemini 3の生成図版」

 サルくん

お!ちょっと見るとGPTよりGeminiはよくできてるな。このまま図を使えそうだと思ったけど、2番のだし汁の容器が卵の殻で、オプションが謎だな。1番に書いてあるキッチンペーパーの使い方が書いていないぞ。5番のまきすの巻き方がおかしいな。でも日本の料理を、日本語で指示するだけでここまで図解できるのだからたいしたもんだ。

■Gemini 3のテック業界での評判とその影響

 チクタク先生

私もこのGemini 3の能力には驚きました。テック業界でも絶賛されていて、Salesforce のCEO Marc Benioffは、ChatGPTからGeminiへの乗り換えを宣言しています。「3年間、毎日ChatGPTを使ってきたが、もう戻ることはない。飛躍がすごい。世界が再び変わったと感じる」とXへ投稿しているくらいです。

 サルくん

そうなんだ。じゃあライバル企業は大変だろうな。

 チクタク先生

12/2のウォール・ストリート・ジャーナルの記事によると、OpenAIのサム・アルトマンは、「コード・レッド」を宣言し、Geminiに対抗するため他の作業を後回しにして、ChatGPT改善を最優先にするよう指示しました。そしてなんと12/11には、GPT-5.2を発表して順次利用可能となっているようです。当然Gemini 3より性能が上だと主張してますが、まだ発表直後なので評価は不明です。

 サルくん

へ~、さすがOpenAIも素早い対応だ。圧倒的に優位だったOpenAIも、かなり焦りだしてるようだな。最近のGoogleは、Gemini2.5あたりから立て続けにニュータイプのAIを発表して、OpenAIより先行してきたイメージがあるけど、Gemini 3は噂よりかなり登場が遅れたんですよね、先生。

 チクタク先生

確かにGemini 2.5 Proの発表が5月だったので、Gemini 3が11月発表というのは最近のAIにしては遅いと言われていました。6か月過ぎただけで開発が遅いと非難されてしまうのは、あまりに過酷な業界ですね。ただ公開されている記事によると、最先端の推論能力とマルチモーダル対応という高い目標を設定したからだけでなく、従来の実験的モデルリリースという方式を変更したことにあるそうです。

 サルくん

どういうことですか?

 チクタク先生

この記事によると、今までは「実験的AIモデルを開発者コミュニティーに渡し、そのフィードバックを使ってモデルを改良し、そのテストのサイクルを何度も繰り返す、という開発方法だった。しかも数億人のユーザーがいる複数のGoogleサービスがあるので、そのローンチの調整が必要となり、追加の複雑さを生んだ」と語っています。

 サルくん

確かにGoogleは様々なサービスを数億人に提供している、世界最大級のネット企業だからな。その多数のサービスを止めずにバージョンアップするなんて、想像したくもない。で、どうしたんですか?

 チクタク先生

Geminiシニアディレクターの話では「寄せられたフィードバックの量は、正直言ってわれわれが適切に処理できる範囲を超えていた」ので、「Geminiモデルも幅広く利用して、品質を重視したクローズドなテスト環境で実施することを選んだ」のだそうです。さらに「Gemini 4はGemini 3によって作られる予定」なのだそうですよ。

 サルくん

以前から予想されていたように、やっぱりそうなるんだろうな。いや~AI界隈は、やっぱりとんでもない業界だ。

 チクタク先生

年末ギリギリまで開発競争しているので、AI界隈は目が離せませんね。この続きは次回にしましょう。

この記事のポイント

・Googleの新サービスNotebookLMは、GPTのようなチャット方式ではなく、ビジネスユースに適したGUIと機能を持ち、Googleの新たな戦略が見えてくるサービスである。
・Google Gemini 3の機能と能力は、テック業界のビジネスユースにおいて非常に好評で、GPTから乗り換える人も多く、OpenAIの地位を脅かしている。
・Gemini 3の開発は従来の開発者コミュニティーを利用した方式から、クローズド方式に変更することで品質を向上させ、Gemini 4開発ではGemini 3が開発する予定となっている。

図版・書き手:谷田部卓
AI講師、サイエンスライター、CGアーティスト、主な著書に、MdN社「アフターコロナのITソリューション」「これからのAIビジネス」、日経メディカル「医療AI概論」他、複数の美術展での入賞実績がある。

(図版・TEXT:谷田部卓 編集:藤冨啓之)

 

参照元

×

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

学びをシェアする

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

掲載特集

デジタル・DX・データにまつわる4コマ劇場『タイムくん』 デジタル・DX・データにまつわる4コマ劇場『タイムくん』 データのじかんをもっと詳しくデータのじかんフィーチャーズ データのじかんをもっと詳しく データのじかんフィーチャーズ 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 DXの1次情報をを世界から『World DX Journal』 DXの1次情報をを世界から 『World DX Journal』 データで越境するあなたへおすすめの『ブックレビュー』 データで越境するあなたへおすすめの 『ブックレビュー』 BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ CIOの履歴書 by 一般社団法人CIOシェアリング協議会 CIOの履歴書 by 一般社団法人CIOシェアリング協議会 なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える 日本ビジネスの血流である帳票のトレンドを徹底解説 日本ビジネスの血流である帳票のトレンドを徹底解説 データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ BI(ビジネスインテリジェンス)のトリセツ BI(ビジネスインテリジェンス)のトリセツ 入社1年目に知っておきたい差が付くKPIマネジメント 入社1年目に知っておきたい 差が付くKPIマネジメント CIOLounge矢島氏が紐解くトップランナーたちのDXの“ホンネ” CIOLounge矢島氏が紐解く トップランナーたちのDXの“ホンネ” データのじかん Resources越境者のためのお役立ち資料集 データのじかん Resources 越境者のためのお役立ち資料集 AI実装の現在地点-トップITベンダーの捉え方 AI実装の現在地点-トップITベンダーの捉え方 データでビジネス、ライフを変える、面白くするDATA LOVERS データでビジネス、ライフを変える、 面白くするDATA LOVERS データマネジメント・ラジオ by データ横丁 データマネジメント・ラジオ by データ横丁 データのじかんNews データのじかんNews データ・情報は生もの!『DX Namamono information』 データ・情報は生もの! 『DX Namamono information』 ちょびっとラビット耳よりラピッドニュース ちょびっとラビット耳よりラピッドニュース AI事務員宮西さん(データ組織立ち上げ編) AI事務員宮西さん(データ組織立ち上げ編) 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! データはともだち 〜怖くないよ!by UpdataTV Original データはともだち 〜怖くないよ!by UpdataTV Original データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH データの壁を越え、文化で繋ぐ。データ界隈100人カイギ データの壁を越え、文化で繋ぐ。データ界隈100人カイギ
close close