・動画生成AI 「Sora」2月発表、12月リリーステキストから複数のシーンをリアルな動画として、60秒生成できる革新的なAIモデル。映画に使えるレベルで世界を驚かせた。
・マルチモーダルLLM 「GPT-4o」5月発表、リリーステキスト・画像・音声データの多様な形式のデータを、単一モデルで高速処理ができる、マルチモーダル機能を大幅に参加させたAIモデル。
・推論AI「o1」9月発表、12月リリース LLMとは異なる新しいアルゴリズムで、高度な推論をできるようにした革新的AIモデル。12月には「o3」を発表した。
・AIモデル「Gemini 2.0 Flash」Gemini 2023/12、2.0 2024/12発表 画像、動画、音声などを高速処理できるマルチモーダルAI。マルチモーダル推論、長文脈理解、複雑な指示への追従と計画など、高度なエージェント機能を実現。
・動画生成AI「Veo 2」Veo 5月、Veo2 12月発表 高度な4K動画を数分間生成できるAIモデル。映画のような映像効果をプロンプトで実現でき、Soraを上回る性能という。
・iPhone/iPad/Mac用AI「Apple Intelligence」9月リリース Neural Engineのあるデバイスで稼働する「パーソナルインテリジェンス」で、ChatGPTと連携する分散処理型のユニークなAI。デバイス内にある大量のユーザーの個人情報をAIが安全に利用できるのが他社との最大の違い。
・研究開発プロセス自動化フレームワーク「The AI Scientist」8月発表 科学研究のサイクルであるアイデア創出、実験の実行と結果の要約、論文の執筆及びピアレビューを、自動的に遂行する前例のない画期的なAIシステム。
・Anthropic:「Claude3.5 Sonnet」6月リリース 対話をしながら視覚的なコンテンツをリアルタイムで生成し編集できる高性能な生成AI。GPT-4o、Gemini 1.5 Proより性能スコアは高い。
・Meta :Meta AI「Llama 3.2」9月発表 画像認識できるオープンソースのマルチモーダルLLM。
・xAI社:イーロンマスクが110億ドルを投じたAIスタートアップ。製品は未発表。
こうしてみると2024年は『AI祭り』でした。
やけに12月の発表やリリースが多いな。ちょっと発表日順にもまとめてみてみましょうよ
2月:動画生成AI 「Sora」(Open AI)
5月:マルチモーダルLLM 「GPT-4o」発表&リリース(Open AI)
:動画生成AI「Veo」発表(Google)
6月:「Claude3.5 Sonnet」リリース(Anthropic)
:研究開発プロセス自動化フレームワーク「The AI Scientist」発表(Sakana AI)
9月:推論AI「o1」9月発表(Open AI)
:iPhone/iPad/Mac用AI「Apple Intelligence」リリース(Apple)
:Meta AI「Llama 3.2」(Meta)
12月:動画生成AI 「Sora」リリース(Open AI)
:推論AI「o1」リリース(Open AI)
:マルチモーダルLLM 「GPT-4o」(Open AI)
:推論AI「o3」発表(Open AI)
:AIモデル「Gemini 2.0 Flash」発表(Google)
:動画生成AI「Veo2」発表(Google)
:イーロンマスクが110億ドルを投じたAIスタートアップ。製品は未発表(xAI社)
確かに12月は盛りだくさんですね。というのも、OpenAIが12月にホリデーイベント『12 Days of OpenAI』を開催して、12日間連続して新しいことを発表したからです。ここで『o1』o3』などが発表されたので、Googleも対抗上急遽製品発表を早めたようです。
こう比較してみるとGoogle は後追いで、AppleやSakana AIの戦略がユニークで面白いですね。
AI業界は、今では完全にレッドオーシャンになっているので、AIの性能が他社より多少上回っているだけでは生き残れないかもしれません。自社の特徴を生かした差別化戦略が最も重要なのです。ただオープンソースモデルの性能も急速に向上して、CatGPTに肉薄してきています。
そうなると、日本のSLM指向はもしかしたら上手くいくかもしれないな。
それでは個々のAIの説明は省いて、次はAI業界が驚いたノーベル賞の話に移ります。
これにはボクも驚きましたよ。ノーベル賞を授与されるほどの人たちでしたっけ?
ノーベル賞が授与されてみて、確かに科学の歴史において輝かしい成果であることに改めて気が付きました。ノーベル物理学賞が、プリンストン大学のジョン・ホップフィールド名誉教授とトロント大学のジェフリー・ヒントン名誉教授。ノーベル化学賞が、ワシントン大学のデイビッド・ベイカー教授とロンドンDeepMind社CEOデミス・ハサビス、研究チームのジョン・ジャンパーの3名です。
ヒントン教授ならボクでも聞いたことがあります。ディープラーニングの開発でしたね。
物理学賞2名の受賞理由は、「人工的なニューラルネットワークによる機械学習を可能にする基礎的な発見と発明に対して」です。ホップフィールド教授は、1982年にホップフィールド・ネットワークを提唱して「第2次AIブーム」の火付け役として有名です。ヒントン教授も長らくディープラーニングを研究して2012年のAlexNetの圧倒的画像認識率で一躍有名になり、「ディープラーニングのゴッドファザー」と呼ばれています。
でもニューラルネットワークは、先生が以前説明していたように、長いAI研究の歴史の中で多くの研究者が関わってきましたよ。
日本の甘利俊一教授は、ホップフィールド・ネットワークより19年前1967年に、「第1次AIブーム」の発端であるローゼンブラットのパーセプトロンの改良案「Theory of adaptive pattern classifiers」を発表し、甘利=ホップフィールド・ネットワークと呼んでいる研究者もいます。福島邦彦博士は、ヒントン教授より30年も前1978年に、独自の多層・畳み込み型ニューラルネットワーク「ネオコグニトロン」を理論的に確立し発表しています。ちなみにお二人とも88歳で元気に活躍されています。
え!じゃなんで二人が受賞できなかったんですか?
そこは分かりません。ただ物理学賞の最終候補に、この二人の日本人の名前が挙がっていたという噂はありますが、詳細は不明です。
それではノーベル化学賞の方は?
ベイカー教授は、コンピュータを使ってタンパク質を構成する20種類のアミノ酸から、全く新たなタンパク質を設計することに成功しました。DeepMind社のCEOハサビスと39歳の研究者ジャンパーは、タンパク質の立体構造を予測するAIモデル「AlphaFold」を開発しています。AlphaFoldは、現代科学の中で最も難しく、かつ可能性に満ちた課題の1つであるタンパク質の形状や構造を予測ができ、医学や生物学の研究に革新をもたらしました。従来、タンパク質の複雑な構造をX線や電子顕微鏡を使って調べる実験は、長い時間と手間がかかり、巨額の費用がかかっていたのです。それをAlphaFoldは劇的に削減することができました。しかも最新版はAlphaFold 3なのですが、そのソースコードとデータベースを科学者向けに無料で公開しています
それじゃDeepMindは、収益を得られないじゃないですか。
DeepMindはGoogle配下なので、単体での利益を気にしていないのでしょう。実際、ハサビスCEOは以下のように発言しています。
AlphaFoldはすでに200万人以上の研究者によって、酵素設計から医薬品発見まで重要な研究を進めるのに使用されています。AlphaFoldが、科学的発見を加速するAIの驚異的な可能性を示す、最初の証明となることを願っています。
しかし科学分野で発見された素晴らしい研究結果を、世界に広く公開することは当然のことだとは思いますよ。でも今までの先端科学分野だと、その道の専門家でないと扱えないような情報というか知識でした。それがデジタル技術になるとソースコードとデータベースがあれば、大学生レベルの知識で、危険なウイルスなんかを設計できてしまうのでは?
DeepMindの研究者ジャンパーは『AlphaFold 2の公開前、約30人の専門家に”悪意ある者がこの技術を悪用する可能性があるか”を尋ねました。その結果、大多数の専門家がこの技術には大きなリスクがなく、公開することに大きなメリットがあると判断した。』と発言しています。DeepMindの技術はバイオテクノロジーと組み合わせると、非常にリスクが高いので、このような評価プロセスを取り入れているようです。
先端科学の研究者が、全員良心を持っているとは限りませんよ。何年か前、世界で初めて遺伝子編集ベビーを誕生させた中国人科学者のような、マッドサイエンティストがまだいるんじゃないですか。
それは否定できませんね。今までこの講座では、AIのリスクについてほとんど言及してこなかったので、次回説明しましょう。
【終わり】
・2024年は多くの企業から革新的なAIが続々と発表されるAI祭りの年だった。動画生成AI、マルチモーダルAI、推論AI、AIエージェント、研究の自動化AIなど多数ある。
・AI業界は競争過多のレッドオーシャンの状況で、スケーリング則が有効な限り資金力の勝負になっており、他社との差別化戦略が一層重要になっている。
・ノーベル賞物理学賞が、ニューラルネットワークの基礎を築きその発展を理由に2名のAI研究者に授与され、ノーベル化学賞は、タンパク質の立体構造を予測するAIモデルを開発した2名のAI研究者が受賞した。
著者:谷田部卓
AIセミナー講師、著述業、CGイラストレーターなど、主な著書に、MdN社「アフターコロナのITソリューション」「これからのAIビジネス」、日経メディカル「医療AI概論」他、美術展の入賞実績もある。
(TEXT:谷田部卓 編集:藤冨啓之)
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!
先生、2024年のAI界隈は、ほとんどお祭り騒ぎでしたよ。あまりに発表が多くて前半は覚えてないです。
そうですよね。私もそうなので、忘れないうちに2024年のAIを総括してみましょう。とりあえずAI企業別の主要AI一覧にしています。最近この講座では主にOpenAIとSakana AIばかりで、他のAI企業はほとんど紹介していませんでしたので、トピックだけ紹介します。