会員ページへmember

About us データのじかんとは?

実用化が始まる動画生成AI(1) ~動画生成AIが与えるインパクト~

テキストで指示すると動画を生成できるAI技術が、予想をはるかに超える進化を遂げており、CM制作や映画制作などの映像制作現場に大きな衝撃を与えてきている。第一回はその皮切りとなったOpen AI「sora」について、実際に生成された動画を確認しながら解説し、さらに米国での動画生成AIサービスの動向についても紹介する。

         

登場人物

大学講師の知久卓泉(ちくたくみ)
眼鏡っ娘キャラでプライバシーは一切明かさない。

サルくん
軽薄で口が達者だが怜悧な頭脳を持つ大学院生。

 

動画生成AIの出現

 チクタク先生

今回は、久しぶりに生成AIの話をしましょう

 サルくん

おや、AI講座に戻ったのですね。桃井先生の「ナラティブの話」はどうなったのですか?認知戦への対抗手段の説明がまだでしたよ

 チクタク先生

桃井先生はまだ調査中のようですが、私に丸投げされても困るので、溜まっている生成AIに関する最新情報を先に話します。というか、受講者はゴリくんではなくてサルくんになったのですか

 サルくん

素直なゴリくんじゃなくて面倒かもしれませんが、よろしく

 チクタク先生

それではAIテクノロジーですが、2024年になってからもその進化速度は衰えず、恐ろしいほどの加速度をつけて突き進んでいます。私の予想では、ChatGPT以降のAIテクノロジーは、本格的に社会実装モードに入り、多くのAI企業はアプリケーション開発に注力していくと思っていました。実際に様々なアプリも登場しているのですが

 サルくん

前回の生成AIの話でも、最後はアプリの紹介でしたね

 チクタク先生

ところが、動画生成AIが出現しそのクオリティの高さに驚いたので、そちらを先に紹介することにします

 サルくん

え!画像生成AIが世界的に有名になったのは、たしか2022年の夏ごろでしたよ。それから2年も経たないうちに、もう動画まで生成できるんですか?

 チクタク先生

そうなのです。実は2022年末時点で、研究室レベルで動画生成の発表がありました。私でも1年以上前から、無料AIツールを試して数秒程度の動画を生成しています。
ただその時点では、解像度1280×768、毎秒24フレームで128フレーム、つまり5秒程度の動画生成が精一杯でした。画像の品質も低く、低レベルのアニメ調です。
ですから、実用化するには早くても4~5年はかかるなと考えていました。そのため、動画生成AIの情報をほとんど収集していなかったので、2024年2月にOpen AIが発表した“Sora”に驚いたのです

 サルくん

どこがそんなに凄いんですか?

 チクタク先生

まぁ、この1分間のビデオを観れば分かります

 サルくん

凄い!この映像を全部AIが制作したんですか!でも、どうやって?

 チクタク先生

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
と、呪文を唱えるだけです

 サルくん

だから、本当は?

 チクタク先生

ですから、OpenAIにプロンプトを以下のように入力するだけです。もちろん英語ですけどね

■プロンプト(日本語訳)

暖かく光るネオンとアニメーションの街の看板で埋め尽くされた東京の通りを歩くスタイリッシュな女性。黒いレザージャケットに赤いロングドレス、黒いブーツを履き、黒い財布を持っている。サングラスに赤い口紅。彼女は自信に満ち、さりげなく歩いている。通りは湿っていて反射し、色とりどりのライトの鏡のような効果を生み出している。多くの歩行者が歩いている。

 サルくん

でも冒頭の引きで下からあおるカメラアングルや、途中から顔がアップになったりするようなシーン構成の指示とカメラモーションが呪文にないですよ。よく見ると看板の文字は無茶苦茶で読めないけど

 チクタク先生

読めない漢字の看板を生成するのは” 画像生成AIあるある” ですね。漢字を読めない外国人には、漢字のようなものさえあれば問題ないのでしょう。シーン構成なんかはAIにお任せのようです。それより、道路が雨に濡れて看板のネオンをキラキラと反射したり、路地を歩く人たちの様子があまりにリアルなのには驚かされたね

 サルくん

これ、なにも言わずに人に見せたら、都会で撮影したスタイリッシュなビデオだと騙せますね。フェイク画像の比じゃないな。ボクならもっと人を驚かすビデオを作れるので、やり方を教えてください

 チクタク先生

残念ながらSoraは、まだ一般公開していません。サルくんみたいに怪しげなビデオを作らせないためには、しかたがないでしょうね。でも、似たような機能を持つ無料の動画生成AIソフトが2023年からいくつも登場しています。それと作詞、作曲、歌唱までできるAIツールと組み合わせれば、ミュージックビデオを一人で制作できますよ。もっとも無料版では、利用する秒数や回数、機能の制限があるので、あくまでお試し用です。高品質の動画を本格的に作るには月額20ドル以上が必要になります

 サルくん

なんだ、やっぱり有料か。まぁそりゃそうですよね。でも、Soraが公開される前から動画生成AIで高画質の映像が制作できていたんだ

 チクタク先生

実はそうなのです。アメリカの企業Runway社が、2023年8月にRunway Gen-2というテキストから動画を生成できるソフトウェアを発表しています。この動画生成AIツールは、プロ用として様々な編集機能などがあるので、広告業界・TV・映画といった映像産業に大きなインパクトを与えていくはずです

 サルくん

へ~、AIといえばOpen AI社だと思っていたのですが、他の企業も凄いAIを開発しているんですね

プロが使う動画生成AIツール

 チクタク先生

このRunway社は、テキストから画像生成できる有名な画像生成AI“Stable Diffusion”を、Stability.AI社と共同開発したスタートアップ企業です。Runway社は、チリとギリシャからの移民たちが創業した会社で、初めのうちはアメリカ人がいなかったそうです。それが創業わずか5年で5000万ドルの資金調達をして、このAIツールを開発したのですから、いかにアメリカが優秀な人材を引き寄せているかが分かります

 サルくん

しかし、移民が設立した実績のない企業に、5000万ドルもの大金をベットするベンチャーキャピタルも、凄いギャンブラーですね

 チクタク先生

AIのスタートアップ企業は、アメリカでは大量に誕生しています。ベンチャーキャピタルは複数の有望な企業に対して、いわばローリスクベットで賭けているので、違法賭博をするような無謀なギャンブラーなどではありません

 サルくん

そうか、ルーレットじゃないからローリスクベットが許されているんだな

 チクタク先生

とにかく、他にも動画生成AIのサービスを提供している企業はあるので、いくつか紹介しておきます。もちろん、このようなAIサービスは数か月も経てば進化していきますし、既にSoraと同等の動画生成AIのオープンソースが登場しています。以下のサービスは2024年3月時点での情報で、個々のサービス紹介は長くなるので割愛します

■動画生成AIサービス提供企業(例)

・GliaCloud
・InVideo
・Pictory
・Synthesia
・Video BRAIN(日本企業)

 サルくん

しかしボクが知らない間に、動画生成はAIに任せる時代になっていたんですね

 チクタク先生

いいえ、どのサービスも開始したばかりなので、実際の現場で使われてからその評価が決まります。映像のプロの使用に耐えられるかどうかの判断は、しばらく時間がかかるはずです。
Soraでも1分程度の映像しか生成できないので、全部を動画生成AIだけで映画の制作はすぐにはできないはずです。それでも映像制作現場では、大幅な人員削減と制作時間の短縮が可能になるので、当然制作コストが大きく下がるでしょうね。
CM制作ならすぐにでも使い始めるはずです

 サルくん

それに、ユーチューバーもすぐに利用するから、素人とプロの境界も崩れてくるはずだな。こりゃ早いもん勝ちだから、ボクもさっさとAIを使ったユーチューブを始めて儲けるぞ

 チクタク先生

注意しなければならないのは、AIツールが生成した動画が、商業利用可能かどうかの確認は必須ですよ。まあ商業利用できなかったら、プロの映像作家は利用しませんが。そういえば、OpenAIがハリウッドの映画スタジオにSoraを売り込んでいるようなので、少なくともOpenAIは問題ないと考えているのでしょう(註1)

 サルくん

あれ、2023年にアメリカの映画俳優組合が、脚本家や俳優の仕事を奪うようなAIの使用を規制せよと、ストライキをしてましたが大丈夫なんですかね。まぁそれより、ハリウッドの映画に使えるほどSoraのレベルは高いのですか?

 チクタク先生

これもSoraのサンプルムービーです。これを見ると分かると思います。Soraが他の動画生成AIツールと一線を画しているところは、複数のキャラクター、特定のモーション、被写体と背景の正確な詳細を含む複雑なシーンを、物理法則をシミュレートしながら動画生成できる点にあります(註2)

 サルくん

例えば?

 チクタク先生

従来のツールですと、男の子がクッキーを食べるムービーを生成した場合、男の子がかじったはずのクッキーにかじった跡が残っていないということが起こります。今まで、複雑な状況で正確に物理的なシミュレートをするのが難しく、AIが動きの原因と結果を理解できていないために、矛盾したムービーが生成されることがよくあったのです

 サルくん

そうか、そこまでやらなきゃならないんだ。だからこのポップなワンちゃんの映像みたいに、Soraの生成動画は、とんでもなくリアルに見えるんだな。確かにこのレベルだと、映画製作に俳優もスタジオも不要ですね。VFXの巨人ILMは数千人も社員を抱えているけど、ゴジラ-1.0の白組並みの数百人にまで減らせそうだぞ

 チクタク先生

映画は、企画から公開まで最低でも3年かかるので、時流に乗ったタイムリーな映画を、実は制作できませんでした。しかし、このツールを使えば短期間かつ低コストで制作が可能になります。しかも高額な人気スターが不要になるので、キャスティングの苦労もなくなります。映画業界は、これからかつてない歴史的変化に見舞われることでしょう

 サルくん

もしかしたら人気スターたちは、お払い箱になる前に、自分の3Dモデルを高額な使用料で使わせることで、永遠に若いころの姿のままスクリーンに登場するかも

 チクタク先生

つい先日、日本では“AIと共に最高の映画を創る会”が発足していますから、ハリウッドほどAIに拒否感が少ないようです

 サルくん

先生が意外に映画に詳しいことは分かったので、話を戻してください

 チクタク先生

失礼しました。動画生成AIの話でしたね。今回は技術的な説明をしていなかったので、次回は動画生成AIの仕組みについて説明しましょう

■ここまでのポイント

・動画生成AIサービスはまだ黎明期であり、今後「プロの現場で使われるか」が普及のポイントになる
・ハリウッドにも売り込んでいる「Sora」は他の動画生成AIと比べて「テキストで指示するだけで、複雑なシーンを物理法則をシミュレートしながらリアルな動画生成ができる」ことが秀でている
・低コストかつ短期間で制作できる動画生成AIは、プロの現場で採用されると映画業界に大きなインパクトをもたらす可能性が高い

第二回に続く

著者:谷田部卓
AIセミナー講師、著述業、CGイラストレーターなど、主な著書に、MdN社「アフターコロナのITソリューション」「これからのAIビジネス」、日経メディカル「医療AI概論」他、美術展の入賞実績もある。

(TEXT:谷田部卓 編集:藤冨啓之)

 

参照元

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

データのじかん会員なら、
全てのコンテンツが
見放題・ダウンロードし放題
 

メール会員でできること

  • 会員限定資料がすべてダウンロードできる
  • セミナー開催を優先告知
  • 厳選情報をメルマガで確認