登場人物
大学講師の知久卓泉(ちくたくみ)
眼鏡っ娘キャラでプライバシーは一切明かさない。
五里雷太(ごりらいた)
IT企業に勤めるビジネスパーソン。
前回は生成AIを企業や組織への導入について、複数の方法を紹介しました。今回は、既存の生成AIの利用例とコストについて、簡単にですが説明します
企業における生成AIの利用とコスト
最初は、生成AIを社内向けとして利用する場合になります
この講座の第2回で、生成AIは有能な個人秘書として社内利用できる、と説明していましたが
※図版:筆者作成 ユーザーの企業データとLLMの連携
MS Copilotの初期の使い方は、その通りです。その後、Copilotのような生成AIに慣れた頃に、この図のように企業データへのアクセス権の付与や社内向けのビジネスアプリとの連携が可能となるはずです。こうなると社員個人のレベルではなく、組織長や経営層レベルの判断をその根拠を示して提案することが近い将来可能になるはずです
いや、社長向けの経営判断資料を、長時間かけて作成しているような社員は不要だ、と言うかもしれませんよ
そうか、人事権を持っている方が強いですからね。それはまずいですね
では次に、一般企業での生成AIの利用コストを紹介します。その前提条件は以下になります。
利用対象:OpenAI CatGPT(GPT-4)
1日1人当たりのチャット数:10回
1チャットのトークン数:1100 ※日本語1単語およそ1.1トークン
1Kトークンの料金:入力8円、出力16円 ※料金は目安です
稼働日/月:21日
月額利用料金:2,570円/1人
この条件で従業員1人当たり2,570円なので、1万人企業なら月額2570万円程度になります
思っていたより安いですね。個人でも支払いできるレベルです
最近発表されたばかりのMS Copilotの追加料金は、月額30ドルです。ChatGPTに近い金額ですが、企業契約の場合は様々な条件が加味されるので、この金額も目安になります
1万人企業にもなると、年間3億円以上の利用料金が必要なのですね。そうなると前回説明のあった、自社独自の生成AIの導入に数億円かけてもいいかもしれないか
実際には生成AI用のクラウド利用料金や運用コストを見積もらないと分かりません。それ以上に生成AIの進化速度に追従できるかも心配ですね
プロンプトエンジニアリングの概要
では、ゴリくんが何度も言っていたプロンプトエンジニアリング(Prompt Engineering)について説明しましょう。そもそもゴリくんは、プロンプトエンジニアリングがなにかを知っているのですか?
いやぁ、ChatGPTに質問する時に特別の呪文を唱えると、答えの精度が上がるということ程度しか知らないので、先生に聞いているのですが
そんなハリーポッターでの呪文”Imperio!“みたいな便利な言葉はありません。プロンプトエンジニアリングとは、LLMを効率的に使用するために、言語モデルへの命令(プロンプト)を開発・最適化する学問分野の名称のことです。LLMに単なる質問や指示を入力するだけでは、意図した通りの回答が出力できない場合があります。適切なプロンプトを設定することで、LLMが効率的に作業を行えて、より精度が高く望ましい結果を出力できるようになります
それほど効果的なら覚えたいのですが、既に学問分野になっているなら難しそうですね
LLMのビジネス活用が本格的に始まってから、まだ1年も経っていないのですが、様々なテストが行われた結果、膨大なノウハウが取得されて体系化されたのがプロンプトエンジニアリングです。種類は多いのですが基本は簡単です。それでも本1冊分あるので、ここではユーザーが利用できるように、ごく簡単にまとめています。詳しくは日本語の参考文献(註1) を参照してください。
・zero-shot prompting
事前情報を与えずに直接モデルに応答を求める一般的なプロンプト。十分な学習をしている事項なら問題ないが、内容によっては回答精度を下げてしまうケースも少なくない。
・Few-shot prompting
LLMに例やデモンストレーションを提供し、文脈学習を通して質問や指示と回答のパターンを学習させる手法。複雑なタスクに有効で、デモの数が多ければ多いほど、適切な回答を出力する確率が高まる傾向がある。
【プロンプトサンプル】
「1+2」は「3」です。「3+3」は「6」です。「4+5」は?
【MS Bingの回答】
※何度やってもエラー
【Google Bardの回答】
1 + 2 = 3
3 + 3 = 6
4 + 5 = 9
答えは9です。このクイズは、フィボナッチ数列を利用したものです。フィボナッチ数列とは、1と1から始まり、次の数は前の2つの数を足した数になる数列です。
1、1、2、3、5、8、13、21、34、55、89、144、233、377、610、987、1597、2584、4181、6765、10946、17711、28657、46368、75025
【ChatGPTの回答】
「4+5」は「9」です。
・Chain-of-thought(CoT)Prompting
プロンプトに中間的なステップを設けたり、段階的に考えること、のような指示をすることで連鎖的な思考をさせ、より複雑なタスクを処理させるためのテクニック。論理的な思考能力が求められるタスクなどで、Few-shotを使っても思うほど精度が向上しない場合に用いられる。
【プロンプトサンプル】
(30+10)*(30-10)を計算しなさい。(a+b)*(a-b)=a2-b2の公式を用いて、段階的に記述すること。
【MS Bingの回答】
(30+10)×(30-10)は、(40)×(20)となります。
(a+b)×(a-b)=a^2-b^2の公式を用いると、
(30+10)×(30-10)=(30^2-10^2)となります。
よって、(30+10)×(30-10)=900となります。
—-間違いです————————————
すみません、間違いがありました。
(30+10)×(30-10)は、(40)×(20)となります。
(a+b)×(a-b)=a^2-b^2の公式を用いると、
(30+10)×(30-10)=(30^2-10^2)となります。
よって、(30+10)×(30-10)=800となります。
ご指摘いただき、ありがとうございます。
【Google Bardの回答】
(a+b)*(a-b)=a^2-b^2 の公式を用いて、段階的に記述すると、以下のようになります。
(30+10)*(30-10)
= (30^2 – 10^2)
= (30+10)(30-10)
= 40*20
= 800
よって、答えは 800 です。
【ChatGPTの回答】
※図版:筆者作成 ChatGPTの回答
この回答だと、MS BingやGoogle BardはChatGPTより算数ができないので、とても算数の問題を任せられません
生成AIは大規模言語モデルであるLLMがベースになっていますが、その名の通り言葉を確率的に生成しているだけです。以前説明したように、LLMが学習していない算数の文章題が解けるなどとは、当初誰も考えていなかったのです。ところがパラメータ数・計算機リソース・学習データ量を巨大化することで、想定外の”創発”が生じた結果、新たな性能まで獲得したのですが、その明確な原因は未だに不明なのです
そういえばそんな説明を前に聞きましたね。では、生成AIに数学の問題を解かせてはいけないのですか?
計算知識が組み込まれているWolfram言語を利用すれば、LLMでも厳密な計算処理が可能になります。ChatGPT用Wolframプラグインが最近リリースされたので、このプラグインを利用すれば自然言語でChatGPTに高度な数学の問題を解かせることができます。詳細は文献(註2) を確認してください
話を戻しましょう。プロンプトの大原則は、あいまいな指示ではなく明確で論理的な指示にする、ことです。実用的な方法としては、英語で質問する、”情報が足りない場合は質問してください”を入れる、回答の根拠を求める、などもあります
なるほど、優秀な部下に丸投げするやり方ではなく、新人の部下に丁寧に指示をするやり方なのですね
まぁそうですかね。ただし、いつも言っていますがLLMというか生成AIの進歩は著しいので、プロンプトエンジニアリングの個々の手法は、寿命が短いはずです。ChatGPTの発表直後は、質問が日本語と英語で大きく精度が異なっていましたが、現在ではそれほど差が無くなってきています。また8月の発表では、ChatGPTがバージョンアップしてプロンプトの提案機能もあるそうです
なんだ、優秀なプロンプトエンジニアリングのエンジニアなら、年収が50万ドル以上で雇ってくれるという噂があったので、プロンプトの勉強をしようとしていたのですが
それだけだったら、1年以内に解雇されますよ。優秀なエンジニアというものは、常に最新のテクノロジーを理解して新しい手法を開発し続けられる人なのです。一度覚えた知識を後生大事に抱えているだけではダメなのです
日本のLLM
先生、最近になって日本企業も新しいLLMを続々と発表していますね。前回も説明してもらいましたが、実用性はどうなのでしょうか?
※図版:筆者作成 2023年に発表された日本のLLM
この表が、今年発表された国産のLLMです。国産といっても自社開発ではなくOSSのLLMに、日本語テキストを大量に学習させたLLMのはずです。しかしGPT-4は5000億パラメータという話なので、日本のLLMは桁違いにパラメータ数が少ないのが分かると思います
LLMの性能指標としてパラメータ数は目安になっていますが、実際の性能はどうでしょうか
前回説明しましたが、このパラメータ数では日本語性能でもChatGPTより低いですね。LLMの性能は、パラメータ数・学習データ量・計算機リソースで決まると考えられています。そのどれをとっても、日本のLLMはOpenAIなどのLLMとは桁違いに少ないので、このスペックでは性能に期待できません。結局のところ資金力と人材の差ですね
厳しいですね。それでは日本製LLMは使い物にならないのですか?
そんなことはないはずです。そもそも日本語の学習データが、英語圏と比較して2桁以上少ないという問題があります。ここは企業レベルでは解決できないので、政府が主導して整備するはずです。資金も政府が提供予定ですが、マイクロソフト並みの資金を拠出できればすごいのですが。当面は、小さなモデルでも使い道を限定し、業種特化型のLLMとして専門データを学習させファインチューニングすれば、特定業種向けとして役に立つはずです
そうですか。では汎用性ある日の丸LLMの登場は、しばらく待つしかないですね
それでは予定よりかなり長くなりましたが、今回のテーマは、これで終了にしたいと思います
ちょっと待ってください!今回の講座のテーマは、AIによって将来仕事がどう変わってしまうのか、のはずですよ
ゴリくん、現在AIが株取引をしてニュース記事を書き、プログラミングしてメールの返信をし、旅行プランをアドバイスしたり小説を書き、イラストを描いて販売しています。未来の話ではなく、近い将来の話でもなく、現在実際に起きている出来事なのです。
ちょうど1年前ですか、日本でも画像生成AIが大評判になっていましたね。2022年の夏でも、AIが仕事を奪うなどとはまだ夢物語でした。ChatGPTの登場は、ずいぶん昔のような気もしますが、一般に知られるようになったのは、せいぜい今年です。AIがプログラミングの肩代わりをしてくれるようになり、ソフトウェアの進化は加速度をつけています。したがってIT業界から職場環境やビジネスのスタイルが激変していくはずです。ビジネスパーソンの仕事がどう変化していくかは、自分の職場にどの程度AIが入り込んでいくかで決まるでしょう。
ビジネスにAIを積極的に活用できないような企業は、相対的に労働生産性が下がるので、収益力が落ち次第に廃れていきます。AIには無縁だと思っているビジネスパーソンでも、オフィスで働いているなら必ず巻き込まれるでしょう。このAI大進化時代に生き残りたかったら、大きな変化にでも追従できる柔軟な多応力と思考力が必要です。せっかく身に着けた専門スキルに固執するべきではありません。常に変化していく技術と環境に追走できるスキルが最も重要なのです。AIの進化は今後も続きます。後戻りはできないのですから
終わり
(TEXT:谷田部卓 編集:藤冨啓之)
ChatGPTとAPI連携したぼくたちが 機械的に答えます!
なんでも質問してください!
何か面白いことを言うかもしれないので、なんでもお気軽に質問してみてください。
ただし、何を聞いてもらってもいいですけど、責任は取れませんので、自己責任でお願いします。
無料ですよー