2000年代から現在まで続く第三次人工知能ブーム。機械学習やディープラーニングにより“これまで人間にしか出来なかった知的活動をAIが代わりに行ってくれること”に期待が集まっています。
しかし、実際のところ機械が人間のように考えられるかどうかをどうすれば判定できるのでしょうか? その尺度として長年活用されてきたもののひとつが「チューリングテスト」です。
本記事ではチューリングテストの概要や代表的な批判「中国の部屋」、世界で初めてチューリングテストに合格したユージーンなどについて解説し、“人工知能が人間に並ぶこと”について考えます。
チューリングテストは1950年にアラン・チューリングによって提唱された「人間か人工知能か」を見分けるテストです。
現在知られるその手順は以下の通り。
判定者が相手が人間かコンピュータかを判別できなければ、コンピュータはチューリングテスト「合格」というわけですね。一般的には複数いる判定者のうち30%をだますことがチューリングテストの合格ラインとされています。
実は、チューリングが最初に論文「COMPUTING MACHINERY AND INTELLIGENCE」で示唆したチューリングテストはより複雑なものでした。
チューリングはまず「女性 or 女性のふりをした男性」を会話で判定するゲームを人間同士で行う状況を考えます。そして、そのゲームにコンピューターが参加して人間と同じように判定者をだませるか? という問いを提示しました。人間とコンピューターに同じゲームを行わせる対照実験がチューリングテストの原型だったんですね。
その内容が現在のようにシンプル化したのは、元論文では「機械は人間のような知能を持てるか?」という問いに対する思考実験だったチューリングテストが、人工知能テストの一形式へと変化してきたからだと考えられます。
チューリングテストの考案者、アラン・チューリングは人工知能の父と称される天才数学者です。
彼は1936年に現代のコンピュータの原型ともいえるチューリングマシンを考案。さらに第二次世界大戦中にドイツ軍の用いていた暗号「エニグマ」を解読し、イギリスの勝利に貢献しました。
イギリスの新50ポンド札に肖像画が描かれる、コンピュータ界の権威ある賞に「チューリング賞」と名付けられるなど今でもその功績はたたえられ続けています。2014年には『イミテーション・ゲーム/エニグマと天才数学者の秘密』でその人生は映画化されました。
同性愛の罪で有罪判決を受け自殺したという悲劇的な最後も含め、語るところの多い人物です。
現在のチューリングテストは人工知能の能力を測る指標としてあまり重要視されてはいません。わざわざテストを行うよりも、直接命令を与えたほうが能力を測るうえで実用的だからです。
また「チューリングテストに合格すれば本当に人間並みの知能を持ったといえるのか?」という疑問は長年提示されてきました。その代表例が「中国語の部屋」という思考実験です。
その内容は以下の通り。
意味や読み方を知らない文字を、スマホで手書き入力したことはありますか? そのときその文字についてほとんど理解は出来ていないのに、入力するという行為を“模倣”出来ていますよね。
人間を機械が模倣できるかを判定するチューリングテストでは、“模倣する能力は測れても知能は測れない”と中国語の部屋は示唆しているのです。
2014年、チューリング没後60周年の節目に開催された「Turing Test 2014」でスーパーコンピュータ「Eugene Goostman(ユージーン・グーツマン)」が判定者の33%をだまし、チューリングテストに合格しました。
しかしその実績を持って「Eugene Goostman」を人間並みの知能を持つコンピュータと評価する声は少ないです。ユージーン・グーツマンはウクライナ出身の13歳の少年とされることでやり取りの稚拙さがごまかされていましたし、審査員には議員や俳優など人工知能の専門家ではない人々が含まれていました。ユージーンは人間並みの人工知能ではなく、高機能なチャットボットというのが妥当なところでしょう。
「中国語の部屋」を提唱したアメリカの哲学者、ジョン・サール氏は「強いAI/弱いAI」という概念を提唱しています。強いAIはターミネーターのスカイネットのように人間並みの知能と判断力を持つ“汎用的な人工知能”のこと。弱いAIはアルファ碁や無人レジのように専門の領域に能力が限られた“特化型の人工知能”のこと。この分類に当てはめると、現在のチューリングテストで測られるのは“弱いAI”の知能に当てはまりそうです。
それでは、チューリングテストを突破したAIは人間以下なのでしょうか?
──そうだと言い切ることもできません。
チューリングテストに合格したAIは一定の会話能力で人間に並んだといえます。2013年にオックスフォード大学のマイケルA.オズボーン准教授らが発表したAIに奪われる確率の高い仕事に電話オペレーターが含まれたのも、チューリングテストで測られるような会話能力の発展が考慮されたからでしょう。
引用元:人工知能は仕事を奪う敵じゃない。人の仕事を「ラク」に「楽しく」進化させるAIとの付き合い方、幸せな働き方とは?┃PR TIMES
弱いAIは人間と総合的な知能で比較ことはできないものの、専門化された「仕事」という枠内で人間に比肩します。市井の人にとっては、その点こそが大きな意味を持つはずです。
2011年SiriがiPhone4Sに搭載され、2014年にAlexaが発表されました。2014年にチューリングテストが世界で初めて突破されたことは、会話機能を持つAIの発展において象徴的ではないでしょうか?
AIの発展を測る指標としてのチューリングテストについて解説してきました。
チューリングテストは現在人工知能の研究において中心的な指標ではありません。しかし、AIが人間並みの知能を持ちうるという可能性を示唆し、人間に開発を促すことで現在の第三次人工知能ブームの礎となりました。
チューリングテストの出発点である「機械は人間のような知能を持てるか?」という問い。その答えはまだ出ていませんが、筆者には1950年よりずっと“Yes”に近づいているように思われます。
(宮田文机)
メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!