カテゴリー
キーワード

ちょびっとラビット耳よりラピッドニュース #031:AIを出口のない迷路に誘うプログラム「Nepenthes」 が示唆する新しいAI時代の幕開け

         

まいどどうも、みなさん、こんにちは。

わたくし世界が誇るハイスペックウサギであり、かのメソポ田宮商事の日本支社長、ウサギ社長であります。二月に入って日本各地は災害級の大雪となり、公共交通機関などにかなりの影響を及ぼしておりました。わたくしウサギではありますが、同時にニューヨーク育ちでもあり、雪にはある程度の耐性があるので、雪は雪で風情があって、たまには悪くないなぁ、と思ったりしてました。ニューヨークは、常に雪が降っているというより、年に何度か強烈なストームがやってきて、その度に一晩で20センチ、ないし30センチの雪が積もる、という感じなので、冬が来て最初のストームが来るとそれ以降は春が来るまでずっと雪は残り、ストームの度に雪は積もり続けることになります。ストームの直前になると住民は挨拶がわりにストームの話をして、ストームの準備でみんながそわそわし始めるのですが、そんな時はなんだか妙な一体感というか連帯感が出たりして、結構それはそれでよかったりもしたまぁ、なんてことも雪を見ながら久しぶりに思い出したりしておりました。あと、純白の雪は真っ白なウサギを美しく包み隠してくれるのでそういう安心感もわたくしの場合はあります。雪が純白なのは降ってすぐだけではありますが。。。

さて、最近の話題といえば、やはりDeepSeekと呼ばれる中国のAIであります。1月末に彗星のように突如として頭角を表したこの大規模言語モデル(LLM)の衝撃はNVIDIAの株価を17%急落させ、時価総額にして約5900億ドル(約91兆円)がそのショックにより吹き飛ばされました。つまり、技術的な面だけでなく、しっかり心理的な面においてもDeepSeekは十二分なインパクトを提供してくれたわけであります。しかも、このDeepSeekの主力モデルであるV3はAIはOpenAIのChatGPT-4oと同等の性能を有しているにも関わらず、学習コストが560万ドルであった、というこの学習コストの低さにも注目が集まりました

つまり、AIは動けばいい、という時代はすでに過去の話であり、AIを育てるのにどのくらいのコストがかかるのか、そして、AIを使用するのにどのくらいのコストがかかるのか、というのが重要視される時代に突入した、と考えられるわけであります。AIは動けばいい、みたいな考え方はたしかに若干乱暴な発想ではありますが、ChatGPTが登場した頃は、裏の事情がどうなっているのかについて深く考えることもなくこの素晴らしいツールにただただ肩を振るわせて感動したわけであり、それってよく考えるとめちゃくちゃ最近のことだったわけですので、ちょっと立ち止まって考えてみると、時代の進むスピードの速さに恐怖を感じずにはいられないですね。。。

そして、AIが学習するために必要な学習マテリアルとして、インターネット上にある膨大な情報が現状では活用されることがほとんどです。この情報をかき集める作業を「クローリング」と呼ぶのですが、まぁ、このクローリング自体は検索エンジンの精度を高めるために全てのサイトにロボットを巡回させ、コンテンツを読み取り、その情報の質をランク付けする、ということをグーグルが始めた時代から行われていることではあります。しかし、その単純なボットが巡回していた時とは異なり、情報を集めようとするAIがかなり賢くなってきている、というか賢くなりすぎてしまっている、というのがまた別の問題を引き起こし始めているのです。ChatGPTなどに質問をすると、あらゆるサイトから情報を引っ張ってきてくれます。ちなみに、わたくしはChatGPTよりもPerplexity派で、なぜかというと、やはりそれぞれの情報がどのサイトから引っ張られてきているのか、というソースを表示してくれるからです。つまり、もっと知りたい情報を自分で確認しにいくことが非常に容易にできるようになっているのですが、確認しようとした時にそのページを読むにはログインが必要だったり、有料の内容だったりすることもしばしばあります

「ググる」は時代遅れ!? これからは「パプる」時代の到来か? 「Perplexity AI」の使い方とメリット

続きを読む 》

 


ということは、AIはそのAIの性能をふんだんに活用し、ニンゲンではなかなか無料では読めない内容の部分まで入り込んでリサーチを行い、わたくしたちが聞いたなんてことのない質問に真剣に答えてくれようとしている、というわけです。これはユーザー側にしてみれば、便利なことこの上ない状況ですが、情報提供側にしてみると、自分たちが商品として掲げているコンテンツを無料で使用されることになるわけですので、けしからんことこの上ない状況である、とも言えます。それでわたくし的にはそれに対してなんとなく見て見ぬ振りをしながらも、あれ、これって本当に大丈夫なの?と思ったり人知れずしていたのですが、こうなってくると情報提供側も黙っていないわけでありまして、情報をタダで抜き取られてはたまるものか、という自己防衛の精神が働き始めるわけです。つまり、鍵の進化とロックスミスの鍵を開ける技術の向上のいたちごっこが始まるわけです。

そこで対策として考え出されたのが、これらのクローラーボットを出口のない落とし穴に閉じ込めてしまい、そこを永遠にクローリングさせ続ける、という恐ろしいプログラムです。「Nepenthes」と呼ばれるこのプログラムはクローラーがアクセスするたびに無意味なデータが羅列されたページとそこから連携していくリンクを自動的に生成します。ちなみに、Nepenthesはウツボカズラという昆虫を袋状の構造に閉じ込める食虫植物の意味なので、まぁ、ネーミングとしてはかなり的確なのではないでしょうか(笑)。永遠に意味のないデータを学習させる、というのは悪意に対する悪意の対抗のような感じではありますが、捉えようによってはレレレのおじさんをサハラ砂漠に連れて行って永遠に掃除をさせ続ける、みたいな構図のある種のおかしみを含む、ウケ狙いな要素を内包したプログラムのようにわたくしは感じております(笑)。クローラーを罠にはめるだけでなく、攻撃をすることも可能で、集めたデータに余計な情報を追加してデータを汚したりすることも可能なのだそうです。Nepenthesのページへはこちらから飛べるので興味のある方は一度覗いてみてくださいませ。意味のないデータが羅列されていくサンプルページも閲覧できます。どこまで言っても意味のないデータなので、読んでもちんぷんかんぷんです(笑)。

まぁ、なぜこれが注目されるようになったのか、というのがこのニュースにおいて大事な部分だと思うのですが、それだけAIクローラーによる被害が増えてきたということなのだと思います。情報提供側はコンテンツをどうやって守るべきなのか、そもそもコンテンツの内容というのは一体誰のものなのか、情報や知識はどこまで共有されるべきなのか、このあたりの線引きのルールをどうしていくのか、という一連の問題提起にもなっているように感じたので今週はこれを取り上げてみました。

そんなわけで、今週はAIの急激すぎる進化とAIを罠にかけるためのプログラム「Nepenthes」についてお話ししました。Nepenthesの開発者はこのプログラムが「有害なアクティビティ」を引き起こす可能性が含んでいることを認識しており、慎重に使用されるべきである、と警告していることも最後に付け加えておきます。こういうのを見ていると、今後の世界はほとんどのことが「AI対AI」の対決になっていくのではないかと思わざるを得ないですね。ま、そんなわけで、また来週お会いしましょう。ちょびっとラビットのまとめ読みはこちらからどうぞ!それでは、アデュー、エブリワン。

(ウサギ社長)

Webサイトのスクレイピングは違法?メリットや注意点、具体的な活用方法まで徹底解説!

続きを読む 》

 

 

参照元

・Nepenthes | zadzmo.org ・AIの無断学習は絶対許さない──Webクローラーを“出口のない落とし穴”に閉じ込めるプログラム、海外ユーザーが公開 |ITmedia AI+  ・サイトのコンテンツを無断収集するAIクローラーを捕獲し、脱出できなくするツールが物議 | INTERNET Watch ・AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される | Gigazine ・AIクローラー対策の新たな戦略 Nepenthesによるウェブスクレイピングへの反撃 | テクログ

メルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。


データ活用 Data utilization テクノロジー technology 社会 society ビジネス business ライフ life 特集 Special feature

関連記事Related article

書評記事Book-review

データのじかん公式InstagramInstagram

データのじかん公式Instagram

30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!

おすすめ記事Recommended articles

掲載特集

デジタル・DX・データにまつわる4コマ劇場『タイムくん』 データのじかんをもっと詳しく データのじかんフィーチャーズ 「47都道府県47色のDXの在り方」を訪ねる『Local DX Lab』 DXの1次情報をを世界から 『World DX Journal』 データで越境するあなたへおすすめの 『ブックレビュー』 BIツールユーザーによる、BIツールユーザーのための、BIツールのトリセツ CIOの履歴書 by 一般社団法人CIOシェアリング協議会 なぜ、日本企業のIT化が進まないのか――日本のSI構造から考える 日本ビジネスの血流である帳票のトレンドを徹底解説 データを武器にした課題解決家「柏木吉基」のあなたの組織がデータを活かせていないワケ BI(ビジネスインテリジェンス)のトリセツ 入社1年目に知っておきたい 差が付くKPIマネジメント CIOLounge矢島氏が紐解く トップランナーたちのDXの“ホンネ” データのじかん Resources 越境者のためのお役立ち資料集 AI実装の現在地点-トップITベンダーの捉え方 データでビジネス、ライフを変える、 面白くするDATA LOVERS データマネジメント・ラジオ by データ横丁 データのじかんNews データ・情報は生もの! 『DX Namamono information』 ちょびっとラビット耳よりラピッドニュース AI事務員宮西さん(データ組織立ち上げ編) 藤谷先生と一緒に学ぶ、DXリーダーのための危機管理入門 生情報取材班AI時代に逆行?ヒトが体感した「生情報」のみをお届け! データはともだち 〜怖くないよ!by UpdataTV Original データ飯店〜データに携わるモノたちの2.5thプレイス by UpdataTV〜 インサイトーク〜データで世界を覗いてみたら〜by WingArc1st + IDEATECH
モバイルバージョンを終了