​「私はロボットではありません」の裏側──実は、私たちが世界中のAIを“無償で育てている”事実

IT
この記事は約3分で読めます。

​ネットショッピングやサービスのログイン時、突如として画面に現れる「私はロボットではありません」のチェックボックス。そして、それに続く「信号機の画像をすべて選択してください」という煩わしいテスト。

​誰もが一度はイライラしたことがあるこのシステムだが、ただ「人間であることを証明するため」だけに存在していると思ったら大間違いだ。

​結論から言えば、あの画像選択システム(reCAPTCHA)の裏側では、世界中のネットユーザーが無意識のうちに「GoogleのAIに学習データを教える無償のアルバイト」をさせられているのである。

​本稿は、私たちの日常的な「クリック」が、いかにして最先端のテクノロジーを育て上げているのか、その見事なシステムの裏側に迫るレポートである。


​第一章:イライラする「画像選択」や「歪んだ文字」の本当の目的

​悪質なプログラム(bot)によるスパム攻撃を防ぐため、人間特有の認識能力をテストするこのシステムは「CAPTCHA(キャプチャ)」と呼ばれる。

  • なぜあんなに分かりにくいのか?
    • ​時折、「この端っこの棒は信号機に入るのか?」「文字がグニャグニャすぎて読めない」と迷うことがあるはずだ。
    • ​実は、あれが分かりにくいのは当然である。なぜなら出題されている画像や文字は、「コンピューター(AI)が自力で認識できなかったから、人間のあなたに答えを教えてもらおうとしている問題」だからだ。

​第二章:文字起こしから始まった「超巨大なクラウドソーシング」

​この「人間によるセキュリティ認証を、他の作業のついでにやってもらおう」という天才的な発想(reCAPTCHA)は、初期の「歪んだ文字を入力するテスト」から始まっている。

  • 古い書物の「デジタル化」を無償で手伝わされていた
    • ​昔のreCAPTCHAでよく見かけた、グニャグニャに歪んだ2つの英単語。あれは古い新聞や書物をデジタルスキャンした際、汚れなどでコンピューターが読み取れなかった文字を切り出したものだ。
    • ​ユーザーがログインするためにその文字を入力すると、それがそのまま「文字起こし」の正解データとしてGoogleのデータベースに送られ、膨大な歴史的文献のデジタル化に貢献していたのである。
ブクブー
ブクブー

「ええーっ!?ただログインしたかっただけなのに、ボクたちは知らないうちに古い本の文字起こしのアルバイトをさせられてたってことブー!?時給を払ってほしいブー!」


​第三章:あなたのクリックが自動運転車を賢くしている

​そして近年、文字入力に代わって主流になったのが「画像選択」である。「横断歩道」「信号機」「自転車」「消火栓」を選ぶあのテストだ。

  • すべては「Google マップ」と「自動運転」のため
    • ​実はあの画像、Google ストリートビューのカメラカーが撮影した実際の風景である。AIが「これが信号機かどうか自信がない」と迷った画像を私たち人間に見せ、私たちが「ここからここまでが信号機だよ」とクリックして教え込んでいるのだ。
    • ​この膨大な解答データは、Google マップの精度向上や、Google傘下の自動運転車(Waymoなど)の画像認識AIを訓練するための「最高の教材(教師データ)」として現在進行形で活用されている。

​終章:私たちはみな、AIの「名教師」である

​結論として、「私はロボットではありません」のテストは、スパムを防ぐという名目の裏で、世界中の何億人もの人々の労働力を少しずつかき集め、世界最高のAIを育て上げるための「壮大な学習システム」であった。

​次に「横断歩道をすべて選択してください」という画面が出たときは、舌打ちする代わりに少しだけ誇らしい気持ちになってみてはいかがだろうか。

「私のこのクリックが、未来の自動運転車を安全にしているのだ」と。

IT企業生活科学
NEWS OFFをフォローする

コメント

タイトルとURLをコピーしました