Google のプライバシー ポリシーの最新の更新により、同社は AI ツールの構築と改善に役立つあらゆるコンテンツをウェブから自由に収集できるようになります。
Googleの新しいポリシーには、「Googleはサービスを改善し、ユーザーや一般の人々に利益をもたらす新しい製品、機能、技術を開発するために情報を使用する」と書かれている。 「たとえば、Google の AI モデルをトレーニングし、Google Translate、 Bard 、Cloud AI 機能などの製品や機能を構築するために、私たちは公開されている情報を使用しています。」
Gizmodo は、 ポリシーが以前は「言語モデルの場合」と言っていたのが、「AI モデル」と更新されたと指摘しています。さらに、このポリシーでは、以前はデータを収集する Google 翻訳についてのみ言及されていましたが、Bard と Cloud AI も追加されました。
先週末に更新されたこのプライバシーポリシーは、オンラインで生成されたあらゆる情報がGoogleのAIモデルのトレーニングに利用されることを示しているため、特に不気味に見える。
前述の文言は、何らかの形で Google エコシステム内のユーザーだけを説明しているようには見えませんが、ブランドが Web のどの部分からでも情報にアクセスできるように詳細に説明されています。
人工知能の大量開発を取り巻く主な問題は、プライバシー、盗作、AI が正しい情報を払拭できるかどうかといった問題です。 ChatGPT などの チャットボットの初期バージョンは、一般的なクロール Web アーカイブ、WebText2、Book1、Book2、Wikipedia などのすでに公開されているソースをトレーニング データとして使用する大規模言語モデル (LLM) に基づいています。
初期の ChatGPT は、2021 年以降の情報に固執し、その後応答に虚偽のデータを埋め込むことで悪名高かった。おそらくこれが、Google が Bard などのツールに利益をもたらし、自社の AI モデルを現実世界で、場合によってはリアルタイムでトレーニングできるよう、ウェブ データへの自由なアクセスを望んでいる理由の 1 つである可能性があります。
またGizmodoは、Googleがこの新しいポリシーを利用して、長い間忘れられていたレビューやブログ投稿など、古くても人間が作成したコンテンツを収集し、人間のテキストや音声がどのように開発され配布されているかを把握できる可能性があるとも指摘しました。それでも、Googleが収集したデータをどのように使用するのかはまだ正確には分からない。
最新情報の主要な情報源である Twitter や Reddit などのいくつかのソーシャル メディア プラットフォームは、 AI チャットボットの人気 を受けて すでに一般アクセスを制限し ており、コミュニティ全体が残念がっています。
両プラットフォームは、知的財産の保護を名目に、APIへの無料アクセスを閉鎖し、ユーザーが大量の投稿をダウンロードして他の場所で共有することを制限している。これにより、Twitter と Reddit の両方をスムーズに実行できるサードパーティ ツールの多くが機能しなくなってしまいました。
TwitterとRedditはどちらも、AIによる乗っ取りに対する経営者の懸念が高まる中、他の挫折や論争に対処しなければならなかった。