物議を醸している Nvidia の AI ゲーム技術の父は、記録を正したいと考えている

Convai の技術デモでは、Ai が生成したキャラクターが別のキャラクターと会話します。
物議を醸している Nvidia の AI ゲーム技術の父は、記録を正したいと考えています

今月初め、私はデジタルの奇跡を目撃しました。 に先立つ記者会見で、Nvidia は、フルボイスの AI キャラクターを生成できる AI スイートである Ace マイクロサービス のデモを披露しました。私はデモストがマイクを通してゲーム内の NPC に話しかけたところ、デジタル キャラクターがリアルタイムで応答するのを畏敬の念を持って見ていました。これはまさに SF の偉業でしたが、1 つ疑問がありました。どのようにしてそのようになったのでしょうか?

Nvidia は曖昧な回答をし、「 単純な答えはない 」と主張しました。ソーシャルメディア上のユーザーは最悪の事態を想定しており、この声明は炎上を引き起こした。 Ace は Nvidia が権利を持っていないコンテンツでトレーニングを受けたのではないかという憶測が生じました。 Nvidiaは後に 、使用が許可されたデータのみを使用していると 主張したが、緊張は依然として高かった。倫理的および芸術的懸念が山積しているため、ゲーマーは懐疑的なままでした。

全ての展開をサイドラインから見ていた観客の中にプルネンドゥ・ムカルジーもいた。ソフトウェア エンジニアは群衆の中の別の顔ではありませんでした。彼は自分が始めたわけではない議論の中心として AI テクノロジーを生み出しました。 Mukherjee 氏は、CES 2024 で Nvidia の Kairos デモを推進した生成 AI 企業 Convai の創設者です。彼は、他の人が自分のツールを説明しようとするのを座して見ているのではなく、記録を正すことに熱心でした。

Digital Trends とのインタビューで、ムカルジー氏は、彼のような AI ツールに関する広範なインタビューの中で、いくつかの倫理的懸念に答えました。彼は、失業の恐怖から、AI が人類の芸術を奪うのではないかという懸念まで、あらゆるものについて自分の考えを述べました。ムカルジー氏にとって、それは真実とは程遠い。 Convai の創設者は、アーティストが AI と協力して創造的なビジョンを完全に実現するという楽観的な未来を見ています。しかし、データ利用というホットな話題となると、彼の説明は答えよりも多くの疑問を引き起こす可能性がある。

AIとアーティストは共存できるのか?

子供の頃、ムカルジーさんは人間の心とそれがどのように機能するかについて常に興味を持っていました。彼は高校で AI について学び始めましたが、当時のより厳格なルールベースのシステムに興味をそそられませんでした。彼の興味はずっと後の 2015 年にインドの研究室でディープラーニングを研究したときに刺激されました。米国に移住し、大学院に通い、Nvidia でしばらく働いた後、Mukherjee 氏は最終的に独立して 2022 年 4 月に Convai を設立しました。彼は 10 か月間、自腹で会社を経営しました。

Mukherjee は根っからのゲーマーです。彼は地元のインターネットカフェで Counter-Strike などの対戦タイトルをプレイして育ちました。そこで彼は、射手の脳死ボットについて冗談を言いながら、AI がどのようにゲームを改善できるかを想像し始めます。その考えは現在、いくつかの AI プロセスを使用して、プレイヤーからのリアルタイムのプロンプトに応答できるフルボイスの NPC を生成する技術革新として成​​功を収めています。彼の目標は?ゲームをより魅力的なものにするため。

Baldur’s Gate 3 The Witcher を 選んでください」と Mukherjee 氏は Digital Trends に語ります。 「彼らは本当に信じられないような話を持っています。とても愛情深く、情熱的に書かれた物語。しかし、NPC から探索できる物語のラインはほんの少ししかないため、プレイヤーとしてその深みに到達することはできません。現在利用可能なテクノロジーを考慮すると、これらの NPC は独自の人生を持ち、キャラクターのままであなたと対話し、物語デザイナーの心の中をより深く掘り下げたい場合には、より多くの情報を提供することができます。」

この声明は、ムカルジー氏がAIに関する一連の相互に関連した懸念に反論する長いインタビューの始まりとなった。 Baldur’s Gate 3 が意図的に書かれていなければ、今のように愛されるゲームになるのかと尋ねると、私たちはマシンとアーティストの関係を解き明かすウサギの穴に落ちました。彼は明らかに、ソーシャルメディアの懐疑的な投稿を一週間かけて研究したかのような準備をして会話に臨んだ。彼はすぐに、AI はアーティストの代わりではないことを強調しました。それはそれらを必要としています。

「私は、ナラティブデザイナーの需要が減っているのではなく、需要が高まっているとしか思っていません」と彼は、AI がどのようにしてアーティストの仕事をより多く生み出すことができるかを概説しながら説明します。 「作家たちは単にバックストーリーや物語を作るために書いているわけではありません。彼らはテスト目的でも書いています。数百万ドル規模のゲームに生成 AI ベースの NPC を自信を持って出荷するには、堅牢なテスト セットが必要です。理想的には同じ物語作家による、数千ではないにしても数百回のやり取りが必要です。私たちのプラットフォームを試す場合は、バックストーリーを作成し、作家自身からの大量の文書をアップロードする必要があります。登場人物の心を書いています。事実上、今日行われているものの 10 倍の執筆が必要になります。」

この考え方は私たちの会話の中で共通の話題になります。 Mukherjee 氏は、生成 AI ツールを適切にトレーニングするには、同じくらい、あるいはそれ以上のアーティストが必要になると考えていることを頻繁に強調しています。ある時点で彼は、優れた AI がゲームをより良くし、それが結果的に売り上げの増加につながり、スタジオが声優にもっと報酬を支払うよう説得するだろうと主張しました。なぜなら、これらのツールをトレーニングする仕事は、次の機能を備えた高品質のゲームを作成するために非常に重要だからです。レベルの関与。ビデオゲーム業界が現在 大量解雇の波 の真っただ中にあり、数千人が職を失っていることを考えると、これは楽観的なビジョンだ。

ムカルジー氏はその現実を見ていないわけではなく、生成型 AI の台頭が雇用に影響を与える可能性があることも否定しません。彼は、これは自然な変化であり、これまでのテクノロジーの進歩で見られたものとそれほど変わらないと説明しています。人々は適応し、AI と連携して作品を作成する方法を学ぶ必要があります。

あなたは依然としてその創造者であり、マスターであり、管理者です。

さらに掘り下げていきます。彼は AI が仕事にどのような影響を与えるかという観点から AI の影響について議論していますが、意図的に手作りされたコンテンツを作りたいという理由でゲームを作るアーティストについてはどうでしょうか?確かに、アーティストにAIエンジニアになれというほど単純ではありません。ムカルジー氏は、それが解決策だとは信じていない。むしろ、アートとテクノロジーがどこで交わるかを理解することが重要だと彼は感じている。

「AI は Adob​​e Photoshop や Unreal Engine と同じものです」と Mukherjee 氏は言います。 「ええ、ゲームはアンリアル エンジンが登場する前から作られていました。今でも人々はそれを手作りしています。しかし、Unreal Engine の最高のアートで自分を表現してみませんか?あなたはできる。 3D ビデオ編集ソフトウェアを使用します。細部まで同じレベルの骨の折れる仕事をする必要があるため、その技術は今でも保たれています。 AI が生成したものに関しては、そのすべてが当てはまります。手作り感が今も残っています。より表現力の高いツールを持っているだけですが、それでもあなたはそのツールの作成者であり、マスターであり、管理者です。」

物議を醸している Nvidia の AI ゲーム技術の父は、記録を正したいと考えています

データラダー

Mukherjee が AI をアーティストに取って代わるのではなく、サポートできる便利なツールと考えていることは明らかです。会話中、彼は AI が人間をどのように必要とするかについていくつかの重要なポイントに立ち戻り、一般的な懸念に徹底的に対処しました。しかし、事態が難しくなり始めるのは、AI 企業が恐れていると思われる「データ」という単語が持ち出されたときです。クリエイターたちは、自分たちの作品でトレーニングされた AI モデルが盗用していると主張する一方、主要な AI 開発者の中には、著作権で保護された作品を含む大量のデータを入力しなければモデルをトレーニングできないと主張する人もいます。 Mukherjee 氏は、AI モデルのトレーニングにデータが使用された場合、人々に報酬が支払われるべきだという考えを抱いています。

「データセットに多大な貢献をした人々に十分な報酬を与える方法が必要だと思います」と彼は言います。 「それがニューヨーク・タイムズであろうとレディットであろうと、情報源にはライセンスが必要です。それは簡単な方法ではありませんが、私の意見では、それが最終的に得られるものです。そして、特に商業レベルで使用する場合には、最も正しく行われたものであれば、もちろんそれを選択します。」

Convai の AI 技術に関する図は、NPC が環境とどのように相互作用するかを説明しています。

Convai 自身のデータセットについて問われると、Mukherjee 氏は、同社は権利を有するデータのみを使用すると主張した。同氏は、このツールが新たな領域を開拓していることを考慮すると、このツールが必要とする種類のデータをランダムにスクレイピングすることさえ不可能だと指摘する。これは論理的な説明ですが、彼はすぐに自分自身でそれを暴きました。

「私たちは OpenAI またはライセンスされたオープンソース モデルの基本モデルを使用しています」と彼は言います。 「それらは商用ライセンスを取得し、倫理的に調達する必要があります。私たちはそういったことにとても気をつけています。また、テキスト読み上げに関しては、声優と緊密に連携することに非常に近づいています。私たちの場合、声優を減らすのではなく、もっと多くの声優を必要とします。」

OpenAI という名前を聞くと眉をひそめます。同社は現在法的問題に直面しており、 ChatGPTのようなボットを 訓練するための文章の「違法使用」をめぐってニューヨーク・タイムズが同社を訴えている。 OpenAIはこの告訴に異議を唱えていない。英国貴族院通信・デジタル特別委員会への返答として、同社は「著作権で保護された素材を使用せずに今日の主要なAIモデルをトレーニングすることは不可能だろう」と書いている。 Convai のモデルが OpenAI の成果に基づいて構築されていることを考慮すると、私は Mukherjee に「著作権で保護された素材が使用されていないことをどうやって確認できるのですか?」と問いかけました。

どのモデルがどのデータセットを使用しているかは完全にはわかりません。

Mukherjee 氏は微妙な区別をしています。Convai 氏は OpenAI のデータを使用しておらず、その上でトレーニングされたモデルだけを使用しています。それはちょっとした言語的な抜け穴です。 Mukherjee 氏は、Convai 社がデータを直接使用していないため、著作権紛争に関しては依然として同社が優位にあると信じているようだ。モデルの使用とモデル内で権利を持たないデータの使用がどのように異なるのかを明確にするよう求められると、状況はさらに曖昧になります。

「どのモデルにどのデータが含まれているかは明らかではありません」と彼は明確にします。 「それは私たちにとって明確ではないのでわかりません。 OpenAI が 5 つのモデルを提供し、Nvidia が 4 つのモデルを提供し、Meta が 3 つのモデルを提供するとします。私たちのユースケースに最適なものを使用しています。どのモデルがどのデータセットを使用しているのかは完全にはわかりません。」

Mukherjee 氏の主張は、他のモデルがデータをどのように扱うかについて Convai 氏は責任を負っていないということのようだ。彼にはそれをコントロールすることができません。彼にできることは、データ自体の使用が倫理的であることを確認し、構築しているモデルも倫理的であることを願うことだけです。しかし、コンバイ氏が「もちろん」最も倫理的な AI モデルに基づいて構築するだろうという以前の主張は、彼が現在著作権訴訟の中心となっている AI モデルを使用していることを考えると、実際には成り立たない。別の行は、その新しい文脈では違った意味で解釈されます。「私たちは声優と緊密に連携することに 非常に 近づいています。」非常に近いということは、コンバイ氏が実際にはまだそこにいないことを意味します。

このような複雑な会話は、そもそも Nvidia がデータ使用量に関する私の質問に答えることを拒否した理由を説明するかもしれません。実際のところ、これらのツールはすべて相互に構築されています。 Ace は OpenAI を使用する Convai を使用しています。データのはしごがあります。上に登るほど、誰が一番下にいるのかを確認するのが難しくなります。データ使用量について「単純な答えはない」という Nvidia の主張は正しいですが、もっと正直な答えがあります。それは、単純に分からないということです。 Nvidiaはおそらく法廷で質問に答える必要はないが、OpenAIが戦いに負ければ、はしご全体が崩壊する可能性がある。

物議を醸している Nvidia の AI ゲーム技術の父は、記録を正したいと考えています

文明レベルの変化

その混乱を解き明かす中で、私は規制というアイデアを持ち出しました。政府が介入してテクノロジーに何らかのガードレールを設置すべきでしょうか?ムカルジー氏は、慎重に行う必要があるとはいえ、ある程度は必要だと考えている。同氏の懸念は、規制が多すぎるとイノベーションが窒息してしまう可能性があることだ。そして結局のところ、彼は AI がもたらすいかなるリスクもテクノロジーの潜在的な力を無効にするものではないと心から信じています。

「今のAIって何?今日の AI は車のようなものです」と彼は言います。 「車って危なくないの?もちろん、そうです!車を使えば人を完全に殺すことができますが、私たちは常に車を運転しています。非常にリスクはありますが、全体としてはプラスです。私はAIも同じものだと考えています。車を運転できる、できないについての規制が必要になるでしょう。違法に運転した場合は罰せられます。いずれAIでも同じようになるでしょう。」

これから変化が起こり、変化は人々を傷つけます。

少し厳しい比較ですが、私たちの会話を通じて、ムカルジー氏は AI について楽観的な見方しかしていませんでした。彼は、企業が人間性を中心に置くことを忘れない限り、それが長期的には社会にとって正にプラスになると心から信じています。彼は、Nvidia Ace のようなツールがアーティストから仕事を奪うのではなく、アーティストをサポートする世界を望んでいます。彼は、誰もが機械に仕事を奪われるような終末的な未来が私たちの先にあるとは考えていませんが、それが人々に適応を強いることは受け入れています。

「変化は起こるでしょう、そして変化は人々を傷つけます」とムケルジーは言う。 「新しい種類のテクノロジーの変化が起こるたびに、同じ種類の変化が起こります。それは文明レベルの変化です。たくさんの新しい仕事が生み出されるだろうし、需要の少ない古い伝統的な仕事もたくさんあるだろう。馬車から自動車に移行したときのことを考えてみましょう。馬のビジネスを営んでいた人々は、間違いなく他の何かを見つけなければなりませんでした…生成 AI は、まったく新しい可能性を生み出します。それは人類全体にとって非常にプラスとなるでしょうが、ある程度の雇用の転換が必要になるでしょう。」

インタビューの終わりに、ムカルジーは私に話しかけ、記録を正す機会を与えてくれたことに感謝した。彼は、Nvidia Ace の発表を報道した多くの報道機関が、Convai がその技術を構築したことについてさえ言及していないと指摘しました。彼は、自分の会社がそれにふさわしい評価を受けていないことに少しイライラしているようだ。私はその感情の皮肉を指摘し、AI ツールが自分の作品をスクレイピングし、それを自分のものとして吐き出すのを見てアーティストが現在感じていることとまったく同じだと指摘しました。

「それは素晴らしいポイントですね!」彼は大笑いし、おそらく新たに発見した明晰さでこう言った。

「物議を醸している Nvidia の AI ゲーム技術の父は、記録を正したいと考えている」についての動画選定!

AIロボット、「人間に反抗する?」と聞かれ…… 国連のAI会合開催
変化するAIチップ市場が、エヌビディアの将来をどう形成するか【2024/02/25】

[list_relate_post_same_category]