Apps

NVIDIAの物議を醸したAIゲーミング技術の父は真実を明らかにしたいと考えている

NVIDIAの物議を醸したAIゲーミング技術の父は真実を明らかにしたいと考えている
Convai の技術デモでは、AI で生成されたキャラクターが他のキャラクターと会話します。
コンヴァイ

今月初め、私はデジタルの奇跡を目の当たりにしました。CESに先立つ記者会見で、NVIDIAはAceマイクロサービスのデモを披露しました。これは、フルボイスのAIキャラクターを生成できるAIスイートです。デモイストがマイクを通してゲーム内のNPCに話しかけると、デジタルキャラクターがリアルタイムで反応する様子を、私は畏敬の念を抱きながら見ていました。まさにSFの偉業と言えるでしょう。しかし、一つ疑問がありました。どうやってこんなことを学習したのでしょうか?

Nvidiaは「簡単な答えはない」と曖昧な回答をした。この発言はソーシャルメディア上で激しい論争を引き起こし、ユーザーは最悪の事態を想定した。AceはNvidiaが権利を持たないコンテンツでトレーニングを受けたのではないかという憶測が飛び交った。Nvidiaは後に、使用許可を得たデータのみを使用していると主張したが、依然として緊張は高まっていた。倫理的および芸術的な懸念が山積しており、ゲーマーたちは懐疑的な姿勢を崩さなかった。

おすすめ動画

傍観者の中には、パーネンドゥ・ムケルジー氏もいた。ソフトウェアエンジニアである彼は、群衆の中のただの顔ではなく、自らが始めたわけではない議論の中心となるAI技術を生み出した人物だ。ムケルジー氏は、CES 2024でNvidiaのKairosデモを支えた生成AI企業Convaiの創業者だ。誰かが自分のツールを説明するのを傍観するのではなく、彼は真実を明らかにしようと躍起になっていた。

Digital Trendsのインタビューで、ムカジー氏は自身のAIツールに関する倫理的な懸念に答えました。失業への不安から、AIが芸術から人間性を奪ってしまうのではないかという懸念まで、あらゆる問題について自身の考えを述べました。ムカジー氏にとって、それは真実とは程遠いものです。Convaiの創設者である彼は、アーティストがAIと協力し、創造的なビジョンを完全に実現するという明るい未来を思い描いています。しかし、データ利用というホットな話題になると、彼の説明は答えよりも多くの疑問を生む可能性があります。

AIとアーティストは共存できるのか?

ムカジー氏は子供の頃から、人間の心とその仕組みに興味を持っていました。高校時代にAIを学び始めましたが、当時の厳格なルールベースのシステムに嫌悪感を抱きました。その後、2015年にインドの研究所でディープラーニングを学んだことで、彼の興味は大きく高まりました。アメリカに移住し、大学院に進学し、しばらくNVIDIAで働いた後、ムカジー氏は2022年4月に独立し、Convaiを設立しました。彼は10ヶ月間、自腹で会社を立ち上げました。

ムケルジー氏は根っからのゲーマーだ。地元のインターネットカフェでカウンターストライクのような対戦ゲームをプレイして育った。そこでAIがゲームをどのように改善できるかを想像し始め、シューティングゲームの脳みそが死んでしまったボットについて冗談を言い始めた。その考えは今や、複数のAIプロセスを駆使して、プレイヤーからのリアルタイムの指示に反応できるフルボイスのNPCを生成するという、成功を収めた技術革新へと発展した。彼の目標は?それは、ゲームをより魅力的なものにすることだ。コンヴァイの創設者プルネンドゥ・ムケルジー氏がスカイラインを背景に立っている。

『バルダーズ・ゲート3』『ウィッチャー』を例に挙げましょう」とムケルジー氏はDigital Trendsに語った。「これらのゲームには素晴らしいストーリーがあり、愛情と情熱を込めて描かれています。しかし、プレイヤーであるあなたは、NPCを通して探索できる物語の筋が限られているため、その深みにたどり着くことができません。今日の技術があれば、これらのNPCは独自の生命を持ち、キャラクターを保ったままプレイヤーと交流し、ナラティブデザイナーの思考をより深く理解したいプレイヤーに、より多くの情報を提供することができるはずです。」

この発言を皮切りに、ムカジー氏はAIに関する一連の相互に関連する懸念に反論する長編インタビューが始まった。意図的な脚本がなければ、『バルダーズ・ゲート3』は今ほど愛されるゲームになっていただろうかと尋ねると、機械とアーティストの関係を紐解くという深淵な話に発展した。彼はまるで1週間かけて懐疑的なソーシャルメディアの投稿を研究してきたかのように、この会話に臨む準備万端だった。そしてすぐに、AIはアーティストの代わりではなく、アーティストを必要としていると強調した。

「ナラティブデザイナーの需要は減るどころか、むしろ増えると考えています」と彼は、AIがアーティストの雇用をどのように増やす可能性があるかを概説しながら説明する。「ライターはバックストーリーや物語を作るためだけに書いているのではありません。テストのためにも書いています。数百万ドル規模のゲームにAIベースの生成型NPCを自信を持ってリリースするには、堅牢なテストセットが必要です。数百、あるいは数千ものやり取りが必要で、理想的には同じナラティブライターによるものです。…私たちのプラットフォームを試す場合、バックストーリーを作成し、キャラクターの心情を描写するライター自身が作成した大量の文書をアップロードする必要があります。実質的に、現在の10倍もの執筆が必要になります。」

この考え方は、私たちの会話の共通のテーマとなっています。ムカジー氏は、生成型AIツールを適切に訓練するには、同程度、あるいはそれ以上の数のアーティストが必要になると繰り返し強調しています。ある時点で彼は、優れたAIはゲームをより良くし、ひいては売上増加につながり、スタジオは声優への報酬を増やすだろうと主張しています。なぜなら、これらのツールの訓練は、次世代のエンゲージメントを備えた高品質なゲームを制作する上で非常に重要だからです。ビデオゲーム業界が現在、数千人の雇用を失っている大規模なレイオフの波の真っ只中にあることを考えると、これは楽観的なビジョンと言えるでしょう。

ムカジー氏はこの現実を無視しているわけではなく、生成型AIの台頭が雇用に影響を与える可能性も否定していない。彼はこれを、これまで見てきたような技術革新とそれほど変わらない、より自然な変化だと説明する。人々はAIと連携して仕事を生み出すために、適応し、AIと連携することを学ばなければならないだろう。

あなたは依然としてその創造者であり、主人であり、そして管理者なのです。

さらに詳しく聞いてみた。彼はAIの影響について、仕事にどのような影響を与えるかという観点から議論しているが、意図的で手作りのコンテンツを作りたいがためにゲームを作るアーティストはどうだろうか?アーティストにAIエンジニアになれと指示するだけでは、確かにそう単純ではない。ムカジー氏はそれが解決策だとは考えていない。むしろ、アートとテクノロジーが交差する場所を理解することが重要なのだと考えている。

「AIはAdobe PhotoshopやUnreal Engineと同じようなものです」とムケルジー氏は語る。「確かに、Unreal Engineが登場する前からゲームは作られていました。人々はまだ手作業で作っていました。しかし、Unreal Engineで最高のアートで自分を表現できないでしょうか? 可能です。どんな3Dビデオ編集ソフトウェアでも、同じように細部にまでこだわって制作する必要があるため、アートは依然として存在します。AIが生成するものにも、それはすべて当てはまります。手作業の側面は依然として存在します。より表現力豊かなツールを手に入れるだけで、あなたは依然としてそのクリエイターであり、マスターであり、コントローラーなのです。」

データラダー

「データセットに多大な貢献をした人々には、十分な報酬が支払われる方法が必要だと考えています」と彼は言います。「ニューヨーク・タイムズであれ、Redditであれ、情報源にはライセンスが必要です。単純な方法ではありませんが、最終的にはそうなると思います。そして、特に商業レベルで利用する場合は、最も適切に行われている方法であれば、もちろんそれを選びます。」

Convai の AI テクノロジーに関する図は、NPC が環境とどのように相互作用するかを説明しています。
コンヴァイ

コンヴァイ自身のデータセットについて追及されると、ムケルジー氏は、同社は権利を有するデータのみを使用していると主張した。彼は、ツールが新しい領域を開拓していることを考えると、必要な種類のデータをランダムに収集することさえ不可能だと指摘した。これは論理的な説明ではあるが、彼自身もすぐに誤りを指摘した。

「OpenAIのものか、ライセンスを取得したオープンソースのモデルをベースに使用しています」と彼は言います。「商用ライセンスを取得し、倫理的に調達されたものでなければなりません。私たちはこうした点に細心の注意を払っています。また、音声合成に関しては、声優と緊密に連携することに注力しています。私たちの場合、声優の数は減るどころか、増えるのです!」

どのモデルがどのデータセットを使用しているかは完全にはわかりません。

「どのモデルがどのデータを持っているかは明確ではありません」と彼は明確に説明する。「それが私たちにとって明確ではないので、私たちにはわかりません。例えば、OpenAIが5つのモデル、Nvidiaが4つのモデル、Metaが3つのモデルを提供しているとしましょう。私たちは、自分たちのユースケースに最適なモデルを使用しています。どのモデルがどのデータセットを完全に使用しているかは、私たちにはわかりません。」

このような複雑なやり取りは、そもそもNvidiaがデータ利用に関する私の質問に答えなかった理由を説明できるかもしれない。実際、これらのツールはすべて互いに積み重なって構築されている。AceはConvaiを利用しており、ConvaiはOpenAIを利用している。データには梯子があり、上るほど誰が最下層にいるのかが見えにくくなる。データ利用について「簡単な答えはない」というNvidiaの主張は正しいが、もっと正直な答えがある。それは、Nvidiaには分からないということだ。Nvidiaは法廷で質問に答える必要はないだろうが、OpenAIが敗訴すれば、梯子全体が崩れ落ちる可能性がある。

文明レベルの変化

その混乱を解きほぐしていく中で、私は規制について言及しました。政府はテクノロジーに何らかのガードレールを設けるべきでしょうか?ムカジー氏は確かに規制は必要だとは考えていますが、慎重に行う必要があると考えています。過剰な規制はイノベーションを阻害する可能性があると懸念しています。そして結局のところ、AIがもたらすリスクが、そのテクノロジーの潜在的な力を無効にすることはないと彼は心から信じています。

「今日のAIとは何でしょうか? 今日のAIは車のようなものです」と彼は言います。「車は危険ではないのか? もちろんです! 車で人を殺してしまう可能性は十分にありますが、私たちは常に車を運転しています。非常にリスクはありますが、全体としてはプラスです。AIも同じだと私は考えています。車の運転の可否に関する規制が必要になるでしょう。違法運転をすれば罰せられます。AIもいずれ同じになるでしょう。」

変化は起こるものであり、変化は人々を傷つけます。

少し厳しい比較ではありますが、ムカジー氏は私たちの会話を通して、AIに対して常に楽観的な見方を崩していません。企業が人間性を常に念頭に置く限り、AIは長期的には社会にとってプラスになると確信しています。彼は、Nvidia Aceのようなツールがアーティストの仕事を奪うのではなく、彼らを支えるような世界が来ることを願っています。誰もが機械に仕事を奪われるような終末的な未来は想像していませんが、人々がAIに適応せざるを得なくなることは認めています。

「変化は必ず起こります。そして、変化は人々を傷つけます」とムケルジー氏は言います。「新たな技術革新が起こるたびに、同じような変化が起こります。それは文明レベルの変化です。多くの新しい仕事が生まれると同時に、需要の減る、より古く伝統的な仕事も生まれるでしょう。例えば、馬車から自動車に移行した時を考えてみましょう。馬関連のビジネスを営んでいた人々は、間違いなく何か別の仕事を見つけなければなりませんでした。…生成AIは全く新しい可能性を生み出すでしょう。人類全体にとって、それは間違いなくプラスの影響を与えるでしょうが、ある程度の雇用の転換が必要になるでしょう。」

インタビューの最後に、ムケルジー氏は私に話を聞かせていただき、事実関係を正す機会を与えてくれたことに感謝の意を表した。彼は、Nvidia Aceの発表を報じた多くの報道機関が、その基盤となる技術をConvaiが開発したことにさえ触れていないと指摘した。自社が正当な評価を受けていないことに、彼は少しばかり不満を抱いているようだ。私はその皮肉な感情を指摘し、まさに今、AIツールが自分の作品をスクレイピングして自分の作品として吐き出すのを見ているアーティストたちが感じているのと同じだと指摘した。

「それは素晴らしい指摘ですね!」彼は大きな笑いとともに、そしておそらく、何か新たな明晰さを見出したかのように言いました。

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.