Mac

危険すぎると判断され、公開できない新しいAIツール

危険すぎると判断され、公開できない新しいAIツール

2019年、OpenAIはGPT2開発に関する研究成果の全容を公開することを拒否しました。これは、公開するには「危険すぎる」という懸念があったためです。木曜日には、OpenAIの最大の資金提供者であるマイクロソフトが、同社の新しい音声合成AI「VALL-E 2」について同様の声明を発表しました。

VALL-E 2システムは、ゼロショットのテキスト音声合成(TTS)AIです。つまり、わずか数秒のサンプル音声に基づいて、超リアルな音声を再現することができます。研究チームによると、VALL-E 2は「音声の堅牢性、自然さ、話者の類似性において、従来のシステムを凌駕しています。これらのベンチマークにおいて人間と同等の性能を達成した初のシステムです。」

おすすめ動画

このシステムは、構造が複雑であったり、早口言葉のような繰り返し表現があったりして発音が難しい文章も処理できるという。

このようなシステムには、失語症や筋萎縮性側索硬化症(ALS、ルー・ゲーリック病とも呼ばれる)の患者がコンピューターを介してではあるものの再び話せるようになるなど、多くの有益な用途が考えられます。また、教育、エンターテインメント、ジャーナリズム、チャットボット、翻訳、あるいはアクセシビリティ機能やSiriのような「インタラクティブ音声応答システム」への活用も考えられます。しかし、研究チームは、一般の人々がこの技術を悪用する機会も数多くあることも認識しています。「例えば、音声認識の偽装や特定の話者になりすますことなど」です。

そのため、このAIは研究目的にのみ利用可能となります。「現在、VALL-E 2を製品に組み込んだり、一般公開したりする計画はありません」とチームは述べています。「VALL-E 2が不正使用や違法行為、あるいはご自身や他者の権利を侵害する形で使用されていると疑われる場合は、不正使用報告ポータルからご報告いただけます。」

コンピューターに人間のように話すよう訓練する取り組みは、Microsoftだけではない。GoogleのChirp、ElevenLabsのIconic Voices、MetaのVoiceboxなど、いずれも同様の機能を実現することを目指している。

しかし、こうしたシステムは、愛する人や著名人の声を模倣することで、何も知らない被害者を騙すために繰り返し利用されてきたため、倫理的な精査の対象となっています。また、生成された画像とは異なり、AI生成音声に効果的に「透かし」を入れる方法は現在のところ存在しません。

アンドリュー・タラントラ

アンドリュー・タラントーラは、ロボット工学や機械工学から自動車工学まで、さまざまな新興技術について 10 年以上取材しているジャーナリストです。

  • コンピューティング

OpenAIが新しいAIアニメーション映画「Critterz」にツールを提供

予算は比較的少額なので、すぐに作れるでしょう。でも、良い作品になるでしょうか?

映画「Critterz」の登場人物。

生成 AI ツールがテキスト プロンプトから動画を作成する様子はすでに確認されていますが、OpenAI は、このようなテクノロジーでハリウッド級の長編アニメーション映画を作成できることを証明したいと考えています。

ウォール・ストリート・ジャーナルの報道によると、ChatGPTとテキストから動画を生成するツールSoraを開発している企業は、数社の制作会社と提携して「Critterz」という映画を制作しており、同映画は世界規模の劇場公開に先立ち、5月に権威あるカンヌ映画祭で初公開される予定だという。

続きを読む

  • コンピューティング

ChatGPTの新しい会話ツールは、最近私が気に入っているAIトリックです

分岐チャットは、OpenAI のチャットボットを使った研究にとって天の恵みです。

ラップトップ上の ChatGPT。

ここ数週間、ChatGPTはいくつかの不穏な調査の渦中にあります。アドバイスによって入院を余儀なくされたケースや、自傷行為が多数発生したケースなど、このAIチャットボットの失敗は深刻な調査の対象となっています。この議論は、OpenAIがペアレンタルコントロールと保護者向けの警告システムを構築するほどにまで発展しています。

より「普通」な面では、ChatGPTに先日機能アップデートが実装されました。これにより、特に仕事をこなしたい場合や、多角的な会話をしたい場合など、会話がより充実したものになります。この機能は「ブランチチャット」と呼ばれます。 

続きを読む

  • コンピューティング

4つのAIに同じ画像を生成させた結果がこれです

画像を作成できる AI コンパニオンがたくさんあるので、試してみました。

AI によって生成された 3 つの異なる画像を並べた画像。

AI画像生成はますます人気が高まっており、多くのAIコンパニオンがテキストプロンプトから画像を作成できるようになりました。まさにあなたが説明した通りです。しかし、選択肢が多すぎるため、どれが画像作成に最も適しているかを判断するのは難しい場合があります。そこで、実際に試してみることにしました。

最も人気のあるAIコンパニオン4つ、Gemini、ChatGPT、Grok、Microsoft Copilotを選び、全く同じプロンプトを与えて、どのツールが様々な種類の画像を生成するのに最も優れているかを調べました。これらのコンパニオンはすべて、テキストプロンプトから無料で画像を生成できますが、1日あたりの生成回数に制限があり、無制限に画像を生成することはできません。

続きを読む

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.