Mac

OpenAIの新しいAI制作動画が人々の心を揺さぶっている

OpenAIの新しいAI制作動画が人々の心を揺さぶっている
山と森を背景に、雪の中を歩く 2 頭のマンモスを描いた AI 画像。
オープンAI

OpenAIの最新のAIへの取り組みは、これまでで最も印象的なものかもしれません。「Sora」と名付けられたこの新しいテキスト動画AIモデルは、限られた数のユーザー向けにテスト公開されました。同社はこのモデルを公開するにあたり、完全にAIによって作成された複数の動画を公開しましたが、その仕上がりは驚くほどリアルです。

OpenAIはSoraを、テキストプロンプトに基づいてリアルなシーンを作成できると紹介しており、ウェブサイトで共有されている動画がその証拠となっています。プロンプトは説明的ではありますが、短いものです。私自身、ChatGPTとのやり取りでは、もっと長いプロンプトを使ったことがあります。例えば、上の写真にあるケナガマンモスの動画を生成するには、Soraは動物、周囲の環境、カメラの位置を説明する67語のプロンプトを必要としました。

おすすめ動画

テキストをビデオに変換するモデル、Sora をご紹介します。

Sora は、非常に詳細なシーン、複雑なカメラ モーション、生き生きとした感情を持つ複数のキャラクターをフィーチャーした、最大 60 秒のビデオを作成できます。https://t.co/7j2JN27M3W

プロンプト: 「美しい、雪景色… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) 2024年2月15日

OpenAIは発表の中で、「Soraは、視覚的な品質を維持しながら、ユーザーの指示に従いながら、最大1分間の動画を生成できます」と述べています。このAIは、多くのキャラクター、風景、そして正確な動きを含む複雑なシーンを生成できます。そのために、OpenAIはSoraが必要に応じて行間を予測し、読み取ると述べています。

「このモデルは、ユーザーがプロンプトで何を求めているかだけでなく、それらが現実世界にどのように存在するかも理解します」とOpenAIは述べています。このモデルは、キャラクター、服装、背景だけでなく、「生き生きとした感情を表現する魅力的なキャラクター」も作成します。

Sora は、既存のビデオの空白部分を埋めたり、ビデオを長くしたり、画像に基づいてビデオを生成したりすることもできるため、単なるテキスト プロンプトだけではありません。

動画はスクリーンショットとして見ると綺麗ですが、実際に動くと驚異的な迫力に迫ります。OpenAIは、サイバーパンク風の東京の街並みやゴールドラッシュ時代のカリフォルニアの「歴史的映像」など、この新技術を披露する幅広い動画を公開しました。他にも、人間の目の超クローズアップなど、様々な動画が用意されています。課題は漫画から野生動物の写真まで、多岐にわたります。

ソラはまだいくつかミスを犯しました。よく見ると、例えば群衆の中にいる人物の中には頭がなかったり、奇妙な動きをしたりしているものがいます。一部のサンプルではそのぎこちない動きが一目瞭然でしたが、全体的な違和感に気づくには何度か見直す必要がありました。

OpenAIがSoraを一般公開するまでには、まだしばらく時間がかかるかもしれません。現在、このモデルはレッドチームによるテストが行​​われており、潜在的なリスクを評価しています。また、開発の初期段階にあるため、一部のクリエイターは今すぐテストを開始できます。

AIはまだ不完全なので、かなり厄介なものになるだろうと覚悟していました。期待値が低かったせいか、Soraの性能に問題があったのかは分かりませんが、感銘を受けましたが、同時に少し不安も感じています。私たちはすでに偽物と本物を見分けるのが難しい世界に生きており、今や危険にさらされているのは画像だけでなく、動画もそうです。しかし、SoraはPikaのような、テキストから動画を生成するモデルとしては初めてのものではありません。

他にも、ソラの動画に対して「これが少しでも心配にならないのなら、何も心配することはない」とツイートした人気テクノロジー系ユーチューバーのマルケス・ブラウンリー氏のように、警鐘を鳴らす人々もいる。

これらの動画はすべてAIによって生成されたもので、これが少しでも気になるなら、何も問題はありません。

最新モデル:https://t.co/zkDWU8Be9S

(ウィル・スミスがスパゲッティを食べていたのを覚えていますか? 質問が山ほどあります)pic.twitter.com/TQ44wvNlQw

— マルケス・ブラウンリー(@MKBHD)2024年2月15日

OpenAIのSoraが今これほど優れているのであれば、今後数年間の開発とテストを経て、どれほどの能力を発揮するのか想像もつきません。これは多くの仕事を奪う可能性を秘めた技術ですが、ChatGPTのように、人間の専門家と共存していくことを期待したいところです。

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.