Ipad

OpenAIのSoraは期待されていたほどのゲームチェンジャーには感じられない

OpenAIのSoraは期待されていたほどのゲームチェンジャーには感じられない
ソラの体操の解釈
オープンAI

OpenAIはSoraのリリースを1年近く予告し、何度も延期してきた。火曜日、同社はついに一般公開を予定している新しい動画生成モデルの完全機能版を公開した。当初の話題とは裏腹に、リリース初期ユーザーの多くはあまり感銘を受けていないようだ。私も同じだ。

テキストをビデオに変換するモデル、Sora をご紹介します。

Sora は、非常に詳細なシーン、複雑なカメラ モーション、生き生きとした感情を持つ複数のキャラクターをフィーチャーした、最大 60 秒のビデオを作成できます。https://t.co/7j2JN27M3W

プロンプト: 「美しい、雪景色… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) 2024年2月15日

同社は昨年2月にSoraを初めて発表し、その超リアルな動画レンダリングで高い評価を得ました。「Soraは、視覚的な品質を維持しながら、ユーザーの指示に忠実に従いながら、最大1分間の動画を生成できます」とOpenAIは当時の発表ブログで述べています。「このモデルは、ユーザーがプロンプトで何を要求したかだけでなく、それらが現実世界でどのように存在するかまで理解します。」

おすすめ動画

OpenAIはますますクレイジーなSORAビデオを投稿し続けている

これらは100% AI生成です

現実を歪める9つのビデオ

1. 葉っぱで作った象 pic.twitter.com/tPsHNGbFPS

— Linus Ekenstam (@LinusEkenstam) 2024 年 3 月 18 日

同社は3月に、Soraで生成した映像をさらに公開しました。今回は葉っぱでできた象の映像で、モデルの能力をさらに宣伝しました。その後、Soraプログラムは開発の遅延に見舞われましたが、OpenAIの最高製品責任者であるケビン・ワイル氏は、最近のReddit AMAで、「モデルを完成させ、安全性やなりすまし、その他の問題を正しく解決し、コンピューティングを拡張する必要がある」ことがその原因だと述べました。同時に、The Informationは、Soraの初期のバージョンはパフォーマンスが低く、ユーザーのプロンプトに集中し続けるのに苦労し、1分間のクリップを生成するのに最大10分間の実時間を要したと報じました。このモデルは最近、OpenAIの「アートウォッシング」の慣行に異議を唱える不満を持ったベータテスターのグループによってオンラインでリークされましたが、OpenAIはこれに対応して、同グループの無許可のUIをHugging Faceから迅速に削除しました。

OpenAIがSoraのパフォーマンスを微調整し洗練させている間に、競合他社がSoraのシェアを奪い取っていた。AdobeのFirefly AI、RunwayのGen 3 Alpha、MetaのMovie Gen、Kuaishou TechnologyのKling(そして数え切れないほどの無料版も)が昨年インターネット上に急増し、その多くがOpenAIが繰り返し約束していたよりも優れた品質のクリップとより高速な推論時間を提供していた。

火曜日、OpenAIはSoraの製品版を正式に発表し、月額20ドルのPlusと月額200ドル(笑)のPro会員にリリースしました。少なくとも数時間はリリースされていました。テクノロジーコメンテーターのエド・ジトロン氏が水曜日のBlueskyで指摘したように、「Soraのリリースを発表してからわずか数時間、あるいはそれ以下で、OpenAIは明確な期限も示さずに新規アカウント登録の受付を停止しました。OpenAIはテクノロジーメディア全体を騙し、おとり商法で騙したのです。この会社が自社の動画ジェネレーターを一般公開できるはずがありません。」

この動画はAI生成!SORAレビュー

アクセスに成功した人々にとって、Soraが生成した動画は感動的なものではありませんでした。YouTuberのMarques Brownlee氏がこのモデルのハンズオン動画で指摘したように、20秒間の1080p解像度の動画1本を生成するのに数分かかり、被写体の脚とその動きを生成するのに非常に苦労しました。動画全体を通して前脚と後脚が不自然に入れ替わっていたのです。体操選手がマットの上を転げ回りながら、腕、脚、頭を瞬時に入れ替えている下の動画を見れば、彼の意図が理解できるでしょう。

ソラが作成した体操のビデオです

—ピーター・ラブザ (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z

体操動画を投稿したBlueskyユーザーのピーター・ラブザ氏は、モデルへの批判を控えず、「申し訳ないが、テキストから動画を生成するジェネレーターを作って、『猫を野原で走らせろ』と指示し開始画像を与えて、猫がただ立つだけなら、そのジェネレーターは動作しない」と述べた。

Bluesky ユーザーの Chris Offner 氏も同様の意見を述べており、「Sora はデータ駆動型の物理エンジンだ」と皮肉を込めて述べながら、既知の物理法則のすべてではないにしてもほとんどを無視するスキーヤーのまったくクレイジーな動画を共有しました。

The Vergeもこのモデルを試用したが、それでも「余分な手足や歪んだ物体」などの見苦しい混入を避けられないことを嘆いた。

「Sora はデータ駆動型の物理エンジンです。」x.com/chrisoffner3…

— クリス・オフナー(@chrisoffner3d.bsky.social)2024-12-10T12:42:53.674Z

もちろん、ソラを一目見て嫌った人は皆無だった。Xユーザーのネイサン・シップリーは、このモデルの「リミックス」機能を披露した。この機能は、アップロードしたサンプル内のオブジェクトの動きに合わせて、生成された動画をマスクできるものだ。この動画では、彼は生成されたクレーンの頭を、自分がハサミを持って動画に撮影した時と同じように動かした。

ソラリミックステスト:ハサミからクレーンへ

プロンプトは「池のほとりの美しい自然の景色を眺める好奇心旺盛なツルのクローズアップ。鳥の頭が画面に飛び込んでは消えていく」でした。pic.twitter.com/CvAkdkmFBQ

— ネイサン・シップリー(@CitizenPlain)2024年12月10日

同社がSoraユーザー向けのアカウント登録をいつ確実に再開できるかはまだ不明です。Runwayが最近Gen 3とLionsgateで行ったように、OpenAIが現状のSoraでハリウッドを魅了できるかどうかも、まだ不透明です。

一つ確かなことは、OpenAI は AI ブームの初期にはリードしていたものの、すぐに業界の他の企業に追い抜かれつつあり、Sora で見られたような精彩を欠いた製品リリースは、同社の評判をさらに傷つけるだけだということです。

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.