Mac

GoogleがOpenAIのSoraローンチに反撃

GoogleがOpenAIのSoraローンチに反撃
  1. コンピューティング
  2. ニュース
VideoFXのVeo 2
Googleディープマインド

GoogleのDeepMind部門は月曜日、第2世代のVeoビデオ生成モデルを発表した。このモデルは、最長2分の長さ、4K品質に達する解像度のクリップを作成できる。これは、Soraが生成できる20秒/1080p解像度のクリップの6倍の長さと4倍の解像度である。

もちろん、これらはVeo 2の理論上の上限です。このモデルは現在、Googleの実験的な動画生成プラットフォームであるVideoFXでのみ利用可能で、動画クリップは8秒、解像度720pに制限されています。VideoFXもウェイティングリストに登録されているため、誰でもVeo 2を試すことができるわけではありませんが、Googleは今後数週間でアクセス範囲を拡大すると発表しています。Googleの広報担当者は、モデルの機能を十分に拡張できる段階になれば、Veo 2をVertex AIプラットフォームでも利用可能になると述べました。

おすすめ動画

「今後数か月間、ユーザーからのフィードバックに基づいて改良を続けていきます」とイーライ・コリンズ氏はTechCrunchに語った。「そして、Veo 2のアップデートされた機能をGoogleエコシステム全体の魅力的なユースケースに統合することを目指します。来年にはさらなるアップデートを公開できる予定です。」

本日は、テキストや画像のプロンプトからリアルで高品質なクリップを生成する最先端のビデオ生成モデル、Veo 2 を発表します。🎥

また、テキストから画像への変換モデルの改良版である Imagen 3 もリリースしました。ImageFX でご利用いただけます… pic.twitter.com/h6ejHaMUM4

— Google DeepMind (@GoogleDeepMind) 2024年12月16日

Veo 2は、従来機に比べて多くの利点を備えていると言われています。例えば、物理学への理解が深まり(流体力学や照明・影の効果など)、テクスチャや画像がより鮮明になり、動きがあってもブレにくい「より鮮明な」ビデオクリップを生成できる機能などです。また、カメラコントロールも改良され、ユーザーは仮想カメラレンズを以前よりも正確に配置できるようになりました。

TechCrunchが指摘しているように、Veo 2はまだ動画生成プロセスを完成させていないものの、Sora、Kling、Movie Gen、Gen 3 Alphaといったライバルと比べると幻覚的な部分ははるかに少ないようだ。「一貫性と一貫性は今後の成長分野です」とコリンズ氏は述べた。「Veoは数分間であればプロンプトに忠実に従うことができますが、長時間にわたる複雑なプロンプトには従うことができません。同様に、キャラクターの一貫性も課題となる可能性があります。精巧なディテールや高速で複雑な動きの生成、そしてリアリズムの限界を押し広げ続けるという点でも、改善の余地があります。」

Googleは月曜日にImagen 3の改良も発表し、商用画像生成モデルが「より明るく、より構図の整った」出力を作成できるようになりました。ImageFXで利用可能なこのモデルは、ユーザーのプロンプトに含まれるキーワードに基づいて追加の説明候補も提供し、各キーワードごとに関連用語のドロップダウンメニューが表示されます。

アンドリュー・タラントラ

アンドリュー・タラントーラは、ロボット工学や機械工学から自動車工学まで、さまざまな新興技術について 10 年以上取材しているジャーナリストです。

  • コンピューティング

OpenAIのGPT-5に関する主張をテストしてみた — 結果はこうだ

メガネとチャット

OpenAIは最近、最新の大規模言語モデルであるGPT-5とChatGPTの大幅なアップデートを発表しました。この新しいアップデートには多くの利点がありますが、主張と現実は別物です。

GPT-5はより高速で、幻覚や媚びへつらうような行動に陥りにくく、素早い応答とより深い「思考」を即座に選択できると言われています。OpenAIの主張は、チャットボットの使用時にどれだけ実際に実現できるのでしょうか?早速見ていきましょう。

続きを読む

  • コンピューティング

OpenAI CEOが、AIの何が彼を夜も眠れなくさせるのかを明かす

OpenAIのプレス画像

地球上で最も著名で強力なAI企業の一つを率いる男が、AIの何が彼を夜も眠れなくさせるのかを明かした。この記事を読んだあなたも、きっと眠れなくなるかもしれない。 

OpenAIのCEOサム・アルトマン氏は火曜日、ワシントンDCで連邦準備銀行のイベントにステージ上で登壇し、自身の考えを述べた。

続きを読む

  • コンピューティング

OpenAIがChatGPTの毎日のプロンプト数を公開 — その数は膨大

スマートフォン上のChatGPT。

OpenAIのChatGPTは、2022年11月のデビュー以来、急速に成長を続けるコンシューマー向けアプリの一つとなり、ユーザー数の増加記録ではInstagramやThreadsに匹敵するほどです。同社のAI搭載チャットボットの初公開は、生成型AIへの世界的な関心を呼び起こし、それ以来、このツールはますます勢いを増しています。

OpenAIは最近、Axiosに対し、同社のAIチャットボットが現在、世界中で1日あたり25億件以上のユーザープロンプトを処理していることを明らかにした。これは、2024年12月の1日あたりわずか10億件のクエリからすると驚異的な飛躍である。そして、その数字のうち約3億3000万件のプロンプトは、米国を拠点とするユーザーからのものだけである。

続きを読む

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.