AIにとって大きな一週間でした。知っておくべき5つの大きな発表をご紹介します。

AGI (汎用人工知能) の実現に向けた競争は、AI の急速な発展における記念碑的な一週間のように感じられるほど速いペースで進みました。

Apple がそのインテリジェンスを披露したことから AI 生成ビデオの大きな進歩まで、今週の AI 関連のトップストーリーをいくつか見てみましょう。

おすすめ動画

Apple Intelligenceのソフトローンチ

屋外に、葉っぱの束に囲まれた、表向きに置かれた白い iPhone 16。 — ジョー・マリング / デジタルトレンド

クパティーノを拠点とするデバイスメーカーにとって、今週は波乱に満ちた週でした。iOS 18、WatchOS 11、macOS 15が一般公開され、その後すぐにiPhone 16とApple Watch 10が発売され、さらにAppleは新OSのベータ版18.1への最初のアップデートをリリースしました。

ベータ版では AI の完全な機能スイートは提供されません (10 月の 18.1 の正式リリースまでは提供されないと思われます) が、関心のあるユーザーが生成 AI エージェントがまもなく実現できることを少し体験するには十分です。

しかし、Digital Trends がすでに確認したところによると、Apple Intelligence は一般公開されるまでにさらに改良と磨きをかける必要がありそうだ。

ライオンズゲート、AIビデオモデルのトレーニングでランウェイと提携

奇妙なことに、昨年夏のハリウッド脚本家ストライキは、ハリウッドが軽率に生成AIを採用したことに反発して起きたと断言できる。しかし、この集団的な行動は、ライオンズゲートがAIブームに再び飛びつくのを阻止するにはほとんど役に立たなかったようだ。同社は今週、第3世代アルファ動画生成モデルを開発するランウェイと提携すると発表した。

この契約により、両社はライオンズゲートの膨大な映画・テレビコンテンツを活用した動画生成モデルの開発と訓練で協力する。両社はこれを活用して「最先端かつ資本効率の高いコンテンツ制作機会の開発」を目指す。これは誰もが知る優れた映画の真髄であり、映画やテレビシリーズの制作現場を担う数千人ものストーリーボードアーティスト、照明・特殊効果デザイナー、俳優、ミュージシャンなどの人材を、出来合いの生成AIで代替することで、彼らの権利を奪おうとする、稚拙な試みではない。

スナップが新しい巨大なスペクタクルARグラスをリリース

SnapchatはARグラスの普及に尽力しています。今週、同社はSpectacles ARグラスシリーズの最新版となる5代目を発表しました。この新しいハードウェアは、より広い視野角と「10フィート（約3メートル）離れたところにある100インチディスプレイ」のような表示を実現し、SnapOSと関連するスマートフォンアプリはどちらも以前のバージョンから大幅にアップグレードされています。Snapchatはまた、OpenAIと提携し、「クラウドホスト型マルチモーダルAIモデル」をスマートグラスに導入すると報じられています。

新しいメガネの重量は226グラムと、昨年のモデルより100グラム以上も重く、まるでエドナ・モードが装着しそうな見た目です。現在は、プログラムアクセス料として月額99ドルを支払う開発者のみが利用可能で、一般向けバージョンのリリース時期については未定です。

YouTubeの新しいAIツールは、コンテンツ作成プロセスのほとんどを自動で行います

携帯電話の画面に表示されたYouTubeのロゴ — グリーンウィッシュ / Pexels

YouTubeは、新規コンテンツクリエイターの参入障壁を下げ、TikTokのような短編動画プラットフォームとの競争力を高めるため、今週、AIを活用した新たな制作ツールを多数導入しました。Googleは水曜日、ニューヨークで開催されたMade on YouTubeイベントで、DeepMindの動画生成モデル「Veo」をYouTube Studioに組み込むことを発表しました。このモデルは、テキストプロンプトのみで、1080p解像度で様々なシネマティックスタイルの6秒間の動画を生成できます。

同社はこれらの新機能を「ブレインストーミング」アシスタントと位置付けており、動画のトピックを提案するだけでなく、タイトル、サムネイル、台本の最初の数行も生成します。また、VeoはAI背景画像生成ツール「Dream Screen」と連携して使用することもできます。Dream Screenで静止画を作成し、Veoでアニメーション化することも可能です。

偶然ですが、チャットボットに100語のメールを書いてもらうと、水3本分とLED電球14個を1時間点灯させるのと同等のエネルギーを消費することをご存知でしたか？大規模な言語モデルの再帰的な提案を聞くために頭を悩ませる代わりに、その頭脳を使って独創的なアイデアをブレインストーミングしてみてはいかがでしょうか。

ランウェイのGen-3アルファ版はビデオからビデオへの生成機能を提供するようになった

ランウェイ Gen-3 アルファがビデオツービデオでレベルアップ

テキストプロンプトだけを使用して、あらゆるビデオのスタイルを驚くべき品質で変換できるようになりました。

可能性を示す10のワイルドな例:pic.twitter.com/onh12zCzpI

—ミンチョイ (@minchoi) 2024年9月15日

ランウェイはライオンズゲートとの提携発表に先立ち、今週初めに第3世代アルファ動画生成モデルの新機能を発表しました。テキストプロンプトであらゆる動画の映画的なスタイルを変更できる機能です。AI愛好家たちはこの新しいツールに大喜びしています。

この技術の実際の動作は、上記のソーシャルメディア投稿でご覧いただけます。また、Runwayは今週、サードパーティ開発者がビデオモデルを自社のアプリ、システム、デバイスに組み込むことを可能にするAPIも発表しました。