- 家
- コンピューティング ニュース

MetaのAI画像生成への最新進出は、非常に迅速だ。同社は火曜日に、入力テキストを1分以内に高忠実度の3D画像に変換する「最先端の高速パイプライン」である新しい「3D Gen」モデルを発表した。
さらに、このシステムは、テキストプロンプトを使用して、生成された画像とアーティストが制作した画像の両方に新しいテクスチャとスキンを適用できると言われています。
おすすめ動画
Meta Gen AI 研究チームの最近の調査によると、3D Gen は高解像度のテクスチャとマテリアル マップの両方を提供するだけでなく、物理ベース レンダリング (PBR) と生成的再テクスチャリング機能もサポートします。
📣 Meta の GenAI による新しい研究で、Meta 3D Gen が紹介されました。これは、1 分未満でテキストから 3D アセットをエンドツーエンドで生成する新しいシステムです。
Meta 3D Gen は、高解像度のテクスチャとマテリアルマップをエンドツーエンドで備えた高品質の 3D アセットを生成できる新しい統合 AI システムです。… pic.twitter.com/rDD5GzNinY
— AI at Meta (@AIatMeta) 2024年7月2日
チームは、Metaの3D AssetGenモデルを用いた初期3Dモデル作成の平均推論時間はわずか30秒と見積もっています。ユーザーはその後、Meta 3D TextureGenを使用して、テキストプロンプトから既存のモデルテクスチャを微調整するか、新しいテクスチャに置き換えることができます。このプロセスには、推論時間がさらに20秒程度しかかからないと同社は見積もっています。
「それぞれの強みを組み合わせることで、3DGenは3Dオブジェクトを3つの方法で同時に表現します。ビュー空間、ボリューム空間、UV(またはテクスチャ)空間です」と研究チームは研究概要に記しています。Metaチームは、3D Genモデルを業界の様々な基準と比較し、テキストプロンプトの忠実度、画質、テクスチャの詳細、アーティファクトなど、様々な要素を比較しました。両モデルの機能を組み合わせることで、統合された2段階プロセスで生成された画像は、1段階プロセスで生成された画像よりも、注釈者によって68%の割合で選択されました。
確かに、この論文で論じられたシステムはまだ開発中であり、一般公開できる状態ではありませんが、この研究が示す技術的進歩は、ゲームや映画の効果から VR アプリケーションまで、さまざまなクリエイティブ分野に変革をもたらす可能性があります。
ユーザーが3D生成コンテンツの作成だけでなく、迅速かつ直感的に編集できるようになれば、こうした分野への参入障壁は劇的に下がる可能性があります。例えば、これがゲーム開発にどのような影響を与えるかは容易に想像できます。
アンドリュー・タラントーラは、ロボット工学や機械工学から自動車工学まで、さまざまな新興技術について 10 年以上取材しているジャーナリストです。
- コンピューティング
OpenAIの新しいo1-previewモデルを実際に試す方法
数ヶ月にわたる開発の噂にもかかわらず、OpenAI の Project Strawberry が 2024 年 9 月にリリースされ、多くの人を驚かせました。
新しい o1-preview モデルとその対応する o1-mini モデルはすでに使用および評価可能です。ここでは、ChatGPT の次世代となる可能性のあるモデルにアクセスする方法を説明します。
続きを読む
- コンピューティング
「オープンソース」の新たな定義はビッグAIにとって問題となる可能性がある
オープンソースソフトウェアの標準規格として最も広く利用されているオープンソースの定義を自ら管理するオープンソース・イニシアティブ(OSI)は、木曜日に「オープンソースAI」の定義を改訂すると発表した。この新しい文言により、MetaやGoogleといった業界大手のモデルが除外される可能性がある。
「オープンソースは、ソフトウェアシステムの学習、利用、共有、そして改善における障壁を取り除くことで、誰もが莫大な利益を得られることを実証してきました」とOSIは最近のブログ投稿で述べています。「AIにおいても、AI開発者、導入者、そしてエンドユーザーがオープンソースと同様の利益を享受できるよう、社会はオープンソースと同等の基本的な自由を必要としています。」
続きを読む
- コンピューティング
Metaの次のAIモデルは、トレーニングに約10倍の電力を必要とする
フェイスブックの親会社であるメタは、この新興技術が利益を生むようになるまでには何年もかかると予想しているにもかかわらず、人工知能の研究に引き続き多額の投資を行うと、同社幹部は水曜日の第2四半期の決算発表で説明した。
Metaは「今後数年間に必要なコンピューティングクラスターとデータについて計画を立てている」と、CEOのマーク・ザッカーバーグ氏は電話会議で述べた。Metaには「Llama 3のトレーニングに使用した量のほぼ10倍のコンピューティング能力が必要になる」とザッカーバーグ氏は述べ、Llama 4は「来年には業界で最も先進的なモデルになるだろう」と付け加えた。ちなみに、Llama 3モデルは16,384基のNvidia H100 80GB GPUで構成されたクラスターでトレーニングされた。
続きを読む