Vision

安定拡散がさらに良くなり、コストも削減されました

安定拡散がさらに良くなり、コストも削減されました
  1. コンピューティング
  2. ニュース
幻想的な風景の中に日の出を表現した AI 生成画像。
Stable Diffusionで作成されたAI生成画像。 アンドリュー・タラントーラ / Stable Diffusion

人気画像生成エンジン「Stable Diffusion」を開発するスタートアップ企業Stability AIは、ライセンス契約の更新を発表しました。これにより、無料利用枠が拡大され、生成画像数制限が撤廃されました。さらに、現行モデルの品質向上も発表されました。

おすすめ動画

まずはライセンスについて取り上げよう。これは月曜日のブログ記事で同社が「SD3 に元々関連していた商用ライセンスがコミュニティに混乱と懸念を引き起こした」と認めた内容だ。

今後は、年間収益が 100 万ドルを超えるエンタープライズ顧客と、出力画像やビデオを商用アプリケーションで使用するユーザーのみが、Stable Diffusion ソフトウェアの料金を支払う必要があります。

「Stability AI Community License」は、最近リリースされた(そしてあまり評価されていない)Stable Diffusion 3 Medium(SD3M)モデルを含む、同社の生成AIモデルの自由利用を大幅に拡大します。

「非営利目的でStability AIモデルを自身のデバイスに(直接、またはそれを含む無料のオープンソースパッケージをインストールすることで)インストールして実行する個人や組織は、引き続き無料で行うことができます」と同社は述べている。

これには、趣味人、研究者、開発者、学生、教師、そしてモデルの改良と配布を支援する「微調整者」が含まれます。新しいライセンスの自由度は中小企業にも適用されます。Stability AIは、企業の年間総収益が100万ドル(または現地通貨相当額)未満であれば、SDモデルを直接利用することも、派生モデル(例えば、SD3を独自に特化・微調整したバージョン)を利用することも許可しています。この財務制限を超える企業は、Stability AIに直接連絡してエンタープライズライセンスを取得する必要があります。

さらに、新しいライセンス スキームでは、画像、ビデオ、オーディオ コンテンツなど、ユーザーまたは組織が作成できる生成作品の数に制限はありません。

「違法な活動に使用したり、明らかに当社のライセンスやAUPに違反したりしない限り、Stability AIは、たとえStability AIに料金を支払わなくても、結果として得られた画像や微調整、その他の派生製品を削除するように要求することはありません」と同社は書いている。

別にいいとこ取りしてるわけじゃないんです、本当に。というか…とにかく面白いの
は、このモデルが正式にAuraDiffusionに改名されたこと! pic.twitter.com/hUyxuQxXpP

— Simo Ryu (@cloneofsimo) 2024年7月7日

Stability社は、開発者コミュニティからの激しい批判を受け、SD3Mモデルのパフォーマンス向上のため微調整を行うことを発表しました。同社によると、新モデルはテストおよび開発段階において、前モデルのSDXLモデル(現在はAuraDiffusionとして知られています)を上回るパフォーマンスを示したとのことです。

しかし、ユーザーが新しいAIに斬新なアバターポーズの作成を依頼したり、モデルのトレーニングデータにはあまり見られない単語を使用したりすると、重大な欠陥が発見されました。「SD3 Mediumはまだ開発中です」と同社は述べています。「今後数週間以内に、大幅に改良されたバージョンをリリースする予定です。」

アンドリュー・タラントラ

アンドリュー・タラントーラは、ロボット工学や機械工学から自動車工学まで、さまざまな新興技術について 10 年以上取材しているジャーナリストです。

  • コンピューティング

レノボのクリエイターゾーンがPCに安定した普及をもたらす

レノボ クリエイターゾーンがヨガに登場 ideapad creatorzone01 5a0aea

レノボは木曜日、ベルリンで開催されたIFA 2024で、YogaとIdeaPadデバイスの新ラインナップに、「創造のプロセスを大幅に強化するように設計された」デバイス内AIであるCreator Zoneが搭載されると発表した。

このアプリケーションは、グラフィックデザイナー、コンテンツクリエイター、そしてマーケター向けに設計されています。Lenovo専用にチューニングされたStable Diffusion 3.0を搭載しています。自然言語処理技術を用いることで、Creator Zoneはユーザーのテキストプロンプト、スケッチ、参考画像に基づいて画像を生成・修正することができます。

続きを読む

  • コンピューティング

AI画像生成は大きな進歩を遂げた

ウェス・アンダーソン監督の『ハリー・ポッター』で、プールサイドに立つダンブルドア教授。

AIが生成した画像が当たり前の時代になって久しいですが、今週、大手企業が大きな前進を遂げました。特に、Midjourney、Googleの新モデル、そしてGrokの大幅なアップデートについてお話しします。

各社は、技術がそれぞれ異なるペースと方向で進化していることを示しています。依然として非常にオープンな競争の場であり、各社は技術の進歩がいかに進んでいるかを実証しています。Midjourney
がウェブに登場。Midjourney
で生成されたAI画像。Channel/Midjourney

続きを読む

  • コンピューティング

Mac用のChatGPTアプリにこの便利な新機能が追加されました

テキスト入力ウィンドウが表示されているOpenAIデスクトップアプリ

OpenAIが最近リリースしたMacデスクトップアプリは、使い勝手が少し向上しました。同社は、Option + Spaceキーを押すとChatGPTテキストプロンプトが横並びで表示されるようになったと発表しました。

デスクトップ版は、Web版とほぼ同一の機能を提供します。ユーザーはAIと直接チャットしたり、テキストまたは音声による自然言語プロンプトを使ってシステムに問い合わせたり、過去の会話を検索したり、分析のために文書や画像をアップロードしたりできます。さらに、画面全体または単一のウィンドウのスクリーンショットを撮ってアップロードすることも可能です。

続きを読む

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.