Vision

クアルコムはAndroidスマートフォンにこれらのクレイジーなAIツールを追加したいと考えています

クアルコムはAndroidスマートフォンにこれらのクレイジーなAIツールを追加したいと考えています
Qualcomm Snapdragon 8 Gen 3 メディア アセット。
クアルコム

モバイル・ワールド・コングレス2024において、クアルコムはAndroidスマートフォン向けSnapdragonシリーズチップを活用したAI搭載スマートフォンのポートフォリオを拡充します。同社は既に、音声起動によるメディア編集、Stable Diffusionを用いたデバイス内画像生成、Metaなどの大規模言語モデルを基盤としたよりスマートなバーチャルアシスタントなど、Snapdragon 8 Gen 3フラッグシップ向けAI機能を披露しています。

本日、QualcommはこれらのAIスーパーパワーにさらなる強化を加えます。まず、スマートフォン上でLarge Language and Vision Assistant(LLaVa)を実行する機能です。これは、ChatGPTのようなチャットボットにGoogle Lens機能を追加したものと考えてください。つまり、Qualcommのソリューションはテキスト入力だけでなく、画像処理も可能になります。

おすすめ動画

例えば、シャルキュトリーボードの画像を提示し、それに基づいて質問をすることができます。70億以上のパラメータを処理できる大規模マルチモーダルモデル(LMM)に基づくAIアシスタントは、以下の入力画像に描かれたボードに載っている果物、チーズ、肉、ナッツの種類をすべて教えてくれます。

Qualcomm による、よりスマートな携帯電話向け AI アシスタントのデモ。
クアルコム

追加のクエリも処理できるため、スムーズな双方向の会話が可能です。現在ではChatGPTなどのツールもマルチモーダル機能を備えているため、OpenAIのツールは画像入力も処理できます。しかし、決定的な違いがあります。

ChatGPTやCopilotのような製品は、依然としてクラウドベースのアーキテクチャに大きく依存しており、データはリモートサーバーで処理されます。Qualcommはデバイス内での処理を重視しており、すべてがスマートフォン上で行われるため、プロセス全体が高速化され、プライバシー侵害のリスクは最小限に抑えられます。

「このLMMはデバイス上で応答性の高いトークンレートで動作し、プライバシー、信頼性、パーソナライゼーション、そしてコスト効率を向上させます」とクアルコムは述べています。クアルコムが約束するLLaVaベースのバーチャルアシスタントがスタンドアロンアプリとして提供されるのか、それとも有料になるのかは、まだ公式には発表されていません。

Qualcommの次の発表は、画像生成と操作というクリエイティブな領域に踏み込んだものです。Qualcommはつい最近、Stable Diffusion技術を用いて、スマートフォン上で世界最速のテキスト画像生成のデモを行いました。本日、同社はLoRAを活用した画像生成を初めて公開します。

Qualcomm が携帯電話での AI 画像生成を披露。
クアルコム

LoRAは、Dall.E.のような一般的な生成AIツールとは異なる画像生成アプローチを採用しています。LoRA(Low-Rank Adaptationの略)は、Microsoftが開発した技術です。AIモデルの学習は、非常にコストがかかり、レイテンシが高く、特にハードウェアの要件が厳しい場合があります。

LoRAは、モデルの重量を大幅に削減します。これは、モデルの特定のセグメントにのみ焦点を当て、学習用のパラメータ数を削減することで実現されます。これにより、メモリ要件が削減され、処理速度が向上し、テキストから画像へのモデルを適応させるのにかかる時間と労力も大幅に削減されます。

長年にわたり、LoRA蒸留技術は、テキストプロンプトから画像を生成するための安定拡散モデルに応用されてきました。LoRAベースのモデルは効率性が向上し、適応性も高いことから、スマートフォンに最適な手法と目されています。Qualcommもその考えは正しく、ライバルのMediaTekでさえ、主力製品であるDimensity 9300チップの生成AI技術に同じソリューションを採用しています。

QualcommはMWC 2024で他のAI技術もいくつか展示しており、その一部はSamsung Galaxy S24 Ultraに既に搭載されています。その中には、生成AIフィルとAIを活用した動画生成を用いて画像のキャンバスを拡張する機能があります。特にOpenAIがSoraで実現した成果を考えると、後者は非常に野心的な取り組みと言えるでしょう。Qualcommがこれをスマートフォンにどのように移植するのか、今後の展開が注目されます。

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.