
つい最近、Appleが社内でApple GPTと呼ばれるものを開発中だという噂がありました。これは、同社独自のAIモデルをベースにしたチャットボットで、OpenAIのChatGPTの機能を模倣することを目指しています。その後数ヶ月にわたり、Google PixelやSamsungのGalaxy S24、そしてNothing Phone 2aのような新興機種に至るまで、あらゆるところに生成AI製品が登場しています。
おすすめ動画
その間、Appleからは漠然としながらも大胆な主張ばかりが聞こえてきた。AppleのCEO、ティム・クック氏は投資家に対し、Appleの生成型AIへの取り組みは今年後半に開始され、「新境地を開く」だろうと述べた。しかし、Appleはこれらの夢を実現するために、Googleの協力を得ることになるようだ。あるいは、OpenAIが救いの手を差し伸べるかもしれない。
ブルームバーグによると、AppleはiPhone向けのGemini AIモデルのライセンス供与についてGoogleと交渉中とのことだ。これは、SamsungがGalaxy S24シリーズで採用した戦略と似ているようだ。Galaxy S24シリーズでは、GoogleのGemini Nanoモデルをデバイス上で実行でき、より強力なバージョンはクラウド上で利用できる。
契約条件はまだ確定しておらず、協議は非常に流動的であると言われています。しかし、AppleはOpenAIとも協議中であると報じられています。ちなみに、GPT-4モデルやDall-EといったOpenAIの基盤技術は現在、Microsoftの製品群全体、そしてChatGPT Plusのようなスタンドアロンアプリやサービスを通じて利用可能です。これはAppleのAIへの野望における興味深い展開であり、私にとっては興奮と不安が同程度に混じったものです。
AppleのAIの旅(これまでのところ)

2023年の最終月、Appleは大々的な宣伝もなく、MLXグループ傘下のモデルライブラリとフレームワーク群を自社製チップ上で動作するように設計した一連の製品を発表しました。この動きは、QualcommがSnapdragon X Eliteプラットフォームで行っている取り組みに類似し、Macシリーズに生成型AI機能を導入するものです。
今年初め、Appleの研究部門は、ユーザーがアニメーションコンテンツを作成できる生成AIツール「Keyframer」に関する論文を発表しました。これは基本的にOpenAIのGPT-4モデルに基づいていますが、静止画像の処理にベクターグラフィックスを組み込んでいます。
さらに、Appleの専門家は、簡単な音声指示で画像編集を容易にするAIツールに関する研究論文も発表しました。この機能は、Qualcommの最新Snapdragonチップに搭載されている音声アシストメディア編集ツールキットに類似しています。

ブルームバーグによるその後の報道では、Appleが生成AI機能の調査を担当する専任チームを増強しており、2024年までにこれらのツールを開発者が利用できるようにすることを大きな目標としていることが強調された。
Appleが6月に発表予定のiOS 18で、初の生成AI機能群がデビューすると噂されています。しかし、ブルームバーグの最新レポートによると、これらの機能はデバイス上のネイティブシステム向けであり、ChatGPT、Gemini、Perplexityなどが提供するような、通常はクラウド接続される生成AI機能には対応していないとのことです。
9月、The InformationはAppleがSiriの強化を目的とした「基盤モデル」を開発していると報じました。この取り組みは、GeminiがGoogleアシスタントを進化させている方法に似ていると言われています。
Gemini は iPhone で何ができるのでしょうか?

Geminiは、ローカルで実行中だけでなく、インターネットに接続しているときでも、スマートフォンに多くの機能をもたらします。Google Pixel 8 Proのようにデバイスに実装されている場合、スマートフォンがオフラインの場合でも、レコーダーアプリで会話を要約できます。
Gboardキーボードアプリをお使いの方には、Gemini NanoがWhatsAppなどのアプリで使えるスマートリプライ機能を提供します。簡単に言うと、会話を読み取り、文脈に基づいて返信候補を提案してくれます。また、デバイス上のAIによってオフライン翻訳も可能になります。この機能は、Gemini対応のSamsung Galaxy S24シリーズで既に搭載されています。
現在、携帯電話に Gemini アプリをインストールすると、次のタスクを実行できます。
- Google アシスタントや ChatGPT と同様に、Gemini で自然言語による会話をしたり、文章作成やアイデア出しなどのサポートを受けることができます。
- Workspace拡張機能を有効にすると、メールやファイル内の情報を素早く要約できます。情報はリスト、グラフ、表などの形式で要約できます。
- OpenAI の Dall-E エンジンのようなテキストプロンプトを使用して画像を生成します。
- カメラを新しい方法で使いこなすためのサポートをご利用ください。Geminiアプリでは、カメラをシーンに向け、フレーム内のオブジェクトに関する情報をAIに尋ねることができます。
- 画面に表示されている内容を理解できます。「Hey Google」コマンドでGeminiを呼び出して、必要な作業を実行できます。例えば、現在読んでいる記事の要約を作成することも可能です。
- Google マップと Google フライトを使用して旅行を計画し、カスタマイズされたルーチンを作成することもできます。
AppleとGoogleのAI取引の結末はどうなるか

前述の通り、SamsungはGoogleと緊密に協力し、Gemini Nano AIモデルを同社のフラッグシップスマートフォンに搭載しました。しかし、Geminiはフラッグシップモデルだけに搭載されるわけではありません。今年2月、MediaTekはミッドレンジモデルのDimensity 8300チップを、フラッグシップモデルのDimensity 9300に加え、Google Gemini向けに最適化したことを発表しました。
Appleで同様のことをするのは、それほど面倒ではないだろう。デバイス上でのライセンス契約がうまくいかなかったとしても、申請という道は常にある。今のところ、そもそも契約が成立したとしても、Appleがどのような戦略を実行するのかは不明だ。
より大きな疑問は、Geminiのライセンス契約がユーザーのiPhoneとの関わり方に大きな変化をもたらすかどうかだ。そしてさらに重要なのは、GeminiがSiriに何らかの変化をもたらすかどうかだ。率直に言って、SiriがGoogleアシスタントに追いつくには、まだ多くの課題を乗り越えなければならない。

しかし、Google自身もGeminiの存在意義や、Googleアシスタントを完全に置き換えるものなのかをまだ完全には把握していません。現状では、AndroidスマートフォンにGeminiをインストールすると、Googleアシスタントが置き換えられます。少なくとも、置き換えようとしているようです。
スマートフォンは、電話をかける、アラームを設定する、メッセージを送信する、スマートホーム機器を操作する、カレンダーに予定を追加するなど、日常的でありながら重要なタスクを幅広くGoogleアシスタントに頼っています。同様に、ナビゲーション、Gboardでの音声入力、Android Autoについても、Geminiではなく、Googleアシスタントが依然として頼りになるAIです。
さらに、Googleアシスタントは依然としてスマートディスプレイやWear OSスマートウォッチにおける頼りになるAIアシスタントです。Appleがハードウェアエコシステム全体、特にiPhoneとApple Watchの間でソフトウェアをいかに密接に連携させているかを考えると、Gemini、Googleアシスタント、そしてSiriがそれぞれの役割を分担するという段階的なアプローチは、一般ユーザーに大きな混乱をもたらすでしょう。
あるいは、AppleはGoogleと緊密に連携し、GeminiをSiri、メール、メモ、Safari、カレンダー、ヘルスケアといったAppleエコシステム機能と連携させる独自の統合を実現する可能性もあるでしょう。しかし、Geminiのデータ保存ポリシーの現状を考えると、システムレベルでの緊密な統合は期待できません。
AppleにとってのGeminiのリスク

もちろん、Appleはスマートフォンにおける生成AIの第一波に乗り遅れており、報道を信じるならば、同社は必死に追い上げようとしている。しかし、Geminiとのライセンス契約は、Appleが「Ajax」プロジェクトの下で行っている生成AI開発を目にする機会がなくなる可能性もあることを意味する。あるいは、GeminiがiPhoneのAI開発を担っている間、Appleの取り組みは薄められた形でしか見られないかもしれない。
しかし、Geminiにも欠点がないわけではありません。それどころか、他の主流の生成AIツールよりも驚くほど多くの失敗を犯してきました。数週間前、Geminiのユーザーは、肌の色、民族、歴史的正確性など、極めて不正確な画像が生成されていることに気付きました。
論争はエスカレートし、GoogleはGeminiにおけるテキスト画像生成機能を一時停止するに至った。「はっきり申し上げますが、これは全く容認できるものではなく、私たちの判断は間違っていました」と、Google CEOのサンダー・ピチャイ氏は社内メモに記しており、NPRが報じた。

大西洋の向こう側では、ジェミニはインドのナレンドラ首相に関する発言が侮辱的とみなされ、ソーシャルメディアで拡散したことで、新たな論争に巻き込まれた。インドのラジーヴ・チャンドラセカール連邦大臣はNDTVを通じて、「ただ『申し訳ありませんが、未検証でした』と言うだけでは、法令遵守という我々の期待に反します」と警告した。
この論争により、AI規制が再び議論の的となり、大手AI企業に対しては、Geminiのようなツールが一般公開される前に明示的な承認を得ることを義務付ける勧告も出された。
Appleのように政府規制を厳格に守る企業にとって、世界中で何億台ものデバイスにGeminiのライセンスを供与することは、決して小さなリスクではありません。特にGoogle自身が「Geminiは間違いを犯す」と警告し、不正確な点がないか常に二重チェックを行うべきだと述べていることを考えると、なおさらです。