
Android、Wear OS、PixelはGoogleの代名詞と言えるでしょう。しかし、Google I/O 2024で注目を集めたのは、同社の新興AI技術「Google Gemini」でした。Googleが毎年開催するこのソフトウェアの祭典は、来年に向けて同社が計画しているすべてのものの土台となるもので、CEOのサンダー・ピチャイ氏は今年、Googleが「Gemini時代」に入ったと明言しました。GoogleフォトのAI検索から、ユーザーと連携して作業する仮想AIアシスタントまで、GoogleはあらゆるものにGeminiを組み込んでおり、その影響は計り知れません。Googleが今年発表したすべてのものの概要をご紹介します。
ジェミニの乗っ取り

ユーザーは毎日60億枚以上の写真をGoogleフォトにアップロードしています。ですから、それらすべてを精査する手伝いが必要なのも無理はありません。今夏、GoogleフォトにGeminiが追加され、「写真に聞く」機能による検索機能がさらに充実します。例えば、「車のナンバープレートは何だったっけ?」と尋ねると、写真の中から最も可能性の高い答えを探し出してくれるので、わざわざ写真を見ながら探す手間が省けます。
おすすめ動画
昨年のGoogle I/Oで注目を集めたNotebook LMにもGeminiが搭載され、AIの知能がさらに向上します。プレゼンテーションでは、バスケットボールを例に物理の授業をカスタマイズする様子が紹介されました。このような学習のパーソナライゼーションは、今後ますます普及していくでしょう。
Gemini 1.5 Pro は、本日より 35 以上の言語ですべての開発者および上級ユーザーに提供されます。
ジェミニエージェントがあなたのためにそれをやります
Geminiは単に質問をしたりデータを要約したりするだけではありません。Googleは、Geminiに実際に何かをやらせたいと考えています。掃除機をかけたりゴミ出しをしたりはできませんが、Agentsはタスクを割り当てることができる新しいAIアシスタントです。Googleは、靴の写真を撮影し、Agentsに返品するように指示することで、この機能を実演しました。AgentsはAIを使って靴を識別し、Gmailでレシートを検索し、メールで返品手続きを開始するよう提案しました。また、休暇や出張の計画、その他情報関連のタスクにも活用できます。
アストラ計画

Googleのもう一つの実験プロジェクトはAstraです。これはGeminiをカメラと連携させ、周囲の世界を理解し解釈することを可能にします。私たちが見たデモでは、Astraは話者を識別し、どの部分が音を出しているかを分析、そしてコードを読み取って説明しました。AstraはスマートグラスにAIを搭載し、スマートフォンのカメラをかざすことなく、目に映るものについて質問できるようになる可能性もあります。
これはこれまでに見たことのないものではありません。ChatGPTも同様のものを披露しています。しかし、Astraが素晴らしいと言わざるを得ません。残念ながら、リリース時期や価格については未定です。
生成AI
生成AIは最も主流のAIであり、GoogleもこのAIの最も重要な要素を無視しているわけではありません。画像生成のための最新のAIモデルはImagen 3と呼ばれ、Googleは、言葉を含む画像生成とプロンプトの理解において、これまでで最高のモデルだと主張しています。

Googleは画像以外にも、音楽生成のためのAIモデルや、非常に印象的なHD動画を作成できるAIモデル「Veo」の開発にも力を入れています。既存の動画はプロンプトを使って編集できるため、毎回ゼロから動画を作り直す必要がなく、ここで紹介する動画サンプルはAIが作成したほとんどの動画よりも明らかに見栄えが良いです。GoogleはVeoの機能をドナルド・グローバーに貸与しており、グローバーは現在、この新しいAIモデルを使った映画を制作中です。
生成された画像、音声、動画が悪意のある目的で使用されることを心配していますか?GoogleはGeminiの作品にSynthIDを追加しました。これは、AIによって作成されたコンテンツであることを目立たない形で示す透かしです。画像と動画のツールはImageFXとVideo FXにあります。
生成AIはGoogle検索にも登場します。AI概要機能は、検索結果の先頭に結果を要約し、複数のウェブサイトに誘導することなく表示します。多段階推論により、Googleのインデックスを活用してユーザーのリクエストを細分化し、最も関連性の高い情報を提供します。旅行の計画にも役立ちます。
AIオーバービューの最も印象的な機能の一つは、Googleレンズで 質問する ことで、質問に回答するカスタマイズされた適切なオーバービューを表示できることです。AIオーバービューは本日より米国全土でご利用いただけます。
ジェミニとワークスペース
Gemini は Google Workspace で既にしばらくご利用いただいていますが、Google はこれをさらに進化させる準備を整えています。来月には Gemini 対応のサイドパネルが利用可能になります。また、Meet でもより多くの言語で Gemini がご利用いただけるようになります。
ご期待通り、Gemini は Gmail にも展開されます。お子様の学校からの情報を要約するように頼めば、Gemini がそれを実行します。また、長いメールを要約してくれるので、あなたが書く必要はありません。質問やプロンプトを入力すると、Gemini が応答したり、アクションを実行したりできます。例えば、建築工事の個別の見積もりをまとめてリストに表示してくれます。スマートリプライも、コンテキスト スマート リプライにアップグレードされます。これらの機能は、今夏に Workspace Labs ユーザー向けに展開されます。
あなたも近い将来、AIと共に働くようになるかもしれません。Googleは、チームのリソース監視を担当する「AIチームメイト」のチップを紹介しました。チップはGoogle Workspaceのチャットで質問に答えることができ、決定が下された日時や、言及された特定のプロジェクトの進捗状況を記憶することができました。
ジェミニアプリ

実質的にはアップグレードされた Google アシスタントである Gemini では、テキストや音声など、Google アシスタントとまったく同じ方法でコミュニケーションできますが、ビデオや、Gemini Live と呼ばれるより会話的な話し方を使用することもできます。
Gemini Gemは、Geminiの小型版で、様々なニッチに特化できるカスタマイズ版です。特定の用途でGeminiを何度も使用する場合、Gemを作成しておけば、必要な時に時間を節約できます。例えば、汎用的なAIチャットボットに同じ質問を何度も繰り返すのではなく、好みのスタイルでストーリーを語れるようにGemをカスタマイズできます。
Geminiアプリは、旅行の計画や旅程の作成など、Geminiに期待される多くの機能を備えています。この機能は今夏にリリース予定です。
AIとAndroid

当然のことながら、GoogleはGeminiを自社のモバイルOSにも組み込む予定です。Androidは、これほど高度なAIモデルを搭載した初のモバイルOSとなり、AIファンにとって最適なプラットフォームとなるでしょう。
Circle to Search は、その最初の部分として公開されましたが、今年、Google は Android の標準 AI アシスタントとして Gemini を追加し、その裏にさらに多くの AI 機能を追加する予定です。
Android版Geminiは、Googleアシスタントの強化版とでも言いましょうか。画面上のコンテンツを文脈に応じて理解し、YouTube動画の要約を作成したり、返信用の画像を作成したり、ユーザーの質問に答えたりといった機能が、画面から目を離すことなく利用できます。
アクセシビリティはAIが提供する重要な機能です。Talkback機能は以前から提供されていましたが、Geminiのおかげで、画像に詳細な説明ができるようになりました。これにより、視覚に障がいのある方でもスマートフォンをより簡単に操作できるようになります。Geminiはデバイス上で利用できるため、操作も高速です。
Geminiは、スパムや詐欺電話への対応にも役立ちます。Geminiは通話を傍受し、疑わしい行動を検知すると警告を発します。しかも、すべての処理はデバイス上で行われるため、情報は端末から外部に漏れることはありません。ただし、この機能はまだ開発中であり、しばらくはご利用いただけません。