
Google I/O 2024の基調講演は、 Geminiのおかげでデスクトップとモバイルに導入される数多くのAI新機能で溢れていました。動画やマルチモーダルなプロンプトリクエストを通してGoogle検索を行う新しい方法が登場し、スマートフォンはProject Astraによってカメラを通してAIのスーパーパワーを最終的に獲得するでしょう。
しかし、私にとって本当に印象的だった機能が 1 つあります。それは、Google フォトの Gemini で写真に質問できる機能です。
おすすめ動画
まず、ジェミニとは何でしょうか?

まず、Geminiとは何でしょうか?これは基本的にGoogleのAIモデルファミリーであり、Gemini Nano、Gemini Pro、Gemini Ultraが含まれます。簡単に言うと、Google版のOpenAIと、ChatGPTのような独自のGPTモデルです。
Geminiは、OpenAIのGPTなどの他の大規模言語モデル(LLM)と同様にテキストを理解し、生成することができます。しかし、Geminiはそれ以上のこともでき、画像、動画、音声、さらにはコードといった他の形式の情報を理解し、処理し、組み合わせることができます。
Androidスマートフォンでは、デバイス本体でローカルに動作するGemini Nanoを使用します。Gemini Nanoモデルのおかげで、「Circle to Search」などの既存の機能がさらに充実し、生徒の物理や数学の宿題を支援する機能が追加されます。
また、画面に表示されている内容のコンテキスト認識能力がさらに向上し、視聴中の動画や閲覧中の長文PDFについて、何十ページもスクロールすることなくGeminiに質問できるようになります。Gemini Nanoは、複数のリクエストを1つにまとめた検索クエリなど、マルチモーダル機能をスマートフォンに提供します。

Geminiで写真に質問は、I/O 2024で発表されたGeminiの多くの新機能の一つで、今年後半にはGoogleフォトにも搭載される予定です。簡単に言うと、膨大な写真ライブラリを、キーワードではなく会話形式で検索できるようになります。
Google I/O のデモでは、Google は「私の車のナンバープレートは何だったっけ?」や「娘はいつ水泳を習ったの?」と尋ねるだけで、それらの要求に応える写真を表示できることを披露しました。
さらに、「娘の水泳の進歩を見せてください」といったリクエストにも対応します。このようなクエリを実行すると、Gemini は日付とコンテキストに基づいて写真を遡って適切な結果を表示します。
ステージ上でAsk Photos with Geminiが披露されたとき、私は興奮し、すぐにでも手に入れたいと思いました。
親のAIコンパニオン

母親になってまだ2年ちょっとですが、その間、これまで以上にたくさんの写真を撮ってきました。娘の可愛くておどけた瞬間から、写真や動画に残しておきたい大切な節目まで、娘のあらゆる瞬間を写真に収めるのが大好きなので。1TBのiPhone 15 Proと、数え切れないほど試しているAndroidスマートフォンで、いつも娘の写真を撮っています。
やりすぎだと思うかもしれませんね。実際そうかもしれません。でも、両親から子供時代の写真、ましてや動画なんてほとんど残っていません。両親は私の特別な瞬間を全部記録してくれているわけではなく、漠然とした記憶しかなく、詳細で具体的な記憶はありません。今のテクノロジーのおかげで、娘に子供時代の視覚的な証拠を残すことができました。
家族や限られた友人と共有するために写真や動画を撮ることもありますが、ほとんどの場合、これらの瞬間を捉えるのは、後で振り返りたいからです。ちょっとした気分転換に笑顔を取り戻したい時も、老齢になって思い出を振り返りたい時も、私は自分の視覚的な記憶を何度も見返します。

Geminiの「Ask Photos」を使えば、娘の様々なライフイベントの進捗状況をGeminiに表示させるのが待ち遠しいです。例えば、今年の8月から娘は幼稚園に入園します。Geminiに、幼稚園での学習を通しての娘の進捗状況を見せてもらったり、各学年の「最初の数日間」を全部見せてもらったりしたいですね。あるいは、娘が自転車に乗れるようになったら、補助輪から本格的な自転車へと移行していく様子も見ることができます。なんと、娘が毎年誕生日ケーキのろうそくを吹き消す瞬間まで、Geminiに見せてくれるんです!
Ask Photosの活用方法はたくさんあるのですが、これはほんの一部に過ぎません。お子さんの記念日に親御さんにとって最適なツールですが、他にも様々な場面で活用できます。私自身も、記念日や休日、さらにはペットの記念日にも活用したいと思っています。
もちろん、今なら写真をすべて見て、顔やキーワードで検索できます。でも、GeminiのAsk Photosは、もっとシンプルで、速く、自然な方法のように思えます。それに、5万枚以上の写真や動画が入ったフォトライブラリを持っていると、もっと簡単に検索できる方法があればいいのにと思います。
これを使うのが待ちきれません

Ask Photos は、Google が Google I/O 2024 で披露した唯一の Gemini AI 機能ではありません。これはその実用性から私が最も 期待している機能ですが、他にもチェックしたいエキサイティングな機能がいくつかあります。
例えば、Project Astraは興味深いと思いました。私はよくスマートフォンで、植物や花など、後で詳しく知りたいものを写真に撮って保存します。しかし、AstraならカメラにAIの優れた機能が備わり、見ているものについてリアルタイムで教えてくれます。Googleはスマートグラスを発表していませんが、Project Astraは、将来的にスマートグラスに搭載される素晴らしい機能になるだろうということを示しています。
Gemini を搭載した Google 検索のマルチモーダル プロンプト リクエストもぜひ試してみたいです。私は計画を立てるのがあまり好きではないので、Google が代わりにやってくれるなら大賛成です。リアルタイム詐欺アラートは私にとってはあまり役に立たないと思いますが(そもそも電話に出ないですし)、他の人には非常に役立つ機能になるでしょう。
Gemini の Ask Photos は今年の夏後半に Google フォトに導入される予定なので、試すのが待ちきれません。