
当然のことながら、今年のGoogle I/O開発者会議ではAIが最前線に立っています。同社は、強力な生成AIスイートであるGemini 1.5 Proのより高度なバージョンを発表しました。本日より開発者向けに提供開始となるGemini 1.5 Proは、テキスト、音声、そして様々なコンテンツ形式に対応できるマルチモーダル言語モデルです。
Gemini 1.5 Proの最新アップデートでは、拡張されたコンテキストウィンドウ、強化されたデータ分析機能、追加のGoogleアプリとの連携、そしてカスタマイズオプションの拡充が導入されています。また、翻訳、コーディング、推論といった重要なユースケースにも改良が加えられています。
おすすめ動画
ジェミニ1.5フラッシュ

Google は、速度と応答時間が最も重要となる、より狭い範囲または高頻度のタスク向けに最適化された小型モデルである Gemini 1.5 Flash も発表しました。
1.5 Proと1.5 Flashはどちらも100万トークンのコンテキストウィンドウをサポートするようになり、Googleは1.5 Proではこれを200万トークンに拡張する計画も立てています。両モデルは現在、プレビューとして200か国のユーザーに提供されており、一般公開は6月に予定されています。
より長いコンテキストウィンドウ

Gemini 1.5 Proの目玉機能の一つは、100万トークンというコンテキストウィンドウの強化です。これは、世界中のコンシューマー向けチャットボットの中で最長と言われています。つまり、AIは最大1,500ページ、あるいは約100通のメールを要約するなど、膨大な量のドキュメントを理解できるようになったのです。さらに、将来的には1時間分の動画コンテンツや3万行を超えるコードベースも処理できるようになる予定です。
Googleはまた、今年末までに200万トークンのコンテキストウィンドウを達成し、AIの機能をさらに拡大することを目指していると発表した。
ジェミニライブ

AIモデルをより自然で直感的に操作できるよう、Geminiに新しいLive機能が追加されます。これにより、より充実した会話体験が実現します。Geminiに話しかけたり質問したりできるだけでなく、周囲のさまざまな音にも反応します。
例えば、Geminiのライブ機能を使えば、面接の準備やリハーサルを一緒に行い、面接で強調すべき重要なスキルを提案することで、面接をサポートできます。さらに、今後リリース予定の機能では、ライブセッション中にGeminiがあなたのカメラを活用し、あなたの周囲の状況について話し合うことができるようになります。
アプリとのより深い統合

Gemini 1.5 Proでは、AIチャットボットを多機能なデジタルアシスタントとして強化し、特に日常的なタスク管理に優れた機能を提供することに重点が置かれます。Googleはこれを実現するために、GeminiをGoogleカレンダー、ToDoリスト、Keepと統合し、昨年Bardプラットフォームに導入された拡張機能を通じて近日中に展開する予定です。
これにより、ユーザーはGmailでメールを要約したり、Googleドキュメントやドライブにアクセスしたり、さらにはGoogleカレンダーにイベントを追加したり、Google Keepの買い物リストにアイテムを追加したりするといったタスクのための画像をアップロードしたりするといった操作をシームレスに実行できるようになります。Geminiのマルチモーダル機能と、写真から学校のイベントリストを認識したり、レシピの材料を買い物リストにまとめたりするといった提案機能は、日々の業務を効率よく管理するためのアプローチを提供します。
Google は、Workspace ユーザー向けに、会社や組織全体に仮想同僚を配置できる新しい AI Teammates 機能も発表しました。
パーソナライズされた宝石

Gemini Advanced のサブスクリプションメンバーは、まもなく Gems を作成できるようになります。これは、よりパーソナライズされたインタラクションを実現する Gemini のカスタマイズ版です。ワークアウト中の相棒、料理のアシスタント、コーディングの共同作業者、ライティングのメンターなど、Gems はあなたの好みに合わせてカスタマイズできます。
タスクと望ましい応答を概説するだけで、Gemini は 1 回のクリックで指示を調整し、独自の要件を満たす Gem を作成します。
Gemini は、Android、検索、Gmail、Google レンズ、Google フォトなどのアップデートを含め、基調講演のほぼすべての発表に触れました。