Watch

ChatGPTの主な挑戦者、Google Geminiの使い方

ChatGPTの主な挑戦者、Google Geminiの使い方

GoogleのGemini AIチャットボットは、生成AI分野における主要プレイヤーの一つに急速に成長しました。当初は不安定なスタートを切りましたが、ChatGPTの真の競合相手と言えるのはGeminiだけです。Geminiについて知っておくべきことをすべてご紹介します。

Google Geminiとは何ですか?

Googleは2023年3月、AI開発プロジェクト「Bard」を無料かつ実験的な形で初めて発表しました。このチャットボットは当初、LaMDA大規模言語モデル(LLM)上で動作していました。

おすすめ動画

同社は2023年8月、Gmail、ドライブ、スライド、ドキュメントなどAIを活用したWorkspaceアプリを搭載したエンタープライズオプションとしてGoogle Duetを導入した。

しかし、2023年12月、GoogleはBard言語モデルをGemini LLMにアップグレードしました。2月にはDuetとBardを統合し、すべてのAIオプションを「Gemini」という単一の名称でリブランドしました。2024年6月現在、GeminiはAndroid 10以降を搭載し、2GB以上のRAMを搭載したデバイスで、29言語に対応しています。iOSユーザーは、GoogleアプリのGeminiタブからこのサービスにアクセスできます。

ChatGPT と同様に、Google Gemini はテキストを生成して質問に答えることができる AI チャットボットであり、ChatGPT が実行できるほぼすべての操作を実行できます。

バードは今やジェミニです。
グーグル

Googleは、テキスト、画像、動画、音声、コード生成といったタスクを同一プラットフォーム内で実行できるマルチモーダル機能を持​​つGemini生成AIを特に強力だと宣伝しています。Geminiは、Gemini Nano、Gemini Pro、Gemini Ultra、Gemini Advancedなど、目的や専門知識に応じて利用可能な大規模言語モデル(LLM)オプションを複数サポートしています。

Googleは、自社のAIを様々なアプリケーションで活用できるようにしたいという大きな野望を抱いています。ChromeブラウザへのGemini統合のテストを経て、Googleは今年5月のI/O 2024でこの技術をGoogle検索に正式に実装しました。また、Gmail、ドライブ、スライド、ドキュメントなどのGoogle Workspaceアプリにも実装されています。これらの機能もI/O 2024で発表され、同年6月から一部のユーザー向けに展開が開始されました。

GoogleはGoogle One AI Premiumという有料プランも提供しています。このプランには、Google AIの最先端バージョン(GPT-4o)に3時間以内で実行できるクエリ数が大幅に増加するなど、いくつかの特典が含まれています。Google Geminiの使い方と、自分に最適なGeminiのオプションについては、以下をお読みください。

Google Geminiに登録する方法

Google Geminiの無料版をご利用になりたい場合は、登録は簡単です。多くの人が既にGoogleアカウントとメールアドレスをお持ちです。Googleの認証情報を使ってGeminiサイトにアクセスするだけで、準備は完了です。必要であれば、先に進む前にGoogleアカウントを登録することもできます。

利用規約やサービスに関する通知が表示される場合がありますが、ご自身の判断で内容をご確認の上、ご確認ください。その後、Google BardがGoogle Geminiに変更されたという通知が表示される場合があります。その後、一般的なAIチャットボットの設定に似たページが表示されます。このページには、あなたの名前を含むパーソナライズされた自己紹介、いくつかのプロンプト候補、そして下部にプロンプ​​トテキストボックスが表示されます。

Google Gemini のメイン メニュー。
グーグル

左上にはGeminiのドロップダウンメニューがあり、ページを更新して新しいチャットを開始したり、Gemini Advancedの有料プランにアップグレードしたりできます。左端には、メニューを展開するための3本線のアイコンがあります。新しいチャットタブ、最近のプロンプト、ヘルプオプション、アクティビティオプション、設定、そしてGemini Advancedへのアップグレードオプションが表示されます。メニューを折りたたむには、もう一度3本線のアイコンを選択してください。

右上にGoogleアカウントのアイコンが表示されます。これを選択すると、Googleアカウントの詳細と、接続されている他のアカウントが表示されます。

プロンプトを使い始める

Google Gemini は他の多くのAIチャットボットと同様に、プロンプトを介してさまざまな種類のテキストを処理・生成する機能を備えています。Google がプロンプトとして使用している例としては、難しいトピックの説明やイベント企画などが挙げられます。Gemini のその他の一般的な用途としては、ストーリーやエッセイの作成、言語翻訳、コード生成と編集、数式の解法などがあります。

「書く」、「解決する」、「要約する」、「生成する」、「作成する」、「手伝って」などの明確なアクションステートメントでプロンプトを開始して、実行する必要があることを示してから、最良の結果が得られるように必要なだけ詳細に進めることができます。

Google ジェミニ相対性理論。

Google Gemini CSS。

Google Gemini 翻訳。

私が使ったプロンプトの一つは「相対性理論について簡単に教えてください」でした。すると、Geminiは科学理論について詳細ながらも、簡潔な回答を返してくれました。3つの下書きが生成され、その中から選択することができました。また、さらに情報を探すためのトピックの他の側面も提案してくれました。

テキストの下部には回答を修正するオプションがあり、これを選択すると、テキストを短くしたり長くしたり、よりカジュアルまたはプロフェッショナルな表現にしたりできます。また、手動でプロンプトを入力して同様の機能を実行することもできます。

私が使ったもう一つの課題は「メアリー・シェリー風に、サンタクロースがイースターバニーに出会う短編小説を書いてください」でした。するとジェミニは、クランプスに工房を破壊されたニコラス神父がバニーに慰められるという、胸が痛む物語を返してくれました。今回も、3つの課題案のうち最初のものだけを選びました。その後、何度か課題案を生成してみたところ、最初のものしか残っていないことに気づきました。ですから、課題案が最初に生成されたら、機会があるうちに必ず目を通しておくことをお勧めします。

Google ジェミニ メアリー シェリー プロンプト。
グーグル

ドキュメントを作成したい場合は、Google Gemini を使用して Google ドキュメントに書き込むことで、さらに高度な機能を実現できます。

私が使ったもう一つの質問は「最も一般的なCSSグリッドコマンドは何ですか?」でした。すると、CSSコマンドとその機能の説明が分かりやすくリストアップされました。この回答のために、いくつかの草稿と、それに含まれるいくつかのソースを調べました。

また、「犬は怠け者のキツネを飛び越えた」という表現を スペイン語、フランス語、中国語に翻訳しました。中国語の翻訳では、さまざまな方言の詳細な説明も得られました。

Google Geminiで画像を作成する方法

Google Geminiの無料版の際立った特徴の一つは、画像を生成できることです。すべての無料AIチャットボットがこの機能を備えているわけではありません。このレベルのGoogle Geminiは、ChatGPTの無料版で使用されているモデルであるGPT-3.5と同等とされるGemini Pro LLM上で動作します。ただし、2つのモデルには違いがあります。

ここでGoogle Geminiのマルチモーダル機能が活かされます。画像生成や動画とのインタラクションといったマルチモーダル機能は、GPT-4以降のモデルを実行する有料プランのChatGPT Plusでのみ利用可能です。

ジェミニカープロンプト。
グーグル

AIを活用した最も驚くべき機能の一つは、詳細なテキストプロンプトを使って画像を作成するというものです。音声合成と同様に、「作成」や「生成」といった言葉を使うことで、チャットボットはWebから何かを取得するのではなく、ユーザーが独自の結果を求めていることを理解できます。また、プロンプトにはスペルミスや構文ミスがないように注意してください。ただし、中にはユーザーが気にしないような面白い結果が出てくることもあるかもしれません。プロンプトのテキストはいつでも編集して、再度試すことができます。

まず、「自然に囲まれた古い山道を走る未来的な車の画像を生成してください」というプロンプトを使ってみました。画像はフォトリアリズムのタッチで、AIを使うのが楽しくなります。同じプロンプトをMicrosoft Copilotでテストしたところ、確かにしっかりとした結果が得られましたが、どちらかと言うと絵や絵画のように見えました。非常に良い出来でしたが、車と風景のマッチングはGoogle Geminiの画像ほどではありませんでした。

ジェミニ・ドッグス・プレイヤー・ポーカー・モダン。

ポーカーをプレイするジェミニ犬 2000。

2020年にポーカーをプレイするジェミニ犬。

次に、「ポーカーをする犬たち」というプロンプトのバリエーションを試してみたところ、興味深い結果が得られました。現代的なものもあれば、2000年代を舞台にしたもの、2020年を舞台にしたものもありました。人間の体に犬の顔が映り始めたところで、もうやめようと決めました。

Google Gemini アドバンス

Gemini Advancedは、Googleの有料チャットボット版で、月額20ドルで、Google One AI Premiumサブスクリプションプランに加入すると、様々な特典が受けられます。Gemini Advancedは、Gemini Ultra 1.0と1.5 Proの言語モデルを搭載しており、後者は2024年2月にリリース予定です。これらのモデルは、長いプロンプトや以前のプロンプトの文脈を理解する能力に優れています。Advancedサブスクリプションでは、コンテキストウィンドウのサイズが100万文字まで拡張され、ユーザーは新機能や限定機能への早期アクセスが可能になります。

Googleは、Gemini Advancedに、Gmail、ドキュメント、スプレッドシート、スライド、MeetのGeminiを含むAI対応生産性向上アプリケーションをバンドルしました。さらに、2TBのストレージ、Googleフォトの編集機能、Googleストアのリワード10%還元、Google Meetのプレミアムビデオ通話機能、Googleカレンダーの高度な予約スケジュール機能、Google One VPN、ダークウェブ監視、Googleストアのリワード3%~10%還元、追加のカスタマーサポートもご利用いただけます。

現在、Google One AI Premiumの2ヶ月無料トライアルを実施しており、リスクなしでGemini Advancedをお試しいただけます。Google Geminiには様々な使い方があるので、選択肢に困ることはありません。

Google Gemini拡張機能

拡張機能は、Gemini の便利なショートカットで、チャットボットを強力な検索エンジンのように使用できます。プロンプトの冒頭で @ メンションを使用すると、Google フライト、ホテル、マップ、Gmail、ドライブ、ドキュメント、YouTube など、Gemini を特定のアプリやサービスに誘導できます。その後、実行したいタスクを入力してプロンプトを終了します。

Googleドキュメントでファイルを検索したり、YouTube動画の要約を作成したり、Googleフライトで旅行プランを検索したりといった操作が可能です。「設定」>「拡張機能」にアクセスし、必要な拡張機能をすべて有効にすることで、この機能がオンになっていることを確認してください。

Googleアプリに切り替えてGeminiを使うことで、使い方を全く変えることもできます。例えば、スプレッドシートにあまり慣れていない場合でも、Google Gemini AIを使えばGoogleスプレッドシートを使いこなすことができます。

ジェミニ活動を管理する方法

生成AI全般に関して多くの人が不満を抱いている点の一つは、データトラッキングです。しかし、Googleはユーザーの安心感を高めるために、アクセスしやすいアクティビティトラッカーを提供しています。このトラッカーでは、データトラッキングのオン/オフを自由に切り替えられるだけでなく、必要に応じてデータを削除することもできます。設定を済ませれば、Googleはユーザーが許可しないデータにアクセスできなくなります。

このエリアでは、時間、日、またはカスタム範囲で個別のプロンプトを削除するオプションがあります。また、3ヶ月、18ヶ月、または36ヶ月ごとの自動削除設定もあります。ただし、これらすべてを気にしたくない場合は、以下の手順に従ってデータをオフにし、アクティビティ履歴を削除する方法をご確認ください。

  • 左上隅の Gemini を選択して、Google Gemini ページに移動します。
  • 左下隅にあるアクティビティ時間の形をしたアイコンを選択します。
  • ページ上部の「Gemini アプリ アクティビティ」オプションを選択します。
  • [オフにする]または [オフにしてアクティビティを削除する]を選択します。

Google Geminiは素晴らしいですが、乗り換える価値はあるのでしょうか?Google GeminiとChatGPTを比較してみました。

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.