GPT-4oは、OpenAIがリリースした最新かつ最高の大規模言語モデル(LLM)AIであり、無料ユーザーと有料ユーザーの両方に多数の新機能を提供します。ChatGPTの応答速度、理解度の向上、そして今後数週間にわたって展開される数々の新機能を強化するマルチモーダルAIです。
MetaのLlama 3やGoogle Geminiとの競争が激化する中、OpenAIの最新リリースは、常に一歩先を行くことを目指しています。その理由をご紹介します。
在庫状況と価格
ChatGPTの無料版をしばらく使っていて、ChatGPT Plusユーザーが楽しんでいる機能に憧れていた方には朗報です!画像検出、ファイルアップロード、GPTストアでのカスタムGPTの検索、チャット中に会話をメモリに保存して同じことを繰り返さないようにする機能、データ分析や複雑な計算の実行など、様々な機能をお楽しみいただけます。
これらはすべて、標準的なGPT-4モデルの高い知能と並んで実現されています。GPT-4oは、マルチモーダルAIとしてゼロから学習されたとしても、GPT-4と同等の性能を備えています。これが可能なのは、GPT-4oの実行コストが計算コストよりもはるかに低いためです。つまり、必要なトークン数が少なく、より幅広いユーザーが利用しやすくなります。
ただし、無料ユーザーはGPT-4oに1日に送信できるメッセージ数に制限があります。この制限に達すると、GPT-3.5モデルに移行します。
はるかに速い

GPT-4はGPT-3.5とは多くの点で異なっており、その一つが速度です。GPT-4は、ここ数ヶ月の進歩とGPT-4 Turboの導入にもかかわらず、はるかに遅いものでした。しかし、GPT-4oはほぼ瞬時に応答します。そのため、テキスト応答ははるかに迅速かつ実用的になり、音声会話はほぼリアルタイムで行われます。
応答速度は画期的な機能というよりは、あれば便利な機能のように感じられますが、ほぼリアルタイムで応答が得られるため、GPT-4o は翻訳や会話によるヘルプなどのタスクにとって、はるかに実用的なツールになります。
高度な音声サポート
GPT-4oは当初、テキストと画像のみに対応していましたが、音声コマンドを活用し、音声を使ってユーザーとインタラクションできるようにゼロから構築されました。つまり、GPT-4が音声をテキストに変換し、それに応答し、さらにテキスト応答を音声出力に変換するのに対し、GPT-4oは音声を聞き、それに応じて応答することができます。速度が向上したことで、より会話的な応答が可能になり、トーン、ペース、気分など、音声の独特な側面を理解できるようになりました。
GPT-4oは笑ったり、皮肉を言ったり、間違いに気づいたり、途中で修正したりすることができます。会話中に割り込んでも、その反応は変わりません。また、様々な言語を理解し、即座に翻訳できるため、リアルタイム翻訳ツールとしても利用可能です。歌ったり、独り言を言ったりすることもできます。
2つのGPT-4osが相互作用しながら歌っている
これは、面接の準備、歌の指導、ロールプレイング NPC の実行、さまざまな声とキャラクターによるドラマチックな就寝時の物語の語り、ゲーム プロジェクト用の音声付きダイアログの作成、ジョークを言う (そしてあなたのジョークに応えて笑う) など、さまざまな用途に使用できます。
理解力の向上
GPT-4oは、特に話しかけられた際に、以前のモデルよりもはるかに優れた理解力を発揮します。口調や意図をはるかに正確に読み取る能力も向上し、リラックスしてフレンドリーな雰囲気で会話をしたい時には、冗談を交えて会話を盛り上げてくれます。
コードやテキストを分析する際には、ユーザーの意図をより深く考慮するようになり、より的確な指示を必要とせずに、ユーザーが望む応答をより正確に返せるようになります。また、動画や画像の読み取りもより正確になり、周囲の世界を理解できるようになります。
GPT-4o ビジョン機能のライブデモ
OpenAIはいくつかのデモで、ユーザーが部屋の様子を撮影し、GPT-4oモデルがその部屋の様子を説明する様子を見せました。ある動画では、AIが別のバージョンの自分自身に部屋の空間を説明し、その説明に基づいて独自の返答をしていました。
ネイティブmacOSデスクトップアプリ

WindowsのネイティブAIは、今のところ比較的機能が制限されたMicrosoft Copilotに限られていますが、macOSユーザーはまもなくデスクトップからChatGPTとその新しいGPT-4oモデルをフル活用できるようになります。新しいネイティブデスクトップアプリにより、ChatGPTはより手軽に利用できるようになります。さらに、新しいユーザーインターフェースも搭載され、これまで以上に使いやすくなります。
このアプリは、ChatGPT Plusのほとんどのユーザーに近日中に提供開始され、無料ユーザーにも数週間以内に提供される予定です。Windows版は今年後半にリリース予定です。
まだ準備はできていません
本稿執筆時点(2024年11月)では、GPT-4oで一般公開されているのはテキストモードと画像モードのみです。高度な音声サポートやリアルタイムの動画認識機能は提供されておらず、macOSデスクトップアプリは少なくとも数日は一般公開されません。
しかし、すべてはこれからです。ChatGPTのこれらの変更とその他のエキサイティングなアップグレードは間もなく行われます。しかし、これらの改訂により、ChatGPTはますます競争が激化する分野において最高のAIチャットボットとなるのでしょうか?