Vision

ChatGPTは笑えるようになったが、それは実に不気味だ

ChatGPTは笑えるようになったが、それは実に不気味だ
OpenAI の Mira Murati が GPT-4o を紹介します。
オープンAI

誰もが予想していましたが、ついにその日が来ました。ChatGPTはゆっくりと、あなたのフレンドリーな近所のAIへと変貌を遂げつつあります。面白いことを言うと不気味に笑ったり、親切に接すると「あぁ」と返したりといった機能も備えています。そして、これは本日発表された内容のほんの一部に過ぎません。OpenAIは先日、特別な春のアップデートイベントを開催し、最新の大規模言語モデル(LLM)であるGPT-4oを発表しました。今回のアップデートにより、ChatGPTはデスクトップアプリに対応し、より優れた高速な処理が可能になりますが、何よりも完全なマルチモーダル化を実現します。

イベントはOpenAIのCTO、ミラ・ムラティ氏による紹介で幕を開けました。ムラティ氏は、本日のアップデートは有料ユーザー限定ではなく、無料ユーザーと有料サブスクリプションの両方のプラットフォームでGPT-4oがリリースされることを明らかにしました。「GPT-4oの特別な点は、無料ユーザーを含むすべての人にGPT-4レベルの知能を提供できることです」とムラティ氏は述べました。

おすすめ動画

GPT-4oははるかに高速と言われていますが、特筆すべきは、テキスト、画像、音声処理のあらゆる分野で、その性能が格段に向上している点です。開発者はAPIへの統合にもGPT-4oを活用でき、GPT-4 Turboと比較して最大2倍の速度と50%のコスト削減を実現し、レート制限は5倍にまで引き上げられていると言われています。

OpenAIがGPT-4oを発表。
オープンAI

OpenAIは、新モデルに加え、ChatGPTデスクトップアプリとウェブサイトのユーザーインターフェースの刷新もリリースします。チャットボットとのコミュニケーションを可能な限り容易にすることが目標です。「私たちは人間と機械のインタラクションの未来を見据えており、GPT-4oはそのパラダイムを、インタラクションがより自然なものになるコラボレーションの未来へと真にシフトさせていると考えています」とムラティ氏は述べています。

ムラティ氏がOpenAIのマーク・チェン氏とバレット・ゾフ氏の協力を得て披露した新たな改良点により、インタラクションはよりシームレスになったようだ。GPT-4oは動画、画像、音声をリアルタイムで分析できるようになり、これら全てにおいて感情を正確に捉えることができる。これは特にChatGPT Voiceにおいて顕著で、不気味の谷の淵に差し掛かるほど人間に近い音声を実現している。

ChatGPTに「こんにちは」と声をかけると、ロボットらしいニュアンスをほんの少し含んだ、熱心でフレンドリーな反応が返ってくる。マーク・チェンがライブデモをしていて落ち着くのに助けが必要だと伝えると、ChatGPTは十分に感銘を受けた様子で、深呼吸をするように促した。また、呼吸が速すぎる(正確には息切れに近い)ことにも気づき、チェンに正しい呼吸の仕方を丁寧に教えた。「君は掃除機じゃないよ」と、ちょっとしたジョークを飛ばしながら。

GPT-4oの紹介

ChatGPTの会話を中断して終了を待つ必要がなくなったため、会話は自然に流れ、返答もぎこちない間もなく素早く返ってきました。寝る前に物語を読んでほしいと頼まれた際には、ChatGPTは声のトーンに関するリクエストに応え、熱狂的な声、ドラマチックな声、ロボットのような声など、変化に富んだ声のトーンを見せました。デモの後半では、ChatGPTがコードを正確に読み取ったり、動画で数学の問題を解いたり、画面の内容を読み取って説明したりする能力を披露しました。

デモは完璧ではありませんでした。ボットの音声が時折途切れることもあり、それが誰かの会話によるものなのか、それとも遅延によるものなのかは判断がつきませんでした。しかし、チャットボットに期待される限り、音声はリアルで、人間の感情を読み取り、それに応じた応答をする能力は、興奮と不安を等しく引き起こします。ChatGPTの笑い声を聞くことは、今週私が聞きたいと思っていたことのリストには入っていませんでしたが、ついに実現しました。

GPT-4oは、マルチモーダル設計とデスクトップアプリを備え、今後数週間かけて段階的にリリースされます。数か月前、Bing Chatは人間になりたいと発言していましたが、今、AIブームの始まり以来、最も人間に近いChatGPTのバージョンが登場しようとしています。

Forbano
Forbano is a contributing author, focusing on sharing the latest news and deep content.