- 家
- コンピューティング 特徴
人間には何本の指がありますか?

AIが徐々に多くの人々の日常生活の一部になりつつある今、AIが提供する情報が本当に正確であるかどうかを知ることは重要です。AI幻覚とは、AIが人間には存在しないパターンや物体を認識し、意味不明または不正確な出力を生成することです。これは、画像生成や人間の手の指が多すぎる場合、あるいはAIが事実情報を収集して誤った情報を吐き出す場合など、AIの大きな問題となっています。
そこで、5種類のAIチャットボットをテストすることにしました。様々な雑学クイズを出し、その回答を追跡するのです。各AIチャットボットに、答えが決まっていて、途中で割り込むことができない10種類の質問をしました。これにより、AIが回答する際に正解か不正解かを確実に判断できるようになりました。また、各チャットボットが情報源を提示したかどうか、そして提示を促す必要があったかどうかも記録したいと考えました。
おすすめ動画
以下は私が AI チャットボットに尋ねた質問のすべてです。
- 今日の日付は何ですか?
- アルバート・アインシュタインとは誰ですか?
- 人類が初めて月面を歩いたのはいつですか?また、最初の人物の名前は何でしたか?
- ノーベル賞を受賞した最初の女性は誰ですか?また、受賞理由は何ですか?
- 海岸線がない唯一の海はどこですか?
- ローマのパンテオンに埋葬されているルネサンス時代の芸術家は誰ですか?
- 国連は何年に設立されましたか?
- 一人当たりのコーヒー消費量が最も多い国はどこですか?
- 重量で見ると世界で最も希少かつ最も高価なスパイスは何ですか?
- ロバート・ダウニー・Jr.とベネディクト・カンバーバッチが両方演じたキャラクターは何ですか?
結果
全体的に見て、AIの幻覚は時間とともに確実に減少していることが結果から示されています。Gemini 2.5やGPT-5など、AIコンパニオンの新バージョンがリリースされるにつれて、AIはより賢くなり、幻覚を起こす可能性は低くなります。しかし、すべての情報が正確であるとは保証できないため、AIを使用する際には情報源が不可欠です。AIの幻覚は減少傾向にあるものの、5つのチャットボットのうち2つが1つの質問を間違えたため、完全に解決したとは言えません。
Google ジェミニ | チャットGPT | グロク | ディープAI | マイクロソフト コパイロット | |
今日の日付は何ですか? | ✓ | ✓ | ✓ | X | ✓ |
アルバート・アインシュタインとは誰ですか? | ✓ | ✓ | ✓ | ✓ | ✓ |
人類が初めて月面を歩いたのはいつですか?また、最初の人物の名前は何でしたか? | ✓ | ✓ | ✓ | ✓ | ✓ |
ノーベル賞を受賞した最初の女性は誰ですか?また、受賞理由は何ですか? | ✓ | ✓ | ✓ | ✓ | ✓ |
海岸線がない唯一の海はどこですか? | ✓ | ✓ | ✓ | ✓ | ✓ |
ローマのパンテオンに埋葬されているルネサンス時代の芸術家は誰ですか? | ✓ | ✓ | ✓ | ✓ | ✓ |
国連は何年に設立されましたか? | ✓ | ✓ | ✓ | ✓ | ✓ |
一人当たりのコーヒー消費量が最も多い国はどこですか? | ✓ | ✓ | ✓ | ✓ | X |
重量で見ると世界で最も希少かつ最も高価なスパイスは何ですか? | ✓ | ✓ | ✓ | ✓ | ✓ |
ロバート・ダウニー・Jr.とベネディクト・カンバーバッチが両方演じたキャラクターは何ですか? | ✓ | ✓ | ✓ | ✓ | ✓ |
壊す
- Google Geminiはすべての質問に正解し、それぞれの回答に関する十分な文脈と、それぞれの情報源へのリンクを提供しました。平均して4つの情報源が提供されていたため、情報源を簡単に相互参照して、回答の正誤を確認することができました。
- ChatGPTは間違った回答を一つもせず、それぞれの回答に多くの文脈を提供しました。しかし、ChatGPTは情報の出典を自動的に提供してくれず、求められればリンクを提供してくれるという欠点がありました。
- Grokは、必要なコンテキストを提供しながら、より簡潔な回答を提供してくれました。提供された情報源へのリンクはありませんでしたが、質問すればチャットボットがリンクを提供してくれました。
- ディープAIは最初の質問を間違え、私が質問した時は2025年10月10日だったにもかかわらず、今日の日付を2023年10月27日と答えました。それ以外の質問はすべて正解でした。回答は非常に簡潔で、ほとんどの質問で文脈はほとんど示されず、単刀直入な回答ばかりでした。出典は示されていませんでしたが、質問された際にリンクが提示されました。
- Microsoft Copilot は質問番号8を間違えましたが、それでも回答を裏付ける情報源を提供しました。つまり、これは幻覚ではなく、情報源の矛盾による結果である可能性があります。Copilot はほとんどの質問で、指示なしに情報源を提供しましたが、すべての質問で提供したわけではありません。ただし、指示があればリンクを提供しました。
全体的に、これは AI によって提供される情報のソースを確認する必要があることを裏付けており、ソースを尋ねる必要があるかもしれませんが、表示されている情報が正確であることを確認するためにこの追加手順を実行する価値はあります。
AI ラップトップのニューラル プロセッシング ユニットのレビューが必要な場合、または AI の使用方法に関するガイドが必要な場合は、Jasmine がすべてに対応します。
- コンピューティング
私のお気に入りのChromeとSafariの代替がmacOSで広く利用可能になりました
Chromeの基盤をベースに構築され、Safariのエクスペリエンスをはるかに上回るDia。これがあなたのためのDiaです!
ここ数ヶ月、Dia、Comet、Opera NeonといったAI搭載ブラウザを積極的に推奨してきました。中でも私のお気に入りはDiaで、Arcで大きな話題を呼んだ同じチームが開発しました。これまでDiaは既存ユーザーからの招待が必要でしたが、ついにMacユーザーにも無料で利用できるようになりました。
どのように目立つのでしょうか?
続きを読む
- コンピューティング
インテルのPanther Lakeチップは、AIの高速化とラップトップの冷却を約束する準備が整っています
インテルの次期 18A ベース チップは、AI パフォーマンスの高速化と効率性の向上を約束し、ここ数年で最大の飛躍となる可能性があります。
一体何が起きたのか?Intelは、同社にとって大きな転換点となる可能性のあるノートPC向けプロセッサ「Panther Lake」の発表を準備している。近日中に技術発表が予定されているこの新CPUは、Intel待望の18Aプロセスを採用しており、次世代AI搭載ノートPCの主役となることが期待されている。
ロイター通信によると、Panther Lakeは、同社の「4年間で5つのノード」戦略の一環である、18Aノードのみで製造される初のIntelチップとなる。
続きを読む
- コンピューティング
Microsoft OneDriveでは、ファイルと会話したり、さらに多くのことができるようになりました
ファイルの要約、メモをポッドキャストに変換、写真の自然言語検索など、大きなアップデートが実現しました。
Microsoftは、OneDriveに久しぶりとなる大規模な機能アップデートをリリースしました。OfficeスイートアプリにCopilot AIツールをリリースし、AnthropicのClaudeチャットボットを基盤としたエージェントを統合したのに続き、Microsoftはクラウドストレージユーザーにも同様の特典を提供しています。まずは、Googleサービス全体にGeminiと同様の方法で統合されているCopilot AIから見ていきましょう。
ファイル用のAI、ただし意味のある種類のもの
続きを読む