世界を変えるテクノロジーという点では、ChatGPT は登場してからの短い期間で、文章の書き方やコーディングに対する人々の考え方に大きな影響を与えました。
しかし、この機能には大きな欠点があり、特に教育現場では、学生が自分の論文や試験にChatGPTを使いたくなる誘惑に駆られます。こうした剽窃行為は、学生が本来得られるはずの学習を妨げ、教師にとって新たな悩みの種となっています。それは、AIの使用をどのように検知するかという問題です。
教師やその他のユーザーは現在、生徒の課題におけるChatGPTの使用を検出する方法を模索しており、プリンストン大学の学生エドワード・ティアン氏が開発したChatGPT検出ツール「GPTZero」のようなツールに注目しています。このソフトウェアは誰でも利用できるので、試してみて、特定のテキストがChatGPTを使用して書かれた可能性を確認したい場合は、以下の手順をご覧ください。
GPTZeroとは何ですか?

GPTZeroは、テキストが人間によって書かれたものか、それとも人工知能によって書かれたものかを検出するために設計されたウェブアプリおよびサービスです。現在、このシステムはChatGPT、GPT-4、Claudeといった様々な大規模言語モデルの出力を検知できるだけでなく、人間とAIが共同で作成したものかどうかも判定可能です。
このプラットフォームは、プリンストン大学でコンピュータサイエンスを学ぶ22歳の学部生で、かつてマイクロソフトでソフトウェアエンジニアリングのインターンを務めたエドワード・ティアン氏によって開発され、2023年1月に初めてリリースされました。ティアン氏はX(旧Twitter)でこのプラットフォームを発表した際、この分析はプリンストン大学の博士課程学生であるスリージャン・クマール氏の研究と、同大学の自然言語処理グループの研究に基づいていると述べました。
この分析は、@sreejan_kumar と @princeton_nlp との進行中の研究に基づいています。近いうちに実証的な何かを公開できればと思っています。でも、その間もこのアプリを作るのは楽しかったです :)
— エドワード・ティアン(@edward_the6)2023年1月3日
GPTZero は無料ですか?
GPTZeroは教育者向けに設計されていますが、誰でも無料で利用できます。無料アカウントでは、1時間あたり40件のドキュメントをスキャンし、GPTZeroダッシュボードにアクセスできます。月額10ドルのEssentialプランでは、月間最大15万語をスキャンでき、「プレミアム」AI検出モデルに加え、「盗作スキャン」と「高度な文法とライティング」のフィードバックも利用できます。月額16ドルのPremiumパッケージでは、月間単語数が30万語に増加し、「高度なAIディープスキャン」と多言語AI検出に加え、Proレベルの機能も提供されます。最上位の月額16ドルのProfessionalサブスクリプションでは、月間50万語に加え、さらに1,000万語の「超過分」が提供されます。これは、相当な盗作検知能力と言えるでしょう。
GPTZero は正確ですか?
GPTZeroは自社のサービスを非常に高性能だと謳っていますが、一部のユーザーはサービスの精度が「一貫性に欠け、人間が書いたテキストをAI生成と誤認したり、特定の種類の生成テキストの扱いに苦労したりする」と感じています。RedditユーザーのSmellz_Of_Elderberryからの提案を受け、私はChatGPTに『老人と海』という本について、高校生が書いたような短い物語を書いてもらうよう依頼しました。GPTZeroは騙されませんでした。

句読点の位置を間違えたり、動詞の時制を間違えたり、その他の小さなエラーをテキストに入力して再度試してみましたが、GPTZero は依然として「テキストは完全に AI によって書かれた可能性があります」と表示しました。
スキャンは、ClaudeやGPT-4以外のテキストジェネレータを使用した場合でも、文章のAIの起源を正しく推測しました。Gemini 1.5 Proで「老人と海」に関する別のレポートを作成させましたが、GPTZeroでも同様に検出されました。
GPTZero の精度はまだ評価中ですが、これらの事例テストに基づくと、うまく機能しているようです。
GPTZeroを使用する場合は、エラーが発生する可能性があることを念頭に置くことが重要です。GPTZeroでAIを検出したり、ChatGPTでドキュメントの作成を支援したりする場合でも、作業内容に間違いがないか確認する必要があります。
GPTZero はどのように機能しますか?

GPTZeroは、テキストのランダム性(パープレキシティ)と、このランダム性のテキスト内での均一性(統計学ではバースト性)を分析します。AIはパープレキシティとバースト性において非常に一貫性がありますが、人間の書き手はこれらの特性を意識することなく変化させます。
作業はまだ終わっておらず、ティアン氏はAIによるテキスト検出の精度を向上させるために、さらなるテストが追加される予定だと指摘しています。特に、暗黙のバイアスは、テキストがAIによって生成されたかどうかを検出する別の方法として研究されている分野です。
私たちは現在もLM生成テキストの暗黙のバイアスについて研究中なので、モデルを改善するためにいくつかのテストと要素を追加したいと考えています。
— エドワード・ティアン(@edward_the6)2023年1月3日
GPTZero はどのように使用すればいいですか?
GPTZeroはウェブサイトから入手できます。確認したいテキストをコピーして、「試してみる」という大きなボックスに貼り付けるだけです。

PDF、Word文書、またはテキストファイルをアップロードして「結果を取得」ボタンをクリックすることもできます。また、利用規約に同意することを示すボックスにチェックを入れる必要があります。
GPTZeroの代替品
GPTZeroは、現在市場に出回っている唯一のAI搭載剽窃検出ツールではありません。OpenAIはGPT-2 Output Detectorを提供しており、アップデート版を開発したと報じられていますが、リリース時期やリリースされるかどうかについては未定です。Content at Scale AI Content Detection、ZeroGPT(商標登録局をどのようにして通過したのかは不明)、Writefull GPT Detector、Originality.aiも、精度はそれぞれ異なりますが、同様のサービスを提供しています。
私の文章が AI としてフラグ付けされるのはなぜですか?
ChatGPTとAI検出ツールの台頭に伴い、書き手と読み手の両方が、コンテンツがAIによって作成されたものかどうか、そして本物の文章がAIによって作成されたものとして分類されているかどうかをどのように見分けるかという新たな懸念を抱いています。これは特に学生にとって大きな問題であり、AIを使用していることが発覚した場合、学校や大学から処分を受ける可能性があります。中には、GPTZeroなどの検出ツールを使って自分の作品を習慣的にチェックし、実際にはAIによって作成されていない文章でもAIによって作成されたものとしてフラグ付けされていることに気づいている学生もいます。
2024年、 The Atlanticのライター、イアン・ボゴスト氏は、自身のオリジナル作品を剽窃検出ソフトウェアにかけたところ、当初はなんと74%もの作品が剽窃と判定されたことを明かしました。綿密なチェックと排除作業を経て、彼はその数をゼロにまで減らすことができましたが、そこに至るまでには数時間にわたるレビューと設定の調整が必要でした。
AI検出は盗作検出と似ており、どちらも文章がオリジナルで人間が作成したものかどうかについて、最善の推測しか反映できません。また、これらのツールは誤検出する傾向があるため、慎重なレビューが必要です。GPTZeroでAI生成ではないのにAI生成とフラグ付けされている場合、その原因は多岐にわたります。英語を母国語としていない、アイデアが繰り返し過ぎている、Grammarlyのようなツールを使用しているなどです。
自分の作品が AI としてフラグ付けされている場合は、すべての引用と引用が適切にフォーマットされていることを再度確認し、編集に Grammarly などの自動ツールを使用しないようにしてください。
そして覚えておいてください。これはGPTZeroのブラックボックスであり、「企業秘密」の独自アルゴリズムであり、あなたの文章がインターネット上で見つかる他の例と統計的に類似していると主張しています。同社は、自社の製品が実際にどのように機能するかを説明したり、法廷で正確に動作することを実証したりするつもりはありません。したがって、もし生成的盗作の疑いで訴えられた場合、あなたの言葉と彼らの言葉が対立することになります。弁護士を雇って、彼らに彼らの仕事ぶりを証明させましょう。
盗作チェックは本当に必要ですか?
OpenAIは、多くのテキスト生成AIが縛られてきた研究室の枠をはるかに超えて、2022年11月下旬にChatGPTを一般公開しました。2023年1月までにChatGPTのユーザー数は1億人を超え、これまでで最も急速に成長している一般公開アプリケーションとなりました。
つまり、AIによる支援が生活のあらゆる場面で利用できるようになるにつれて、盗作への懸念はますます高まるばかりです。マイクロソフトはOpenAIの技術をBing検索に組み込んでおり、GoogleはGemini(旧称Bard)と呼ばれる独自のバージョンをテストしています。

ある意味、AIは人間の知性を借りているのであり、独自に創造しているわけではありません。もし他の人間から情報を借りるなら、クレジットを付与し、場合によってはライセンス料を支払わなければなりません。生成型AIでは、個々のテキストや画像が分散した要素に分解され、数千、数百万もの情報源から再構成されて新しい作品が作られるため、出典の引用はより困難になります。