- 家
- コンピューティング ニュース
研究者たちは、トレーニングプロセスの一環として別の AI チャットボットを使用することで、AI チャットボットに組み込まれたメカニズムを回避し、禁止されているトピックやデリケートなトピックに関する質問に応答できるようにすることが可能であることを発見しました。
シンガポールの南洋理工大学(NTU)のコンピュータ科学者チームは、この手法を非公式に「脱獄」と呼んでいますが、正式には「マスターキー」プロセスと呼ばれています。このシステムは、ChatGPT、Google Bard、Microsoft Bing Chatなどのチャットボットを2段階の学習方式で相互に学習させ、2つのチャットボットが互いのモデルを学習し、禁止されたトピックに対してコマンドを迂回させるというものです。

チームには、Liu Yang教授とNTU博士課程の学生であるDeng Gelei氏とLiu Yi氏が参加しており、彼らは共同で研究を執筆し、本質的には悪意のあるハッカーのように機能する概念実証の攻撃方法を開発した。
おすすめ動画
研究チームによると、まず大規模言語モデル(LLM)をリバースエンジニアリングし、その防御機構を明らかにした。これらの防御機構は元々モデル上のブロックであり、暴力的、不道徳的、または悪意のある意図により、特定のプロンプトや単語への回答を回答として許可しないものだった。
しかし、この情報をリバースエンジニアリングすることで、別のLLMにバイパスの作成方法を教えることができます。バイパスが作成されると、2つ目のモデルは、最初のモデルのリバースエンジニアリングされたLLMに基づいて、より自由に表現できるようになります。研究チームはこのプロセスを「マスターキー」と呼んでいます。これは、LLMチャットボットが追加のセキュリティで強化されたり、将来的にパッチが適用されたりしても機能するはずだからです。
マスターキー プロセスは、プロンプトよりもチャットボットのジェイルブレイクに 3 倍優れていると主張しています。
ルイ・ヤン教授は、このプロセスの核心は、LLM AIチャットボットがいかに容易に学習し、適応できるかを示すことだと指摘しました。研究チームは、このマスターキープロセスは、従来のプロンプトプロセスと比較して、LLMチャットボットのジェイルブレイク成功率が3倍高いと主張しています。同様に、一部の専門家は、GPT-4などの特定のLLMで最近報告された不具合は、一部の批評家が主張するように、より低能で怠惰なものではなく、LLMがより高度になっている兆候だと主張しています。
2022年後半にOpenAIのChatGPTが導入され、AIチャットボットの人気が高まって以来、様々なサービスが誰にとっても安全で快適に利用できるようにするための取り組みが活発化しています。OpenAIは、ChatGPT製品のサインアップ時や定期的なアップデート時に、意図しない言葉遣いの誤りを警告する安全警告を表示しています。一方、様々なチャットボットの派生サービスでは、ある程度の罵倒や不快な表現が許容されています。
さらに、ChatGPT、Google Bard、その他のチャットボットが広く普及する前から、実際の犯罪者はその需要につけ込み始めました。多くのキャンペーンでは、画像リンクにマルウェアを添付したソーシャルメディア上でこれらの製品を宣伝するなど、様々な攻撃が行われました。これは、AIがサイバー犯罪の新たなフロンティアであることを瞬く間に示しました。
NTUの研究チームは、研究に関与したAIチャットボットサービスプロバイダーに連絡を取り、チャットボットのジェイルブレイクが実際に可能であることを示す概念実証データを入手しました。研究チームは、2月にサンディエゴで開催されるネットワークおよび分散システムセキュリティシンポジウムで研究結果を発表する予定です。
フィオナ・アゴムオーはDigital Trendsのコンピューティングライターです。コンピューティング分野における幅広いトピックをカバーしており、その中には…
- コンピューティング
OpenAIはChatGPTを搭載したAIデバイスを多数計画しているようだ
ウェアラブル、ボイスレコーダー、スマートスピーカー。OpenAIはこれらすべてを網羅し、さらにそれ以上のものをカバーしようとしているようだ。
6月、OpenAIは著名なAppleデザイナー、ジョナサン・アイブ卿が創業したioを買収しました。買収発表以来、ChatGPT搭載機器に関する様々な憶測が飛び交っていましたが、今のところ、両社の提携から生まれたデバイスに関する公式発表はありません。しかし、信頼できるメディアが報じたところによると、このAI大手はAIハードウェアの幅広いラインナップを開発中です。
大きな計画は何ですか?
続きを読む
- コンピューティング
ChatGPTはIDを要求する可能性があるとOpenAIの責任者が語る
また、ペアレンタルコントロールや自動年齢予測システムも導入している。
OpenAIは最近、今月末までにChatGPTにペアレンタルコントロールを導入することについて話した。
ChatGPTを開発する同社はまた、ユーザーが18歳未満かどうかを判定する自動年齢予測システムを開発中であることも明らかにした。18歳未満であれば、人気のAI搭載チャットボットで年齢相応の体験を提供する予定だ。
続きを読む
- コンピューティング
OpenAIの人間とChatGPTの会話に関する最大の研究はあなたを驚かせるでしょう
多くの人が AI チャットボットに密かに心を打ち明けていると思いますか? いいえ、違います。
OpenAIは、ChatGPTの利用習慣に関するこれまでで最大規模の分析を発表しました。同社の経済研究チームとハーバード大学の経済学者デイビッド・デミング氏の協力を得て作成されたこの研究論文では、150万件のChatGPTの会話を分析し、AIチャットボットとのやり取りがどのように展開されるかについて、興味深い統計データを明らかにしました。
誰が、なぜ、いくら?
続きを読む