ChatGPhish: ChatGPTのMarkdown欠陥がプロンプトインジェクション型フィッシングを可能に

新たに公開された「ChatGPhish」と呼ばれるChatGPTのフィッシング脆弱性が、AI支援によるウェブブラウジングが、本来支援すべきユーザー自身に対して悪用される可能性に深刻な懸念を引き起こしている。Permiso Securityの研究者らは、ChatGPTがMarkdown形式のリンクや画像を信頼してしまう性質が、攻撃者にとって悪意のあるプロンプトをAIのウェブ要約に直接注入する隙間を生み出し、日常的な生産性機能をフィッシング配信メカニズムへと事実上武器化できることを明らかにした。

ChatGPhishがChatGPTのMarkdown信頼を悪用する仕組み

ChatGPTがウェブを閲覧し、ユーザーのためにコンテンツを要約する際、ハイパーリンクや埋め込み画像を含むMarkdown形式を処理してレンダリングする。ChatGPhishの脆弱性は、この挙動を悪用し、細工された指示をウェブページのコンテンツ内に埋め込む。ChatGPTがそのコンテンツを信頼できる入力として扱うため、注入された指示はAIの出力を誘導し、偽のリンクを表示させたり、ユーザーから虚偽の口実で資格情報を要求するように仕向けたりできる。

これは間接プロンプトインジェクション攻撃である。ユーザーが意図的に細工した入力でAIを操作する直接プロンプトインジェクションとは異なり、間接プロンプトインジェクションは、AIが自律的に取得・処理する外部コンテンツ内に悪意のあるコマンドを隠す。ユーザーは隠された指示を目にすることはなく、攻撃者がAIに出力させるよう仕向けた内容だけを見る。ChatGPhishの場合、その出力には、AI自身から発信されたように見える説得力のあるフィッシングプロンプトが含まれる可能性があり、それに偽りの正当性を与えてしまう。

これが特に注目に値するのは、攻撃対象領域がAIの基盤モデルではなく、AIが要約するウェブコンテンツに対して置く信頼そのものだからだ。攻撃者はOpenAIのシステムを侵害する必要はない。ユーザーがChatGPTに要約を依頼する可能性のあるウェブページを制御または操作するだけでよい。

最もリスクの高いユーザーと露出する可能性のあるデータ

ChatGPTのウェブブラウジングや要約機能を使用するすべてのユーザーが潜在的に脆弱だが、特定のグループはより高いリスクに直面する。記事や文書、サードパーティのページを素早く要約するためにChatGPTを利用するユーザーは、気づかぬうちに注入されたコンテンツに遭遇する可能性が最も高い。ChatGPTを外部データソースを含むワークフローに統合している企業ユーザーは、さらに複合的に露出する。

危険にさらされるデータは、主に資格情報レベルの情報だ。ChatGPhish攻撃が成功すれば、AIが正当なものとして提示したフィッシングページを通じて、パスワードや認証トークン、アカウント詳細をユーザーに入力させる可能性がある。RockYou2024リークで公開された190億件のパスワードを含め、数十億の資格情報がすでに流出リポジトリに出回っていることを考えれば、通常のユーザーの懐疑心をすり抜ける新たなフィッシング経路は深刻な懸念材料である。

決済サービス、エンタープライズシステム、機密性の高い個人データに紐づくアカウントが最も魅力的な標的となる。ChatGPTの応答の自然な一部として表示されるフィッシングプロンプトは、通常のフィッシングメールを見分ける際にユーザーが働かせる心的フィルターをすり抜けてしまう可能性が高い。

公共ネットワークとVPNユーザーが直面する高まるリスク

公共Wi-Fiネットワークの利用者は、ChatGPhishによる複合的なリスクに直面する。暗号化されていない、あるいはセキュリティの甘いネットワークでは、トラフィックの傍受は現実的な脅威だ。ChatGPhish攻撃自体はネットワークレベルでのアクセスを必要としないが、侵害されたネットワーク環境と操作されたAI要約の組み合わせが、特に危険な状況を生み出す。カフェや空港で取得されたフィッシング資格情報は、ユーザーが侵害に気づくいとまもなく、即座に悪用される可能性がある。

VPNの使用は、ユーザーのデバイスとインターネット間のトラフィックを暗号化することで、この問題の一層に対処し、ネットワークレベルでの傍受リスクを低減する。しかし、ChatGPTが悪意のあるウェブページコンテンツを処理し、注入されたプロンプトを表面化させるのを防ぐことはできない。ChatGPhish攻撃はアプリケーション層で発生するため、ネットワークレベルの保護だけでは不十分である。ネットワークトラフィックがどのように保護されているかに関わらず、AI生成の要約内に表示される予期しない資格情報要求に対して、ユーザーは警戒を怠らない必要がある。

ChatGPhishの標的になるのを避けるための実践的対策

OpenAIがMarkdownベースのプロンプトインジェクションを防ぐ決定的なパッチやアーキテクチャ変更を提供するまでは、ユーザーは露出を減らすためにいくつかの実践的な手段を講じることができる。

第一に、ChatGPTの要約を通じて表示された資格情報やログイン要求は、直ちに疑ってかかること。ChatGPTがウェブ要約の一環としてパスワードや認証トークンを要求する正当な理由は一切ない。そのような要求を目にした場合は、セッションを閉じ、ブラウザを通じて直接該当サイトに移動すること。

第二に、ChatGPTに要約を依頼するページ、特に認知していない、あるいは信頼できないソースからのページは慎重に選ぶこと。攻撃者に制御されたページこそが、ChatGPhishペイロードの主要な配信メカニズムだからである。

第三に、インシデントが発生した後ではなく、今のうちにアカウントと資格情報の衛生状態を包括的に見直すこと。すべてのアカウントで強力かつ一意のパスワードを使用すれば、仮にフィッシング攻撃で一つの資格情報が取得されたとしても、被害は封じ込められる。大規模な流出後に資格情報が攻撃で再利用される実態を考えれば、これは絶対に外せない最低ラインである。

最後に、ChatGPhishに関連するパッチや緩和策について、OpenAIのセキュリティアドバイザリを監視すること。更新を速やかに適用することは、開示された脆弱性に対する最もシンプルな防御策の一つである。

ユーザーにとっての意味

ChatGPhishは、AIツールが処理するコンテンツのリスクを受け継ぐことを改めて示すものだ。AIの要約を信頼することは、その基盤となるソースを信頼することと同じではない。攻撃者はすでに、そのギャップを悪用している。この攻撃は、攻撃者側に高度な技術スキルを必要としないため、セキュリティ研究者の域を超えて、現実の犯罪利用に広がる可能性が高い。

あなたが今すぐ取れる最も実践的な対策は、自分の資格情報のセキュリティを監査することだ。もし同じパスワードが複数のアカウントを保護しているなら、ChatGPhishによる一度のフィッシング成功が、はるかに大規模な侵害へと連鎖する恐れがある。RockYou2024の侵害に関する報道を確認することは、ChatGPhishのような攻撃をこれほど重大にしている資格情報の脅威環境の規模を理解する上で、有益な出発点となる。AIツールがフィッシングの舞台に変わり得る今、重要な全アカウントにおける強力かつ一意のパスワードと多要素認証が、最も信頼できる防御の第一線であり続ける。