ChatGPhish: Una vulnerabilidad en el Markdown de ChatGPT permite el phishing por inyección de prompts

Una vulnerabilidad de phishing en ChatGPT recién revelada, llamada ChatGPhish, está generando serias preocupaciones sobre cómo la navegación web asistida por IA puede volverse contra los mismos usuarios a los que busca ayudar. Investigadores de Permiso Security han dado a conocer que la confianza integrada de ChatGPT en los enlaces e imágenes formateados con Markdown crea una puerta para que atacantes inyecten instrucciones maliciosas directamente en los resúmenes web de la IA, convirtiendo así una funcionalidad rutinaria de productividad en un mecanismo de distribución de phishing.

Cómo ChatGPhish explota la confianza de ChatGPT en el Markdown

Cuando ChatGPT navega por la web y resume contenido para un usuario, procesa y renderiza el formato Markdown, incluyendo hipervínculos e imágenes incrustadas. La vulnerabilidad ChatGPhish explota este comportamiento al incrustar instrucciones especialmente diseñadas dentro del contenido de una página web. Debido a que ChatGPT trata ese contenido como información confiable, las instrucciones inyectadas pueden redirigir la salida de la IA, coaccionarla para que muestre enlaces engañosos o instruirle para que solicite credenciales al usuario con falsos pretextos.

Se trata de un ataque de inyección indirecta de prompts. A diferencia de la inyección directa, donde un usuario manipula intencionadamente a una IA con entradas preparadas, la inyección indirecta oculta comandos maliciosos dentro de contenido externo que la IA obtiene y procesa de forma autónoma. El usuario nunca ve las instrucciones ocultas; solo ve la salida que el atacante ha diseñado para que la IA produzca. En el caso de ChatGPhish, esa salida puede incluir solicitudes de phishing convincentes que aparentan provenir de la propia IA, lo que les otorga una falsa apariencia de legitimidad.

Lo que hace esto particularmente notable es que la superficie de ataque no es el modelo subyacente de la IA, sino la confianza que deposita en el contenido web que resume. Un atacante no necesita comprometer los sistemas de OpenAI; solo necesita controlar o manipular una página web que un usuario pueda pedir a ChatGPT que resuma.

Quiénes corren mayor riesgo y qué datos podrían quedar expuestos

Cualquier persona que utilice las funciones de navegación o resumen web de ChatGPT está potencialmente expuesta, pero ciertos grupos enfrentan un riesgo mayor. Los usuarios que dependen de ChatGPT para resumir rápidamente artículos, documentos o páginas de terceros son los más propensos a encontrarse con contenido inyectado sin darse cuenta. Los usuarios empresariales que han integrado ChatGPT en flujos de trabajo que involucran fuentes de datos externas se enfrentan a un riesgo aún mayor.

Los datos en peligro son principalmente información a nivel de credenciales. Un ataque exitoso de ChatGPhish podría engañar a un usuario para que envíe una contraseña, un token de autenticación o detalles de cuenta a través de una página de phishing que la IA ha presentado como legítima. Dado que miles de millones de credenciales ya circulan en repositorios de filtraciones, incluidos los 19 mil millones de contraseñas expuestas en la filtración RockYou2024, cualquier vector de phishing adicional que eluda el escepticismo habitual del usuario supone una seria preocupación.

Las cuentas vinculadas a servicios de pago, sistemas empresariales o datos personales sensibles son los objetivos más atractivos. La solicitud de phishing, que aparece como parte natural de una respuesta de ChatGPT, es probable que pase por alto los filtros mentales que los usuarios aplican al detectar correos de phishing convencionales.

Por qué los usuarios de redes públicas y VPN enfrentan una exposición acentuada

Los usuarios en redes wifi públicas enfrentan un riesgo agravado por ChatGPhish. En redes no cifradas o mal protegidas, la interceptación de tráfico es una amenaza realista. Aunque el ataque ChatGPhish en sí no requiere acceso a nivel de red, la combinación de un entorno de red comprometido y un resumen manipulado por la IA crea una situación especialmente peligrosa. Las credenciales de phishing capturadas en una cafetería o un aeropuerto pueden usarse de inmediato, antes de que el usuario tenga oportunidad de detectar el compromiso.

El uso de una VPN aborda una capa de este problema al cifrar el tráfico entre el dispositivo del usuario e internet, reduciendo el riesgo de interceptación a nivel de red. Sin embargo, no impide que ChatGPT procese contenido web malicioso y muestre prompts inyectados. El ataque ChatGPhish opera en la capa de aplicación, lo que significa que las protecciones a nivel de red no son suficientes por sí solas. Los usuarios deben permanecer alerta ante solicitudes inesperadas de credenciales que aparezcan dentro de los resúmenes generados por IA, independientemente de cómo esté protegido su tráfico de red.

Medidas prácticas para evitar ser víctima de ChatGPhish

Hasta que OpenAI publique un parche definitivo o un cambio arquitectónico que impida la inyección de prompts basada en Markdown, los usuarios pueden tomar varias medidas prácticas para reducir su exposición.

Primero, trate con sospecha inmediata cualquier solicitud de credenciales o inicio de sesión que aparezca a través de un resumen de ChatGPT. ChatGPT no tiene ningún motivo legítimo para pedir contraseñas o tokens de autenticación como parte de un resumen web. Si ve una solicitud de este tipo, cierre la sesión y navegue directamente al sitio correspondiente desde su navegador.

Segundo, sea selectivo con las páginas que pide resumir a ChatGPT, especialmente las que provengan de fuentes que no reconozca o en las que no confíe. Las páginas controladas por atacantes son el principal mecanismo de distribución de las cargas útiles de ChatGPhish.

Tercero, revise ahora su higiene general de cuentas y credenciales, no después de un incidente. Usar contraseñas seguras y únicas en cada cuenta significa que, incluso si un ataque de phishing captura una credencial, el daño queda contenido. Dada la facilidad con que las credenciales se reutilizan en ataques tras filtraciones a gran escala, esta es una medida básica e innegociable.

Por último, monitoree los avisos de seguridad de OpenAI en busca de parches o mitigaciones relacionadas con ChatGPhish. Aplicar las actualizaciones con prontitud es una de las defensas más simples contra las vulnerabilidades reveladas.

Qué significa esto para usted

ChatGPhish es un recordatorio de que las herramientas de IA heredan los riesgos del contenido que procesan. Confiar en un resumen de la IA no equivale a confiar en la fuente subyacente, y los atacantes ya están explotando esa brecha. El ataque no requiere habilidades técnicas sofisticadas por parte del atacante, lo que significa que es probable que se extienda más allá de los investigadores de seguridad hacia un uso criminal activo.

La medida más práctica que puede tomar ahora mismo es auditar la seguridad de sus credenciales. Si la misma contraseña protege varias cuentas, un solo intento exitoso de ChatGPhish podría desencadenar un compromiso mucho más amplio. Revisar la cobertura de la filtración RockYou2024 es un punto de partida útil para comprender la escala del entorno de amenazas a las credenciales que hace que ataques como ChatGPhish sean tan graves. Contraseñas únicas y seguras, junto con la autenticación multifactor en todas las cuentas críticas, siguen siendo su primera línea de defensa más confiable cuando las herramientas de IA pueden convertirse en superficies de phishing.