Las nuevas etiquetas de “riesgo elevado” buscan frenar ataques de inyección de instrucciones en un momento de adopción masiva de la IA generativa

OpenAI blinda ChatGPT con Lockdown Mode para usuarios de alto riesgo

La compañía que popularizó la inteligencia artificial generativa ha decidido pisar el freno en un frente muy concreto: la seguridad. OpenAI ha anunciado dos nuevas capas de protección para ChatGPT —Lockdown Mode y las etiquetas de “Elevated Risk”— con un objetivo explícito: reducir el impacto de los ataques de prompt injection que ya empiezan a explotar empresas y ciberdelincuentes. Lejos de ser un detalle técnico, el movimiento apunta al corazón del uso corporativo de la IA: ejecutivos, equipos de seguridad y departamentos que trabajan con información sensible. Lockdown Mode será un modo endurecido, opcional, pensado para ese grupo reducido, mientras que las etiquetas de riesgo elevado se extenderán por todas las interfaces de ChatGPT, Atlas y Codex para avisar de qué funciones implican más exposición. La decisión llega en un contexto en el que más de 200 millones de personas usan ChatGPT cada semana en todo el mundo, y en el que la compañía afirma trabajar ya con más de un millón de empresas.

Fabiana Ruiz

Actualizado: 14/02/26 | 8:47 | Tiempo de lectura: 9 min.

Un giro en la batalla contra las ‘prompt injections’

Hasta hace poco, el término prompt injection sonaba a jerga de laboratorio. Hoy es la amenaza que más preocupa a los equipos de ciberseguridad que experimentan con agentes de IA conectados a la web, al correo o a los sistemas internos de la compañía. En esencia, estos ataques consisten en introducir instrucciones maliciosas —por ejemplo, escondidas en una web, en un documento o incluso en un correo— que el modelo interpreta como órdenes legítimas, con el riesgo de revelar información sensible o realizar acciones no deseadas.

Las nuevas medidas de OpenAI se sitúan exactamente en este punto. La compañía reconoce que, a medida que ChatGPT y sus agentes se integran con aplicaciones de terceros y con la red, “las apuestas de seguridad cambian”. La consecuencia es inequívoca: ya no basta con filtrar contenido ofensivo o limitar respuestas peligrosas; hay que evitar que el propio modelo se convierta en vector de fuga de datos.

Lo más relevante es que estas protecciones no se lanzan en un entorno experimental, sino sobre una base instalada gigantesca. Plataformas empresariales, centros sanitarios, universidades y administraciones públicas han empezado a usar agentes de IA para tareas como resumir expedientes, revisar contratos o cruzar bases de datos. Cada uno de esos casos, si no se controla, es un posible canal para una prompt injection bien diseñada.

Qué es Lockdown Mode y a quién va dirigido

Lockdown Mode se presenta como un modo de seguridad reforzada, pensado para un grupo reducido de usuarios “de alto riesgo”: ejecutivos de grandes grupos, equipos de ciberseguridad, personal sanitario o responsables de políticas públicas que manejan información extremadamente sensible. No será el modo por defecto. De hecho, OpenAI insiste en que no es necesario para la mayoría de usuarios, lo que revela hasta qué punto el equilibrio entre seguridad y usabilidad sigue siendo delicado.

En la práctica, este modo restringe de forma determinista cómo puede interactuar ChatGPT con sistemas externos. El modelo sigue conversando, pero se le cierran puertas: menos conexiones en vivo con la web, menos capacidades para interactuar con aplicaciones y herramientas, y bloqueo total de aquellas funciones para las que no se puede garantizar un nivel de seguridad suficiente. Es, en términos corporativos, un “cinturón y tirantes” para quienes no se pueden permitir un desliz.

El diagnóstico que subyace es claro: hay perfiles para los que un fallo aislado de la IA podría traducirse en pérdidas millonarias, filtraciones regulatorias o incluso riesgos para la seguridad nacional. Para ellos, sacrificar parte de la comodidad o de la “magia” del asistente merece la pena si a cambio se minimiza la superficie de ataque.

Cómo cambia el uso de herramientas, apps y navegación

El elemento más delicado del nuevo modo es la relación con la web y con las apps conectadas. En Lockdown Mode, la navegación se limita a contenido en caché, de forma que no se realizan peticiones de red en tiempo real hacia dominios externos.
Este detalle técnico tiene una consecuencia muy concreta: se reduce drásticamente la posibilidad de que el modelo envíe datos sensibles a un servidor controlado por un atacante bajo la apariencia de una simple consulta.

Además, ciertas herramientas y capacidades se deshabilitan por completo cuando OpenAI considera que no puede ofrecer garantías deterministas de seguridad. Esto afecta especialmente a funciones que implican ejecutar código, manipular archivos o activar acciones automáticas en otras aplicaciones. El contraste con el modo estándar resulta llamativo: mientras la industria empuja hacia agentes cada vez más autónomos, aquí se impone un enfoque de “mínimo privilegio” para los usuarios más expuestos.

Sin embargo, la compañía no opta por un apagón total. Los administradores de espacios de trabajo pueden definir qué aplicaciones y qué acciones concretas seguirán disponibles incluso en Lockdown Mode. Esta granularidad es clave para no destruir flujos de trabajo críticos en sectores como finanzas, salud o energía, donde los agentes ya están integrados con sistemas internos de gran valor económico.

Las etiquetas de “riesgo elevado” que llegan al ecosistema

La segunda pata del anuncio son las etiquetas de “Elevated Risk”. A diferencia de Lockdown Mode, que se activa solo para ciertos roles, estas advertencias llegarán a todas las interfaces donde aparezcan funciones que implican riesgos adicionales: conexiones a internet, acceso a sistemas externos, ejecución de código o manipulación avanzada de datos.

La idea es introducir un lenguaje visual común en ChatGPT, Atlas y Codex: cuando una capacidad pueda aumentar la superficie de ataque, el usuario verá claramente que entra en una zona de mayor exposición. En el caso de Codex, por ejemplo, el panel donde se concede acceso a la red ya incluye una etiqueta de riesgo elevado y una explicación explícita de qué cambia y en qué situaciones se recomienda activarla.

Este enfoque se aproxima a lo que en otros sectores se conoce como “consentimiento informado”. No basta con esconder la advertencia en unos términos de uso interminables; el aviso tiene que aparecer justo en el momento en que el usuario decide abrir la puerta al sistema. Lo más grave, para cualquier compañía que integre estos agentes, sería que un empleado habilite una función peligrosa sin entender sus implicaciones.

Impacto en empresas: de los comités de ciberseguridad al consejo

Para las grandes organizaciones, el movimiento de OpenAI tiene lectura inmediata. Muchas compañías ya han creado comités internos de IA y han incorporado la gestión del riesgo algorítmico a sus matrices de cumplimiento. Lockdown Mode y las etiquetas de riesgo elevado les dan, por primera vez, un conjunto de controles nativos que pueden integrar en sus políticas corporativas.

En la práctica, los CIO, CISOs y directores de cumplimiento podrán definir qué colectivos tendrán acceso al modo endurecido, qué aplicaciones se permiten dentro de él y qué funciones marcadas como de riesgo elevado quedan restrictas solo a ciertos perfiles. Este tipo de decisiones, hasta ahora, se estaban tomando de forma artesanal, con reglas internas, proxys o bloqueos a nivel de red.

La consecuencia es clara: la conversación sobre la IA deja de ser puramente tecnológica y sube al consejo de administración. Si un despliegue masivo de agentes promete ahorros de costes de dos dígitos —en algunos casos, reducciones de tiempos de trabajo del 80% en tareas repetitivas—, también habrá que explicar qué escudos se han puesto para evitar una filtración que destruya ese valor en cuestión de horas.

El punto ciego: productividad frente a blindaje extremo

Todo refuerzo de seguridad tiene un coste oculto. En este caso, el riesgo evidente es que Lockdown Mode limite parte del potencial productivo de los agentes más avanzados. La capacidad de navegar por la web en tiempo real, consultar APIs o interactuar con sistemas corporativos es precisamente lo que convierte a estos modelos en algo más que un simple chatbot.

Si se restringe en exceso, algunas organizaciones podrían verse tentadas a desactivar el modo endurecido para mantener la velocidad y la flexibilidad de sus equipos. El desafío pasará por encontrar el equilibrio: usar Lockdown Mode solo en conversaciones donde realmente se maneje información crítica, mientras se mantiene el modo estándar para tareas de bajo riesgo.

Este hecho revela una tensión que marcará la próxima fase de la IA en la empresa: el mismo agente que ahorra horas de trabajo puede convertirse, sin controles, en un nuevo eslabón débil de la cadena de seguridad. La diferencia entre uno y otro escenario dependerá menos del modelo y más de la gobernanza interna, el diseño de roles y la formación de los empleados que lo utilizan.

Competencia y regulación: la UE y Estados Unidos toman nota

Aunque el anuncio se centra en un producto concreto, su alcance es regulatorio. La Unión Europea, que ultima el despliegue del Reglamento de IA y refuerza las exigencias sobre sistemas de alto riesgo, verá en Lockdown Mode y en las etiquetas de riesgo elevado un argumento a favor de las grandes plataformas: los proveedores empiezan a asumir que deben ofrecer controles robustos y transparencia sobre la exposición de cada función.

En Estados Unidos, los supervisores de sectores como banca o sanidad ya han avisado de que cualquier uso de IA generativa deberá cumplir los mismos estándares que los sistemas tradicionales. Un fallo de un agente que exponga historiales clínicos o datos financieros podría desencadenar sanciones y litigios millonarios. En este contexto, el movimiento de OpenAI actúa también como mensaje político: la compañía quiere situarse en el lado de quienes anticipan la regulación antes de que esta llegue.

El contraste con otras regiones resulta demoledor: mientras algunos proveedores menores todavía venden soluciones de IA conectadas a sistemas críticos sin mencionar apenas el riesgo de prompt injection, los líderes del mercado empiezan a etiquetar claramente estas capacidades como de “riesgo elevado”. En términos de competencia, quien no ofrezca controles similares quedará, inevitablemente, bajo sospecha.

Etiquetas: