OpenAI lleva Sora a ChatGPT y dispara la batalla del vídeo
La integración del modelo de vídeo en el chatbot eleva el atractivo del servicio, pero amenaza con disparar aún más unos costes operativos ya tensionados.
La decisión de OpenAI de integrar “pronto” su herramienta de vídeo Sora directamente en ChatGPT, adelantada por The Information, supone un giro estratégico de calado para la compañía de Sam Altman. Hasta ahora, el modelo de vídeo vivía en un circuito separado, accesible vía web y a través de la app social de Sora 2 para iOS. Llevar esa capacidad al corazón del chatbot abre la puerta a que centenares de millones de usuarios textuales se conviertan, de golpe, en creadores de vídeo, pero también a que la factura de GPU se dispare. Distintas estimaciones sitúan la base de ChatGPT entre 800 y 900 millones de usuarios semanales en 2026, con unos 10 millones de suscriptores de pago. El movimiento promete más uso, más datos y más dependencia del ecosistema de OpenAI. La incógnita es si el modelo de negocio aguantará la presión de un formato, el vídeo generativo, que sigue siendo extraordinariamente caro de producir.
Un giro estratégico: del laboratorio al producto masivo
Sora nació como experimento de texto a vídeo en 2024 y se fue desplegando de forma gradual a usuarios de ChatGPT Plus y Pro en Estados Unidos y Canadá. La segunda generación, Sora 2, se lanzó en septiembre de 2025 junto a una app social para iOS y, poco después, para Android, con un posicionamiento mucho más cercano a TikTok que a una herramienta profesional clásica.
Hasta ahora, la estrategia de OpenAI había sido mantener Sora en un carril casi independiente: invitaciones limitadas, app propia, feed social, creadores “early adopters” y una narrativa de laboratorio creativo. La información de que el modelo se integrará directamente en la app de ChatGPT señala otra prioridad: convertir el vídeo en una función más del asistente, al mismo nivel que el texto, el código o las imágenes.
El diagnóstico es inequívoco: OpenAI quiere que cualquier conversación pueda culminar en un clip de vídeo generado en segundos. “Del prompt al plano” se convierte en el nuevo eslogan implícito. La consecuencia es clara: el experimento se transforma en producto masivo, con todas las implicaciones de coste, regulación y reputación que eso conlleva.
ChatGPT como escaparate: 800 millones de usuarios de vídeo
La decisión se entiende mejor si se mira el tamaño del escaparate. ChatGPT supera ya los 800 millones de usuarios activos semanales, procesando más de 1.000 millones de consultas al día, según datos de distintas firmas de analítica. Otras estimaciones, como las citadas por The Wall Street Journal, elevan la cifra hasta los 900 millones de usuarios semanales, consolidando al chatbot como la puerta de entrada de referencia a la IA generativa.
Hasta ahora, Sora exigía salir de ese flujo: abrir una web específica o descargar la app, registrarse, aprender una interfaz nueva. La fricción se traducía en que solo una fracción mínima de la base de ChatGPT probaba el vídeo. Integrar el modelo dentro del propio chat reduce ese coste casi a cero: el usuario puede escribir “convierte este guion en un anuncio de 30 segundos en formato vertical” y obtener el clip sin abandonar la conversación.
Si solo un 5% de los usuarios semanales de ChatGPT generaran un vídeo corto al día, estaríamos hablando de entre 40 y 45 millones de clips diarios. Esa cifra situaría a Sora, de facto, en la liga de las grandes plataformas de vídeo social en volumen bruto de producción, aunque no todo acabe publicándose. El contraste con rivales como Runway, Pika o los modelos de Google se vuelve, de repente, demoledor: ninguno de ellos está integrado en un asistente conversacional de semejante escala.
La factura oculta: GPUs, energía y márgenes bajo presión
Lo más grave, visto desde la cuenta de resultados, es que el vídeo no es un formato neutro. A diferencia del texto o incluso de la imagen, generar 60 segundos de vídeo HD requiere órdenes de magnitud más cómputo. Un análisis externo de Leonis Capital estimaba que, extrapolando precios de DALL·E 3, un minuto de vídeo podría costar teóricamente hasta 170 dólares en cómputo bruto; incluso bajo supuestos conservadores, la cifra bajaría solo a unos 17 dólares por clip.
OpenAI, obviamente, no paga esas cantidades gracias a acuerdos de infraestructura con Microsoft y optimizaciones internas. Pero este dato revela la magnitud del desafío: si millones de usuarios empiezan a generar vídeo “porque viene incluido” en la suscripción de 20 dólares de ChatGPT Plus, la presión sobre los márgenes será intensa. De hecho, Sora 2 ya ha introducido sistemas de créditos y generación de pago para usos intensivos, alejándose del acceso completamente gratuito de sus primeros meses.
En paralelo, el consumo energético y la huella de carbono de estos modelos se convierte en un tema político y reputacional. Cada minuto de vídeo generado se traduce en GPUs funcionando a pleno rendimiento en centros de datos que ya operan al límite en algunas regiones. El riesgo para OpenAI es quedar atrapada en un modelo en el que cuanto más éxito tiene el producto, más dinero pierde por usuario si no ajusta a tiempo precios y límites.
Sora 2: capacidades, app social y lo que llega al chat
Desde el punto de vista técnico, Sora 2 ha dado un salto relevante frente a la primera versión: vídeo más realista, mejor física, mayor control de cámara, y, sobre todo, audio y diálogos sincronizados. La app para iOS, “Sora by OpenAI”, convierte esos avances en un producto de consumo con un feed personalizable, funciones de remezcla y cameos que permiten al usuario aparecer en las escenas tras una breve grabación para verificar su identidad.
Con más de 230.000 valoraciones y una nota cercana a 4,8 sobre 5 en la App Store, la aplicación ya actúa como campo de pruebas de lo que puede llegar a ChatGPT: estilos cinematográficos, anime, vídeos verticales listos para redes sociales, plantillas de anuncios o vídeos educativos cortos.
Sin embargo, las primeras filtraciones apuntan a que la integración en el chatbot será parcial: algunas capacidades avanzadas de edición seguirán reservadas al panel específico de Sora y a la app social, mientras que el chat ofrecerá funciones más guiadas y predefinidas. En otras palabras: ChatGPT será la puerta de entrada, pero no necesariamente el estudio de montaje completo. Esto permitiría a OpenAI contener costes y, al mismo tiempo, empujar hacia arriba a los usuarios más intensivos hacia productos de mayor valor añadido.
Una carrera global por el vídeo generativo
El movimiento de OpenAI se produce en plena carrera por el dominio del vídeo generativo. Meta, Runway, Pika o Google con Veo compiten por atraer a creadores y marcas a sus propios ecosistemas. Hasta ahora, la batalla se libraba principalmente en la calidad del modelo y en la interfaz, pero la integración de Sora en ChatGPT introduce una variable distinta: la distribución.
Mientras que un aspirante como Runway debe convencer a cada usuario para que abra una nueva cuenta y aprenda una nueva herramienta, OpenAI puede ofrecer vídeo como una pestaña más en un producto que ya domina casi el 60% del tráfico web de las principales herramientas de IA generativa. El contraste es contundente, sobre todo para pequeñas startups que dependen de convertir cada visita en un cliente de pago.
El riesgo, no obstante, es que esta posición genere nuevas suspicacias regulatorias. Si el regulador entiende que OpenAI aprovecha el poder de mercado de ChatGPT para empujar su modelo de vídeo frente a alternativas, podrían llegar investigaciones por abuso de posición dominante similares a las que han afectado a los gigantes de las plataformas móviles o los buscadores en la última década. Para Europa, donde ya se vigilan de cerca los “gatekeepers” digitales, Sora podría convertirse en un nuevo caso de estudio.
Monetización, publicidad y el riesgo de saturar al usuario
La integración de Sora se cruza, además, con otro experimento delicado: la introducción de publicidad en ChatGPT. OpenAI ha comenzado a probar formatos de anuncios en el chatbot precisamente para aliviar la presión financiera de un crecimiento que exige inversiones masivas en chips y centros de datos.
La combinación de vídeo generativo y publicidad abre un abanico de modelos: desde clips patrocinados generados por la propia IA hasta plantillas de anuncios personalizadas para pymes que hoy no pueden pagar una agencia creativa. Un escenario plausible es que OpenAI reserve las capacidades más potentes de Sora dentro de ChatGPT para planes “Pro” o corporativos, mientras mantiene un nivel básico gratuito o subvencionado. Esto cuadraría con la existencia de un nivel “Sora 2 Pro” ya asociado a suscriptores de ChatGPT.
Sin embargo, el peligro de saturar al usuario es evidente. Un chat que responde con texto, ofrece un banner y, además, propone generar un vídeo “listo para redes” puede convertirse en una experiencia pesada si no se calibra bien. “Hacer más cosas” no siempre significa crear más valor; el equilibrio entre utilidad y ruido será una de las claves de este nuevo movimiento.

