Gemini 3

Gemini 3: la nueva IA de Google que inaugura una era agéntica

gemini_3_webdev_arena_leaderboard

Juan Antonio Muñoz-Gallego

18 de noviembre de 2025 (19:08 h.)

Etiquetas

Google lanza Gemini 3, su modelo de IA más avanzado, con mejor razonamiento multimodal, nuevas capacidades de agente y despliegue inmediato en búsqueda, nube y herramientas para desarrolladores.

Google presenta Gemini 3, su modelo de inteligencia artificial más inteligente hasta la fecha, diseñado para dar vida a “cualquier idea” con un salto notable en razonamiento, comprensión del contexto y capacidades multimodales. La compañía, liderada por Sundar Pichai, extiende esta nueva generación a escala global desde el primer día: al Modo IA en la Búsqueda, a la app de Gemini, a AI Studio, Vertex AI y a la nueva plataforma de agentes Google Antigravity. Con funciones reforzadas para aprender, crear y planificar, y tras un proceso de evaluación de seguridad más estricto que nunca, Gemini 3 se convierte en el eje de la nueva etapa de IA de Google.

Tras casi dos años de la “era Gemini”, Google asegura que el impacto ya es masivo: la Vista Creada con IA alcanza a 2.000 millones de usuarios mensuales, la app de Gemini supera los 650 millones, más del 70% de los clientes de Google Cloud usan sus capacidades de IA y 13 millones de desarrolladores han creado soluciones con sus modelos generativos. Gemini 3 se presenta como la culminación de esa estrategia “full-stack”, desde la infraestructura hasta los productos de consumo.

De Gemini 1 y 2 a la tercera generación

Cada iteración de Gemini ha extendido el alcance de la IA de Google. Gemini 1 amplió el tipo y el volumen de información que los modelos podían procesar. Gemini 2 introdujo de forma más clara las capacidades agénticas, elevando el listón del razonamiento y permitiendo ayudar en tareas e ideas más complejas. Sobre esa base, Gemini 2.5 Pro llegó a encabezar durante más de seis meses la clasificación de LMArena, uno de los rankings de referencia en modelos lingüísticos.

Con Gemini 3, Google busca integrar y superar todo lo anterior en un solo sistema. Se trata de un modelo capaz de entender matices, captar “las pistas sutiles” de una idea creativa y desgranar problemas difíciles en capas, con mejor interpretación del contexto y de la intención del usuario. El objetivo: que las personas obtengan lo que necesitan con menos interacciones y más precisión.

Gemini 3 in Google Search (Blog Hero)

Gemini 3 Pro: salto en razonamiento y multimodalidad

La pieza central del anuncio es Gemini 3 Pro, presentado como el mejor modelo del mundo en comprensión multimodal y el modelo de programación más potente de Google hasta la fecha. Según los datos de la compañía, supera de forma notable a 2.5 Pro en las principales pruebas comparativas de IA, tanto en texto como en imagen y vídeo.

Gemini 3 Pro encabeza de nuevo la tabla de LMArena con 1.501 puntos, unos 50 ELO por encima del récord anterior, marcado precisamente por Gemini 2.5 Pro. En razonamiento avanzado, alcanza resultados de nivel doctorado con puntuaciones destacadas en pruebas como Humanity’s Last Exam (37,5% sin herramientas) y GPQA Diamond (91,9%). En matemáticas, establece un nuevo estado del arte con un 23,4% en MathArena Apex, lo que, según Google, demuestra una mayor capacidad para resolver problemas complejos con fiabilidad.

Multimodalidad y ventana de contexto ampliada

Donde Gemini 3 pretende diferenciarse claramente es en su razonamiento multimodal. Además del texto, Gemini 3 Pro mejora la comprensión y el análisis de imágenes y vídeo, con puntuaciones del 81% en MMMU-Pro y del 87,2% en Video-MMMU. En la prueba SimpleQA Verified alcanza un 72,1%, un avance relevante en precisión factual.

El modelo se apoya en una ventana de contexto de 1 millón de tokens, lo que le permite trabajar con grandes volúmenes de información: artículos académicos extensos, clases en vídeo, tutoriales completos o repositorios de código. Según Google, esto habilita casos de uso como traducir y unificar recetas familiares escritas a mano para crear un libro de cocina, o transformar artículos científicos y vídeos largos en tarjetas interactivas, visualizaciones y explicaciones personalizadas.

Deep Think: modo de pensamiento profundo

Un componente clave de la nueva generación es Gemini 3 Deep Think, el modo de razonamiento reforzado que lleva el rendimiento del modelo un paso más allá. En las pruebas internas, Deep Think supera a Gemini 3 Pro en Humanity’s Last Exam (41,0% sin herramientas) y GPQA Diamond (93,8%), y alcanza un 45,1% en ARC-AGI (con ejecución de código), un resultado sin precedentes según Google.

Deep Think está orientado a problemas especialmente complejos y novedosos, donde resulta crucial combinar razonamiento simbólico, uso de herramientas y ejecución de código. Antes de ofrecerlo a los suscriptores de Google AI Ultra, la empresa ha decidido extender sus evaluaciones de seguridad y recoger feedback de testers especializados, lo que refleja la sensibilidad de este tipo de capacidades en el umbral de la llamada inteligencia artificial general.

Gemini 3 Pro demuestra una mejor planificación a largo plazo para generar retornos significativamente más altos en comparación con otros modelos de frontera

Herramientas para desarrolladores y Google Antigravity

Gemini 3 también se presenta como un salto cualitativo para el ecosistema de desarrolladores. El modelo destaca en generación de código sin ejemplos y en el manejo de instrucciones complejas para producir interfaces web interactivas y ricas en contenido. Lidera el ranking WebDev Arena con 1.487 ELO, obtiene un 54,2% en Terminal-Bench 2.0 (uso de herramientas y operación de un ordenador vía terminal) y alcanza un 76,2% en SWE-bench Verified, muy por encima de 2.5 Pro.

Los desarrolladores pueden empezar a trabajar con Gemini 3 desde Google AI Studio, Vertex AI, la CLI de Gemini y, como novedad, la plataforma de desarrollo basada en agentes Google Antigravity. Esta última eleva los agentes de IA a una “superficie” propia con acceso directo al editor, al terminal y al navegador, permitiendo que el sistema planifique y ejecute tareas de software complejas de extremo a extremo, validando su propio código. Además, Antigravity se integra con otros modelos de la familia, como Gemini 2.5 para uso en ordenador (control del navegador) y Nano Banana (Gemini 2.5 Image) para edición de imágenes.

IA agéntica y planificación a largo plazo

En el terreno de los agentes, Gemini 3 profundiza el camino iniciado con Gemini 2. Google destaca su rendimiento en Vending-Bench, un banco de pruebas que evalúa la capacidad de planificación a largo plazo gestionando un negocio simulado de máquinas expendedoras durante un año virtual. Gemini 3 Pro mantiene un uso coherente de herramientas y una toma de decisiones estable, generando mayores beneficios sin desviarse de la tarea asignada.

Trasladado al día a día del usuario, esto se traduce en agentes capaces de clasificar una bandeja de entrada de Gmail, planificar itinerarios de viaje o ejecutar flujos de trabajo complejos de varios pasos, combinando razonamiento, llamadas a herramientas y control del navegador, todo bajo supervisión humana. Los suscriptores de Google AI Ultra pueden experimentar estas funciones mediante Gemini Agent en la app de Gemini, con la promesa de extenderlas a más productos de Google.

Seguridad, pruebas externas y despliegue

Google subraya que Gemini 3 es su modelo más seguro hasta la fecha, sometido al conjunto de evaluaciones de seguridad más exhaustivo de todos sus modelos. Entre las mejoras destacan menor adulación, mayor resistencia a inyecciones de prompt y mejores defensas frente a usos indebidos relacionados con ciberataques.

Además de las pruebas internas bajo el Frontier Safety Framework, la empresa ha colaborado con expertos independientes y organismos externos como el AISI del Reino Unido, y ha obtenido evaluaciones de firmas especializadas como Apollo, Vaultis y Dreadnode, entre otras. En paralelo, el despliegue se realiza a gran escala: para usuarios finales en la app de Gemini y en el Modo IA de la Búsqueda, para desarrolladores en la API de Gemini, AI Studio, Google Antigravity y la CLI, y para empresas a través de Vertex AI y Gemini Enterprise.

Una nueva etapa en la estrategia de IA de Google

Con Gemini 3, Google pretende consolidar una nueva etapa en su estrategia de IA, en la que convergen razonamiento avanzado, agentes autónomos, multimodalidad y personalización. La compañía anticipa que este lanzamiento es solo el inicio de una familia más amplia de modelos Gemini 3, pensada para ampliar aún más el abanico de casos de uso.

En palabras de sus responsables, el reto ahora es seguir empujando los límites de la inteligencia artificial sin perder de vista la seguridad y la utilidad práctica. A medida que los usuarios, desarrolladores y empresas empiecen a integrar Gemini 3 en sus flujos de trabajo, se irá viendo hasta qué punto este modelo cumple la promesa de convertir la IA en un compañero creativo y operativo capaz de aprender, crear y planificar junto a las personas.

Gemini 3 Deep Think mode excels on some of the most challenging AI benchmarks.

Etiquetas

Google IA gemini