10 años de AlphaGo: la Jugada 37 cambió la ciencia

DeepMind celebra el hito de 2016 como prólogo de AlphaFold y como argumento de venta de la AGI, la “tecnología más trascendental” por venir.

Juan Antonio Muñoz-Gallego

12/03/26 | 15:05 | Tiempo de lectura: 6 min.

Más de 200 millones de personas siguieron en 2016 la partida en Seúl que hizo historia: un programa derrotaba a un campeón del mundo en el juego de go y lo hacía con una jugada —la Move 37— que los comentaristas calificaron de “error” antes de entender que era una idea nueva.
Aquel tablero era una metáfora extrema: 10^170 posiciones posibles, una escala “mayor que los átomos del universo observable”.
Diez años después, DeepMind sostiene que aquel método ya no sirve solo para ganar juegos: ha impulsado AlphaFold, una base de datos con más de 200 millones de estructuras y más de 3 millones de usuarios.
La pregunta ya no es si la IA puede ser creativa. Es quién controla su uso cuando deja de jugar y empieza a decidir.

La Jugada 37: el instante en que la IA dejó de imitar

AlphaGo no cambió la investigación por vencer 4-1. Lo hizo por la forma de ganar. En el relato oficial, la partida quedó marcada por la Move 37 de la segunda partida, tan poco convencional que los profesionales la interpretaron como un fallo antes de verla encajar, “cien movimientos después”, en el lugar exacto para decidir la victoria.
Ese momento tuvo una consecuencia inmediata: convirtió a la IA en un actor cultural. De pronto, no era un algoritmo que optimiza, sino un sistema capaz de encontrar estrategias que los humanos no habían formalizado. DeepMind lo usa hoy como síntesis de una tesis mayor: la tecnología ya estaba lista para salir del laboratorio de juegos y saltar a problemas científicos.
En términos económicos, fue el disparo de salida a una década de inversión acelerada en cómputo, talento y modelos. Lo que parecía un espectáculo se transformó en agenda industrial.

El método AlphaGo: búsqueda y refuerzo a escala inhumana

El go llevaba años siendo una “prueba de estrés” porque su complejidad castiga el atajo. DeepMind lo traduce en una cifra que funciona como advertencia: 10^170 posiciones posibles.
La clave de AlphaGo fue combinar redes neuronales profundas, búsqueda avanzada y aprendizaje por refuerzo. Primero aprendió de partidas humanas para construir un modelo de movimientos plausibles y después jugó cientos de miles de partidas contra sí mismo, reforzando las estrategias ganadoras.
El salto conceptual no fue “más datos”, sino más método: reducir el espacio de posibilidades a rutas “prometedoras” y, desde ahí, elegir el movimiento con mayor probabilidad de victoria.
Esta arquitectura —planificar, explorar, corregir— es la semilla que DeepMind dice haber generalizado en AlphaGo Zero y AlphaZero, y la que ahora reivindica como puente hacia sistemas más generales.

AlphaFold: del tablero a las proteínas en un problema de 50 años

La transición más rentable del “método AlphaGo” no está en otro juego, sino en biología. DeepMind recuerda que el plegamiento de proteínas era un reto de 50 años: predecir la estructura 3D de una proteína para entender enfermedades y diseñar fármacos.
En 2020, AlphaFold 2 “rompió” ese cuello de botella y, desde ahí, el proyecto escaló a una magnitud difícil de exagerar: todas las 200 millones de proteínas conocidas por la ciencia plegadas y liberadas en una base de datos abierta.
La cifra de adopción completa el giro: DeepMind habla de más de 3 millones de investigadores usando esa base para acelerar trabajos que van desde vacunas contra la malaria hasta enzimas que degradan plástico.
Aquí aparece el verdadero impacto económico: la IA deja de ahorrar “tiempo de cálculo” y empieza a ahorrar años de laboratorio, capital y ensayo-error.

Del Nobel al negocio: ciencia abierta, control y dependencia

DeepMind subraya el reconocimiento institucional: en 2024, Demis Hassabis y John Jumper recibieron el Nobel de Química por AlphaFold, un premio compartido que consagra la IA como herramienta científica central.
Pero el mismo éxito revela una tensión de fondo: la ciencia abierta convive con incentivos corporativos. Le Monde recuerda que parte de la comunidad criticó restricciones y cambios de disponibilidad en versiones recientes, y que el debate sobre “código abierto” y acceso no es menor cuando el estándar pasa a ser privado.
Este hecho revela el nuevo riesgo sistémico: si millones de investigadores dependen de una infraestructura controlada por una empresa, la autonomía científica queda ligada a decisiones comerciales (cuotas, licencias, prioridades).
“Fue una ‘hoja de ruta del futuro’: la IA no era un mañana difuso, era una realidad llamando a la puerta”, resumió Lee Sae Dol al mirar atrás.

Matemáticas, código y co-científicos: la herencia se expande

La narrativa de 2026 ya no se queda en proteínas. DeepMind enumera una cadena de “descendientes” que aplican búsqueda y refuerzo a otros dominios: AlphaProof y AlphaGeometry 2 alcanzando nivel medalla de plata en la Olimpiada Internacional de Matemáticas, y un modo Deep Think de Gemini con rendimiento de medalla de oro en la IMO 2025, según la propia compañía.
En programación, el ejemplo es AlphaEvolve: explorar el espacio del código para encontrar algoritmos más eficientes, con una “Move 37” propia al proponer una nueva forma de multiplicar matrices, núcleo de casi toda red neuronal moderna.
Y en colaboración científica, el “AI co-scientist” introduce un matiz inquietante: agentes que debaten hipótesis y revisan literatura, con validaciones citadas en Imperial College London sobre resistencia antimicrobiana.
El salto es claro: la IA ya no solo predice; organiza investigación.

El nuevo tablero: Gemini, AGI y la economía que viene

DeepMind usa el aniversario como puente hacia su objetivo explícito: la AGI, descrita como “la tecnología más profunda jamás inventada” y “herramienta definitiva” para ciencia, medicina y productividad. El camino, dicen, pasa por modelos multimodales —Gemini— capaces de razonar sobre texto, audio, vídeo e imágenes, y por un sistema que combine “modelos del mundo”, búsqueda y uso de herramientas especializadas como AlphaFold.
El diagnóstico es inequívoco: estamos entrando en una economía donde la ventaja competitiva no será solo el dato, sino la capacidad de planificar y verificar en entornos complejos.
Pero el escenario tiene coste: concentración de poder, dependencia de infraestructuras y una nueva asimetría entre quien puede pagar cómputo a escala y quien solo puede consumirlo. La década que empezó con una jugada en un tablero termina con una disputa por el control de la ciencia aplicada. Y esa partida, a diferencia del go, no tiene reglas claras.

Etiquetas:

ciencia