Chess24 •  Tecnología •  07/12/2017

El nuevo amo del ajedrez: AlphaZero

Veinte años después de que DeepBlue venciera a Garry Kasparov, los ajedrecistas han despertado ante una nueva revolución. El algoritmo AlphaZero desarrollado por Google y DeepMind necesitó solo de cuatro horas de jugar contra sí mismo para sintetizar el conocimiento ajedrecístico de un milenio y medio y alcanzar un nivel en el que no solo superó a los humanos sino también al campeón mundial de módulos de análisis, Stockfish, por 28 victorias a 0 en un match a 100 partidas.

El nuevo amo del ajedrez: AlphaZero

Todas las estratagemas brillantes y los refinamientos de los programadores humanos han sido superados, y al igual que los jugadores de Go solo podemos maravillarnos ante este nuevo paradigma.

Con la llegada de AlphaZero el mundo del ajedrez nunca volverá a ser el mismo.

Hace solo cinco días, en un mundo más inocente, Ian Nepomniachtchi declaró después de la primera ronda del London Chess Classic en las oficinas de Google:

Espero que se cree una gran historia de cooperación entre Google y el ajedrez. Que no se trate de crear un AlphaGo, un AlphaChess, lo que matará el ajedrez, sino una colaboración amistosa.

Ya se veían signos preocupantes, sin embargo, pues AlphaGo, el programa que superó al campeón del mundo de los humanos, había sido superado por AlphaGoZero, que aprendió todo simplemente jugando contra sí mismo.

El cofundador de DeepMind, Demis Hassabis, es un ex-prodigio del ajedrez, y mientras que su equipo se había establecido el desafío de vencer al Go, un juego en el que los humanos todavía están aprendiendo, él estaba obviamente tentado por la idea de aplicar las mismas técnicas al ajedrez. Hace mucho hemos reconocido nuestra inferioridad como humanos, pero podíamos orgullecernos del hecho de que las máquinas de ajedrez que nos vencen también fueron producto del ingenio humano. Eso estaba a punto de cambiar.

Ahora sabemos por qué Demis Hassabis, aquí al lado de Magnus Carlsen, estaba de tan buen humor | foto: Lennart Ootes, Grand Chess Tour

La sorpresa llegó en un paper académico lanzado sin mayores pomposidades el 5 de diciembre de 2017: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

El trabajo está disponible en la red:

El contenido es impresionante. El equipo de DeepMind logró demostrar que una versión genérica de su algoritmo, sin ningún conocimiento específico más que las reglas del juego, puede entrenarse durante cuatro horas en el ajedrez, dos horas en el shogi (ajedrez japonés) u ocho horas en Go y luego vencer a los campeones reinantes de entre los módulos computacionales, es decir, los más fuertes competidores de cada disciplina. En el caso del ajedrez, no fue solo una paliza, sino que una gran demolición.

Stockfish es el campeón reinante del torneo TCEC de módulos y, si bien no pudo llegar a la final este año, quedó invicto en 51 partidas. En un match contra AlphaZero, sin embargo, perdió 28 partidas y no ganó ninguna, sumando 71 empates. Con blancas, AlphaZero obtuvo unas impresionantes 25 victorias y 25 empates, mientras que con negras «apenas» consiguió 3 victorias y 47 empates. ¡Resulta que tener el primer movimiento es realmente importante después de todo!

Más información: https://chess24.com/es/informate/noticias/el-nuevo-amo-del-ajedrez-alphazero


ajedrez /