AlphaGo, el sistema de inteligencia artificial de Google pensado para jugar al juego de estrategia Go, ya aprende de sí mismo y derrotó por 100 partidas a cero a su predecesor, entrenado por humano.
AlphaGo Zero, tal el nombre del nuevo algoritmo, es el sucesor del sistema que se hizo famoso mundialmente tras vencer en 2016 al surcoreano Lee Sedol, campeón del mundo del llamado “ajedrez asiático”.
El software que venció al campeón de Go en 18 ocasiones fue “entrenado” por humanos, que crearon un sistema de aprendizaje supervisado a partir de millones de movimientos de partidas de Go jugadas por expertos.
AlphaGo Zero, en cambio, aprendió el juego de estrategia compitiendo contra sí misma, un fuerte reto para los ingenieros que crearon la nueva versión del algoritmo.
El sistema aprendió de sus errores y aciertos en los millones de partidas que jugó contra sí mismo. En pocos días, AlphaGo Zero fue capaz de derrotar a cualquier humano y, lo más importante, a todas las versiones anteriores del programa.
AlphaGo es un desarrollo de DeepMind, una empresa adquirida por Google en 2014 desde donde destacaron que el sistema descubrió de manera independiente algunos conceptos del juego Go que los humanos tardaron siglos en conceptualizar.
AlphaGo Zero también desarrolló nuevas estrategias capaces de ampliar las posibilidades del juego, inventado en China hace más de 2.500 años.