AlphaZero, la IA capaz de aprender ella misma a jugar al ajedrez y ganar a todas a las IAs adiestradas por humanos

AlphaZero, la IA apto de estudiar ella misma a jugar al ajedrez y vencer a todas a las IAs adiestradas por individuos

A terminos de 2017, DeepMind (la filial británica de Alphabet dedicada a la IA) presentó en sociedad a AlphaZero, una inteligencia artificial que había comprobado ser apto de estudiar a jugar desde cero ajedrez, shogi y Go, y acabar ganando a todas las IAs que se habían proclamado campeonas en cada uno de esos juegos.

Ahora, la revista Science ha anunciado un artículo de analisis sobre AlphaZero que describe el modo en que empezó a estudiar autónomamente y recurriendo a una red neuronal profunda, a través de constantes partidas aleatorias y sin contar mas información previa que las normas del juego.

Eso suponía una ruptura con respecto al enfoque adoptado hasta ahora por las IAs que han destacado en el campo del ajedrez (como Stockfish, o Deep Blue de IBM): éstas se basaban en decenas de normas y heurísticas creadas por poderosos jugadores individuos que tratan de explicar cada eventualidad en un juego.

Un ejemplo de aprendizaje por refuerzo

Según los inventores de la investigación, socios de DeepMind, los “resultados demuestran que un algoritmo de aprendizaje por refuerzo y de propósito general puede estudiar desde cero y alcanzar un rendimiento sobrehumano en muchos videojuegos de enorme complejidad“.

La suma de entrenamiento que AlphaZero necesitó en cada caso dependió del estilo y la complejidad del juego: próximamente nueve horas para el ajedrez, doce horas para el shogi y 13 días para el Go.

El hablado ‘aprendizaje por refuerzo’ (ya usado además con videojuegos) consiste en este caso en una red neuronal que juega millones de partidas contra sí misma en un proceso de prueba y error, de tal modo que va tomando nota de la clase de jugadas que contribuyen de lograr el objetivo de vencer la partida.

Una vez entrenada, la red se usa para dirigir un algoritmo de busqueda llamado ‘Árbol de busqueda de Monte-Carlo’ que acepta que, en lugar de examinar todos los desplazamientos posibles, AlphaZero se centre solamente en aquellos mas prometedores segun su destreza previa.

Pese a eso (y a contar con menor capacidad de computación), AlphaZero se proclamó vencedor sobre todos sus rivales.

Az Blog Fig3 Performance Width 1500

Un gamer poco ortodoxo

Desde DeepMind destacan como les emocionó “la respuesta de los socios de la sociedad de ajedrez, quienes vieron en los videojuegos de AlphaZero un estilo de videojuego innovador, altamente dinámico y ‘no convencional’.

De hecho, 2 ajedrecistas de talla internacional, Matthew Sadler y Natasha Regan, analizaron decenas de partidas de ajedrez de AlphaZero para su libro “Game Changer” (que saldrá a la venta dentro de un mes) y afirman que su estilo es distinto al de cualquier motor de ajedrez tradicional:

“Es como detectar los cuadernos secretos de algún enorme gamer del pasado”.

Y es que, al ser autodidacta y no estar limitado por la sabiduría convencional, AlphaZero “desarrolló sus propias intuiciones y estrategias, añadiendo un conjunto nuevo y expansivo de ideas novedosas que aumentan siglos de pensamiento sobre la tactica del ajedrez”.

El sistema, por ejemplo, se muestra fundamentalmente dispuesto a sacrificar piezas al origen de un videojuego si con ello calcula que puede recibir un beneficio a largo plazo.

“Los motores tradicionales son excepcionalmente robustos y cometen pocos errores obvios, sin embargo pueden tener problemas cuando se enfrentan a posiciones sin una solucion concreta y calculable”, expone Sadler.

Es exactamente en esas situaciones, en las que se solicita ‘sentimiento’, ‘percepción’ o ‘intuición’, donde AlphaZero se reivindica“.

Más que un juego

Los examinadores se proclaman “entusiasmados con la respuesta creativa de AlphaZero al ajedrez, que ha sido un enorme reto para la inteligencia artificial desde los princicios de la era de la computación”.

Garri Kaspárov, ex campeón internacional de ajedrez y inventor del libro ‘Deep Thinking’ sobre la inteligencia artificial, expone la importancia de los logros de Alpha Zero en este videojuego de mesa: “Durante mas de un siglo, el ajedrez se ha venido empleando como Piedra Rosetta tanto de la cognición humana como de la artificial“.

Pero los examinadores del dispositivo de AlphaZero avisan que su creación “va mas allá de ajedrez, el shogi o el Go”:

“El objetivo de DeepMind es edificar sistemas que puedan solucionar algunos de los problemas mas dificiles del planeta y inventar un software que puede enseñarse a sí mismo como dominar el ajedrez, el shogi y el go desde cero es un significativo 1° paso en ese camino”.

También te recomendamos

Esta "huella maestra" artificial permitiría desbloquear lectores dactilares con una fiabilidad de casi el 80%

La BBC experimenta con 'deep fakes' para doblar a un presentador en muchos lenguajes

#CienciaenelParlamento o como Twitter® puede inventar una cultura política científica


La novedad AlphaZero, la IA apto de estudiar ella misma a jugar al ajedrez y vencer a todas a las IAs adiestradas por individuos fue publicada originalmente en Xataka por Marcos Merino .


Xataka



Agradecemos a la fuente original por la información que nos ayudo a crear este articulo.

También puedes revisar estas noticias relacionadas.

Tags: #adiestradas #ajedrez #AlphaZero #Aprender #capaz #ella #ganar #humanos #jugar #misma #todas

Deja un comentario

Author: 
    author