Este robot de DeepMind sólo ha recibido una tarea, ha aprendido por sí mismo a moverse y completarla

DeepMind

DeepMind, la filial de Alphabet dedicada al desarrollo de la inteligencia artificial y el aprendizaje automático, ha obtenido un nuevo logro. Dejando de lado juegos de mesa como el Go, le han encomendado a un brazo robótico la labor de guardar todos los objetos de una mesa en una caja. Con esta simple labor en mente, el brazo robótico ha tenido que ingeniárselas 1° para estudiar a moverse empleando sus sensores y habilidades, despues para guardar los objetos y cumplir la tarea.

A DeepMind la sabemos principalmente por sus progresos con AlphaGo, la inteligencia artificial que crearon para ser la preferible jugadora del planeta en el Go. Una evolución de esta inteligencia, AlphaGo Zero, aprendió a jugar por si sola al Go y batió 100 veces a 0 a su antigua versión. Básicamente se entrenó por si misma, sin basarse en la destreza recopilada de partidas reales. Con SAC-X, el nuevo proyecto de DeepMind, van un paso mas allá. A la inteligencia artificial ni siquiera se le dan las normas o su forma de funcionar, sólo una labor que cumplir. Y esto aumenta la dificultad de forma considerable.

La inteligencia artificial 1° aprendió en un entorno virtual, y ultimamente lo aplicó con un brazo robótico real.

Primero ejerce a moverte, despues soluciona el problema

El ensayo se ha llevado a cabo en un espacio virtual donde un brazo robótico tenía a su alcance una mesa con varios cubos y una caja donde colocarlos. Para terminar la labor primero debe saber los bienes de los que dispone, que en este caso son ese brazo robótico con todos los sensores apagados y por descubrir. Al empezar a mover el brazo localiza los sensores que le aceptan descubrir la proximidad o medir su fuerza por ejemplo, así ejerce hasta lograr manejar el brazo robótico coordinando todas sus articulaciones.

El próximo paso es interactuar con los 2 cubos que se localizan en la mesa: los toca, los empuja, los sujeta y levanta… Y por último, ejerce a levantar la tapa de la caja y a guardar los 2 cubos dentro. El proceso es de lo mas curioso, de un 1° mirada nos puede parecer un robot algo inepto (más si lo comparamos con el perro-robot de Boston Dynamics), sin embargo teniendo en cuenta que ha practicado desde cero… recuerda mas bien a un bebe que esta descubrido a coger objetos y a caminar.

La motivación del brazo robótico es lograr una recompensa, un punto virtual. Por cumplir acciones pequeñas recibe pequeñas puntuaciones, por guardar los objetos en la caja recibe la puntuación máxima. De este modo, el robot detecta que si ejerce a coger un objeto se le recompensa por ello, además por apilar los cubos. Pero como no hay recompensa por obtener fuera de la mesa un cubo, entiende que ese no es el acceso a continuar en su aprendizaje. En otras palabras, traza su propio plan de aprendizaje para adaptarse al entorno en el que se encuentra, ejerce a aprender.

¿Cuál es el objetivo de todo esto? Conseguir que una inteligencia artificial sea apto de aprender desde cero adaptándose al entorno en el que se localiza y aprovechando los bienes de los que dispone. Las decisiones que debe tomar un brazo robótico son mucho mayores que las que se deben tomar en una partida del Go. SAC-X es un metodo de inteligencia artificial que esperan aplicar en varios otros ámbitos, se especifica un objetivo general y se le deja aprender.

Más información | DeepMind
En Xataka | ‘AlphaGo’ es el documental de Netflix que preferible expone lo que supuso la victoria de la IA de Google® al campeón de Go

También te recomendamos

Google® ha enfrentado 2 sistemas de inteligencia artificial: ¿lucharán o trabajarán juntos?

Cómo organizar preferible los beneficios en la Nube que tenemos a punto de reventar

DeepMind, la inteligencia artificial de Google, ya es apto de 'recordar' y utilizar lo practicado en nuevas actividades


La novedad Este robot de DeepMind sólo ha recibido una tarea, ha practicado por sí mismo a moverse y completarla fue publicada originalmente en Xataka por Cristian Rus .


Xataka



Agradecemos a la fuente original por la información que nos ayudo a crear este articulo.

También puedes revisar estas noticias relacionadas.

Tags: #aprendido #completarla #DeepMind #Este #mismo #moverse #recibido #robot #solo #tarea

Deja un comentario

Author: 
    author