Google crea Inteligencia Artificial capaz de “crear conocimiento en sí mismo"

Robótica e Inteligencia Artificial

Por Sophimania Redacción
18 de Octubre de 2017 a las 22:30
Compartir Twittear Compartir
Google crea Inteligencia Artificial capaz de “crear conocimiento en sí mismo"
AlphaGo Zero aprendió en 3 días, lo que a los humanos nos tomó miles de años. Foto: DeepMind

DeepMind, la división de Google encargada de desarrollar inteligencia artificial, ha desvelado la última versión de Alpha Go, un programa que puede jugar Go. Esta IA es tan poderosa que adquirió miles de años de conocimiento humano sobre el juego antes de inventar sus propios movimientos, todo en el espacio de tres días.

Llamado AlphaGo Zero, el programa de IA ha sido aclamado como un gran avance porque dominó el antiguo juego de tablero chino desde cero, y sin ninguna ayuda humana (solo se le dio las reglas). Este nuevo programa le ganó 100 a 0 a la versión del 2015, que a su vez ya le había ganado al campeón humano Lee Sedol.

Eleni Vasilaki, profesora de neurociencias computacionales de la Universidad de Sheffield, dijo a The Guardian, que fue una hazaña impresionante. "Esto puede implicar que al no involucrar a un experto humano en su entrenamiento, AlphaGo descubre mejores movimientos que superan a la inteligencia humana en este juego específico", dijo.

La hazaña marca un hito en el camino hacia las IAs de propósito general que pueden hacer más que ganarle a los humanos en los juegos de mesa. Debido a que AlphaGo Zero aprende por sí sola desde cero, podría ayudar a solucionar muchos problemas de la vida real.

En los laboratorios de DeepMind, AlphaGo Zero está resolviendo cómo se doblan las proteínas, un inmenso desafío científico que podría ayudar al descubrimiento de medicamentos cada vez más potentes.

"Para nosotros, AlphaGo no se trató solo ganar el juego Go", dijo Demis Hassabis, CEO de DeepMind e investigador principal del equipo. "También fue un gran paso para construir estos algoritmos de propósito general".

La mayoría de las IA se describen como "débiles" porque realizan una sola tarea, como traducir idiomas o reconocer rostros, pero las IA de propósito general podrían potencialmente superar a los humanos en muchas tareas diferentes; y Hassabis cree que los descendientes de AlphaGo trabajarán junto con los humanos como científicos y médicos expertos en las próximas décadas.

Las versiones anteriores de AlphaGo aprendieron sus movimientos entrenando en miles de juegos contra aficionados y profesionales humanos. Pero AlphaGo Zero no tuvo esa ayuda. En cambio, aprendió puramente al jugar millones de veces. Comenzó colocando piedras en el tablero al azar, y fue mejorando rápidamente al descubrir estrategias ganadoras.

"Es más poderoso que los enfoques anteriores porque al no usar datos humanos ni ningún tipo de experiencia humana, hemos eliminado las limitaciones del conocimiento humano y ha sido capaz de crear conocimiento en sí mismo", dijo David Silver, investigador principal de AlphaGo.

El programa acumula su habilidad mediante un procedimiento llamado aprendizaje de refuerzo. Es el mismo método mediante el cual los humanos aprendemos a dominar el arte de montar en bicicleta. Cuando AlphaGo Zero juega un buen movimiento, es más probable que sea recompensado con una victoria. Cuando hace un mal movimiento, se acerca más a una derrota.

En el corazón del programa hay un grupo de "neuronas" de software que están conectadas entre sí para formar una red neuronal artificial. Para cada turno del juego, la red observa las posiciones de las piezas en el tablero y calcula qué movimientos se pueden hacer a continuación y la probabilidad de que lleven a una victoria. Después de cada juego, actualiza su red neuronal, lo que lo convierte en un jugador más fuerte para la próxima pelea.

Aunque es mucho mejor que las versiones anteriores, AlphaGo Zero es un programa más simple y domina el juego más rápido a pesar de entrenar con menos datos y correr en una computadora más pequeña. Si se le hubiera dado más tiempo, también hubiera podido aprender las reglas por sí mismo, dijo Silver.

 

FUENTES: THE GUARDIAN, ABC, THE VERGE

 

Si quieres estar siempre enterado de lo último y lo mejor en descubrimientos, investigaciones y avances científicos y tecnológicos SUSCRÍBETE AQUÍ en un solo paso. Recibirás un boletín semanal con lo mejor de Sophimania.


#google #ia #alphago #deepmind #alphago zero
Compartir Twittear Compartir