Computadora resuelve juego de Poker online

Sociología y Antropología

Por Sophimania Redacción
9 de Enero de 2015 a las 12:11
Compartir Twittear Compartir
Computadora resuelve juego de Poker online

Científicos informáticos de la Universidad de Alberta en Canadá han programado un jugador de poker con inteligencia artificial, que nunca pierde una mano en el juego Texas Hold'em, popular entre los fanáticos de este deporte de azar. El equipo publicó sus hallazgos en la revista Science.

El programa utiliza una estrategia de juego de dos jugadores Poker brillantes, haciendo un análisis estadístico que hace que hasta la persona más experta en el tema pierda ante este programa. Este jugador inteligente nunca va a cometer un error, incluso sin saber qué cartas está sosteniendo su oponente.

Este “jugador virtual”, CEFEO, ha descubierto la manera de revertir incluso las peores situaciones para asegurarse la victoria. "Usará la estrategia de perder si se trata de una mano inferior, pero va a minimizar sus pérdidas de la mejor manera matemáticamente posible y poco a poco retomar el camino para ganar manos más complejas, tomando siempre la decisión perfecta”, dice Jason Koebler.

 

 

poke 2

Foto: PLAY

 

 

¿Cómo lo hace?

 

El programa estaría haciendo trampa si supiera las cartas que tienen los oponentes en sus manos. Como señala Koebler, el programa debe saber de alguna manera cómo navegar por las 3 x 10 ^ 14 posibles decisiones en un juego de póquer con límite. El equipo de la Universidad de Alberta se refiere a este tipo de juego, donde no se sabe toda la información, como un juego de "información imperfecta".

"Las soluciones para los juegos de información imperfecta requieren computadoras para manejar la complicación adicional de no saber exactamente el estado del juego, como no saber la mano de un oponente," explica el autor.

Para esto, el programa ejecuta un algoritmo llamado CFR +, que fue inventado por el equipo para mejorar un algoritmo existente conocido como la reducción al mínimo arrepentimiento contrafactual (CFR).

Esto significa, en esencia, trata de aprender de los propios errores. Así que, si el programa piensa en la posibilidad de elevar una apuesta, y decide jugar al azar y pierde, volverá sobre sus pasos, calculará la cantidad que podría haber ganado si hubiera aumentado la apuesta y almacenará esa cantidad como un "valor de arrepentimiento”. Gracias a este estimado, se evita volver a cometer el mismo error y se va perfeccionando el juego.

¿Quieres probar tu mano contra Cefeo? Haz clic aquí para jugar en contra. Espero  que disfrutes la sensación de perder.

 

 

FUENTE: Science Alert


Compartir Twittear Compartir