Minimax | Diccionario Economico

Definición de Minimax | Diccionario Economico

El minimax es un algoritmo utilizado en la teoría de juegos para encontrar la mejor estrategia en situaciones de competencia entre dos jugadores, en la que cada uno intenta minimizar sus pérdidas y maximizar sus ganancias.

Para decirlo de otra manera, el método minimax se trata de cómo tomas la mejor decisión asumiendo que el otro jugador elige el peor de los casos para ti.

Debemos tener en cuenta que este método es aplicable en un juego de dos personas (dos jugadores) y que este no es un juego cooperativo, sino un juego de suma cero. Esto quiere decir que lo que gana un jugador, lo pierde el otro, y viceversa. Por lo tanto, cada agente estará interesado en maximizar su propia utilidad, aunque perjudique al otro.

Aquí también debemos recordar que la teoría de juegos es una rama de las matemáticas y la economía que estudia las elecciones que optimizan la situación de un individuo cuando los costos y beneficios no están fijados de antemano sino que dependen de las decisiones de otros.

Algoritmo minimax en árbol de decisión

Podemos ver cómo se aplica el método minimax en un árbol de decisión de múltiples nodos. El juego comienza en la parte inferior y termina en el nivel superior.

En la base del árbol, el oponente hace el primer movimiento, por lo que se espera el peor resultado. Luego, en el segundo nivel, le toca al jugador x, quien buscará maximizar su ganancia, teniendo en cuenta la decisión tomada previamente por el oponente.

En el tercer nivel, nuevamente el turno del enemigo, y así sucesivamente. A continuación, mostraremos un ejemplo.

ejemplo de algoritmo minimax

En el siguiente árbol de decisión mostramos los resultados obtenidos por el jugador x en cada momento del juego. En la base, en el primer nivel, la decisión la toma el oponente. Por este motivo, existen escenarios en los que un jugador puede perder -10 o ganar 5.

En el segundo nivel, es el turno del jugador x, por lo que maximiza su beneficio. Entre perder 10 o ganar 1, ganarás 1. Del mismo modo, entre ganar 5 o 7, ganarás 7.

Luego vuelve a ser el turno del oponente, por lo que habrá escenarios donde el jugador x tiene el peor resultado, -3 y 4, según el caso. Finalmente, entre perder 3 o ganar 4, el jugador x tomará una decisión que permita lo segundo.

Debemos tener en cuenta que los valores de cada nodo dependerán de la función de utilidad.

Para comprender mejor el árbol, supongamos que se toma una decisión en la base de datos sobre la distribución de un producto. Un competidor (oponente) puede subcontratar la distribución (ver el lado izquierdo del árbol). En este caso, debe elegir, por ejemplo, entre el repartidor A y el B. Entonces elige al primero, lo que hace que el jugador x pierda 10 (si hubiera elegido B, el jugador x habría ganado 12).

Sin embargo, es posible que el enemigo prefiera distribuir él mismo sus mercancías, pudiendo alquilar vehículos motorizados o comprar una furgoneta. De ambos escenarios, elige el primero, que es menos favorable para el jugador x, ya que gana 5, no 10.

¿Problemas o dudas? Te ayudamos

Si quieres estar al día, suscríbete a nuestra newsletter y síguenos en Instagram. Si quieres recibir soporte para cualquier duda o problema, no dude en ponerse en contacto con nosotros en info@wikieconomia.org

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio