La Estrategia Maximin

Algunos sabran de lo que trata este teorema, asi que dar'e algo simple y conciso....

El teorema Maximin se utiliza en la Teoria de Juegos, y se explica de la siguiente manera:
Consideremos un juego de suma cero en el que lo que yo gano lo pierde el otro jugador. Cada jugador dispone de tres estrategias posibles a las que designaremos como A, B, y C (supongamos que son tres tarjetas con dichas letras impresas). Los premios o pagos consisten en la distribución de diez monedas que se repartirán según las estrategias elegidas por ambos jugadores y se muestran en la siguiente tabla llamada matriz de pagos. Mis ganancias, los pagos que puedo recibir, se muestran en verde, a la izquierda de cada casilla. Los pagos al otro jugador se muestran en rosa, a la derecha de cada casilla. Para cualquier combinación de estrategias, los pagos de ambos jugadores suman diez.

MATRIZ DE PAGOS





Las estrategias
del otro jugador




A B C

Mi estrategia

A 9 | 1 1 | 9 2 | 8

B 6 | 4 5 | 5 4 | 6

C 7 | 3 8 | 2 3 | 7


Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo recibiré ocho monedas y el otro jugador recibirá dos.

Éste es por tanto un juego de suma cero. Se llama juego de suma cero aquél en el que lo que gana un jugador es exactamente igual a lo que pierde o deja de ganar el otro.

Para descubrir qué estrategia me conviene más vamos a analizar la matriz que indica mis pagos, la de fondo verde. Ignoro cuál es la estrategia (la tarjeta) que va a ser elegida por el otro jugador. Una forma de analizar el juego para tomar mi decisión consiste en mirar cuál es el mínimo resultado que puedo obtener con cada una de mis cartas. En la siguiente tabla se ha añadido una columna indicando mis resultados mínimos.

MATRIZ DE MIS PAGOS



La estrategia del otro jugador


A B C mínimos

Mi estrategia

A 9 1 2 1
B 6 5 4 4
C 7 8 3 3
En efecto,
  • Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como mínimo obtendré un resultado de 1.
  • Si elijo la tarjeta B, puedo obtener 6, 5 o 4, luego como mínimo obtendré 4
  • Si elijo la tarjeta C, puedo obtener 7, 8 o 3, luego como mínimo obtendré 3

De todos esos posibles resultados mínimos, el que prefiero es 4 ya que es el máximo de los mínimos. La estrategia MAXIMIN consiste en elegir la tarjeta B ya que esa estrategia me garantiza que, como mínimo, obtendré 4

¿Podemos prever la estrategia del otro jugador? Supongamos que el otro jugador quiere elegir también su estrategia MAXIMIN. Mostramos ahora sólo los pagos asignados al otro jugador en los que destacamos el pago mínimo que puede obtener para cada una de sus estrategias. Subrayamos el máximo de los mínimos y su estrategia maximin.


MATRIZ DE PAGOS AL OTRO JUGADOR



La estrategia del otro jugador


A B C

Mi estrategia

A 1 9 8
B 4 5 6
C 3 2 7
mínimos 1 2 6

En efecto,
  • Si él elige A, su peor resultado sería si yo elijo A con lo que yo obtendría 9 y él 1
  • Si él elige B, su peor resultado sería si yo elijo C con lo que yo obtendría 8 y él 2
  • Si él elige C, su peor resultado sería si yo elijo B con lo que yo obtendría 4 y él 6

Su estrategia MAXIMIN consiste por tanto en jugar la carta C con lo que se garantiza que, al menos, obtendrá 6.

Éste es un juego con solución estable. Ninguno de los jugadores siente la tentación de cambiar de estrategia. Supongamos que se empieza a repetir el juego una y otra vez. Yo jugaré siempre mi estrategia maximin (B) y el otro jugará siempre su estrategia maximin (C). Cada uno sabe lo que jugará el otro la siguiente vez. Ninguno estará tentado de cambiar su estrategia ya que el que decida cambiar su estrategia perderá.

Se llama punto de silla al resultado en el que coinciden las estrategias maximin de ambos jugadores.

No todos los juegos tienen un punto de silla, una solución estable. La estabilidad del juego anterior desaparece simplemente trastocando el orden de las casillas BB y BC:

MATRIZ DE MIS PAGOS


MATRIZ DE PAGOS AL OTRO JUGADOR


La estrategia del otro jugador


La estrategia del otro jugador


A B C


A B C

Mi estrategia

A 9 1 2
Mi estrategia A 1 9 8
B 6 4 5
B 4 6 5
C 7 8 3
C 3 2 7

En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia maximin del otro jugador sigue siendo la C. Pero la solución ahora ya no es estable. Si jugamos repetidas veces y yo repito mi estrategia maximín, B, el otro estará tentado de cambiar su estrategia, pasando de la C a la B con lo que obtendrá un pago mayor, 6 en vez de 5.

Claro que si el otro empieza a elegir sistemáticamente la estrategia B yo preferiré cambiar mi estrategia a la C para así obtener 8. Entonces el querrá volver a su estrategia C y así sucesivamente.



1 comentarios:

Gerald Velásquez Yantas dijo...

Chévere, ¿puedes poner la bibliografía?