Página Principal | Todo para Matemáticas Finitas | Todo para Cálculo Aplicado | Todo | Resumen del temas | Tutoriales En Línea | Utilidades En Línea | |||||||||
|
|||||||||||
Matemáticas finitas resumen del tema: teoría de juegos |
Juegos bipersonales de suma cero
En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante. La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j. |
Ejemplo
Piedra, papel, tijera
¿Quiere jugar? Clic en una acción renglón...
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Estrategia mixta, Valor esperado
Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo. Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad): R = [a b c . . . ]con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1. Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0. El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por e = RPCEl valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificado por R y C después de un gran número de turnos. |
Ejemplo
Aquí es una variante de "piedra, papel, tijera" en la que "papel/papel" y "piedra/piedra" ya no está un empate.
Suponga el jugador de renglón usa la estrategia mixta R = [0.75 0 0.25](juega papel 75% del tiempo, tijeras 0% del tiempo y piedra 25% del tiempo) y el jugador columna juega tijeras y piedra 50% del tiempo cada uno; Entonces el valor esperado del juego es
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Criterio minimax, Principios fundamentales de la teoría de juegos
Criterio Minimax
Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta tema muestra un método gráficamente para solucionar juegos 2×2. Para juegos general, se puede usar el método simplex (vea siguiente tema). Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo). Principios fundamentales de la teoría de juegos Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:
|
Ejemplo
Considere el siguiente juego:
Si el jugador renglón sigue Principio 1, nunca debería jugar Acción 1 pues Acción 2 da mejor pagos sin tener en cuenta cual acción escoja el jugador columna. (Los pagos en renglón 2 son por lo menos tan altos que los pagos correspondientes en renglón 1.) Además, siguiendo Principio 2, el jugador renglón espera que el jugador columna nunca jugaría Acción A, pues Acción B da mejor pagos desde el punto de vista del jugador columna. (Los pagos en columna B son por lo menos tan bajos que los pagos correspondientes en columna A.) |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Reducir por predominio
Una acción domina a otra si todos sus pagos son por lo menos tan provechoso al jugador que los pagos correspondientes de la otra. En términos de la matriz de pagos, podemos decirlo como sigue:
Siguiendo el primero principios de la teoría de juegos, la acción que corresponde a un renglón o columna estrictamente dominado nunca será jugado, y ambos jugadores son conscientes de esto por el segundo principio. Entonces cada jugador quien sigue los principios de la teoría de juegos eliminará repetidamente renglones y columnas dominadas como podría ser el caso. (En el caso que son iguales dos renglones o columnas, no hay razón para elegir uno sobre el otro, entonces cualquiera de los dos puede ser eliminado.) Este proceso se llama reducción por predominio. |
Ejemplo
Considere otra vez el siguiente juego.
Pues las entradas de Renglón 2 son ≥ las entradas correspondientes en Renglón 1, entonces Renglón 2 domina a Renglón 1. Pues las entradas de Columna B son ≤ las entradas correspondientes en Columna A, Columna B domina a Columna A. Reducir el juego más arriba por predominio Pues Renglón 2 domina a Renglón 1, eliminamos Renglón 1 para obtener
Pues Columna B ahora domina a ambas Columnas A y C, eliminamos las dos Columnas A y C para obtener
Pues el primero renglón domina ahora al último renglón, eliminamos el último renglón, y estamos reducidos a la siguiente matriz 1×1
En este caso, hemos solucionado el juego por reducción por predominio: El jugador renglón debe siempre jugar 2 y el jugador de columna debe siempre jugar B. Pues el pago correspondiente es 0, decimos que el juego es justo (ninguno jugador tiene ventaja sobre el otro). Observe que tuvimos suerte aquí: No todos los juegos pueden ser reducido a un juego 1×1 por predominio. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Punto de silla, juego estrictamente determinado
Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja los máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja. Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinado:
El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial. |
Ejemplo
En el juego más arriba, hay dos puntos de silla, mostrados en color.
Pues son cero los puntos de silla, es un juego justo. Se puede usar la herramienta teoría de juegos para comprobar cualquier juego (de hasta 5×5) para puntos de silla. Pruébela. |