Página Principal Todo para Matemáticas Finitas Todo para Cálculo Aplicado Todo Resumen del temas Tutoriales En Línea Utilidades En Línea
← Tema anterior Tema siguiente → Tutoriales para este tema Monografía Wikilearning Libro de texto Take me to the English page
Matemáticas finitas resumen del tema: teoría de juegos

Herramientas: Herramienta matriz álgebra | Herramienta Gauss-Jordan y pivotador | Herramienta Excel Gauss-Jordan y pivotador | Herramienta teoría de juegos

Tópicos: Juegos bipersonales de suma cero | Estrategia mixta, Valor esperado | Criterio minimax, Principios fundamentales de la teoría de juegos | Reducir por predominio | Punto de silla, juego estrictamente determinado

Juegos bipersonales de suma cero

En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante.

La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j.

Inicio de página
Ejemplo

Piedra, papel, tijera
Piedra vence a las tijeras rompiéndolas, las tijeras vencen al papel cortándolo, y el papel vence a la piedra envolviéndola.
Cada entrada +1 indica una ganancia para el jugador renglón, -1 indica una pérdida, y 0 indica un empate.

¿Quiere jugar? Clic en una acción renglón...

Jugador columna
Jugador
renglón
0
-1
1
1
0
-1
-1
1
0
Clic en una acción renglón.

Inicio de página
Estrategia mixta, Valor esperado

Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo.

Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):

R = [a   b   c  . . . ]
con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1.

Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.

El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por

e = RPC
El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificado por R y C después de un gran número de turnos.

Inicio de página
Ejemplo

Aquí es una variante de "piedra, papel, tijera" en la que "papel/papel" y "piedra/piedra" ya no está un empate.

2
-1
1
1
0
-1
-1
1
-2

Suponga el jugador de renglón usa la estrategia mixta

R = [0.75   0   0.25]
(juega papel 75% del tiempo, tijeras 0% del tiempo y piedra 25% del tiempo) y el jugador columna juega tijeras y piedra 50% del tiempo cada uno;
C =
0
0.5
0.5
.
Entonces el valor esperado del juego es
  e= RPC
= [0.75   0   0.25]
2
-1
1
0
1
0
-1
0.5
-1
1
-2
0.5
= -0.125

Inicio de página
Criterio minimax, Principios fundamentales de la teoría de juegos

Criterio Minimax
Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante.

Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta tema muestra un método gráficamente para solucionar juegos 2×2. Para juegos general, se puede usar el método simplex (vea siguiente tema). Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo).

Principios fundamentales de la teoría de juegos Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:

  1. Cada jugador hace la acción mejor posible.
  2. Cada jugador sabe que su contrincante está también haciendo la acción mejor posible.

Inicio de página
Ejemplo

Considere el siguiente juego:

Acción Columna
A B C
Acción
Renglón
1
0
-1
1
2
0
0
2
3
-1
-2
3

Si el jugador renglón sigue Principio 1, nunca debería jugar Acción 1 pues Acción 2 da mejor pagos sin tener en cuenta cual acción escoja el jugador columna. (Los pagos en renglón 2 son por lo menos tan altos que los pagos correspondientes en renglón 1.)

Además, siguiendo Principio 2, el jugador renglón espera que el jugador columna nunca jugaría Acción A, pues Acción B da mejor pagos desde el punto de vista del jugador columna. (Los pagos en columna B son por lo menos tan bajos que los pagos correspondientes en columna A.)

Inicio de página
Reducir por predominio

Una acción domina a otra si todos sus pagos son por lo menos tan provechoso al jugador que los pagos correspondientes de la otra. En términos de la matriz de pagos, podemos decirlo como sigue:

  1. Renglón r en la matriz de pagos domina a renglón s si cada pago en renglón r ≥ el pago correspondiente en renglón s.
  2. Columna r en la matriz de pagos domina a columna s si cada pago en columna r ≤ el pago correspondiente en columna s.
Observe que si dos renglones o columnas son iguales, cada uno domina al otro. Un renglón o columna domina estrictamente a un otro si el uno domina al otro y son desiguales.

Siguiendo el primero principios de la teoría de juegos, la acción que corresponde a un renglón o columna estrictamente dominado nunca será jugado, y ambos jugadores son conscientes de esto por el segundo principio. Entonces cada jugador quien sigue los principios de la teoría de juegos eliminará repetidamente renglones y columnas dominadas como podría ser el caso. (En el caso que son iguales dos renglones o columnas, no hay razón para elegir uno sobre el otro, entonces cualquiera de los dos puede ser eliminado.) Este proceso se llama reducción por predominio.

Inicio de página
Ejemplo

Considere otra vez el siguiente juego.

Acción Columna
A B C
Acción
Renglón
1
0
-1
1
2
0
0
2
3
-1
-2
3

Pues las entradas de Renglón 2 son ≥ las entradas correspondientes en Renglón 1, entonces Renglón 2 domina a Renglón 1.

Pues las entradas de Columna B son ≤ las entradas correspondientes en Columna A, Columna B domina a Columna A.

Reducir el juego más arriba por predominio

Pues Renglón 2 domina a Renglón 1, eliminamos Renglón 1 para obtener

A B C
2
0
0
2
3
-1
-2
3

Pues Columna B ahora domina a ambas Columnas A y C, eliminamos las dos Columnas A y C para obtener

B
2
0
3
-2

Pues el primero renglón domina ahora al último renglón, eliminamos el último renglón, y estamos reducidos a la siguiente matriz 1×1

B
2 (
0
)

En este caso, hemos solucionado el juego por reducción por predominio: El jugador renglón debe siempre jugar 2 y el jugador de columna debe siempre jugar B. Pues el pago correspondiente es 0, decimos que el juego es justo (ninguno jugador tiene ventaja sobre el otro).

Observe que tuvimos suerte aquí: No todos los juegos pueden ser reducido a un juego 1×1 por predominio.

Inicio de página
Punto de silla, juego estrictamente determinado

Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja los máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.

Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinado:

  1. Todos los puntos de silla en un juego tienen los mismos valores de pago.
  2. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.

El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial.

Inicio de página
Ejemplo

En el juego más arriba, hay dos puntos de silla, mostrados en color.

A B C
1
0
-1
1
2
0
0
2
3
-1
-2
3

Pues son cero los puntos de silla, es un juego justo.

Se puede usar la herramienta teoría de juegos para comprobar cualquier juego (de hasta 5×5) para puntos de silla. Pruébela.

Inicio de página
Ultima actualización: septiembre 2007
Derechos de autor © Stefan Waner

Inicio de página