Teoría de juegos (2): equilibrio de Nash
Si quieres ver videos relacionados, puedes encontrarme en Xigua Video (cuenta zidea) o Bilibili (cuenta zidea2015) para publicar explicaciones en video. Presta atención al avatar y usa el mismo avatar.
También conocido como equilibrio de juegos no cooperativos, es un término importante en la teoría de juegos y lleva el nombre de John Nash. En el proceso de un juego, independientemente de la elección de estrategia de la otra parte, una de las partes elegirá una determinada estrategia, y esta estrategia se denomina la mejor respuesta. Si las combinaciones de estrategias de los jugadores en los dos juegos constituyen sus respectivas "mejores respuestas", entonces esta combinación se define como equilibrio de Nash.
Antes de dar una explicación del equilibrio de Nash, primero debemos aclarar un concepto sobre la mejor respuesta.
El equilibrio de Nash describe una situación si, en una situación, la estrategia de cada jugador es la mejor correspondiente a la estrategia actual de otros jugadores, entonces se dice que la situación es un equilibrio de Nash.
Si una determinada estrategia de un jugador es la mejor respuesta a cualquier estrategia de otros jugadores, entonces esta estrategia es la estrategia dominante del jugador
Bajo el equilibrio de Nash, nadie en el juego quiere cambiar. porque quien cambie puede quedar en desventaja en el juego.
Primero, echemos un vistazo al equilibrio de Nash en el dilema del prisionero. El equilibrio de Nash para el problema del dilema del prisionero es que ambas partes confiesan, lo cual es una estrategia dominante.
En. De hecho, independientemente de si el jugador 2 resiste o confesa, la mejor respuesta para la persona en la situación es confesar. Se puede observar que el punto de equilibrio de Nash no es necesariamente la solución óptima general. Algunas personas pueden decir, entonces, ¿por qué no es beneficioso para ambas personas (resistencia, resistencia)? La mejor respuesta aquí es que no importa cuál sea la estrategia del oponente, es la mejor estrategia para ti. Al final de maxmin, la tendrás. entender por qué tomaron la decisión. Francamente, esta es una estrategia de aversión al riesgo.
Este es el equilibrio de Nash con estrategia pura, el equilibrio de Nash bajo la estrategia mixta, la probabilidad p de que las niñas miren el baile y la probabilidad de ver fútbol Es 1 - p La probabilidad q de que los niños vean bailar es 1 - q La probabilidad de que los niños vean fútbol es 1 - q
El propósito de la aleatoriedad de la esposa: deja al marido sin posibilidad de aprovecharlo. No importa qué estrategia elija, su rendimiento esperado es el mismo
p>
<. p> Cuando el marido da la distribución de probabilidad, no hará que la esposa mire fútbol y mire, aproximadamente
Por lo que sé sobre mi marido, él sabe mejor que a mí me gusta ver fútbol
<. p> La distribución de elección de estrategia del jugador 1 se denota como , y la distribución de elección de estrategia del jugador 2 se denota como . Suponiendo que la distribución de estrategias del jugador 1 permanece sin cambios, la utilidad de la selección de estrategias del jugador 2 es
Equilibrio de Nash mixto del estado tijera-piedra-papel
Cualquier juego finito (con un número limitado de jugadores y estrategias) tiene al menos un equilibrio de Nash. Este equilibrio puede ser un equilibrio de Nash de estrategia pura (como tijera-piedra-papel), o puede serlo. una estrategia mixta Equilibrio, multiplicidad de equilibrios de Nash (por ejemplo, Batalla de los sexos)