Colección de citas famosas - Colección de consignas - Sobre la teoría de juegos de John Nacy

Sobre la teoría de juegos de John Nacy

Definición del equilibrio de Nash: supongamos que hay n jugadores participando en el juego, dadas las estrategias de los demás, cada jugador elige su propia estrategia óptima (la estrategia óptima individual puede depender o no de las estrategias de los demás), maximice su propia utilidad. Las estrategias de todos los jugadores constituyen un perfil estratégico. El equilibrio de Nash se refiere a una combinación estratégica que consta de las estrategias óptimas de todos los participantes. Es decir, dadas las estrategias de otros, nadie tiene razones suficientes para romper este equilibrio. El caso clásico del equilibrio de Nash: el dilema del prisionero (1950, el matemático Tucker era profesor visitante en la Universidad de Stanford. Al dar una conferencia a algunos psicólogos, contó la historia de dos prisioneros. Supongamos que dos ladrones A y B cometieron un crimen juntos. irrumpieron en la casa en privado y fueron capturados por la policía. La policía puso a las dos personas en dos habitaciones diferentes para interrogarlas. La política dada por la policía era que si un sospechoso confesaba su crimen, entregaría al sospechoso. concluyente, y ambos fueron condenados si el otro sospechoso también confesó, cada uno fue sentenciado a 8 años de prisión; si el otro sospechoso negaba sin confesar, sería acusado de obstrucción de deberes oficiales (porque había pruebas de su culpabilidad). ), será condenado a otros dos años de prisión, y el confesor será puesto en libertad inmediatamente después de una pena reducida a ocho años. Si ambos lo niegan, la policía no puede condenarlos por robo por falta de pruebas, pero sí pueden ser condenados. a un año de prisión cada uno por invasión de propiedad privada. La Tabla 2.2 muestra la matriz de resultados de este juego. Tabla 2.2 Juego del dilema del prisionero——————————————————————————. ———————————————————————————————————————————————————— ———————————————————————— Proceso de cálculo: si confiesa, lo niego, iré a la cárcel 10 años, y la confesión máxima es 8 años; si lo niega, puedo ser liberado y él irá a la cárcel por 10 años. Considerando las circunstancias anteriores, independientemente de si confiesa o no, iré a la cárcel por 10 años. Ambas personas utilizaron este tipo de pensamiento. Al final, ambos optaron por confesar y fueron sentenciados a ocho años de prisión basándose en la premisa de los agentes racionales en economía, los dos presos eligieron confesar o dejarse ir. confesar, y la estrategia que hubiera sido beneficiosa para ambas partes no hubiera ocurrido. De esta manera, ambos eligieron la estrategia de confesar y fueron sentenciados a ocho años de prisión. El Equilibrio de Nash desafió por primera vez la " "mano invisible" de Adam Smith. "Principio: Según la teoría de Smith, en la economía de mercado, todos parten del interés propio y, finalmente, toda la sociedad logra efectos altruistas. Sin embargo, podemos extraer una "mano invisible" del equilibrio de Nash. La paradoja de la "mano". Principio: partiendo del interés propio, el resultado será dañar a los demás y no beneficiar a uno mismo. Los libros que registran la vida de Nash incluyen: "El fantasma de Princeton" (también traducido como "Una mente maravillosa, echemos un vistazo"). la introducción a la teoría del equilibrio de Nash: El ganador del Premio Nobel de Economía en 1994 fue John Nash de la Universidad de Princeton. Nash ganó el Premio Nobel de Economía por sus contribuciones al campo de la teoría de juegos. La historia más popular sobre la teoría de juegos se llama "La historia del prisionero". Dilema": Un día, un hombre rico fue asesinado en su casa y le robaron sus bienes; durante la investigación del caso, la policía capturó al sospechoso Zhang. Tres, Li y cuatro encontraron los objetos faltantes en la casa de la víctima. Sin embargo, Negó el asesinato y argumentó que simplemente robaron cosas. Entonces la policía los aisló y los puso en habitaciones diferentes para interrogarlos. Le dijeron a Zhang San y Li Si respectivamente: "Como tienes pruebas concluyentes de robo, puedo sentenciarte a uno. año de prisión. Pero puedo hacer un trato contigo. Si confiesas solo el asesinato, solo te sentenciaré a tres meses de prisión", pero tu cómplice será sentenciado a 10 años de prisión. Si te niegas a confesar y eres denunciado por tu pareja, serás condenado a 10 años de prisión, y él sólo será condenado a 3 meses de prisión. Sin embargo, si ambos confiesan, ambos serán sentenciados a cinco años de prisión. "¿Qué pasa con Zhang Sanhe y Li Si? Se enfrentaron a un dilema: confesar o negar. Obviamente, la mejor estrategia para ambas partes era negar y, como resultado, todos solo recibieron una sentencia de un año. Pero como los dos estaban aislados, Por lo tanto, no pueden confabularse entre sí. Según la teoría de Adam Smith, todos son "hombres económicos racionales" y tomarán decisiones basadas en sus propios intereses. Las dos personas tendrán el siguiente proceso de cálculo: si él confiesa, yo no confesaré. Tuvo que ir a la cárcel durante 10 años, pero sólo confesó durante 5 años, así que era un buen trato; si yo confesaba, él confesaría, y tendría que ir a la cárcel durante cinco años. Si no confesara, yo solo iría a la cárcel por tres meses y él iría a la cárcel por 10 años, y también es un buen trato, considerando lo anterior, es un buen trato para ambos, lo confiese o no. .

¿Al final ambas personas eligieron un truco? Como resultado, fueron condenados a cinco años de prisión. No aparecerá ni la estrategia (negación) ni el resultado (sentencia a 1 año de prisión) que fue beneficioso para ambas partes. Este es el famoso "dilema del prisionero". En realidad refleja un problema muy profundo, que es la contradicción entre racionalidad individual y racionalidad colectiva. De hecho, si ambas son negativas, cada sentencia es de 1 año, lo que obviamente es mejor que ambas sentencias sean de 5 años, pero no se puede hacer en la práctica porque no cumple con los requisitos de la racionalidad individual. Como personas racionales, Zhang San y Li Si pensarían que si lo niego y la otra parte confiesa, puedo ser sentenciado a 10 años. Las personas racionales no correrán ese riesgo. Pero el resultado de una elección racional fue que tanto Zhang San como Li Si fueron sentenciados a 5 años, y el mejor resultado de ser sentenciados a 1 año no apareció. En otras palabras, una elección racional para cada individuo pero irracional para el colectivo. Esto es contrario a la conclusión de la economía tradicional. La economía tradicional cree que hay una "mano invisible" en la economía de mercado, y el resultado de su regulación es que la elección racional de todos conducirá en última instancia a la maximización de los intereses de todo el colectivo. De hecho, al igual que el dilema del prisionero, esta mano invisible perderá su efecto cuando sólo unas pocas personas participen en la elección, porque en este momento el proceso de toma de decisiones de las personas considerará las ideas de otros participantes, al igual que el juego y el ajedrez, y compra y venta La competencia perfecta cuando el número de ambas partes es enorme es exactamente igual y requiere un nuevo conjunto de ideas para estudiar. En el ejemplo anterior, notamos un resultado no óptimo, es decir, ambas personas eligieron la estrategia Frank y fueron sentenciadas a cinco años. Este resultado se denomina "equilibrio de Nash", también llamado equilibrio no cooperativo. El concepto más básico de la teoría de juegos es el "equilibrio de Nash". Cuando se trata de teoría de juegos, la más comentada y famosa es el "equilibrio de Nash". El equilibrio de Nash se refiere a una combinación de estrategias que consta de las estrategias óptimas de todos los participantes. Es decir, dadas las estrategias de los demás, ningún jugador tiene la iniciativa de elegir otras estrategias para obtener mayores beneficios para sí mismo, por lo que nadie tiene la iniciativa de romper este equilibrio. Por supuesto, aunque el "equilibrio de Nash" se compone de la estrategia óptima de una sola persona, eso no significa que sea un resultado óptimo general. Como se mencionó anteriormente, en el caso de conflicto entre la racionalidad individual y la racionalidad colectiva, el resultado final resultante de la búsqueda de cada uno de sus propios intereses es un "equilibrio de Nash", que también es un resultado desfavorable para todos. En este sentido, la paradoja que plantea el equilibrio de Nash en realidad sacude los cimientos de la economía occidental. También nos recuerda que la cooperación es una “estrategia de interés propio” beneficiosa. De hecho, si los dos prisioneros mencionados anteriormente pudieran conspirar, definitivamente optarían por negar ambos y serían sentenciados a un año de prisión por robo. Por supuesto, fue precisamente con esto en mente que la policía les realizó una revisión de aislamiento para conocer la verdad, pero no aparecieron los resultados cooperativos que fueran más beneficiosos para los presos. El "equilibrio de Nash" describe un equilibrio de juego no cooperativo. En realidad, las situaciones no cooperativas son más comunes que las cooperativas. Por lo tanto, el "equilibrio de Nash" es un desarrollo importante de la teoría de juegos cooperativos de von Neumann y Morgen Stern, e incluso se puede decir que es una revolución. Hoy en día, el equilibrio de Nash es ampliamente utilizado en diversos campos de investigación, especialmente en el análisis institucional. Aplicándolo, podemos sacar una conclusión muy importante: para que un acuerdo institucional sea eficaz, debe existir un equilibrio de Nash. De lo contrario, este acuerdo institucional no podrá establecerse. (Basado en la teoría clásica del Premio Nobel de Economía)

Adoptalo

上篇: Escribe tres oraciones metafóricas sobre la comprensión china. 下篇: Métodos de balanceo de ecuaciones químicas en el tercer año de secundaria.