ekonomi

Ekuilibrium Nash. Teori Permainan untuk Ekonom (John Nash)

Daftar Isi:

Ekuilibrium Nash. Teori Permainan untuk Ekonom (John Nash)
Ekuilibrium Nash. Teori Permainan untuk Ekonom (John Nash)
Anonim

Pada 1930-an, John von Neumann dan Oscar Morgenstern menjadi pendiri bidang matematika baru yang menarik, yang disebut "teori permainan". Pada 1950-an, ahli matematika muda John Nash menjadi tertarik pada bidang ini. Teori keseimbangan menjadi subjek disertasinya, yang ia tulis ketika berusia 21 tahun. Maka lahirlah strategi baru untuk permainan yang disebut Nash Equilibrium, yang meraih Hadiah Nobel bertahun-tahun kemudian, pada tahun 1994.

Image

Kesenjangan panjang antara penulisan tesis dan penerimaan universal adalah ujian bagi ahli matematika. Genius tanpa pengakuan menghasilkan pelanggaran mental yang serius, tetapi John Nash mampu menyelesaikan masalah ini berkat pikiran logisnya yang sangat baik. Teorinya tentang "Nash equilibrium" dianugerahi Hadiah Nobel, dan adaptasi filmnya dalam film "Beautiful mind" ("Mind Games").

Teori Game Secara Singkat

Karena teori Nash equilibrium menjelaskan perilaku orang dalam hal interaksi, oleh karena itu perlu mempertimbangkan konsep dasar teori permainan.

Teori permainan mempelajari perilaku peserta (agen) dalam kondisi interaksi satu sama lain sesuai dengan jenis permainan, ketika hasilnya tergantung pada keputusan dan perilaku beberapa orang. Peserta membuat keputusan, dipandu oleh ramalannya mengenai perilaku orang lain, yang disebut strategi permainan.

Ada juga strategi dominan di mana peserta mendapatkan hasil yang optimal untuk setiap perilaku peserta lain. Ini adalah strategi win-win terbaik pemain.

Dilema Tahanan dan Terobosan Ilmiah

Dilema tahanan adalah kasus dengan permainan ketika peserta dipaksa untuk membuat keputusan yang rasional, mencapai tujuan bersama dalam konteks konflik alternatif. Pertanyaannya adalah pilihan mana yang akan ia pilih, mengenali minat pribadinya dan bersama, serta ketidakmampuan untuk mendapatkan keduanya. Para pemain tampaknya tertutup dalam kondisi permainan yang keras, yang terkadang membuat mereka berpikir sangat produktif.

Image

Dilema ini dieksplorasi oleh ahli matematika Amerika John Nash. Keseimbangan yang ia bawa menjadi revolusioner dari jenisnya. Khususnya dengan jelas, pemikiran baru ini memengaruhi pendapat para ekonom tentang bagaimana para pelaku pasar membuat pilihan, dengan mempertimbangkan kepentingan orang lain, dengan interaksi yang erat dan persimpangan kepentingan.

Yang terbaik adalah mempelajari teori permainan dengan contoh-contoh spesifik, karena disiplin matematika ini sendiri bukan teori kering.

Contoh Dilema Tahanan

Contoh, dua orang dirampok, jatuh ke tangan polisi dan sedang diinterogasi di sel yang terpisah. Pada saat yang sama, petugas kepolisian menawarkan kondisi yang menguntungkan bagi setiap peserta di mana ia akan dibebaskan jika ia bersaksi melawan rekannya. Setiap penjahat memiliki serangkaian strategi berikut yang akan ia pertimbangkan:

  1. Keduanya secara bersamaan bersaksi dan menerima 2, 5 tahun penjara.

  2. Keduanya diam pada saat yang sama dan masing-masing menerima 1 tahun, karena dalam hal ini basis bukti kesalahan mereka akan kecil.

  3. Satu memberikan bukti dan mendapat kebebasan, sementara yang lain diam dan mendapat 5 tahun penjara.

Jelas, hasil kasus tergantung pada keputusan kedua peserta, tetapi mereka tidak dapat mencapai kesepakatan karena mereka duduk di sel yang berbeda. Konflik kepentingan pribadi mereka dalam perjuangan untuk kepentingan bersama juga terlihat jelas. Setiap tahanan memiliki dua opsi untuk tindakan dan 4 opsi untuk hasil.

Rantai Inferensi

Jadi, penjahat A sedang mempertimbangkan opsi-opsi berikut:

  1. Saya diam dan pasangan saya diam - kami berdua akan menerima 1 tahun penjara.

  2. Saya memberi pasangan saya dan dia memberi saya - kita berdua mendapatkan 2, 5 tahun penjara.

  3. Saya diam, dan pasangan saya menyerahkan saya - saya akan menerima 5 tahun penjara, dan dia akan bebas.

  4. Saya menyewa pasangan saya, dan dia diam - saya mendapatkan kebebasan, dan dia 5 tahun penjara.

Kami memberikan matriks kemungkinan solusi dan hasil untuk kejelasan.

Tabel kemungkinan hasil dari dilema tahanan.

Image

Pertanyaannya adalah apa yang akan dipilih masing-masing peserta?

"Diam, kamu tidak bisa bicara" atau "Diam kamu tidak bisa bicara"

Untuk memahami pilihan peserta, Anda harus melalui rantai pemikirannya. Mengikuti alasan penjahat A: jika saya diam dan diam pasangan saya, kami akan mendapatkan jangka waktu minimum (1 tahun), tetapi saya tidak bisa mengetahui bagaimana dia akan berperilaku. Jika dia bersaksi melawan saya, maka lebih baik bagi saya untuk bersaksi, kalau tidak saya bisa duduk selama 5 tahun. Saya lebih suka duduk 2, 5 tahun daripada 5 tahun. Jika dia tidak mengatakan apa-apa, maka semakin saya perlu bersaksi, karena dengan cara ini saya akan mendapatkan kebebasan. Anggota B juga berdebat dengan cara yang sama.

Image

Mudah dipahami bahwa strategi dominan untuk masing-masing penjahat adalah bersaksi. Titik optimal dari permainan ini terjadi ketika kedua penjahat memberikan bukti dan menerima "hadiah" mereka - 2, 5 tahun penjara. Teori permainan Nash menyebutnya keseimbangan.

Solusi Optimal Optimal Nash

Revolusi pandangan Nashev adalah bahwa keseimbangan semacam itu tidak optimal jika kita mempertimbangkan partisipan individu dan kepentingan pribadinya. Lagi pula, opsi terbaik adalah tetap diam dan tetap bebas.

Ekuilibrium Nash adalah titik kontak, di mana setiap peserta memilih opsi yang optimal baginya hanya jika peserta lain memilih strategi tertentu.

Mempertimbangkan opsi ketika kedua penjahat diam dan masing-masing hanya menerima 1 tahun, kita dapat menyebutnya sebagai opsi Pareto-optimal. Namun, itu hanya mungkin jika para penjahat bisa menyetujui sebelumnya. Tetapi bahkan ini tidak akan menjamin hasil ini, karena godaan untuk mundur dari persuasi dan menghindari hukuman adalah besar. Kurangnya kepercayaan penuh satu sama lain dan bahaya menjadi 5 tahun memaksa seseorang untuk memilih opsi dengan pengakuan. Untuk merefleksikan fakta bahwa peserta akan mematuhi opsi dengan diam, bertindak bersama, benar-benar tidak masuk akal. Kesimpulan seperti itu dapat dibuat jika kita mempelajari ekuilibrium Nash. Contohnya hanya membuktikan itu.

Egois atau rasional

Teori keseimbangan Nash telah menghasilkan kesimpulan yang menakjubkan, menyangkal prinsip-prinsip yang ada sebelumnya. Sebagai contoh, Adam Smith menganggap perilaku masing-masing peserta sebagai benar-benar egois, yang membawa sistem ke keseimbangan. Teori ini disebut "tangan pasar yang tak terlihat."

Image

John Nash melihat bahwa jika semua peserta bertindak untuk mengejar kepentingan mereka sendiri, maka ini tidak akan menghasilkan hasil kelompok yang optimal. Mempertimbangkan bahwa pemikiran rasional melekat pada setiap partisipan, pilihan yang ditawarkan oleh strategi keseimbangan Nash lebih mungkin.

Eksperimen murni pria

Contoh nyata adalah permainan "paradoks pirang", yang, meskipun tampaknya tidak tepat, adalah ilustrasi yang menunjukkan bagaimana teori permainan Nash bekerja.

Dalam permainan ini Anda perlu membayangkan bahwa perusahaan orang-orang bebas datang ke bar. Berikutnya adalah perusahaan perempuan, salah satunya lebih disukai dari yang lain, kata seorang pirang. Bagaimana kelakuan cowok untuk mendapatkan pacar terbaik untuk diri mereka sendiri?

Image

Jadi, alasan para lelaki: jika semua orang mulai berkenalan dengan si pirang, maka kemungkinan besar dia tidak akan menemui siapa pun, maka teman-temannya tidak akan mau bertemu. Tidak ada yang mau menjadi fallback kedua. Tetapi jika para cowok memilih untuk menghindari si pirang, maka kemungkinan bagi masing-masing cowok untuk menemukan pacar yang baik di antara para gadis itu tinggi.

Situasi keseimbangan Nash tidak optimal untuk pria, karena, hanya mengejar kepentingan egois mereka, semua orang akan memilih pirang. Jelaslah bahwa hanya mengejar kepentingan diri sendiri akan sama dengan runtuhnya kepentingan kelompok. Ekuilibrium Nash berarti bahwa setiap pria bertindak demi kepentingan pribadinya sendiri, yang berhubungan dengan kepentingan seluruh kelompok. Ini bukan opsi optimal untuk semua orang secara pribadi, tetapi optimal untuk semua orang, berdasarkan strategi keberhasilan keseluruhan.

Seluruh hidup kita adalah sebuah permainan

Membuat keputusan dalam kondisi nyata sangat mirip dengan permainan ketika Anda mengharapkan perilaku rasional tertentu dari peserta lain. Dalam bisnis, dalam pekerjaan, dalam tim, di perusahaan, dan bahkan dalam hubungan dengan lawan jenis. Dari transaksi besar ke situasi kehidupan biasa, semuanya mematuhi satu hukum atau lainnya.

Image

Tentu saja, situasi permainan yang dianggap dengan penjahat dan bar hanyalah ilustrasi yang sangat bagus yang menunjukkan keseimbangan Nash. Contoh-contoh dilema seperti ini sangat sering muncul di pasar riil, dan ini terutama bekerja dalam kasus dengan dua perusahaan monopoli yang mengendalikan pasar.

Strategi campuran

Seringkali kita terlibat bukan dalam satu tetapi beberapa game sekaligus. Memilih salah satu opsi untuk satu game, dipandu oleh strategi rasional, tetapi Anda masuk ke game lain. Setelah beberapa keputusan rasional, Anda mungkin menemukan bahwa hasil Anda tidak cocok untuk Anda. Apa yang harus dilakukan

Pertimbangkan dua jenis strategi:

  • Strategi murni adalah perilaku peserta yang berasal dari pemikiran tentang kemungkinan perilaku peserta lain.

  • Strategi campuran atau strategi acak adalah pergantian strategi murni secara acak atau pilihan strategi murni dengan probabilitas tertentu. Strategi ini juga disebut acak.

Image

Mempertimbangkan perilaku ini, kita mendapatkan pandangan baru pada kesetimbangan Nash. Jika sebelumnya dikatakan bahwa pemain memilih strategi sekali, maka perilaku lain dapat dibayangkan. Kami dapat mengakui opsi bahwa pemain memilih strategi secara acak dengan probabilitas tertentu. Permainan di mana keseimbangan Nash tidak dapat ditemukan dalam strategi murni selalu memilikinya dalam campuran.

Ekuilibrium Nash dalam strategi campuran disebut kesetimbangan campuran. Ini adalah keseimbangan, di mana setiap peserta memilih frekuensi optimal untuk memilih strategi mereka, asalkan peserta lain memilih strategi mereka dengan frekuensi yang diberikan.