कैदियों की दुविधा क्या है?

खेल में ही, दंड (और पुरस्कार, जहां प्रासंगिक) द्वारा प्रतिनिधित्व किया जाता है उपयोगिता संख्या। सकारात्मक संख्याएं अच्छे परिणामों का प्रतिनिधित्व करती हैं, नकारात्मक संख्या बुरे परिणामों का प्रतिनिधित्व करती हैं, और एक परिणाम दूसरे से बेहतर है यदि इससे जुड़ी संख्या अधिक है। (सावधान रहें, हालांकि, नकारात्मक संख्याओं के लिए यह कैसे काम करता है, क्योंकि -5, उदाहरण के लिए, -20 से अधिक है!)

ऊपर दी गई तालिका में, प्रत्येक बॉक्स में पहला नंबर खिलाड़ी 1 के परिणाम को दर्शाता है और दूसरा नंबर खिलाड़ी 2 के परिणाम को दर्शाता है। ये संख्याएँ संख्याओं के कई सेटों में से एक का प्रतिनिधित्व करती हैं जो कैदियों की दुविधा के अनुरूप हैं।

एक बार एक खेल को परिभाषित करने के बाद, खेल का विश्लेषण करने में अगला कदम खिलाड़ियों की रणनीतियों का आकलन करना है और यह समझने की कोशिश करना है कि खिलाड़ियों के व्यवहार की संभावना कैसे है। अर्थशास्त्री कुछ विश्लेषण करते हैं जब वे खेल का विश्लेषण करते हैं- पहले, वे मानते हैं कि दोनों खिलाड़ियों के बारे में पता है अपने और दूसरे खिलाड़ी के लिए, और दूसरा, वे दोनों खिलाड़ियों को देख रहे हैं सेवा तर्क से खेल से अपने स्वयं के भुगतान को अधिकतम करें।

instagram viewer

एक आसान प्रारंभिक दृष्टिकोण यह है कि क्या कहा जाता है प्रमुख रणनीतियाँ- ऐसी रणनीतियाँ जो किसी अन्य खिलाड़ी द्वारा चुनी गई रणनीति की परवाह किए बिना सर्वश्रेष्ठ हैं। उपरोक्त उदाहरण में, कबूल करना दोनों खिलाड़ियों के लिए एक प्रमुख रणनीति है:

यह देखते हुए कि कबूल करना दोनों खिलाड़ियों के लिए सबसे अच्छा है, यह आश्चर्य की बात नहीं है कि दोनों खिलाड़ी कबूल करते हैं कि खेल का संतुलन परिणाम है। उस ने कहा, हमारी परिभाषा के साथ थोड़ा और सटीक होना महत्वपूर्ण है।

की अवधारणा नैश संतुलन गणितज्ञ और खेल सिद्धांतकार जॉन नैश द्वारा संहिताबद्ध किया गया था। सीधे शब्दों में कहें, नैश इक्विलिब्रियम सर्वश्रेष्ठ-प्रतिक्रिया रणनीतियों का एक सेट है। दो खिलाड़ियों के खेल के लिए, नैश संतुलन एक परिणाम है जहां खिलाड़ी 2 की रणनीति खिलाड़ी 1 की रणनीति के लिए सबसे अच्छी प्रतिक्रिया है और खिलाड़ी 1 की रणनीति खिलाड़ी 2 की रणनीति के लिए सबसे अच्छी प्रतिक्रिया है।

इस सिद्धांत के माध्यम से नैश संतुलन का पता लगाना परिणामों की तालिका में चित्रित किया जा सकता है। इस उदाहरण में, खिलाड़ी 2 के खिलाड़ी के लिए सबसे अच्छी प्रतिक्रियाएं हरे रंग की हैं। अगर खिलाड़ी 1 कबूल करता है, तो खिलाड़ी 2 की सबसे अच्छी प्रतिक्रिया कबूल करना है, क्योंकि -6 बेहतर है -10 से। यदि खिलाड़ी 1 कबूल नहीं करता है, तो खिलाड़ी 2 की सर्वश्रेष्ठ प्रतिक्रिया कबूल करना है, क्योंकि 0 -1 से बेहतर है। (ध्यान दें कि यह तर्क काफी हद तक प्रभावी रणनीतियों की पहचान करने के लिए इस्तेमाल किए जाने वाले तर्क के समान है।)

प्लेयर 1 की सर्वश्रेष्ठ प्रतिक्रियाओं को नीले रंग में परिचालित किया जाता है। यदि खिलाड़ी 2 कबूल करता है, तो खिलाड़ी 1 की सर्वश्रेष्ठ प्रतिक्रिया कबूल करना है, क्योंकि -6 बेहतर है -10 से। यदि खिलाड़ी 2 कबूल नहीं करता है, तो खिलाड़ी 1 की सर्वश्रेष्ठ प्रतिक्रिया कबूल करना है, क्योंकि 0 -1 से बेहतर है।

नैश संतुलन एक ऐसा परिणाम है जहां एक हरा वृत्त और नीला वृत्त दोनों है क्योंकि यह दोनों खिलाड़ियों के लिए सर्वोत्तम प्रतिक्रिया रणनीतियों का एक समूह है। सामान्य तौर पर, कई नैश संतुलन या कोई भी नहीं होना संभव है (कम से कम शुद्ध रणनीतियों में जैसा कि यहां वर्णित है)।

आपने देखा होगा कि इस उदाहरण में नैश सन्तुलन एक तरह से सबप्टिमल लगता है (विशेष रूप से, इसमें पारेटो इष्टतम नहीं है) क्योंकि दोनों खिलाड़ियों के लिए यह संभव है -1 इसके बजाय -6। यह खेल में मौजूद बातचीत का एक स्वाभाविक परिणाम है- सिद्धांत रूप में, कबूल न करना एक होगा सामूहिक रूप से समूह के लिए इष्टतम रणनीति, लेकिन व्यक्तिगत प्रोत्साहन इस परिणाम को होने से रोकते हैं हासिल। उदाहरण के लिए, यदि खिलाड़ी 1 ने सोचा कि खिलाड़ी 2 चुप रहेगा, तो उसके पास चुप रहने के बजाय उसे बाहर निकालने के लिए एक प्रोत्साहन होगा, और इसके विपरीत।

इस कारण से, नैश संतुलन को एक परिणाम के रूप में भी माना जा सकता है, जहां किसी भी खिलाड़ी को एकतरफा (यानी खुद से) प्रोत्साहन नहीं मिलता है, जो उस परिणाम के लिए बनाई गई रणनीति से विचलित होता है। ऊपर दिए गए उदाहरण में, एक बार खिलाड़ी कबूल करना चुनते हैं, तो न तो खिलाड़ी अपने मन को बदलकर बेहतर कर सकते हैं।

instagram story viewer