खेल में ही, दंड (और पुरस्कार, जहां प्रासंगिक) द्वारा प्रतिनिधित्व किया जाता है उपयोगिता संख्या। सकारात्मक संख्याएं अच्छे परिणामों का प्रतिनिधित्व करती हैं, नकारात्मक संख्या बुरे परिणामों का प्रतिनिधित्व करती हैं, और एक परिणाम दूसरे से बेहतर है यदि इससे जुड़ी संख्या अधिक है। (सावधान रहें, हालांकि, नकारात्मक संख्याओं के लिए यह कैसे काम करता है, क्योंकि -5, उदाहरण के लिए, -20 से अधिक है!)
ऊपर दी गई तालिका में, प्रत्येक बॉक्स में पहला नंबर खिलाड़ी 1 के परिणाम को दर्शाता है और दूसरा नंबर खिलाड़ी 2 के परिणाम को दर्शाता है। ये संख्याएँ संख्याओं के कई सेटों में से एक का प्रतिनिधित्व करती हैं जो कैदियों की दुविधा के अनुरूप हैं।
एक बार एक खेल को परिभाषित करने के बाद, खेल का विश्लेषण करने में अगला कदम खिलाड़ियों की रणनीतियों का आकलन करना है और यह समझने की कोशिश करना है कि खिलाड़ियों के व्यवहार की संभावना कैसे है। अर्थशास्त्री कुछ विश्लेषण करते हैं जब वे खेल का विश्लेषण करते हैं- पहले, वे मानते हैं कि दोनों खिलाड़ियों के बारे में पता है अपने और दूसरे खिलाड़ी के लिए, और दूसरा, वे दोनों खिलाड़ियों को देख रहे हैं सेवा तर्क से खेल से अपने स्वयं के भुगतान को अधिकतम करें।
एक आसान प्रारंभिक दृष्टिकोण यह है कि क्या कहा जाता है प्रमुख रणनीतियाँ- ऐसी रणनीतियाँ जो किसी अन्य खिलाड़ी द्वारा चुनी गई रणनीति की परवाह किए बिना सर्वश्रेष्ठ हैं। उपरोक्त उदाहरण में, कबूल करना दोनों खिलाड़ियों के लिए एक प्रमुख रणनीति है:
यह देखते हुए कि कबूल करना दोनों खिलाड़ियों के लिए सबसे अच्छा है, यह आश्चर्य की बात नहीं है कि दोनों खिलाड़ी कबूल करते हैं कि खेल का संतुलन परिणाम है। उस ने कहा, हमारी परिभाषा के साथ थोड़ा और सटीक होना महत्वपूर्ण है।
की अवधारणा नैश संतुलन गणितज्ञ और खेल सिद्धांतकार जॉन नैश द्वारा संहिताबद्ध किया गया था। सीधे शब्दों में कहें, नैश इक्विलिब्रियम सर्वश्रेष्ठ-प्रतिक्रिया रणनीतियों का एक सेट है। दो खिलाड़ियों के खेल के लिए, नैश संतुलन एक परिणाम है जहां खिलाड़ी 2 की रणनीति खिलाड़ी 1 की रणनीति के लिए सबसे अच्छी प्रतिक्रिया है और खिलाड़ी 1 की रणनीति खिलाड़ी 2 की रणनीति के लिए सबसे अच्छी प्रतिक्रिया है।
इस सिद्धांत के माध्यम से नैश संतुलन का पता लगाना परिणामों की तालिका में चित्रित किया जा सकता है। इस उदाहरण में, खिलाड़ी 2 के खिलाड़ी के लिए सबसे अच्छी प्रतिक्रियाएं हरे रंग की हैं। अगर खिलाड़ी 1 कबूल करता है, तो खिलाड़ी 2 की सबसे अच्छी प्रतिक्रिया कबूल करना है, क्योंकि -6 बेहतर है -10 से। यदि खिलाड़ी 1 कबूल नहीं करता है, तो खिलाड़ी 2 की सर्वश्रेष्ठ प्रतिक्रिया कबूल करना है, क्योंकि 0 -1 से बेहतर है। (ध्यान दें कि यह तर्क काफी हद तक प्रभावी रणनीतियों की पहचान करने के लिए इस्तेमाल किए जाने वाले तर्क के समान है।)
प्लेयर 1 की सर्वश्रेष्ठ प्रतिक्रियाओं को नीले रंग में परिचालित किया जाता है। यदि खिलाड़ी 2 कबूल करता है, तो खिलाड़ी 1 की सर्वश्रेष्ठ प्रतिक्रिया कबूल करना है, क्योंकि -6 बेहतर है -10 से। यदि खिलाड़ी 2 कबूल नहीं करता है, तो खिलाड़ी 1 की सर्वश्रेष्ठ प्रतिक्रिया कबूल करना है, क्योंकि 0 -1 से बेहतर है।
नैश संतुलन एक ऐसा परिणाम है जहां एक हरा वृत्त और नीला वृत्त दोनों है क्योंकि यह दोनों खिलाड़ियों के लिए सर्वोत्तम प्रतिक्रिया रणनीतियों का एक समूह है। सामान्य तौर पर, कई नैश संतुलन या कोई भी नहीं होना संभव है (कम से कम शुद्ध रणनीतियों में जैसा कि यहां वर्णित है)।
आपने देखा होगा कि इस उदाहरण में नैश सन्तुलन एक तरह से सबप्टिमल लगता है (विशेष रूप से, इसमें पारेटो इष्टतम नहीं है) क्योंकि दोनों खिलाड़ियों के लिए यह संभव है -1 इसके बजाय -6। यह खेल में मौजूद बातचीत का एक स्वाभाविक परिणाम है- सिद्धांत रूप में, कबूल न करना एक होगा सामूहिक रूप से समूह के लिए इष्टतम रणनीति, लेकिन व्यक्तिगत प्रोत्साहन इस परिणाम को होने से रोकते हैं हासिल। उदाहरण के लिए, यदि खिलाड़ी 1 ने सोचा कि खिलाड़ी 2 चुप रहेगा, तो उसके पास चुप रहने के बजाय उसे बाहर निकालने के लिए एक प्रोत्साहन होगा, और इसके विपरीत।
इस कारण से, नैश संतुलन को एक परिणाम के रूप में भी माना जा सकता है, जहां किसी भी खिलाड़ी को एकतरफा (यानी खुद से) प्रोत्साहन नहीं मिलता है, जो उस परिणाम के लिए बनाई गई रणनीति से विचलित होता है। ऊपर दिए गए उदाहरण में, एक बार खिलाड़ी कबूल करना चुनते हैं, तो न तो खिलाड़ी अपने मन को बदलकर बेहतर कर सकते हैं।