चेबीशेव की असमानता का कहना है कि कम से कम 1-1 /क2 एक नमूना से डेटा के भीतर गिर चाहिए क मतलब से मानक विचलन (यहाँ) क क्या कोई सकारात्मक है वास्तविक संख्या एक से अधिक)।
कोई भी डेटा सेट जो आम तौर पर वितरित किया जाता है, या एक के आकार में घंटीनुमा वक्राकार रेखा, कई विशेषताएं हैं। उनमें से एक माध्य से मानक विचलन की संख्या के सापेक्ष डेटा के प्रसार से संबंधित है। एक सामान्य वितरण में, हम जानते हैं कि 68% डेटा औसत से एक मानक विचलन है, 95% दो है मतलब से मानक विचलन, और लगभग 99% मतलब से तीन मानक विचलन के भीतर है।
लेकिन अगर डेटा सेट को घंटी की वक्र के आकार में वितरित नहीं किया जाता है, तो एक अलग मात्रा एक मानक विचलन के भीतर हो सकती है। Chebyshev की असमानता यह जानने का एक तरीका प्रदान करती है कि डेटा का कौन सा अंश भीतर आता है क के लिए माध्य से मानक विचलन कोई भी डेटा सेट।
असमानता के बारे में तथ्य
हम "नमूने से डेटा" के साथ वाक्यांश को प्रतिस्थापित करके ऊपर असमानता भी बता सकते हैं संभावना वितरण. ऐसा इसलिए है क्योंकि चेबिशेव की असमानता संभाव्यता का एक परिणाम है, जिसे तब आँकड़ों पर लागू किया जा सकता है।
यह ध्यान रखना महत्वपूर्ण है कि यह असमानता एक परिणाम है जो गणितीय रूप से सिद्ध हुई है। यह ऐसा नहीं है
अनुभवजन्य संबंध माध्य और मोड के बीच, या अंगूठे का नियम यह सीमा और मानक विचलन को जोड़ता है।असमानता का चित्रण
असमानता को स्पष्ट करने के लिए, हम इसे कुछ मूल्यों के लिए देखेंगे क:
- के लिये क = 2 हमारे पास 1 - 1 / हैक2 = 1 - 1/4 = 3/4 = 75%. तो चेबीशेव की असमानता कहती है कि किसी भी वितरण के डेटा मान का कम से कम 75% मतलब के दो मानक विचलन के भीतर होना चाहिए।
- के लिये क = 3 हमारे पास 1 - 1 / हैक2 = 1 - 1/9 = 8/9 = 89%. तो चेबेशेव की असमानता कहती है कि किसी भी वितरण के डेटा मान का कम से कम 89% मतलब के तीन मानक विचलन के भीतर होना चाहिए।
- के लिये क = 4 हमारे पास 1 - 1 / हैक2 = 1 - 1/16 = 15/16 = 93.75%. तो चेबीशेव की असमानता कहती है कि किसी भी वितरण के डेटा मान का कम से कम 93.75% मतलब के दो मानक विचलन के भीतर होना चाहिए।
उदाहरण
मान लीजिए कि हमने स्थानीय पशु आश्रय में कुत्तों के वजन का नमूना लिया है और पाया है कि हमारे नमूने में 3 पाउंड के मानक विचलन के साथ 20 पाउंड का मतलब है। चेबीशेव की असमानता के उपयोग के साथ, हम जानते हैं कि हमारे द्वारा नमूना किए गए कम से कम 75% कुत्तों में वजन है जो कि दो मानक विचलन हैं। दो बार मानक विचलन हमें 2 x 3 = 6 देता है। 20 के माध्य से इसे घटाएं और जोड़ें। यह हमें बताता है कि 75% कुत्तों का वजन 14 पाउंड से 26 पाउंड तक है।
असमानता का उपयोग
यदि हम उस वितरण के बारे में अधिक जानते हैं जिसके साथ हम काम कर रहे हैं, तो हम आम तौर पर गारंटी दे सकते हैं कि अधिक डेटा एक निश्चित संख्या में मानक विचलन से दूर है। उदाहरण के लिए, यदि हम जानते हैं कि हमारा सामान्य वितरण है, तो 95% डेटा औसत से दो मानक विचलन हैं। चेबीशेव की असमानता कहती है कि इस स्थिति में हम जानते हैं कि कम से कम 75% डेटा औसत से दो मानक विचलन हैं। जैसा कि हम इस मामले में देख सकते हैं, यह इस 75% से बहुत अधिक हो सकता है।
असमानता का मूल्य यह है कि यह हमें "बदतर मामला" परिदृश्य देता है जिसमें केवल हमारे नमूना डेटा (या संभाव्यता वितरण) के बारे में हम जानते हैं कि इसका मतलब क्या है? मानक विचलन. जब हम अपने डेटा के बारे में और कुछ नहीं जानते हैं, तो Chebyshev की असमानता डेटा सेट के प्रसार के बारे में कुछ अतिरिक्त जानकारी प्रदान करता है।
असमानता का इतिहास
असमानता का नाम रूसी गणितज्ञ पफानूट चेबीशेव के नाम पर रखा गया है, जिन्होंने पहली बार 1874 में बिना प्रमाण के असमानता को बताया था। दस साल बाद मार्कोव ने अपनी पीएचडी में असमानता साबित की। निबंध। अंग्रेजी में रूसी वर्णमाला का प्रतिनिधित्व करने के तरीके में भिन्नता होने के कारण, यह चेबेशेव को टेशबाइटफ के रूप में भी जाना जाता है।