सांख्यिकीय डेटा सेट की सीमा

click fraud protection

सांख्यिकी और गणित में, सीमा एक डेटा सेट के अधिकतम और न्यूनतम मूल्यों के बीच का अंतर है और डेटा सेट की दो महत्वपूर्ण विशेषताओं में से एक के रूप में कार्य करता है। एक सीमा के लिए सूत्र अधिकतम मूल्य शून्य है जो कि डेटासेट में न्यूनतम मूल्य है, जो सांख्यिकीविदों को एक बेहतर समझ प्रदान करता है कि डेटा सेट कितना विविध है।

डेटा सेट की दो महत्वपूर्ण विशेषताओं में डेटा का केंद्र और डेटा का प्रसार शामिल है, और केंद्र हो सकता हैकई तरीकों से मापा जाता है: इनमें से सबसे लोकप्रिय साधन हैं, मंझला, मोड, और मिडरेंज, लेकिन एक समान फैशन में, यह गणना करने के लिए अलग-अलग तरीके हैं कि डेटा सेट को कैसे फैलाया जाता है और प्रसार का सबसे आसान और कठोर माप सीमा कहा जाता है।

रेंज की गणना बहुत सीधी है। बस हमें अपने सेट में सबसे बड़े डेटा मूल्य और सबसे छोटे डेटा मूल्य के बीच अंतर खोजना होगा। संक्षिप्त रूप से हमारे पास निम्न सूत्र हैं: रेंज = अधिकतम मूल्य-न्यूनतम मूल्य। उदाहरण के लिए, डेटा सेट 4,6,10, 15, 18 में अधिकतम 18, न्यूनतम 4 और सीमा होती है 18-4 = 14.

रेंज डेटा के प्रसार का एक बहुत क्रूड माप है क्योंकि यह आउटलेर्स के लिए बेहद संवेदनशील है, और परिणामस्वरूप, कुछ निश्चित हैं सांख्यिकीविदों के लिए निर्धारित डेटा की एक सच्ची श्रेणी की उपयोगिता की सीमाएं क्योंकि एक एकल डेटा मान के मूल्य को बहुत प्रभावित कर सकता है रेंज।

instagram viewer

उदाहरण के लिए, डेटा 1, 2, 3, 4, 6, 7, 7, 8 के सेट पर विचार करें। अधिकतम मूल्य 8 है, न्यूनतम 1 है और सीमा 7 है। फिर डेटा के एक ही सेट पर विचार करें, जिसमें केवल 100 मूल्य शामिल हैं। सीमा अब बन जाती है 100-1 = 99 जिसमें एक अतिरिक्त डेटा बिंदु के अलावा सीमा के मूल्य को बहुत प्रभावित करता है। मानक विचलन प्रसार का एक और उपाय है जो आउटलेर्स के लिए कम संवेदनशील है, लेकिन दोष यह है कि ए मानक विचलन की गणना बहुत अधिक जटिल है।

सीमा हमें अपने डेटा सेट की आंतरिक विशेषताओं के बारे में कुछ भी नहीं बताती है। उदाहरण के लिए, हम 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 के डेटा सेट पर विचार करते हैं, जहां इस डेटा सेट की सीमा होती है। 10-1 = 9. अगर हम इसकी तुलना 1, 1, 1, 2, 9, 9, 9, 10 के डेटा सेट से करते हैं। यहाँ सीमा है, फिर भी, नौ, हालांकि, इस दूसरे सेट के लिए और पहले सेट के विपरीत, डेटा न्यूनतम और अधिकतम के आसपास क्लस्टर किया गया है। इस तरह के कुछ आंतरिक ढांचे का पता लगाने के लिए पहले और तीसरे चतुर्थक जैसे अन्य आंकड़ों का उपयोग करने की आवश्यकता होगी।

सीमा एक बहुत अच्छा तरीका है कि डेटा सेट में संख्याओं के प्रसार की बहुत बुनियादी समझ वास्तव में है क्योंकि यह करना आसान है गणना करें क्योंकि इसमें केवल एक बुनियादी अंकगणितीय ऑपरेशन की आवश्यकता होती है, लेकिन इसमें निर्धारित डेटा की सीमा के कुछ अन्य अनुप्रयोग भी होते हैं आंकड़े।

रेंज का उपयोग प्रसार के एक और उपाय, मानक विचलन का अनुमान लगाने के लिए भी किया जा सकता है। मानक विचलन को खोजने के लिए एक काफी जटिल सूत्र के माध्यम से जाने के बजाय, हम इसके बजाय इसका उपयोग कर सकते हैं जिसे कहा जाता है सीमा नियम. इस गणना में सीमा मौलिक है।

सीमा भी एक में होती है बॉक्स प्लॉट, या बॉक्स और मूंछ की साजिश। अधिकतम और न्यूनतम मान दोनों ग्राफ के मूंछ के अंत में चित्रित किए जाते हैं और मूंछ और बॉक्स की कुल लंबाई सीमा के बराबर होती है।

instagram story viewer