सांख्यिकीय नमूना आंकड़ों में अक्सर उपयोग किया जाता है। इस प्रक्रिया में, हमारा लक्ष्य जनसंख्या के बारे में कुछ निर्धारित करना है। चूंकि आबादी आम तौर पर आकार में बड़ी होती है, इसलिए हम उस आबादी के सबसेट का चयन करके एक सांख्यिकीय नमूना बनाते हैं जो पूर्व निर्धारित आकार का होता है। नमूने का अध्ययन करके हम जनसंख्या के बारे में कुछ निर्धारित करने के लिए हीन सांख्यिकी का उपयोग कर सकते हैं।
आकार का एक सांख्यिकीय नमूना n का एक समूह शामिल है n ऐसे व्यक्ति या विषय जिन्हें जनसंख्या से यादृच्छिक रूप से चुना गया है। एक सांख्यिकीय नमूने की अवधारणा से निकटता एक नमूना वितरण है।
नमूना वितरण की उत्पत्ति
नमूना वितरण तब होता है जब हम एक से अधिक बनते हैं सरल यादृच्छिक नमूना किसी दिए गए जनसंख्या से समान आकार का। इन नमूनों को एक दूसरे से स्वतंत्र माना जाता है। इसलिए यदि कोई व्यक्ति एक नमूने में है, तो उसे अगले नमूने में होने की संभावना है।
हम प्रत्येक नमूने के लिए एक विशेष सांख्यिकीय की गणना करते हैं। यह एक नमूना हो सकता है मतलब, एक नमूना विचरण या एक नमूना अनुपात। चूँकि एक आँकड़ा हमारे पास मौजूद नमूने पर निर्भर करता है, इसलिए प्रत्येक नमूना आम तौर पर ब्याज के आँकड़ों के लिए एक अलग मूल्य पैदा करेगा। जिन मूल्यों का उत्पादन किया गया है, वह श्रेणी हमें हमारे नमूना वितरण को प्रदान करती है।
मतलब के लिए नमूना वितरण
उदाहरण के लिए, हम माध्य के लिए नमूना वितरण पर विचार करेंगे। आबादी का मतलब एक पैरामीटर है जो आमतौर पर अज्ञात है। यदि हम आकार 100 के नमूने का चयन करते हैं, तो इस नमूने का अर्थ आसानी से सभी मूल्यों को एक साथ जोड़कर और फिर इस मामले में, कुल डेटा बिंदुओं की संख्या से विभाजित करके 100 है। आकार 100 का एक नमूना हमें 50 का मतलब दे सकता है। इस तरह के एक अन्य नमूने का मतलब 49 हो सकता है। एक और 51 और दूसरा नमूना 50.5 का हो सकता है।
इन नमूने के वितरण का मतलब है कि हमें एक नमूना वितरण प्रदान करना है। हम केवल चार नमूना साधनों से अधिक पर विचार करना चाहेंगे जैसा कि हमने ऊपर किया है। कई और नमूने के साथ इसका मतलब है कि हमारे पास नमूना वितरण के आकार का एक अच्छा विचार होगा।
हम क्यों परवाह करते हैं?
नमूना वितरण काफी सार और सैद्धांतिक लग सकता है। हालांकि, इनका उपयोग करने से कुछ बहुत महत्वपूर्ण परिणाम हैं। मुख्य लाभों में से एक यह है कि हम आंकड़ों में मौजूद परिवर्तनशीलता को समाप्त करते हैं।
उदाहरण के लिए, मान लें कि हम and और of के मानक विचलन के साथ जनसंख्या के साथ शुरू करते हैं। मानक विचलन हमें माप देता है कि वितरण कितना फैला हुआ है। हम इसकी तुलना आकार के सरल यादृच्छिक नमूने बनाकर प्राप्त एक नमूना वितरण से करेंगे n. माध्य के नमूने वितरण में अभी भी μ का माध्य होगा, लेकिन मानक विचलन अलग है। नमूना वितरण के लिए मानक विचलन dev / a हो जाता है n.
इस प्रकार हमारे पास निम्नलिखित हैं
- 4 का एक नमूना आकार हमें 2/2 के मानक विचलन के साथ एक नमूना वितरण की अनुमति देता है।
- 9 का एक नमूना आकार हमें 3/3 के मानक विचलन के साथ एक नमूना वितरण की अनुमति देता है।
- 25 का एक नमूना आकार हमें 5/5 के मानक विचलन के साथ एक नमूना वितरण की अनुमति देता है।
- 100 का एक नमूना आकार हमें 10/10 के मानक विचलन के साथ एक नमूना वितरण की अनुमति देता है।
प्रयोग में
आंकड़ों के अभ्यास में, हम शायद ही कभी नमूना वितरण का निर्माण करते हैं। इसके बजाय, हम आकार के एक साधारण यादृच्छिक नमूने से प्राप्त आँकड़ों का इलाज करते हैं n मानो वे एक समान नमूना वितरण के साथ एक बिंदु हैं। यह फिर से जोर देता है कि हम अपेक्षाकृत बड़े नमूना आकार क्यों चाहते हैं। नमूना आकार जितना बड़ा होगा, उतना कम बदलाव जो हम अपने आंकड़े में प्राप्त करेंगे।
ध्यान दें, केंद्र और प्रसार के अलावा, हम अपने नमूना वितरण के आकार के बारे में कुछ भी कहने में असमर्थ हैं। यह पता चला है कि कुछ व्यापक परिस्थितियों में, केंद्रीय सीमा प्रमेय एक नमूना वितरण के आकार के बारे में हमें काफी आश्चर्यजनक कुछ बताने के लिए लागू किया जा सकता है।