कई बार शोधकर्ता उन सवालों के जवाब जानना चाहते हैं जो दायरे में बड़े हैं। उदाहरण के लिए:
- कल रात टेलीविजन पर एक विशेष देश में सभी ने क्या देखा?
- एक मतदाता कौन है वोट देने का इरादा है आगामी चुनाव में?
- एक निश्चित स्थान पर कितने पक्षी प्रवास से लौटते हैं?
- कितने प्रतिशत कार्यबल बेरोजगार है?
इस प्रकार के प्रश्न इस अर्थ में विशाल हैं कि हमें लाखों व्यक्तियों पर नज़र रखने की आवश्यकता है।
सांख्यिकी नमूनाकरण नामक तकनीक का उपयोग करके इन समस्याओं को सरल बनाती है। एक सांख्यिकीय नमूने का संचालन करके, हमारे कार्यभार में भारी कटौती की जा सकती है। अरबों या लाखों लोगों के व्यवहार पर नज़र रखने के बजाय, हमें केवल उन हजारों या सैकड़ों की जांच करने की आवश्यकता है। जैसा कि हम देखेंगे, यह सरलीकरण एक मूल्य पर आता है।
आबादी और सेंसरशिप
एक सांख्यिकीय अध्ययन की जनसंख्या वह है जिसके बारे में हम कुछ जानने की कोशिश कर रहे हैं। इसमें वे सभी व्यक्ति शामिल हैं जिनकी जांच की जा रही है। जनसंख्या वास्तव में कुछ भी हो सकती है। कैलिफ़ोर्निया, कैरिबस, कंप्यूटर, कार या काउंटियों को सभी सांख्यिकीय माना जा सकता है, जो सांख्यिकीय प्रश्न पर निर्भर करता है। हालांकि शोध की जा रही अधिकांश आबादी बड़ी है, लेकिन जरूरी नहीं कि वे भी हों।
जनसंख्या पर शोध करने की एक रणनीति जनगणना करना है। एक जनगणना में, हम अपने अध्ययन में आबादी के प्रत्येक सदस्य की जांच करते हैं। इसका एक प्रमुख उदाहरण है अमेरिकी जनगणना. हर दस साल में जनगणना ब्यूरो देश में सभी के लिए एक प्रश्नावली भेजता है। जो लोग फॉर्म नहीं लौटाते हैं, उन्हें जनगणना कार्यकर्ताओं द्वारा देखा जाता है
सेंसरशिप कठिनाइयों से भरा है। वे आमतौर पर समय और संसाधनों के मामले में महंगे हैं। इसके अतिरिक्त, इस बात की गारंटी देना मुश्किल है कि आबादी में सभी लोग पहुँच चुके हैं। जनगणना करने के लिए अन्य आबादी और भी मुश्किल है। अगर हम न्यूयॉर्क राज्य में आवारा कुत्तों की आदतों का अध्ययन करना चाहते हैं, तो सौभाग्य की बात है सब उन क्षणिक कैनाइनों की।
नमूने
चूंकि जनसंख्या के प्रत्येक सदस्य को ट्रैक करने के लिए सामान्य रूप से असंभव या अव्यवहारिक है, इसलिए उपलब्ध अगला विकल्प जनसंख्या का नमूना है। एक नमूना आबादी का कोई सबसेट है, इसलिए इसका आकार छोटा या बड़ा हो सकता है। हम चाहते हैं कि एक छोटा सा नमूना हमारी कंप्यूटिंग शक्ति द्वारा प्रबंधनीय हो, फिर भी हमें सांख्यिकीय रूप से महत्वपूर्ण परिणाम देने के लिए पर्याप्त है।
यदि कोई पोलिंग फर्म कांग्रेस और उसके साथ मतदाता संतुष्टि का निर्धारण करने की कोशिश कर रही है नमूने का आकार एक है, तो परिणाम अर्थहीन होने वाले हैं (लेकिन प्राप्त करना आसान है)। दूसरी ओर, लाखों लोगों से पूछना बहुत सारे संसाधनों का उपभोग करने वाला है। एक संतुलन बनाने के लिए, इस प्रकार के सर्वेक्षणों में आमतौर पर लगभग 1000 के नमूने आकार होते हैं।
यादृच्छिक नमूने
लेकिन अच्छे परिणाम सुनिश्चित करने के लिए सही नमूना आकार का होना पर्याप्त नहीं है। हम एक नमूना चाहते हैं जो जनसंख्या का प्रतिनिधि है। मान लीजिए कि हम यह पता लगाना चाहते हैं कि अमेरिकी औसतन कितनी किताबें सालाना पढ़ता है। हम 2000 कॉलेज के छात्रों से पूछते हैं कि वे साल भर में क्या पढ़ते हैं, इस पर नज़र रखें, फिर एक साल बीत जाने के बाद उनके साथ वापस जाएँ। हम पाते हैं कि पढ़ी जाने वाली पुस्तकों की औसत संख्या 12 है, और फिर यह निष्कर्ष निकालते हैं कि औसत अमेरिकी एक वर्ष में 12 किताबें पढ़ता है।
इस परिदृश्य की समस्या नमूने के साथ है। कॉलेज के अधिकांश छात्र 18-25 वर्ष के बीच के हैं और उनके प्रशिक्षकों द्वारा पाठ्य पुस्तकों और उपन्यासों को पढ़ना आवश्यक है। यह औसत अमेरिकी का खराब प्रतिनिधित्व है। एक अच्छे नमूने में विभिन्न उम्र के लोग शामिल होंगे, जीवन के सभी क्षेत्रों से और देश के विभिन्न क्षेत्रों से। इस तरह के नमूने को प्राप्त करने के लिए हमें इसे यादृच्छिक रूप से रचना करने की आवश्यकता होगी ताकि प्रत्येक अमेरिकी के नमूने में होने की समान संभावना हो।
नमूने के प्रकार
सांख्यिकीय प्रयोगों का स्वर्ण मानक है सरल यादृच्छिक नमूना. ऐसे में आकार का एक नमूना n व्यक्तियों, जनसंख्या के प्रत्येक सदस्य के नमूने के लिए चुने जाने की समान संभावना है, और प्रत्येक समूह n व्यक्तियों के चुने जाने की संभावना समान है। जनसंख्या का नमूना लेने के कई तरीके हैं। कुछ सबसे आम हैं:
- यादृच्छिक नमूना
- सरल यादृच्छिक नमूना
- स्वैच्छिक प्रतिक्रिया नमूना
- सुविधा का नमूना
- व्यवस्थित नमूना
- क्लस्टर नमूना
- स्तरीकृत नमूना
सलाह के कुछ शब्द
जैसा कि कहा जाता है, "अच्छी तरह से शुरू हुआ आधा काम हो गया है।" यह सुनिश्चित करने के लिए कि हमारे सांख्यिकीय अध्ययन और प्रयोगों के अच्छे परिणाम हैं, हमें योजना बनाने और उन्हें सावधानीपूर्वक शुरू करने की आवश्यकता है। खराब सांख्यिकीय नमूनों के साथ आना आसान है। अच्छा सरल यादृच्छिक नमूने प्राप्त करने के लिए कुछ काम करने की आवश्यकता है। यदि हमारे डेटा को बेतरतीब ढंग से और एक घुड़सवार तरीके से प्राप्त किया गया है, तो कोई फर्क नहीं पड़ता कि हमारा विश्लेषण कितना परिष्कृत है, सांख्यिकीय तकनीक हमें कोई सार्थक निष्कर्ष नहीं देगी।