बूटस्ट्रैपिंग एक सांख्यिकीय तकनीक है जो पुनरुत्पादन के व्यापक शीर्ष के अंतर्गत आती है। इस तकनीक में एक अपेक्षाकृत सरल प्रक्रिया शामिल है लेकिन कई बार दोहराया जाता है कि यह कंप्यूटर गणनाओं पर बहुत अधिक निर्भर है। बूटस्ट्रैपिंग जनसंख्या पैरामीटर का अनुमान लगाने के लिए आत्मविश्वास अंतराल के अलावा एक विधि प्रदान करता है। बहुत ज्यादा बूटस्ट्रैपिंग जादू की तरह काम करता है। यह देखने के लिए पढ़ें कि यह अपने दिलचस्प नाम को कैसे प्राप्त करता है।
बूटस्ट्रैपिंग का एक स्पष्टीकरण
का एक लक्ष्य आनुमानिक आंकड़े जनसंख्या के एक पैरामीटर के मूल्य को निर्धारित करना है। यह आम तौर पर बहुत महंगा है या इसे सीधे मापना भी असंभव है। इसलिए हम उपयोग करते हैं सांख्यिकीय नमूनाकरण. हम एक जनसंख्या का नमूना लेते हैं, इस नमूने का एक आँकड़ा मापते हैं और फिर इस आँकड़ों का उपयोग कुछ के बारे में कहने के लिए करते हैं संगत पैरामीटर जनसंख्या की।
उदाहरण के लिए, एक चॉकलेट फैक्ट्री में, हम यह गारंटी देना चाहते हैं कि कैंडी बार के पास एक विशेष है मतलब वजन। यह प्रत्येक कैंडी बार का उत्पादन करने के लिए संभव नहीं है, इसलिए हम नमूना तकनीक का उपयोग करते हुए यादृच्छिक रूप से 100 कैंडी बार चुनते हैं। हम इन 100 कैंडी बार के मतलब की गणना करते हैं और कहते हैं कि जनसंख्या का मतलब हमारे नमूने का मतलब क्या है से त्रुटि के एक मार्जिन के भीतर आता है।
मान लीजिए कि कुछ महीने बाद हम अधिक सटीकता के साथ जानना चाहते हैं - या कम गलती की सम्भावना - उस दिन कैंडी बार का क्या मतलब था जिस दिन हमने उत्पादन लाइन का नमूना लिया था। हम आज की कैंडी बार का भी उपयोग नहीं कर सकते कई चर तस्वीर में प्रवेश किया है (दूध, चीनी और कोको बीन्स के विभिन्न बैचों, विभिन्न वायुमंडलीय स्थितियों, लाइन पर विभिन्न कर्मचारियों, आदि)। जिस दिन से हम उत्सुक हैं उस दिन से हम 100 वज़न के हैं। उस समय तक बिना टाइम मशीन के, यह प्रतीत होता है कि त्रुटि का प्रारंभिक मार्जिन सबसे अच्छा है जिसे हम आशा कर सकते हैं।
सौभाग्य से, हम उपयोग कर सकते हैं बूटस्ट्रैपिंग की तकनीक. इस स्थिति में, हम बेतरतीब ढंग से प्रतिस्थापन के साथ नमूना 100 ज्ञात वजन से। हम तो इसे बूटस्ट्रैप नमूना कहते हैं। चूंकि हम प्रतिस्थापन की अनुमति देते हैं, इसलिए यह बूटस्ट्रैप नमूना हमारे प्रारंभिक नमूने के समान नहीं है। कुछ डेटा बिंदुओं को डुप्लिकेट किया जा सकता है, और प्रारंभिक 100 के अन्य डेटा बिंदुओं को बूटस्ट्रैप नमूने में छोड़ा जा सकता है। कंप्यूटर की सहायता से, अपेक्षाकृत कम समय में हजारों बूटस्ट्रैप नमूनों का निर्माण किया जा सकता है।
एक उदाहरण
जैसा कि उल्लेख किया गया है, वास्तव में बूटस्ट्रैप तकनीकों का उपयोग करने के लिए हमें एक कंप्यूटर का उपयोग करने की आवश्यकता है। निम्नलिखित संख्यात्मक उदाहरण यह प्रदर्शित करने में मदद करेगा कि प्रक्रिया कैसे काम करती है। यदि हम नमूना 2, 4, 5, 6, 6 से शुरू करते हैं, तो निम्नलिखित सभी संभव बूटस्ट्रैप नमूने हैं:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
तकनीक का इतिहास
बूटस्ट्रैप तकनीक आँकड़ों के क्षेत्र में अपेक्षाकृत नई हैं। पहला उपयोग ब्रैडले एफ्रॉन द्वारा 1979 के पेपर में प्रकाशित किया गया था। जैसे-जैसे कंप्यूटिंग शक्ति बढ़ी है और कम खर्चीली हो गई है, बूटस्ट्रैप तकनीक अधिक व्यापक हो गई है।
क्यों नाम बूटस्ट्रैपिंग?
"बूटस्ट्रैपिंग" नाम वाक्यांश से आया है, "अपने बूटस्ट्रैप्स द्वारा खुद को ऊपर उठाने के लिए।" यह किसी ऐसी चीज को संदर्भित करता है जो कि पूर्ववर्ती और असंभव है। जितना संभव हो उतना कठिन प्रयास करें, आप अपने जूते पर चमड़े के टुकड़ों को बांधकर खुद को हवा में नहीं उठा सकते।
कुछ गणितीय सिद्धांत है जो बूटस्ट्रैपिंग तकनीकों को सही ठहराता है। हालाँकि, बूटस्ट्रैपिंग के उपयोग से ऐसा महसूस होता है कि आप असंभव कार्य कर रहे हैं। हालांकि ऐसा नहीं लगता है कि आप एक ही नमूने का बार-बार पुन: उपयोग करके जनसंख्या सांख्यिकी के अनुमान पर सुधार कर पाएंगे, बूटस्ट्रैपिंग, वास्तव में, ऐसा कर सकता है।