में आंकड़े, शब्द की मजबूती या मजबूती एक सांख्यिकीय मॉडल की ताकत, परीक्षण, और सांख्यिकीय विश्लेषण की विशिष्ट शर्तों के अनुसार प्रक्रियाओं को संदर्भित करता है जो एक अध्ययन को प्राप्त करने की उम्मीद करता है। यह देखते हुए कि एक अध्ययन की इन शर्तों को पूरा किया जाता है, गणितीय प्रमाणों के उपयोग के माध्यम से मॉडल को सच होने के लिए सत्यापित किया जा सकता है।
कई मॉडल आदर्श स्थितियों पर आधारित होते हैं जो वास्तविक दुनिया के डेटा के साथ काम करते समय मौजूद नहीं होते हैं, और परिणामस्वरूप, मॉडल सही परिणाम प्रदान कर सकते हैं, भले ही स्थितियां ठीक से पूरी न हों।
इसलिए, मजबूत आंकड़े किसी भी ऐसे आंकड़े हैं जो डेटा को विस्तृत श्रेणी से खींचे जाने पर अच्छा प्रदर्शन करते हैं प्रायिकता वितरण जो किसी दिए गए मॉडल मान्यताओं से आउटलेर या छोटे प्रस्थान से अप्रभावित हैं डाटासेट। दूसरे शब्दों में, एक मजबूत आंकड़ा परिणामों में त्रुटियों के लिए प्रतिरोधी है।
आमतौर पर आयोजित मजबूत सांख्यिकीय प्रक्रिया का निरीक्षण करने का एक तरीका, किसी को टी-प्रक्रियाओं से आगे नहीं देखना चाहिए, जो सबसे सटीक सांख्यिकीय भविष्यवाणियों को निर्धारित करने के लिए परिकल्पना परीक्षणों का उपयोग करते हैं।
टी-प्रक्रिया का अवलोकन करना
मजबूती के उदाहरण के लिए, हम विचार करेंगे टी-प्रक्रिया, जिसमें शामिल हैं विश्वास अंतराल एक आबादी के लिए इसका मतलब है कि अज्ञात जनसंख्या मानक विचलन के साथ-साथ आबादी के बारे में परिकल्पना परीक्षण।
का उपयोग टीप्रक्रियाएँ निम्नलिखित मानती हैं:
- हम जिस डेटा के साथ काम कर रहे हैं उसका सेट ए है सरल यादृच्छिक नमूना जनसंख्या की।
- जिस जनसंख्या से हमने नमूना लिया है, वह आम तौर पर वितरित की जाती है।
वास्तविक जीवन के उदाहरणों के साथ व्यवहार में, सांख्यिकीविदों के पास शायद ही कोई आबादी होती है जो सामान्य रूप से वितरित की जाती है, इसलिए प्रश्न इसके बजाय बन जाता है, "हम कितने अच्छे हैं टीप्रक्रियाओं? "
सामान्य स्थिति में हमारे पास एक साधारण यादृच्छिक नमूना उस स्थिति की तुलना में अधिक महत्वपूर्ण है जिसे हमने सामान्य रूप से वितरित जनसंख्या से नमूना लिया है; इसका कारण यह है कि केंद्रीय सीमा प्रमेय एक नमूना वितरण सुनिश्चित करता है जो लगभग होता है सामान्य - हमारा नमूना आकार जितना अधिक होगा, नमूने के नमूने का वितरण उतना ही निकट होगा सामान्य।
कैसे T- प्रक्रियाएँ रोबस्ट सांख्यिकी के रूप में कार्य करती हैं
के लिए इतनी मजबूती टी-प्रक्रिया नमूना आकार और हमारे नमूने के वितरण पर टिका है। इसके लिए विचार शामिल हैं:
- यदि नमूनों का आकार बड़ा है, तो इसका मतलब है कि हमारे पास 40 या अधिक अवलोकन हैं टीप्रक्रियाओं का उपयोग उन वितरणों के साथ भी किया जा सकता है जो तिरछे होते हैं।
- यदि नमूना आकार 15 और 40 के बीच है, तो हम उपयोग कर सकते हैं टीकिसी भी आकार के वितरण के लिए प्रक्रियाएं, जब तक कि आउटलेयर या उच्च स्तर का तिरछा न हो।
- यदि नमूना आकार 15 से कम है, तो हम उपयोग कर सकते हैं टी- डेटा के लिए प्रक्रियाएं जिसमें कोई आउटलेयर नहीं है, एक एकल चोटी है, और लगभग सममित हैं।
ज्यादातर मामलों में, गणितीय आंकड़ों में तकनीकी कार्य के माध्यम से मजबूती स्थापित की गई है, और, सौभाग्य से, हमें इन उन्नत गणितीय गणनाओं को ठीक से करने के लिए जरूरी नहीं है उनका उपयोग करें; हमें केवल यह समझने की आवश्यकता है कि हमारे विशिष्ट सांख्यिकीय पद्धति की मजबूती के लिए समग्र दिशानिर्देश क्या हैं।
टी-प्रक्रियाएं मजबूत आंकड़ों के रूप में कार्य करती हैं क्योंकि वे आम तौर पर प्रक्रिया को लागू करने के लिए नमूने के आकार में फैक्टरिंग करके इन मॉडलों के प्रति अच्छा प्रदर्शन करते हैं।