मानक विचलन का अनुमान कैसे करें (SD)

मानक विचलन और सीमा दोनों के उपाय हैं एक डेटा सेट का प्रसार. प्रत्येक संख्या हमें अपने तरीके से बताती है कि डेटा कितने हैं, क्योंकि वे दोनों भिन्नता के मापक हैं। हालांकि, के बीच एक स्पष्ट संबंध नहीं है रेंज और मानक विचलन, वहां एक है अंगूठे का नियम जो इन दो आंकड़ों से संबंधित हो सकता है। इस संबंध को कभी-कभी मानक विचलन के लिए सीमा नियम के रूप में जाना जाता है।

रेंज नियम हमें बताता है कि एक नमूना का मानक विचलन लगभग डेटा की सीमा के एक-चौथाई के बराबर है। दूसरे शब्दों मेंरों = (अधिकतम - न्यूनतम) / 4. यह उपयोग करने के लिए एक बहुत ही सीधा सूत्र है, और इसे केवल बहुत ही मोटे रूप में इस्तेमाल किया जाना चाहिए मानक विचलन का अनुमान.

एक उदाहरण

रेंज नियम कैसे काम करता है, इसका एक उदाहरण देखने के लिए, हम निम्नलिखित उदाहरण को देखेंगे। मान लें कि हम 12, 12, 14, 15, 16, 18, 18, 20, 20, 25 के डेटा मूल्यों के साथ शुरू करते हैं। इन मूल्यों में ए मतलब 17 और मानक 4.1 का विचलन। यदि इसके बजाय हम पहली बार 25 के रूप में अपने डेटा की सीमा की गणना करते हैं - 12 = 13 और फिर इस संख्या को चार से विभाजित करें हमारे पास मानक विचलन का अनुमान 13/4 = 3.25 है। यह संख्या सही मानक विचलन के करीब है और मोटे अनुमान के लिए अच्छा है।

instagram viewer

क्यों काम करता है?

ऐसा लग सकता है कि रेंज का नियम थोड़ा अजीब है। यह काम क्यों करता है? क्या यह पूरी तरह से मनमाने ढंग से नहीं लगता है कि यह सीमा को चार से विभाजित करना है? हम एक अलग संख्या से क्यों विभाजित नहीं करेंगे? वास्तव में पर्दे के पीछे कुछ गणितीय औचित्य चल रहा है।

के गुणों को याद करते हैं घंटीनुमा वक्राकार रेखा और एक से संभावनाओं मानक सामान्य वितरण. एक विशेषता को उन डेटा की मात्रा के साथ करना है जो एक निश्चित संख्या में मानक विचलन के भीतर आते हैं:

लगभग 68% डेटा औसत से एक मानक विचलन (उच्च या निम्न) के भीतर है।
लगभग 95% डेटा औसत से दो मानक विचलन (उच्च या निम्न) के भीतर है।
लगभग 99% औसत से तीन मानक विचलन (उच्च या निम्न) के भीतर है।

संख्या है कि हम उपयोग करेंगे 95% के साथ क्या करना है। हम कह सकते हैं कि औसत से दो मानक विचलन से नीचे दो मानक विचलन से 95%, हमारे पास 95% डेटा है। इस प्रकार हमारे लगभग सभी सामान्य वितरण एक सेगमेंट खंड पर फैल जाएंगे जो कि कुल चार मानक विचलन हैं।

सभी डेटा सामान्य रूप से वितरित नहीं होते हैं और घंटी वक्र के आकार के होते हैं। लेकिन अधिकांश डेटा को अच्छी तरह से व्यवहार किया जाता है कि दो मानक विचलन से दूर जाने से लगभग सभी डेटा कैप्चर होता है। हम अनुमान लगाते हैं और कहते हैं कि चार मानक विचलन लगभग सीमा के आकार के होते हैं, और इसलिए चार से विभाजित की गई सीमा मानक विचलन का लगभग अनुमान है।

रेंज नियम के लिए उपयोग करता है

सीमा नियम कई सेटिंग्स में सहायक है। सबसे पहले, यह मानक विचलन का एक बहुत ही त्वरित अनुमान है। मानक विचलन के लिए हमें पहले माध्य की आवश्यकता होती है, फिर इस माध्य को प्रत्येक डेटा बिंदु, वर्ग से घटाते हैं अंतर, इन्हें जोड़ते हैं, डेटा बिंदुओं की संख्या से एक से कम विभाजित करते हैं, फिर (अंत में) वर्ग लेते हैं जड़। दूसरी ओर, सीमा नियम में केवल एक घटाव और एक विभाजन की आवश्यकता होती है।

अन्य स्थान जहां रेंज नियम सहायक है, जब हमारे पास अधूरी जानकारी होती है। फ़ार्मुलों जैसे कि नमूना आकार निर्धारित करने के लिए तीन टुकड़ों की जानकारी की आवश्यकता होती है: वांछित गलती की सम्भावना, को आत्मविश्वास का स्तर और जिस आबादी की हम जांच कर रहे हैं, उसका मानक विचलन है। कई बार यह जानना असंभव है कि जनसंख्या क्या है मानक विचलन है। सीमा नियम के साथ, हम इस आंकड़े का अनुमान लगा सकते हैं, और फिर जान सकते हैं कि हमें अपना नमूना कितना बड़ा बनाना चाहिए।