की गणना ए नमूना विचरण या मानक विचलन आम तौर पर एक अंश के रूप में कहा जाता है। इस अंश के अंश में माध्य से चुकता विचलन का योग होता है। आंकड़ों मेंवर्गों के इस कुल योग का सूत्र है
Σ (x)मैं - एक्स)2
यहाँ प्रतीक x symbol नमूना माध्य को संदर्भित करता है, और प्रतीक us हमें वर्ग अंतर को जोड़ने के लिए कहता है (x)मैं - x -) सभी के लिए मैं.
जबकि यह सूत्र गणनाओं के लिए काम करता है, एक समतुल्य, शार्टकट फॉर्मूला है, जिसके लिए हमें पहले गणना करने की आवश्यकता नहीं है नमूना माध्य. वर्गों के योग का यह शॉर्टकट फॉर्मूला है
Σ (xमैं2) - (Σ xमैं)2/n
यहाँ चर n हमारे नमूने में डेटा बिंदुओं की संख्या को संदर्भित करता है।
मानक फॉर्मूला उदाहरण
यह देखने के लिए कि यह शॉर्टकट फॉर्मूला कैसे काम करता है, हम एक उदाहरण पर विचार करेंगे, जिसकी गणना दोनों सूत्रों का उपयोग करके की जाती है। मान लीजिए हमारा नमूना 2, 4, 6, 8 है। नमूना का मतलब है (2 + 4 + 6 + 8) / 4 = 20/4 = 5। अब हम माध्य 5 के साथ प्रत्येक डेटा बिंदु के अंतर की गणना करते हैं।
- 2 – 5 = -3
- 4 – 5 = -1
- 6 – 5 = 1
- 8 – 5 = 3
अब हम इनमें से प्रत्येक संख्या को वर्ग बनाते हैं और उन्हें एक साथ जोड़ते हैं। (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.
शॉर्टकट फॉर्मूला उदाहरण
अब हम डेटा के समान सेट का उपयोग करेंगे: 2, 4, 6, 8, शॉर्टकट फार्मूले के साथ वर्गों का योग निर्धारित करने के लिए। हम पहले प्रत्येक डेटा पॉइंट को स्क्वायर करते हैं और उन्हें एक साथ जोड़ते हैं: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.
अगला चरण सभी डेटा को एक साथ जोड़ना और इस योग को वर्ग करना है: (2 + 4 + 6 + 8)2 = 400. हम इसे 400/4 = 100 प्राप्त करने के लिए डेटा बिंदुओं की संख्या से विभाजित करते हैं।
अब हम इस संख्या को 120 से घटाते हैं। इससे हमें पता चलता है कि चुकता विचलन का योग 20 है। यह ठीक वही संख्या थी जो हमने पहले ही दूसरे सूत्र से पाई है।
यह कैसे काम करता है?
बहुत से लोग सिर्फ अंकित मूल्य पर सूत्र को स्वीकार करेंगे और इस सूत्र के काम करने का कोई विचार नहीं है। थोड़ा बीजगणित का उपयोग करके, हम देख सकते हैं कि यह शॉर्टकट फॉर्मूला मानक, पारंपरिक तरीके से चुकता विचलन के योग की गणना के बराबर क्यों है।
हालाँकि सैकड़ों हो सकते हैं, यदि वास्तविक विश्व डेटा सेट में हजारों मान नहीं हैं, तो हम मानेंगे कि केवल तीन डेटा मान हैं: x1, एक्स2, एक्स3. यहां जो हम देखते हैं, उसका डेटा सेट में विस्तार किया जा सकता है जिसमें हजारों बिंदु हैं।
हम यह देखते हुए शुरू करते हैं (x)1 + x2 + x3) = 3 x̄। अभिव्यक्ति x (एक्समैं - एक्स)2 = (x)1 - एक्स)2 + (x)2 - एक्स)2 + (x)3 - एक्स)2.
अब हम मूल बीजगणित से इस तथ्य का उपयोग करते हैं कि (a + b)2 = ए2 + 2ab + बी2. इसका मतलब है कि (एक्स1 - एक्स)2 = एक्स12 -2x1 x + x̄2. हम अपने योग की अन्य दो शर्तों के लिए ऐसा करते हैं, और हमारे पास हैं:
एक्स12 -2x1 x + x̄2 + x22 -2x2 x + x̄2 + x32 -2x3 x + x̄2.
हम इसे पुनर्व्यवस्थित करते हैं और करते हैं:
एक्स12+ x22 + x32+ 3x +2 - 2x - (एक्स1 + x2 + x3) .
पुनर्लेखन द्वारा (एक्स1 + x2 + x3) = 3x above ऊपर हो जाता है:
एक्स12+ x22 + x32 - 3x -2.
अब 3x̄ से2 = (x)1+ x2 + x3)2/ 3, हमारा सूत्र बनता है:
एक्स12+ x22 + x32 - (एक्स1+ x2 + x3)2/3
और यह सामान्य सूत्र का एक विशेष मामला है जिसका उल्लेख ऊपर किया गया था:
Σ (xमैं2) - (Σ xमैं)2/n
क्या यह वास्तव में एक शॉर्टकट है?
ऐसा नहीं लग सकता है कि यह सूत्र वास्तव में एक शॉर्टकट है। सब के बाद, ऊपर के उदाहरण में ऐसा लगता है कि बस कई गणनाएं हैं। इसका एक हिस्सा इस तथ्य के साथ करना है कि हमने केवल एक नमूना आकार को देखा जो छोटा था।
जैसे ही हम अपने नमूने का आकार बढ़ाते हैं, हम देखते हैं कि शॉर्टकट फॉर्मूला गणना की संख्या को लगभग आधा कर देता है। हमें प्रत्येक डेटा बिंदु से माध्य को घटाना और फिर परिणाम को स्क्वायर करने की आवश्यकता नहीं है। यह ऑपरेशन की कुल संख्या पर काफी कम है।