कई बार जब हम एक समूह का अध्ययन करते हैं, तो हम वास्तव में दो आबादी की तुलना कर रहे हैं। पर निर्भर करता है पैरामीटर इस समूह में हम रुचि रखते हैं और जिन स्थितियों से हम निपट रहे हैं, वहां कई तकनीकें उपलब्ध हैं। सांख्यिकीय अनुमान ऐसी प्रक्रियाएं जो दो आबादी की तुलना में चिंता करती हैं उन्हें आमतौर पर तीन या अधिक आबादी पर लागू नहीं किया जा सकता है। एक साथ दो से अधिक आबादी का अध्ययन करने के लिए, हमें विभिन्न प्रकार के सांख्यिकीय उपकरणों की आवश्यकता होती है। भिन्नता का विश्लेषण, या एनोवा, सांख्यिकीय हस्तक्षेप से एक तकनीक है जो हमें कई आबादी से निपटने की अनुमति देती है।
मीन्स की तुलना
यह देखने के लिए कि समस्याएं क्या हैं और हमें एनोवा की आवश्यकता क्यों है, हम एक उदाहरण पर विचार करेंगे। मान लीजिए कि हम यह निर्धारित करने की कोशिश कर रहे हैं कि क्या मतलब हरे, लाल, नीले और नारंगी एम एंड एम कैंडीज का वजन एक दूसरे से भिन्न होता है। हम इनमें से प्रत्येक आबादी के लिए माध्य भार को बताएंगे, μ1, μ2, μ3 μ4 और क्रमशः। हम उपयुक्त का उपयोग कर सकते हैं परिकल्पना परीक्षण कई बार, और परीक्षण सी (4,2), या छह अलग-अलग अशक्त परिकल्पनाएँ:
- एच0: μ1 = μ2 यह जांचने के लिए कि क्या लाल कैंडी की आबादी का औसत वजन, नीले कैंडी की आबादी के औसत वजन से अलग है या नहीं।
- एच0: μ2 = μ3 यह जांचने के लिए कि क्या नीली कैंडीज की आबादी का औसत वजन हरे कैंडीज की आबादी के औसत वजन से अलग है या नहीं।
- एच0: μ3 = μ4 यह जांचने के लिए कि हरे कैंडीज की आबादी का औसत वजन नारंगी कैंडी की आबादी के औसत वजन से अलग है या नहीं।
- एच0: μ4 = μ1 यह जांचने के लिए कि क्या नारंगी कैंडी की आबादी का औसत वजन लाल कैंडी की आबादी के औसत वजन से अलग है या नहीं।
- एच0: μ1 = μ3 यह जांचने के लिए कि क्या लाल कैंडी की आबादी का औसत वजन हरे कैंडीज की आबादी के औसत वजन से अलग है या नहीं।
- एच0: μ2 = μ4 यह जांचने के लिए कि क्या नीली कैंडी की आबादी का औसत वजन नारंगी कैंडी की आबादी के औसत वजन से अलग है या नहीं।
इस तरह के विश्लेषण के साथ कई समस्याएं हैं। हमारे पास छह होंगे पी-values. भले ही हम 95% पर प्रत्येक का परीक्षण कर सकते हैं आत्मविश्वास का स्तर, समग्र प्रक्रिया में हमारा विश्वास इस से कम है क्योंकि संभावनाएं कई गुना अधिक हैं: .95 x .95 x .95 x .95 x .95 x .95 लगभग .74 है, या 74% आत्मविश्वास का स्तर है। इस प्रकार एक प्रकार की त्रुटि की संभावना बढ़ गई है।
एक अधिक मूलभूत स्तर पर, हम इन चार मापदंडों को एक बार में दो की तुलना करके एक पूरे के रूप में तुलना नहीं कर सकते हैं। लाल और नीले रंग का साधन M & Ms महत्वपूर्ण हो सकता है, लाल रंग का औसत वजन नीले रंग के औसत वजन से अपेक्षाकृत बड़ा होता है। हालांकि, जब हम कैंडी के सभी चार प्रकारों के औसत वजन पर विचार करते हैं, तो महत्वपूर्ण अंतर नहीं हो सकता है।
भिन्नता का विश्लेषण
उन स्थितियों से निपटने के लिए जिनमें हमें कई तुलनाएँ करने की आवश्यकता है जिनका उपयोग हम एनोवा करते हैं। यह परीक्षण हमें एक साथ कई आबादी के मापदंडों पर विचार करने की अनुमति देता है, बिना किसी समस्या के जो हमें सामना करता है परिकल्पना परीक्षण आयोजित करना एक समय में दो मापदंडों पर।
उपरोक्त एम एंड एम उदाहरण के साथ एनोवा का संचालन करने के लिए, हम अशक्त परिकल्पना एच का परीक्षण करेंगे0:μ1 = μ2 = μ3= μ4. यह बताता है कि लाल, नीले और हरे रंग के एम एंड एमएस के औसत वजन के बीच कोई अंतर नहीं है। वैकल्पिक परिकल्पना यह है कि वहाँ है लाल, नीले, हरे और नारंगी एम एंड एमएस के माध्य भार के बीच कुछ अंतर। यह परिकल्पना वास्तव में कई कथनों का संयोजन है एचए:
- लाल कैंडी की आबादी का औसत वजन नीली कैंडी की आबादी के औसत वजन के बराबर नहीं है, या
- नीली कैंडीज की आबादी का औसत वजन हरी कैंडीज की आबादी के औसत वजन के बराबर नहीं है, या
- हरी कैंडी की आबादी का औसत वजन नारंगी कैंडी की आबादी के औसत वजन के बराबर नहीं है, या
- हरी कैंडीज की आबादी का औसत वजन लाल कैंडीज की आबादी के औसत वजन के बराबर नहीं है, या
- नीली कैंडी की जनसंख्या का औसत वजन नारंगी कैंडी की आबादी के औसत वजन के बराबर नहीं है, या
- नीली कैंडी की आबादी का औसत वजन लाल कैंडी की आबादी के औसत वजन के बराबर नहीं है।
इस विशेष उदाहरण में, हमारे पी-मूल्य को प्राप्त करने के लिए, हम एक उपयोग करेंगे संभावना वितरण के रूप में जाना एफ वितरण. एनोवा एफ परीक्षण से जुड़ी गणना हाथ से की जा सकती है, लेकिन आमतौर पर सांख्यिकीय सॉफ्टवेयर के साथ गणना की जाती है।
एकाधिक तुलना
एनोवा को अन्य सांख्यिकीय तकनीकों से अलग करता है, इसका उपयोग कई तुलना करने के लिए किया जाता है। यह पूरे आँकड़ों में सामान्य है, क्योंकि कई बार हम जहाँ दो समूहों से अधिक की तुलना करना चाहते हैं। आमतौर पर एक समग्र परीक्षण से पता चलता है कि हमारे द्वारा अध्ययन किए जा रहे मापदंडों के बीच कुछ अंतर है। हम फिर इस परीक्षण का पालन करते हैं कि कौन सा पैरामीटर अलग है यह तय करने के लिए कुछ अन्य विश्लेषण।