सहसंबंध और कारण के बीच अंतर

एक दिन दोपहर के भोजन में एक युवती आइसक्रीम का एक बड़ा कटोरा खा रही थी, और एक साथी संकाय सदस्य उसके पास गया और कहा, "आप बेहतर रूप से सावधान थे, एक उच्च है सांख्यिकीयसह - संबंध आइसक्रीम और डूबने के बीच। ” उसने उसे कुछ उलझा दिया होगा, क्योंकि उसने कुछ और बताया। "आइसक्रीम की सबसे अधिक बिक्री के साथ दिन भी सबसे अधिक लोगों को डूबते हुए दिखाई देते हैं।"

जब उसने मेरी आइसक्रीम खत्म की तो दोनों सहकर्मियों ने इस तथ्य पर चर्चा की कि सिर्फ इसलिए कि एक चर दूसरे के साथ सांख्यिकीय रूप से जुड़ा हुआ है, इसका मतलब यह नहीं है कि एक दूसरे का कारण है। कभी-कभी पृष्ठभूमि में एक चर छुपा होता है। इस मामले में, वर्ष का दिन डेटा में छिपा हुआ है। बर्फीली सर्दियों की तुलना में गर्मी के दिनों में अधिक आइसक्रीम बेची जाती है। अधिक लोग गर्मियों में तैरते हैं, और इसलिए सर्दियों में गर्मियों में अधिक डूबते हैं।

लर्किंग वेरिएबल्स से सावधान रहें

उपरोक्त किस्सा एक प्रमुख उदाहरण है जिसे लर्किंग चर के रूप में जाना जाता है। जैसा कि इसके नाम से पता चलता है, एक गुप्त चर मायावी और मुश्किल का पता लगा सकता है। जब हम पाते हैं कि दो संख्यात्मक डेटा सेट दृढ़ता से सहसंबद्ध हैं, तो हमें हमेशा पूछना चाहिए, "क्या ऐसा कुछ और हो सकता है जो इस संबंध को पैदा कर रहा है?"

instagram viewer

निम्नलिखित एक मजबूत चर के कारण मजबूत सहसंबंध के उदाहरण हैं:

  • किसी देश में प्रति व्यक्ति कंप्यूटर की औसत संख्या और उस देश की औसत जीवन प्रत्याशा।
  • एक आग पर अग्निशमन की संख्या और आग से नुकसान।
  • एक प्राथमिक विद्यालय के छात्र की ऊँचाई और उसका पढ़ने का स्तर।

इन सभी मामलों में, चर के बीच संबंध बहुत मजबूत है। यह आमतौर पर ए द्वारा इंगित किया जाता है सहसंबंध गुणांक जिसका मान 1 या -1 के करीब है। इससे कोई फर्क नहीं पड़ता कि यह सहसंबंध गुणांक 1 या -1 से कितना निकट है, यह आँकड़ा यह नहीं दिखा सकता है कि एक चर दूसरे चर का कारण है।

लुकिंग वेरिएबल्स का पता लगाना

उनकी प्रकृति से, चर चर का पता लगाना मुश्किल होता है। एक रणनीति, यदि उपलब्ध हो, तो यह जांचना है कि समय के साथ डेटा का क्या होता है। यह मौसमी रुझानों को प्रकट कर सकता है, जैसे कि आइसक्रीम उदाहरण, जो डेटा के एक साथ लोप होने पर अस्पष्ट हो जाते हैं। एक और तरीका है देखने का बाहरी कारकों के कारण और यह निर्धारित करने का प्रयास करें कि उन्हें अन्य डेटा से अलग क्या बनाता है। कभी-कभी यह संकेत देता है कि पर्दे के पीछे क्या हो रहा है। कार्रवाई का सबसे अच्छा तरीका सक्रिय होना है; प्रश्न मान्यताओं और डिजाइन प्रयोगों को ध्यान से देखें।

इससे क्या फर्क पड़ता है?

शुरुआती परिदृश्य में, एक अच्छी तरह से अर्थ लगता है, लेकिन सांख्यिकीय रूप से बेख़बर कांग्रेस ने डूबने को रोकने के लिए सभी आइसक्रीम को बाहर करने का प्रस्ताव दिया। इस तरह के बिल से आबादी के बड़े हिस्से को असुविधा होगी, कई कंपनियों को दिवालिया होने पर मजबूर किया जाएगा, और हजारों नौकरियों को खत्म कर दिया जाएगा क्योंकि देश का आइसक्रीम उद्योग बंद हो गया है। बेहतरीन इरादों के बावजूद, इस बिल में डूबने वाली मौतों की संख्या में कमी नहीं होगी।

यदि वह उदाहरण थोड़ा बहुत दूर लगता है, तो निम्नलिखित पर विचार करें, जो वास्तव में हुआ था। 1900 की शुरुआत में, डॉक्टरों ने देखा कि कुछ शिशु रहस्यमय तरीके से सांस की समस्याओं से अपनी नींद में मर रहे थे। इसे पालना मृत्यु कहा जाता था और अब इसे SIDS के रूप में जाना जाता है। एक चीज जो ऑटोप्सिस से बाहर निकलती है, जो कि एसआईडीएस से मारे गए लोगों पर प्रदर्शन करती है, एक बढ़े हुए थाइमस, छाती में स्थित एक ग्रंथि थी। SIDS शिशुओं में बढ़े हुए थाइमस ग्रंथियों के सहसंबंध से, डॉक्टरों ने माना कि असामान्य रूप से बड़े थाइमस के कारण अनुचित श्वास और मृत्यु हुई।

प्रस्तावित उपाय था कि थाइमस को विकिरण के उच्च स्तर के साथ सिकोड़ें, या ग्रंथि को पूरी तरह से हटा दें। इन प्रक्रियाओं में मृत्यु दर काफी अधिक थी और इससे और भी ज्यादा मौतें हुईं। दुखद यह है कि इन ऑपरेशनों का प्रदर्शन नहीं किया गया है। बाद के शोध से पता चला है कि इन डॉक्टरों को उनकी मान्यताओं में गलत माना गया था और यह कि थाइमस SIDS के लिए जिम्मेदार नहीं है।

सहसंबंध प्रोत्साहन नहीं करता है

जब हम सोचते हैं कि सांख्यिकीय साक्ष्य का उपयोग चिकित्सा व्यवस्था, कानून और शैक्षिक प्रस्तावों जैसी चीजों को सही ठहराने के लिए किया जाता है, तो उपरोक्त को हमें विराम देना चाहिए। यह महत्वपूर्ण है कि डेटा की व्याख्या करने में अच्छा काम किया जाता है, खासकर यदि सहसंबंध से जुड़े परिणाम दूसरों के जीवन को प्रभावित करने वाले हैं।

जब कोई भी कहता है, "अध्ययन से पता चलता है कि ए बी का कारण है और कुछ आंकड़े इसे वापस करते हैं," के लिए तैयार रहें उत्तर, "सहसंबंध का अर्थ कार्य नहीं है।" हमेशा इस बात की तलाश रहती है कि किस चीज के नीचे लर्क है डेटा।

instagram story viewer