के अध्ययन में कई बार आंकड़े विभिन्न विषयों के बीच संबंध बनाना महत्वपूर्ण है। हम इसका एक उदाहरण देखेंगे जिसमें प्रतिगमन रेखा का ढलान सीधे तौर पर संबंधित है सहसंबंध गुणांक. चूंकि इन अवधारणाओं में दोनों सीधी रेखाएं शामिल हैं, इसलिए यह प्रश्न पूछना स्वाभाविक है, "सहसंबंध गुणांक कैसे हैं और सबसे कम वर्ग रेखा सम्बंधित?"
पहले, हम इन दोनों विषयों के बारे में कुछ पृष्ठभूमि को देखेंगे।
सहसंबंध के बारे में विवरण
यह सहसंबंध गुणांक से संबंधित विवरणों को याद रखना महत्वपूर्ण है, जिसे इसके द्वारा निरूपित किया जाता है आर. इस आंकड़े का उपयोग तब किया जाता है जब हमने जोड़ा है मात्रात्मक डेटा. के बिखराव से युग्मित डेटा, हम डेटा के समग्र वितरण में रुझान देख सकते हैं। कुछ युग्मित डेटा एक रेखीय या सीधी-रेखा पैटर्न प्रदर्शित करते हैं। लेकिन व्यवहार में, डेटा कभी भी एक सीधी रेखा के साथ नहीं गिरता है।
वही देख रहे कई लोग स्कैटर प्लॉट युग्मित डेटा इस बात पर असहमत होगा कि यह समग्र रेखीय प्रवृत्ति दिखाने के कितने करीब है। आखिरकार, इसके लिए हमारे मानदंड कुछ व्यक्तिपरक हो सकते हैं। जिस पैमाने का हम उपयोग करते हैं, वह डेटा की हमारी धारणा को भी प्रभावित कर सकता है। इन कारणों और अधिक के लिए हमें यह बताने के लिए किसी तरह के वस्तुनिष्ठ माप की आवश्यकता है कि हमारा जोड़ा डेटा रैखिक होने के कितने करीब है। सहसंबंध गुणांक हमारे लिए यह प्राप्त करता है।
के बारे में कुछ बुनियादी तथ्य आर शामिल:
- का मूल्य आर किसी भी वास्तविक संख्या के बीच -1 से लेकर 1 तक होती है।
- का मान आर 0 के करीब मतलब है कि डेटा के बीच कोई रेखीय संबंध नहीं है।
- का मान आर 1 के करीब मतलब है कि डेटा के बीच एक सकारात्मक रैखिक संबंध है। इसका मतलब है कि जैसा एक्स वह बढ़ जाता है y भी बढ़ता है।
- का मान आर -1 के करीब है कि डेटा के बीच एक नकारात्मक रैखिक संबंध है। इसका मतलब है कि जैसा एक्स वह बढ़ जाता है y घट जाती है।
कम से कम वर्ग वर्गों की ढलान
उपरोक्त सूची में अंतिम दो आइटम हमें सबसे उपयुक्त फिट के सबसे कम वर्गों की ढलान की ओर इंगित करते हैं। स्मरण करो कि एक रेखा का ढलान इस बात का मापन है कि हम कितनी इकाइयों तक जाते हैं या हर उस इकाई के लिए नीचे जाते हैं जिसे हम दाईं ओर ले जाते हैं। कभी-कभी इसे रन द्वारा विभाजित लाइन के उदय, या परिवर्तन के रूप में कहा जाता है y मूल्यों में परिवर्तन से विभाजित एक्स मान।
सामान्य तौर पर, सीधी रेखाओं में ढलान होते हैं जो सकारात्मक, नकारात्मक या शून्य होते हैं। अगर हम अपनी कम से कम वर्ग प्रतिगमन लाइनों की जांच करने के लिए और के संबंधित मूल्यों की तुलना कर रहे थे आर, हम नोटिस करेंगे कि हर बार हमारे डेटा में ए नकारात्मक सहसंबंध गुणांकप्रतिगमन रेखा का ढलान ऋणात्मक होता है। इसी तरह, हर बार जब हमारे पास एक सकारात्मक सहसंबंध गुणांक होता है, तो प्रतिगमन रेखा का ढलान सकारात्मक होता है।
इस अवलोकन से यह स्पष्ट होना चाहिए कि सहसंबंध गुणांक के संकेत और कम से कम वर्गों की ढलान के बीच एक संबंध है। यह स्पष्ट है कि यह सच क्यों है।
ढलान के लिए सूत्र
के मूल्य के बीच संबंध का कारण आर और कम से कम वर्गों की ढलान का उस सूत्र के साथ क्या करना है जो हमें इस रेखा का ढलान देता है। युग्मित डेटा के लिए (एक्स, वाई) हम निरूपित करते हैं मानक विचलन का एक्स द्वारा डेटा रोंएक्स और के मानक विचलन y द्वारा डेटा रोंy.
ढलान के लिए सूत्र ए प्रतिगमन रेखा है:
- a = r (s)y/ sएक्स)
एक मानक विचलन की गणना में गैर-संख्यात्मक संख्या का धनात्मक वर्गमूल सम्मिलित होता है। नतीजतन, ढलान के फार्मूले में दोनों मानक विचलन nonnegative होना चाहिए। यदि हम मानते हैं कि हमारे डेटा में कुछ भिन्नता है, तो हम इस संभावना की अवहेलना कर सकेंगे कि इनमें से कोई भी मानक विचलन शून्य है। इसलिए सहसंबंध गुणांक का संकेत प्रतिगमन रेखा के ढलान के संकेत के समान होगा।