रैखिक प्रतिगमन एक सांख्यिकीय उपकरण है जो यह निर्धारित करता है कि एक सीधी रेखा कितनी अच्छी तरह फिट होती है युग्मित डेटा. उस डेटा को सबसे अच्छी तरह से फिट करने वाली सीधी रेखा को सबसे कम वर्ग प्रतिगमन रेखा कहा जाता है। इस लाइन का उपयोग कई तरीकों से किया जा सकता है। इन उपयोगों में से एक व्याख्यात्मक चर के दिए गए मूल्य के लिए एक प्रतिक्रिया चर के मूल्य का अनुमान लगाना है। इस विचार से संबंधित एक अवशिष्ट है।
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
अंकों पर अवशिष्ट की गणना करने के लिए एक्स = 5, हम अपने देखे गए मूल्य से अनुमानित मूल्य को घटाते हैं। के बाद से y हमारे डेटा बिंदु का समन्वय 9 था, इससे 9 - 10 = -1 का अवशिष्ट मिलता है।
अवशिष्ट के लिए कई उपयोग हैं। एक उपयोग हमें यह निर्धारित करने में मदद करने के लिए है कि क्या हमारे पास एक डेटा सेट है जिसमें समग्र रेखीय प्रवृत्ति है, या यदि हमें एक अलग मॉडल पर विचार करना चाहिए। इसका कारण यह है कि अवशिष्ट हमारे डेटा में किसी भी nonlinear पैटर्न को बढ़ाने में मदद करते हैं। स्कैल्पलॉट को देखकर क्या देखना मुश्किल हो सकता है, अवशेषों और एक संबंधित अवशिष्ट प्लॉट की जांच करके आसानी से देखा जा सकता है।
अवशेषों पर विचार करने का एक और कारण यह जांचना है कि रैखिक प्रतिगमन के लिए अनुमान की शर्तें पूरी की जाती हैं। एक रैखिक प्रवृत्ति (अवशेषों की जांच करके) के सत्यापन के बाद, हम अवशिष्टों के वितरण की भी जांच करते हैं। प्रतिगमन निष्कासन करने में सक्षम होने के लिए, हम चाहते हैं कि हमारी प्रतिगमन रेखा के बारे में अवशिष्ट लगभग सामान्य रूप से वितरित हों। ए हिस्टोग्राम या stemplot अवशिष्टों से यह सत्यापित करने में मदद मिलेगी कि यह स्थिति पूरी हो चुकी है।