स्कैप्लेटोट एक प्रकार का ग्राफ़ है जिसका उपयोग प्रतिनिधित्व करने के लिए किया जाता है युग्मित डेटा. व्याख्यात्मक चर को क्षैतिज अक्ष के साथ प्लॉट किया जाता है और अनुक्रिया चर को ऊर्ध्वाधर अक्ष के साथ रेखांकन किया जाता है। इस प्रकार के ग्राफ का उपयोग करने का एक कारण चर के बीच संबंधों की तलाश करना है।
युग्मित डेटा के एक सेट में देखने के लिए सबसे बुनियादी पैटर्न एक सीधी रेखा है। किसी भी दो बिंदुओं के माध्यम से, हम एक सीधी रेखा खींच सकते हैं। यदि हमारे स्कैल्पलॉट में दो से अधिक बिंदु हैं, तो अधिकांश समय हम अब हर बिंदु से गुजरने वाली रेखा नहीं खींच पाएंगे। इसके बजाय, हम एक रेखा खींचेंगे जो अंकों के बीच से होकर गुजरेगी और डेटा के समग्र रैखिक चलन को प्रदर्शित करेगी।
जैसा कि हम अपने ग्राफ में बिंदुओं को देखते हैं और इन बिंदुओं के माध्यम से एक रेखा खींचना चाहते हैं, एक सवाल उठता है। हमें कौन सी रेखा खींचनी चाहिए? अनंत रेखाएँ हैं जिन्हें खींचा जा सकता है। अकेले हमारी आंखों का उपयोग करके, यह स्पष्ट है कि स्कैल्पलॉट को देखने वाला प्रत्येक व्यक्ति थोड़ी अलग रेखा का उत्पादन कर सकता है। यह अस्पष्टता एक समस्या है। हम सभी को एक ही लाइन प्राप्त करने के लिए एक अच्छी तरह से परिभाषित तरीका चाहते हैं। लक्ष्य को गणितीय रूप से सटीक वर्णन करना है कि किस रेखा को खींचा जाना चाहिए। सबसे कम वर्ग
बढतीरेखा हमारे डेटा बिंदुओं के माध्यम से एक ऐसी रेखा है।कम से कम दो गुना
सबसे कम वर्ग रेखा का नाम बताता है कि यह क्या करता है। हम द्वारा दिए गए निर्देशांक के साथ अंकों के संग्रह के साथ शुरू करते हैं (एक्समैं, yमैं). कोई भी सीधी रेखा इन बिंदुओं के बीच से गुजरेगी और इनमें से प्रत्येक के ऊपर या नीचे जाएगी। हम इन बिंदुओं से दूरी की गणना करके रेखा का मान चुन सकते हैं एक्स और फिर मनाया घटाया y समन्वय जो इसके अनुरूप है एक्स वहाँ से y हमारी लाइन का समन्वय।
समान बिंदुओं के माध्यम से अलग-अलग रेखाएं अलग-अलग दूरी तय करती हैं। हम चाहते हैं कि ये दूरी उतनी ही छोटी हो जितना हम उन्हें बना सकते हैं। लेकिन एक समस्या है। चूंकि हमारी दूरियां सकारात्मक या नकारात्मक हो सकती हैं, इन सभी दूरियों का कुल योग एक दूसरे को रद्द कर देगा। दूरियों का योग हमेशा शून्य के बराबर होगा।
इस समस्या का हल अंकों और रेखा के बीच की दूरी को कम करके सभी नकारात्मक संख्याओं को समाप्त करना है। यह नॉनगेटिव नंबर का एक संग्रह देता है। जिस लक्ष्य को पाने के लिए हमें सबसे अधिक उपयुक्त होना चाहिए, वह है इन चौकोर दूरियों के योग को यथासंभव छोटा बनाना। कैलकुलस यहाँ बचाव के लिए आता है। पथरी में विभेदन की प्रक्रिया किसी दिए गए रेखा से वर्ग दूरी के योग को कम करना संभव बनाती है। यह इस पंक्ति के लिए हमारे नाम में "कम से कम वर्ग" वाक्यांश की व्याख्या करता है।
बेस्ट फिट की लाइन
चूँकि सबसे कम वर्ग रेखा रेखा और हमारे बिंदुओं के बीच वर्ग दूरी को कम करता है, इसलिए हम इस रेखा के बारे में सोच सकते हैं जो आपके डेटा को सबसे अच्छी तरह से फिट करती है। यही कारण है कि सबसे कम वर्ग को सर्वश्रेष्ठ फिट की रेखा के रूप में भी जाना जाता है। खींची जा सकने वाली सभी संभावित पंक्तियों में से, सबसे कम वर्ग रेखा डेटा के सेट के सबसे करीब है। इसका मतलब यह हो सकता है कि हमारी लाइन हमारे डेटा के किसी भी बिंदु से टकराने से चूक जाएगी।
कम से कम वर्ग की विशेषताएं
कुछ विशेषताएं हैं जो हर कम से कम वर्ग रेखा के पास हैं। ब्याज की पहली वस्तु हमारी रेखा के ढलान से संबंधित है। ढलान का कनेक्शन है सहसंबंध गुणांक हमारे डेटा की। वास्तव में, रेखा का ढलान बराबर है r (s)y/ sएक्स). यहाँ रों एक्स के मानक विचलन को दर्शाता है एक्स निर्देशांक और रों y के मानक विचलन y हमारे डेटा के निर्देशांक। सहसंबंध गुणांक का संकेत सीधे हमारी सबसे कम वर्ग रेखा के ढलान के संकेत से संबंधित है।
सबसे कम वर्गों की एक और विशेषता एक बिंदु की चिंता करती है जो इसे गुजरती है। जबकि y कम से कम वर्गों की अवरोधन एक सांख्यिकीय दृष्टिकोण से दिलचस्प नहीं हो सकता है, एक बिंदु है जो है। हर कम से कम वर्ग रेखा डेटा के मध्य बिंदु से होकर गुजरती है। यह मध्य बिंदु एक है एक्स समन्वय है कि मतलब का एक्स मान और ए y का मतलब है कि समन्वय y मान।