माध्यमिक डेटा विश्लेषण की परिभाषा और उदाहरण

माध्यमिक डेटा विश्लेषण डेटा का विश्लेषण है जो किसी और द्वारा एकत्र किया गया था। नीचे, हम माध्यमिक डेटा की परिभाषा की समीक्षा करेंगे, यह शोधकर्ताओं द्वारा कैसे उपयोग किया जा सकता है, और इस प्रकार के अनुसंधान के पेशेवरों और विपक्षों द्वारा।

मुख्य नियम: माध्यमिक डेटा विश्लेषण

  • प्राथमिक डेटा उन डेटा को संदर्भित करता है जो शोधकर्ताओं ने खुद को एकत्र किया है, जबकि माध्यमिक डेटा उस डेटा को संदर्भित करता है जो किसी और द्वारा एकत्र किया गया था।
  • माध्यमिक डेटा विभिन्न स्रोतों से उपलब्ध है, जैसे कि सरकार और अनुसंधान संस्थान।
  • जबकि माध्यमिक डेटा का उपयोग अधिक किफायती हो सकता है, मौजूदा डेटा सेट किसी शोधकर्ता के सभी सवालों के जवाब नहीं दे सकते हैं।

प्राथमिक और माध्यमिक डेटा की तुलना

सामाजिक विज्ञान अनुसंधान में, प्राथमिक डेटा और द्वितीयक डेटा शब्द सामान्य समानता हैं। प्राथमिक डेटा को एक शोधकर्ता या शोधकर्ताओं की टीम द्वारा विचार के तहत विशिष्ट उद्देश्य या विश्लेषण के लिए एकत्र किया जाता है। यहां, एक शोध दल एक अनुसंधान परियोजना की कल्पना करता है और विकसित करता है, एक पर निर्णय लेता है नमूना लेने की तकनीकविशिष्ट प्रश्नों को संबोधित करने के लिए डिज़ाइन किया गया डेटा एकत्र करता है, और उनके द्वारा एकत्र किए गए डेटा का अपना विश्लेषण करता है। इस मामले में, डेटा विश्लेषण में शामिल लोग अनुसंधान डिजाइन और डेटा संग्रह प्रक्रिया से परिचित हैं।

instagram viewer

माध्यमिक डेटा विश्लेषणदूसरी ओर, डेटा का उपयोग है कि किसी अन्य उद्देश्य के लिए किसी और द्वारा एकत्र किया गया था. इस मामले में, शोधकर्ता उन प्रश्नों को प्रस्तुत करता है जो एक डेटा सेट के विश्लेषण के माध्यम से संबोधित किए जाते हैं जो वे एकत्र करने में शामिल नहीं थे। शोधकर्ता के विशिष्ट शोध प्रश्नों का उत्तर देने के लिए डेटा एकत्र नहीं किया गया था और इसके बजाय एक अन्य उद्देश्य के लिए एकत्र किया गया था। इसका मतलब यह है कि एक ही डेटा सेट वास्तव में एक शोधकर्ता के लिए एक प्राथमिक डेटा सेट और एक दूसरे के लिए एक माध्यमिक डेटा सेट हो सकता है।

द्वितीयक डेटा का उपयोग करना

एक विश्लेषण में माध्यमिक डेटा का उपयोग करने से पहले कुछ महत्वपूर्ण चीजें होनी चाहिए। चूंकि शोधकर्ता ने डेटा एकत्र नहीं किया था, इसलिए उनके लिए डेटा सेट से परिचित होना महत्वपूर्ण है: डेटा कैसे एकत्र किया गया था, प्रत्येक के लिए प्रतिक्रिया श्रेणियां क्या हैं प्रश्न, विश्लेषण के दौरान वज़न लागू करने की आवश्यकता है या नहीं, क्लस्टर्स या स्तरीकरण का अध्ययन करने की आवश्यकता है, जो अध्ययन की आबादी थी, और अधिक।

माध्यमिक डेटा संसाधनों और डेटा सेट का एक बड़ा सौदा हैं समाजशास्त्रीय अनुसंधान के लिए उपलब्ध है, जिनमें से कई सार्वजनिक हैं और आसानी से सुलभ हैं। संयुक्त राज्य अमेरिका की जनगणना, को सामान्य सामाजिक सर्वेक्षण, और यह अमेरिकी सामुदायिक सर्वेक्षण सबसे अधिक उपयोग किए जाने वाले कुछ सेकेंडरी डेटा सेट उपलब्ध हैं।

माध्यमिक डेटा विश्लेषण के लाभ

माध्यमिक डेटा का उपयोग करने का सबसे बड़ा लाभ यह है कि यह अधिक किफायती हो सकता है। किसी और ने पहले ही डेटा एकत्र किया है, इसलिए शोधकर्ता को अनुसंधान के इस चरण में पैसा, समय, ऊर्जा और संसाधन समर्पित नहीं करना है। कभी-कभी द्वितीयक डेटा सेट खरीदा जाना चाहिए, लेकिन एक समान संग्रह करने के खर्च की तुलना में लागत लगभग हमेशा कम होती है खरोंच से सेट डेटा, जो आमतौर पर वेतन, यात्रा और परिवहन, कार्यालय अंतरिक्ष, उपकरण, और अन्य ओवरहेड पर जोर देता है लागत। इसके अलावा, चूंकि डेटा पहले से ही एकत्र किया गया है और आमतौर पर इलेक्ट्रॉनिक प्रारूप में साफ और संग्रहीत किया जाता है, इसलिए शोधकर्ता अपना अधिकांश समय खर्च कर सकते हैं डेटा का विश्लेषण इसके बजाय डेटा विश्लेषण के लिए तैयार हो जाओ।

द्वितीयक डेटा का उपयोग करने का दूसरा प्रमुख लाभ उपलब्ध आंकड़ों की चौड़ाई है। संघीय सरकार एक बड़े, राष्ट्रीय पैमाने पर कई अध्ययनों का आयोजन करती है जो व्यक्तिगत शोधकर्ताओं के लिए एक कठिन समय होता है। इनमें से कई डेटा सेट भी हैं अनुदैर्ध्य, जिसका अर्थ है कि एक ही डेटा को कई अलग-अलग समय अवधि में एक ही आबादी से एकत्र किया गया है। यह शोधकर्ताओं को समय के साथ घटनाओं के रुझानों और परिवर्तनों को देखने की अनुमति देता है।

द्वितीयक डेटा का उपयोग करने का एक तीसरा महत्वपूर्ण लाभ यह है कि डेटा संग्रह प्रक्रिया अक्सर एक स्तर बनाए रखती है विशेषज्ञता और व्यावसायिकता जो व्यक्तिगत शोधकर्ताओं या छोटे अनुसंधान परियोजनाओं के साथ मौजूद नहीं हो सकती है। उदाहरण के लिए, कई संघीय डेटा सेटों के लिए डेटा संग्रह अक्सर स्टाफ के सदस्यों द्वारा किया जाता है जो विशेषज्ञ होते हैं कुछ कार्यों में और उस विशेष क्षेत्र में और उस विशेष सर्वेक्षण के साथ कई वर्षों का अनुभव है। कई छोटे शोध परियोजनाओं में उस स्तर की विशेषज्ञता नहीं होती है, क्योंकि अंशकालिक रूप से काम करने वाले छात्रों द्वारा बहुत अधिक डेटा एकत्र किया जाता है।

माध्यमिक डेटा विश्लेषण के नुकसान

द्वितीयक डेटा का उपयोग करने का एक बड़ा नुकसान यह है कि यह शोधकर्ता के विशिष्ट शोध प्रश्नों का उत्तर नहीं दे सकता है या इसमें विशिष्ट जानकारी नहीं होती है जो शोधकर्ता के पास होनी चाहिए। यह भौगोलिक क्षेत्र में या इच्छित वर्षों के दौरान, या उस विशिष्ट आबादी के साथ एकत्र नहीं किया जा सकता है, जिसे शोधकर्ता अध्ययन में रुचि रखता है। उदाहरण के लिए, एक शोधकर्ता जो किशोरों का अध्ययन करने में रुचि रखता है, वह पा सकता है कि माध्यमिक डेटा सेट में केवल युवा वयस्क शामिल हैं।

इसके अतिरिक्त, चूंकि शोधकर्ता ने डेटा एकत्र नहीं किया था, इसलिए डेटा सेट में क्या निहित है, इस पर उनका कोई नियंत्रण नहीं है। अक्सर कई बार यह विश्लेषण को सीमित कर सकता है या शोधकर्ता मूल प्रश्नों को बदल सकता है जो उत्तर देने के लिए मांगता है। उदाहरण के लिए, एक शोधकर्ता जो खुशी और आशावाद का अध्ययन कर रहा है, वह पा सकता है कि एक माध्यमिक डेटा सेट में केवल इनमें से एक शामिल है चर, लेकिन दोनों नहीं।

एक संबंधित समस्या यह है कि चर हो सकते हैं अलग से परिभाषित या वर्गीकृत जितना शोधकर्ता ने चुना होगा। उदाहरण के लिए, आयु को एक निरंतर चर के बजाय श्रेणियों में एकत्र किया जा सकता है, या दौड़ को हर प्रमुख दौड़ के लिए श्रेणियों को शामिल करने के बजाय "सफेद" और "अन्य" के रूप में परिभाषित किया जा सकता है।

माध्यमिक डेटा का उपयोग करने का एक और महत्वपूर्ण नुकसान यह है कि शोधकर्ता को ठीक से पता नहीं है कि डेटा संग्रह प्रक्रिया कैसे की गई थी या इसे कितनी अच्छी तरह से किया गया था। शोधकर्ता आमतौर पर इस बात की जानकारी देने के लिए गोपनीयता नहीं रखते हैं कि कम प्रतिक्रिया दर या विशिष्ट सर्वेक्षण प्रश्नों की प्रतिवादी गलतफहमी जैसी समस्याओं से डेटा कितनी गंभीरता से प्रभावित होता है। कभी-कभी यह जानकारी आसानी से उपलब्ध होती है, जैसा कि कई संघीय डेटा सेटों के साथ होता है। हालांकि, कई अन्य माध्यमिक डेटा सेट इस प्रकार की जानकारी के साथ नहीं हैं और विश्लेषक को डेटा की किसी भी संभावित सीमाओं को उजागर करने के लिए लाइनों के बीच पढ़ना सीखना चाहिए।