डेटा का विश्लेषण: 4 चरण

यह लेख डेटा के विश्लेषण में शामिल चार मुख्य चरणों पर प्रकाश डालता है। चरण हैं: 1. श्रेणियों की स्थापना या डेटा का वर्गीकरण 2. कोडिंग 3. सारणीकरण 4. डेटा का सांख्यिकीय विश्लेषण।

चरण # 1. डेटा की वर्गीकरण या वर्गीकरण की स्थापना :

सामाजिक विज्ञान अनुसंधान में आम तौर पर उत्तरदाताओं के नमूने या 'आबादी' के लिए प्रस्तुत विभिन्न प्रकार के प्रश्नों की प्रतिक्रियाएं या उत्तेजनाएं शामिल होती हैं। ये प्रतिक्रियाएं मौखिक या गैर-मौखिक हो सकती हैं।

स्पष्ट रूप से, यदि विभिन्न प्रकार की प्रतिक्रियाओं की एक बड़ी संख्या का आयोजन किया जाना है, ताकि उनका उपयोग अनुसंधान के सवालों के जवाब देने में किया जा सके, या सामान्यीकरण को आकर्षित करने में, उन्हें सीमित संख्या में श्रेणियों या वर्गों में वर्गीकृत किया जाना चाहिए। एक सरल उदाहरण लेने के लिए, मान लीजिए कि एक प्रश्न उत्तरदाताओं के लिए रखा गया है, "क्या आप कॉलेज के छात्रों के लिए वस्तुनिष्ठ प्रकार की परीक्षा के पक्ष में हैं?"

उत्तरदाताओं की प्रतिक्रियाओं को संभवतः चार व्यापक श्रेणियों में वर्गीकृत किया जा सकता है, निम्नानुसार:

(ए) "हाँ" प्रतिक्रियाएँ।

(बी) "नहीं" प्रतिक्रियाएं।

(ग) "नहीं जानते", "कह नहीं सकते" आदि, प्रतिक्रियाएँ।

(घ) "उत्तर नहीं दिया।"

मान लीजिए उत्तरदाताओं से पूछा गया एक और सवाल है, "आप किस सामाजिक वर्ग से कहेंगे कि आप हैं?"

उत्तरदाताओं की प्रतिक्रियाओं को निम्नलिखित श्रेणियों में बांटा जा सकता है:

(ए) उच्च वर्ग।

(b) मध्य वर्ग।

(c) निम्न वर्ग।

(घ) "कह नहीं सकते।"

(() अन्य प्रतिक्रियाएँ (जैसे, "मैं सामाजिक वर्गों में विश्वास नहीं करता हूं।"

डेटा को समूहीकृत करने के लिए बनाई जाने वाली श्रेणियों के बारे में निर्णय लेने के लिए एक शर्त यह है कि शोधकर्ता को वर्गीकरण के कुछ उपयुक्त सिद्धांत का चयन करना होगा। शोध प्रश्न या परिकल्पना, यदि कोई तैयार किया गया है, तो एक शास्त्रीय सिद्धांत का चयन करने के लिए एक अच्छा तार्किक आधार प्रदान करता है।

मान लीजिए, एक अध्ययन में परिकल्पना है:

"जिन छात्रों को सहशिक्षा विद्यालयों में अध्ययन करने का अनुभव है, उनके पास सह-शिक्षा की प्रणाली के प्रति अधिक अनुकूल रवैया होगा।"

यहां, जाहिर है, प्रतिक्रियाओं के वर्गीकरण का एक सिद्धांत यह होगा कि उत्तरदाता को सह-शैक्षिक प्रणाली का पूर्व अनुभव था या नहीं। प्रतिक्रियाओं को वर्गीकृत करने का एक अन्य आधार फ़ेवराबिलिटी या अनौपचारिकता की डिग्री होगा जो सह-शिक्षा प्रणाली की ओर व्यक्त किया गया है। वर्गीकरण के अन्य आधारों को भी लागू किया जा सकता है, जो इस बात पर निर्भर करता है कि आगे संघों की जांच की जानी है।

वर्गीकरण के पहले आधार पर प्रतिक्रियाओं की दो श्रेणियां होंगी:

(ए) ने कहा, उन्हें सह-शिक्षा का पूर्व अनुभव था;

(b) कहा, उन्हें सह-शिक्षा का कोई पूर्व अनुभव नहीं था।

इन दोनों श्रेणियों में प्रतिक्रियाओं की पूरी श्रृंखला होती है (यह मानते हुए, कि किसी भी उत्तरदाता ने जवाब देने से इनकार नहीं किया या कोई प्रतिक्रिया नहीं दी या कुछ अन्य प्रतिक्रिया नहीं दी।) उपरोक्त धारणा पर कोई भी प्रतिक्रिया इन दोनों श्रेणियों के कम्पास से परे नहीं है। इन दो श्रेणियों को मिलाकर एक "श्रेणी-सेट" के रूप में जाना जाता है।

एक 'श्रेणी-सेट' को निम्नलिखित तीन आवश्यकताओं को पूरा करना चाहिए:

(1) श्रेणियों के सेट को एकल वर्गीकरण सिद्धांत से लिया जाना चाहिए। यह आवश्यकता काफी समझ में आती है क्योंकि यदि वर्गीकरण के एक से अधिक सिद्धांत कार्यरत हैं, तो एक एकल प्रतिक्रिया को एक से अधिक श्रेणी द्वारा दावा किया जा सकता है।

इस प्रकार, श्रेणियां एक-दूसरे से स्वतंत्र नहीं होंगी। उदाहरण के लिए, यदि हमारे पास श्रेणी-सेट बनाने वाली तीन श्रेणियां हैं, उदाहरण के लिए, पुरुष, महिला, बच्चा, स्पष्ट रूप से व्युत्पन्न, दो शास्त्रीय सिद्धांतों से, क्रमशः, सेक्स और आयु से, तो किसी भी एक मामले (प्रतिसाद) को अधिक से अधिक कवर किया जा सकता है श्रेणी-सेट में एक श्रेणी।

उदाहरण के लिए, एक बच्चा भी एक पुरुष हो सकता है, एक महिला भी बच्चा हो सकती है और इसी तरह। शास्त्रीय सिद्धांत, हालांकि, एक यौगिक हो सकता है, अर्थात, दो या अधिक मानदंडों से बना है, अर्थात, पुरुष बच्चा, महिला बच्चा, आदि।

(२) दूसरी आवश्यकता यह है कि श्रेणी-सेट पूर्ण होना चाहिए, अर्थात, प्रत्येक प्रतिक्रिया को समुच्चय में श्रेणियों में से किसी एक में रखना संभव होना चाहिए। सेट में उपयुक्त श्रेणी के लिए 'कोई प्रतिक्रिया नहीं' छोड़नी चाहिए, जिसमें यह शामिल होगा।

जो कुछ भी प्रतिक्रियाएं हैं, उसे सेट के भीतर कुछ श्रेणी द्वारा कवर किया जाना चाहिए। उदाहरण के लिए, अगर दुनिया के लोगों को उनके नस्लीय स्टॉक के आधार पर वर्गीकृत किया जाना था, तो श्रेणी तीन श्रेणियों का गठन किया गया था, अर्थात् (क) कोकसॉएड, (बी) नेग्रोइड और (ग) मंगोलॉयड, स्पष्ट रूप से नहीं ऊपर उल्लिखित आवश्यकता के अनुसार एक विस्तृत श्रेणी-सेट होना चाहिए, क्योंकि इसमें एक भी श्रेणी नहीं होती है जिसमें कई भारतीय लोग (और कुछ अन्य) एक स्थान पा सकते हैं।

(3) अंतिम आवश्यकता पहले वाले की एक कोरोलरी है, अर्थात्, सेट के भीतर श्रेणियां परस्पर अनन्य होनी चाहिए; यह है, श्रेणियों को ओवरलैप नहीं करना चाहिए। इस प्रकार, सेट के भीतर एक से अधिक श्रेणियों द्वारा किसी भी प्रतिक्रिया का दावा नहीं किया जाएगा।

सामाजिक विज्ञानों की डेटा विशेषता के लिए श्रेणियों की स्थापना हमेशा एक आसान काम नहीं है। शास्त्रीय सिद्धांत अक्सर एक यौगिक हो सकता है (जैसा कि सरल, एकात्मक के विपरीत)। सभी परस्पर अनन्य श्रेणियों को एक साथ जोड़ने का कार्य जो एक मिश्रित शास्त्रीय सिद्धांत के आधार पर एक साथ प्रतिक्रियाओं के कुल ब्रह्मांड को समाप्त कर देगा, वास्तव में एक सटीक है, जो कल्पना की मांग कर रहा है।

ऐसे मामलों में प्रतीकों या कोडों के वर्गीकरण के यौगिक सिद्धांत को कम करने वाले गुणों को कम करना और बूलियन विस्तार की तकनीक के माध्यम से बाहर निकालना संभव है, श्रेणी-सेट सहित संभावित श्रेणियों की पूरी श्रृंखला।

आइए एक बहुत ही सरल उदाहरण लेते हैं। मान लीजिए शोधकर्ता तीन गुणों को मानता है, जैसे, सेक्स (महिला का पुरुष), उम्र (21 वर्ष से कम या 21 वर्ष से अधिक आयु) और वैवाहिक स्थिति (विवाहित या एकल) उसके एकल (लेकिन यौगिक) वर्गीकरण के सिद्धांत के रूप में और इन प्रतीकों को कम करता है:

नर = एस, महिला = एस̅

21 वर्ष से कम आयु = A, 21 वर्ष से अधिक आयु = A =

विवाहित = एम, एकल = एम̅

परिणामी श्रेणी-सेट इन तीन विशेषताओं के सभी संभावित संयोजनों से युक्त संपूर्ण समग्रता होगी जिसमें यौगिक वर्गीकरण सिद्धांत शामिल है। संभावित संयोजन, अर्थात, श्रेणियां, संख्या में 2 3 = 2 x 2 x 2 = 8 होंगी।

ये निम्नानुसार हैं:

(१) सैम

(२) एस̅ ए.एम.

(३) एस ए 3 एम

(4) SA M 4

(५) एस 5 ए̅ एम

(६) स̅ अ म̅

(() एस ए 7 एम̅

(8) S̅ A̅ M̅

डिकोडिंग, यानी, प्रतीकों के लिए वास्तविक अर्थों को प्रतिस्थापित करते हुए, हम आठ परस्पर अनन्य श्रेणियां प्राप्त करते हैं जो निम्नानुसार पढ़ते हैं:

(१) पुरुष २१ से नीचे और विवाहित।

(२) २१ साल से कम उम्र की महिला और विवाहित।

(३) २१ वर्ष से ऊपर के पुरुष और विवाहित।

(४) नर २१ वर्ष से कम और अविवाहित।

(५) २१ वर्ष से ऊपर की महिलाएं और विवाहित।

(६) २१ साल से कम उम्र की महिलाएं और अविवाहित।

(() २१ वर्ष से ऊपर और अविवाहित पुरुष।

(() २१ साल से ऊपर की महिलाएं और अविवाहित।

एक ही टोकन के द्वारा, यदि यौगिक गुणात्मक सिद्धांत चार विशेषताओं का गठन किया जाता है, तो हमारे पास 2 4 = 2x 2 x 2 x 2, यानी 16 परस्पर अनन्य श्रेणियां होंगी। अब यह स्पष्ट होना चाहिए कि अंतर्ज्ञान के बजाय श्रेणियों को स्थापित करने का यह तरीका वर्गीकरण के कार्य को कितना आसान और मूर्खतापूर्ण बनाता है।

यह स्पष्ट है कि श्रेणियों के एक सेट की स्थापना अपेक्षाकृत आसान है यदि अध्ययन के दौरान उत्तरदाताओं से प्राप्त प्रतिक्रियाएं काफी सरल और स्पष्ट हैं और इसलिए श्रेणियों को आसानी से अस्पष्ट तरीके से परिभाषित किया जा सकता है। यद्यपि यह वह तरीका है जिसे श्रेणियों को हमेशा परिभाषित किया जाना चाहिए, कुछ विशेष प्रकार की सामग्री के साथ कार्य अधिक कठिन है।

एक अध्ययन में मानें कि शोधकर्ता ने पुरुष छात्रों से पूछा, "आप कैसे कहेंगे कि आपके जैसे पुरुष छात्रों के साथ एक ही कॉलेज में अध्ययन करने के बारे में महिला छात्रों को कैसा महसूस होगा?" ) अत्यधिक प्रतिकूल दृष्टिकोणों के प्रतिरूपण के लिए। मान लीजिए, ये उत्तरदाताओं से प्राप्त कुछ उत्तर हैं।

(1) उन्हें विचार पसंद है। '

(2) 'मुझे नहीं लगता कि वे मन लगाते हैं।'

(३) 'उन्हें लगता है कि यह उन्हें कमतर करता है।'

(4) मैं उनके संपर्क में नहीं आता, इसलिए मैं नहीं जानता। '

(५) 'वे इससे घृणा करते हैं।'

(6) 'उनमें से कुछ इसे पसंद करते हैं, कुछ नहीं।'

(7) 'वे यहाँ अध्ययन करना चाहते हैं ताकि वे कह सकें कि वे पुरुषों से कम नहीं हैं।'

(() 'विशुद्ध रूप से लेडीज कॉलेज में वे बहुत मिस करती थीं, इसलिए उन्हें यह अच्छा लगता है।'

उपरोक्त प्रतिक्रियाओं के संबंध में, छात्राओं के लिए लगाए गए प्रतिकूल बनाम प्रतिकूल दृष्टिकोण के शास्त्रीय सिद्धांत के आधार पर श्रेणियों का एक सरल सेट विकसित करना मुश्किल नहीं होगा। लेकिन हम पाते हैं कि अनुकूल और प्रतिकूल दोनों उत्तर अर्थों के विभिन्न रंगों को व्यक्त करते हैं।

जो पुरुष छात्र कहता है, "वे (छात्राएं) यहां पढ़ना चाहते हैं, इसलिए वे कह सकते हैं कि वे पुरुषों से कम नहीं हैं" जो कहते हैं, "जो उन्हें विचार पसंद है।", "वे सोचते हैं कि यह उन्हें कम करता है" फिर से कहने वाले से अलग कुछ कह रहा है, "वे इसे नफरत करते हैं।"

इस प्रकार, हम देखते हैं कि दो विशेषताएँ, अर्थात्:

(1) लड़कियों के लिए अनुकूल या प्रतिकूल दृष्टिकोण का प्रतिष्ठा, और

(२) अनुकूल या प्रतिकूल दृष्टिकोण का समर्थन करने वाले लाभ या हानि के संदर्भ का स्पष्ट संदर्भ या अनुपस्थिति वर्गीकरण के एक जटिल सिद्धांत के दो महत्वपूर्ण घटक हैं।

पहले से चर्चा की गई श्रेणी-सेट की आदर्श आवश्यकताओं के अनुरूप श्रेणी-सेट में श्रेणियां निम्नानुसार रखी जा सकती हैं:

(1) छात्राओं के प्रति अनुकूल रवैया, उन्हें उन लाभों के संदर्भ में समझाया जाता है जो वे पुरुष छात्रों के साथ एक ही कॉलेज में पढ़ते हैं (उदाहरण के लिए, 7 वें और 8 वें उत्तर)।

(2) पुरुषों के साथ एक ही कॉलेज में अध्ययन करने से प्राप्त लाभ के स्पष्ट संदर्भ के बिना लड़कियों के प्रति अनुकूल रवैया (जैसे, कथन संख्या 1)।

(३) लड़कियों के प्रति उदासीन या मिलनसार रवैया (जैसे, कथन संख्या १)।

(४) लड़कियों के प्रति असंभावित रवैया, नुकसान (नकारात्मक लाभ) के संदर्भ में बताया गया है कि वे पुरुष छात्रों के साथ एक ही कॉलेज में पढ़ते हैं।

(५) सह-शिक्षा से होने वाले नुकसान या नुकसान के स्पष्ट संदर्भ के बिना लड़कियों के प्रति प्रतिकूल रवैया (जैसे, कथन संख्या ५)।

(6) अन्य उत्तर, नहीं कह सकते, कोई उत्तर नहीं, पता नहीं (जैसे, कथन संख्या 4)।

उपरोक्त दृष्टांत एक विचार देगा कि सामाजिक विज्ञान में वर्गीकरण कितना जटिल हो सकता है। ऐसी जटिल श्रेणियों के साथ काम करने के लिए वर्गीकरण में काफी देखभाल और प्रयास की आवश्यकता होती है। यहां तक ​​कि जब श्रेणियों को ध्यान से काम किया गया है, तो उनका उपयोग श्रेणियों के उपयोग से अधिक संकीर्ण और बिल्कुल परिभाषित की तुलना में अधिक समस्याएं पेश करेगा।

यदि उपरोक्त उदाहरण में एक पुरुष छात्र कहता है, "वे इसे यहाँ पसंद करते हैं, तो वे जानते हैं कि क्यों" यह एक विवादास्पद प्रश्न है कि इस कथन से कोई लाभ होता है या नहीं। इस प्रकार, ऐसे उत्तरों से निपटने के लिए अतिरिक्त नियम स्थापित करने होंगे।

यह कुछ पुनरावृत्ति की कीमत पर भी कहा जाना चाहिए कि हालांकि सिद्धांत रूप में, श्रेणी-सेटों के निर्माण के लिए प्रतिक्रियाओं की कई विशेषताओं का उपयोग करना संभव है, व्यवहार में, यह अक्सर इन सभी वर्गीकरण सिद्धांतों के बाद से अनावश्यक, असंवैधानिक और अपरिवर्तनीय है। अध्ययन के उद्देश्य पर आधारित है।

आइए अब हम असंरचित सामग्री को वर्गीकृत करने के लिए एक शास्त्रीय सिद्धांत का चयन करने की समस्या पर विचार करते हैं (यानी, असंरचित उपकरण द्वारा एकत्र की गई जानकारी)।

स्पष्ट रूप से तैयार किए गए शोध प्रश्नों या परिकल्पना के लिए प्रासंगिक डेटा एकत्र करने के लिए संरचित साधनों का उपयोग करते हुए, प्रतिक्रियाओं के वर्गीकरण के लिए उपयुक्त सिद्धांत प्रश्नों की प्रकृति और सुरक्षित प्रतिक्रियाओं द्वारा स्पष्ट रूप से निर्धारित हैं।

असंरचित सामग्री या डेटा के साथ काम करने में, हालांकि, पहली समस्या उन निर्णयों तक पहुंचने की है जिनके बारे में सामग्री के पहलुओं को वर्गीकृत किया जाना है, अर्थात, श्रेणियों को स्थापित करने में किस शास्त्रीय सिद्धांतों का उपयोग किया जाना है।

खोजपूर्ण अध्ययनों में जो मूल रूप से एक अच्छी तरह से तैयार की गई समस्या या स्पष्ट परिकल्पना के साथ शुरू नहीं होते हैं, शास्त्रीय सिद्धांतों के बारे में निर्णय पर पहुंचना मुश्किल है। डेटा संग्रह के समय, अन्वेषक को पता नहीं होता है कि कौन से पहलू सबसे महत्वपूर्ण हो सकते हैं।

इसलिए उसे असंरचित प्रकार का डेटा एकत्र करना चाहिए। विश्लेषण के दौरान, शोधकर्ता को न केवल असंरचित सामग्री से निपटने की समस्या का सामना करना पड़ता है, बल्कि उनमें से एक बड़ी मात्रा के साथ भी।

काम की परिकल्पना विकसित करने के लिए एक खोजपूर्ण अध्ययन के आंकड़ों का विश्लेषण करते समय यह उचित है कि काम करने योग्य संतोषजनक शास्त्रीय सिद्धांतों का उत्पादन होगा। शोधकर्ता को अपनी सभी सामग्री के माध्यम से सावधानीपूर्वक पढ़ने की आवश्यकता होती है, जो हर समय डेटा में अव्यक्त सुराग के लिए सतर्क रहता है। ऐसे सुराग अक्सर उन विषयों या स्थितियों पर अध्ययन सामग्री के माध्यम से सुरक्षित किए जाते हैं जो उनके अध्ययन के विपरीत हैं।

इस तरह के अध्ययन से अन्वेषक को दो स्थितियों के बीच महत्वपूर्ण अंतर देखने में मदद मिलती है। इस तरह के सुराग पाने के लिए एक और प्रक्रिया एक के मामलों को एक समूह में रखना है जो एक करीबी रिश्तेदारी लगती हैं या एक साथ आती हैं और फिर खुद से पूछते हैं कि किसने उसे महसूस किया कि वह एक ही समूह में रखे गए मामले एक जैसे हैं।

फिर भी एक और दृष्टिकोण जो काम की परिकल्पना के सूत्रीकरण के लिए सुराग को उत्तेजित कर सकता है, वह यह है कि ऐसे मामलों को ध्यान में रखा जाए जो कुछ सैद्धांतिक अपेक्षाओं या सामान्य ज्ञान को देखते हुए आश्चर्यचकित करते हैं और फिर आश्चर्यजनक या अप्रत्याशित घटनाओं की संभावित व्याख्या के लिए खोज करते हैं।

हालांकि, यह याद रखना चाहिए कि स्पष्ट रूप से परिकल्पना के साथ भी, असंरचित सामग्री का विश्लेषण विशेष समस्याएं प्रस्तुत करता है। सबसे पहले, इस बात की संभावना हमेशा बनी रहती है कि दिए गए बिंदु पर जानकारी कुछ दस्तावेजों से गायब हो सकती है।

हाइपोथीसिस पर प्रत्यक्ष असर नहीं होने से सामग्री का एक बड़ा सौदा होने की संभावना भी है। इसके अलावा, सामग्री की इकाइयों के आकार पर निर्णय लेने की समस्या है जिसके लिए श्रेणियां लागू की जानी हैं।

उदाहरण के लिए, यदि कोई शोधकर्ता कल्याणकारी एजेंसियों द्वारा रखे गए केस-रिकॉर्ड्स का उपयोग कर रहा है, तो उसे यह तय करना होगा कि कौन सी इकाई (जैसे, क्लाइंट, स्टेटमेंट, एक्ट, सोशल वर्कर, क्लाइंट के साथ सेशन या पूरा रिकॉर्ड) उसके जवाब देने के लिए सबसे उपयुक्त है विशिष्ट शोध प्रश्न।

चरण # 2. कोडिंग:

कोडिंग में प्रतीकों को निर्दिष्ट करना शामिल है, आमतौर पर प्रत्येक उत्तर के लिए अंक होते हैं जो एक पूर्व निर्धारित वर्ग में आते हैं। दूसरे शब्दों में, कोडिंग को बाद के सारणीकरण के लिए आवश्यक वर्गीकरण प्रक्रिया माना जा सकता है। कोडिंग के माध्यम से, कच्चे डेटा को प्रतीकों में बदल दिया जाता है जिसे सारणीबद्ध और गिना जा सकता है।

यह परिवर्तन हालांकि स्वचालित नहीं है, इसमें कोडर के हिस्से पर बहुत बड़ा निर्णय शामिल है। 'कोडर' एक ऐसे व्यक्ति के लिए आधिकारिक शीर्षक है जिसे रिकॉर्ड किए गए नोटों को कार्यालय में लाने के बाद प्रतिक्रियाओं को विशेष कोड देने की जिम्मेदारी सौंपी गई है।

हालांकि, यह याद रखना चाहिए कि अक्सर वह निर्णय जिसके अनुसार प्रतिक्रिया को एक विशेष कोड सौंपा जाना चाहिए, एक व्यक्ति के अलावा किसी अन्य व्यक्ति द्वारा बनाया जाता है जो 'कोडर' के आधिकारिक पदनाम से जाता है।

कोडिंग प्रत्येक अध्ययन में तीन अलग-अलग बिंदुओं पर हो सकती है, जिनमें से विभिन्न प्रकार के व्यक्ति कच्चे डेटा को कोड असाइन करने के लिए जिम्मेदार हो सकते हैं। कई अध्ययनों में, प्रतिवादी स्वयं को अपनी प्रतिक्रिया या स्थिति के लिए कोड आवंटित करने के लिए कहा जा सकता है।

यह कई पोल-प्रकार और बहुविकल्पीय प्रश्नों के लिए सही है। उदाहरण के लिए, जब प्रतिवादी को यह इंगित करने के लिए कहा जाता है कि कौन सी कक्षाएं (आय समूह कहती हैं) वह उदाहरण के लिए, उदाहरण के लिए, (ए) 3000 रुपये से नीचे है, (बी) रु। 3001 / - से रु। 6000 / - पीएम, (सी) रु। 6001 / - से रु। 9000 / - पीएम, (डी) रु। 9001 / - और ऊपर, प्रतिवादी दिए गए विकल्पों के बीच अपनी स्थिति को बंद करके बस अपनी प्रतिक्रिया को कोड करता है।

दूसरा बिंदु जिस पर कोडिंग हो सकती है, जब डेटा संग्रह के दौरान, साक्षात्कारकर्ता या पर्यवेक्षक विषयों की प्रतिक्रियाओं को श्रेणीबद्ध करता है। यह तब किया जा रहा है जब एक साक्षात्कारकर्ता या पर्यवेक्षक किसी व्यक्ति की प्रतिक्रिया या व्यवहार का वर्णन करने के लिए रेटिंग स्केल नियुक्त करता है।

अंतिम बिंदु जिस पर कोडिंग हो सकती है, निश्चित रूप से, जब कच्चे अनियंत्रित डेटा (विशेष रूप से डेटा-संग्रह के असंरचित उपकरणों के माध्यम से एकत्र) परियोजना कार्यालय में जमा किए जाते हैं और आधिकारिक कोडर विशेष कोड असाइन करने के लिए अपने निर्णय का उपयोग करते हैं प्रतिक्रिया या डेटा।

आइए हम कार्यालय में आधिकारिक कोडर्स द्वारा कोडिंग के पेशेवरों और विपक्षों की संक्षिप्त तुलना और तुलना करें और साक्षात्कारकर्ताओं या पर्यवेक्षकों द्वारा कोडिंग करके डेटा- संग्रह के क्षेत्र में काम करें।

साक्षात्कारकर्ता या पर्यवेक्षक स्थिति को नोटिस करने के साथ-साथ व्यक्ति के व्यवहार पर भी ध्यान देने की स्थिति में हैं। इस प्रकार, उनके पास अधिक जानकारी है जिस पर लिखित रिकॉर्ड के आधार पर काम करने वाले कोडरों की तुलना में प्रतिक्रियाओं के उचित वर्गीकरण के संबंध में अपने निर्णय को आधार बनाया जा सकता है जो प्रतिक्रिया के वास्तविक अर्थ के बारे में पूर्ण विचार नहीं दे सकता है।

डेटा-कलेक्टरों द्वारा कोडिंग का एक और लाभ यह है कि समय और श्रम दोनों को बचाया जा सकता है।

इसके विपरीत, कोडर्स द्वारा कार्यालय में कोडिंग के कुछ निश्चित लाभ हैं। जटिल डेटा का कोडिंग जो प्रतिबिंब के लिए समय की आवश्यकता होती है, उसे कार्यालय-कोडर्स द्वारा सलाह दी जानी चाहिए। डेटा-कलेक्टरों द्वारा किए गए स्पॉट कोडिंग निर्णय पर विचार-विमर्श के रूप में अधिक समय के साथ निर्णय के रूप में समझदार नहीं हो सकता है।

डेटा-कलेक्टरों का निर्णय कई कारकों द्वारा रंगीन हो सकता है, प्रतिवादी के दिखावे, लहजे और पिछले सवालों के जवाब, तरीके आदि। दूसरा, कोडिंग प्रतिक्रियाओं के दौरान एकरूपता में डेटा-कलेक्टरों की कमी का खतरा होता है।

इस प्रकार, बड़ी संख्या में प्रतिवादी से प्राप्त आंकड़ों की तुलना में बाधा आती है। तीसरा, साक्षात्कारकर्ता या पर्यवेक्षक उस सामग्री के संदर्भ में संदर्भ के अपने व्यक्तिगत फ्रेम विकसित कर सकते हैं जिसे वे कोडिंग कर रहे हैं। यह एक समय के बाद उनके वर्गीकरण को अविश्वसनीय बना देगा। संदर्भों का एक सामान्य ढांचा क्षेत्र की तुलना में कार्यालय-कोडिंग ऑपरेशन में प्राप्त करना और बनाए रखना आसान है।

आइए कोडिंग में विश्वसनीयता से संबंधित कुछ महत्वपूर्ण समस्याओं पर चर्चा करते हैं। कई चीजें हैं जो कोडर्स के निर्णय को अविश्वसनीय बनाने के लिए काम कर सकती हैं। कुछ कारकों को डेटा से वर्गीकृत किया जा सकता है, कुछ उन श्रेणियों की प्रकृति से जिन्हें लागू किया जाना है और अभी भी अन्य स्वयं कोडर से निकल सकते हैं।

अब हम संक्षेप में इनमें से कुछ कारकों और उन तरीकों के बारे में विचार करेंगे, जिनके खिलाफ उनका बचाव किया जा सकता है।

डेटा की अपर्याप्तता के परिणामस्वरूप कोडिंग में उत्पन्न होने वाली कई कठिनाइयाँ। अक्सर, डेटा एक विश्वसनीय कोडिंग के लिए पर्याप्त प्रासंगिक जानकारी की आपूर्ति नहीं करता है। यह कमी और अपर्याप्त डेटा-संग्रह प्रक्रियाओं के कारण हो सकता है। हालाँकि, इन कठिनाइयों को आम तौर पर डेटा के सावधानीपूर्वक संपादन से दूर किया जा सकता है। संपादन के रूप में ज्ञात कोडिंग के लिए अपनी गुणवत्ता में सुधार करने के लिए डेटा को जांचने में जो प्रक्रिया शामिल है।

जब डेटा-कलेक्टर अपनी सामग्री को परियोजना कार्यालय को सौंपता है, तो कई संभावित कोडिंग कठिनाइयों को समाप्त करने की संभावना अभी भी मौजूद है। डेटा की एक सावधानीपूर्वक जांच जैसे ही वे एकत्र की जाती हैं और यदि आवश्यक हो, साक्षात्कारकर्ताओं या पर्यवेक्षकों की एक व्यवस्थित पूछताछ कई कोडिंग समस्याओं को रोकने में मदद करती है।

न केवल बाद में कोडिंग की समस्याओं से बचने के लिए संपादन मदद करता है, यह यह भी इंगित करके डेटा-संग्रह की गुणवत्ता में काफी सुधार कर सकता है जहां साक्षात्कारकर्ताओं या पर्यवेक्षकों को गलत निर्देश हो सकते हैं या पर्याप्त विवरण में डेटा दर्ज नहीं हो सकता है।

वास्तव में, साक्षात्कार को पूर्व-परीक्षण या अवलोकन-अनुसूची प्रशिक्षण के दौरान साक्षात्कारकर्ताओं या पर्यवेक्षकों और वास्तव में डेटा-संग्रह की अवधि के दौरान संपादित किया जाना चाहिए। कोडिंग समस्याओं को दूर करने में परियोजना कार्यालय में संपादन एक लंबा रास्ता तय करता है।

इस प्रकार, संपादन किया जाना चाहिए, जबकि साक्षात्कारकर्ताओं या पर्यवेक्षकों को पूछताछ के लिए आसानी से उपलब्ध कराया जा सकता है। संपादन में साक्षात्कार या अवलोकन कार्यक्रम की सावधानीपूर्वक जांच शामिल है।

इनकी जाँच होनी चाहिए:

(1) पूर्णता: संपादकों को यह देखने की जरूरत है कि सभी आइटम विधिवत रूप से भरे हुए हैं। एक साक्षात्कार अनुसूची में एक प्रश्न के आगे एक रिक्त स्थान, उदाहरण के लिए, या तो 'कोई प्रतिक्रिया नहीं' या 'पता नहीं' या इनकार करने का मतलब हो सकता है। प्रश्न का उत्तर या अनुपयुक्तता, या ओवरसिट, आदि द्वारा छोड़े गए प्रश्न

(2) संपादक को साक्षात्कार या अवलोकन कार्यक्रम की जांच करनी चाहिए ताकि यह पता लगाया जा सके कि साक्षात्कारकर्ता या पर्यवेक्षक द्वारा सौंपी गई लिखावट या प्रतीकों या कोड को आसानी से कोडर द्वारा समझा जा सकता है या नहीं।

जब सामग्री सौंपी जाती है, और यदि उसे फिर से लिखने के लिए साक्षात्कारकर्ता या पर्यवेक्षक को प्राप्त करना आवश्यक हो, तो यह पठनीयता की जांच करना हमेशा उचित होता है। यदि ऐसा नहीं किया जाता है, तो कोडिंग एक मंच पर अटक सकती है जब साक्षात्कारकर्ता या पर्यवेक्षक को पूछताछ के लिए आसानी से याद नहीं किया जा सकता है।

(३) सम्पादन में समय-सारिणी की जांच करना भी शामिल है। अक्सर ऐसा होता है कि एक रिकॉर्ड की गई प्रतिक्रिया साक्षात्कारकर्ता या पर्यवेक्षक के लिए पूरी तरह से समझ में नहीं आती है, लेकिन कोडर के लिए समझदार नहीं है क्योंकि व्यवहार या प्रतिक्रिया का संदर्भ कोडर को नहीं पता है। डेटा-संग्राहकों की व्यवस्थित पूछताछ से भ्रम और अस्पष्टता दूर हो जाएगी और कोडिंग की गुणवत्ता में काफी सुधार होगा।

(४) आंकड़ों की जांच या जाँच की जानी चाहिए कि क्या अनुसूची में दर्ज प्रतिक्रियाओं के संबंध में कुछ विसंगतियाँ हैं या नहीं।

उदाहरण के लिए, एक प्रतिवादी ने पहले के एक प्रश्न के जवाब में कहा हो सकता है कि वह विशेष समूह के लोगों से कभी नहीं मिला था और फिर भी, बाद के एक प्रश्न के उत्तर में, उसने इस समूह के कुछ लोगों के जाने के बारे में कुछ कहा हो सकता है राउंड। यदि ऐसी स्थिति है, तो इस विसंगति के बारे में पूछताछ करने के लिए एक स्पष्ट आवश्यकता है, और इसे डेटा-कलेक्टरों से पूछताछ के माध्यम से स्पष्ट किया जाए।

(5) एकरूपता की डिग्री की जांच करना भी आवश्यक है जिसके साथ साक्षात्कारकर्ताओं ने डेटा एकत्र करने और रिकॉर्ड करने में निर्देशों का पालन किया है। यदि निर्देशों में निर्दिष्ट लोगों के अलावा अन्य इकाइयों में प्रतिक्रिया दर्ज की जाती है, तो कोडिंग में बाधा आ सकती है।

(६) यह ध्यान दिया जाना चाहिए कि कुछ प्रतिक्रिया जांच के उद्देश्य के लिए अप्रासंगिक हो सकती है। ऐसा होने की संभावना है यदि कोई प्रश्न स्पष्ट रूप से काम नहीं किया गया है या समझदारी से नहीं पूछा गया है। इस प्रकार डेटा को उचित लोगों से अनुचित प्रतिक्रियाओं को अलग करने की दृष्टि से सावधानीपूर्वक जांच की जानी चाहिए।

डेटा के वर्गीकरण का मूल्य स्वाभाविक रूप से नियोजित श्रेणियों की ध्वनि पर निर्भर करता है। यह आवश्यक है कि अनुसंधान के उद्देश्य के लिए प्रासंगिक होने के अलावा श्रेणियों को एक वैचारिक दृष्टिकोण से भी परिभाषित किया गया है।

यदि सूचकों को उन संकेतकों के संदर्भ में स्पष्ट रूप से परिभाषित नहीं किया गया है, तो कोडिंग अविश्वसनीय होगा, जो यहां और अब डेटा पर लागू होते हैं। व्यवहार में, श्रेणियों को हाथ में डेटा से उदाहरण के माध्यम से परिभाषित किया जाता है। यह बहुत मददगार है अगर डेटा से मिलने वाले चित्र न केवल यह दिखाते हैं कि किस प्रकार की प्रतिक्रियाएँ श्रेणी को टाइप करती हैं, बल्कि समान रूप से समान श्रेणियों के बीच सीमा-रेखा को भेद करने में भी मदद करती हैं।

यह स्पष्ट है कि कोडिंग की गुणवत्ता कोडर्स की क्षमता से प्रभावित होती है। इस प्रकार कोडर्स का प्रशिक्षण किसी भी अध्ययन में एक महत्वपूर्ण कदम है।

कोडर का प्रशिक्षण निम्नलिखित चरणों द्वारा आगे बढ़ सकता है:

सबसे पहले, विभिन्न कोड्स को ट्रेडीनेस (कोडर्स) को समझाया जाता है और डेटा से वर्गीकृत किए जाने वाले उदाहरणों के साथ सचित्र किया जाता है।

दूसरे, सभी प्रशिक्षु-कोडर्स तब डेटा के एक नमूने पर अभ्यास करते हैं, जो समस्याएं उत्पन्न होती हैं, जो सामान्य प्रक्रियाओं और परिभाषाओं को विकसित करने के लिए पर्यवेक्षक के साथ एक समूह के रूप में कोडर्स द्वारा चर्चा की जाती हैं।

तीसरा, अभ्यास-कोडिंग से उत्पन्न सुराग का उपयोग श्रेणियों में संशोधन को प्रभावी बनाने के लिए किया जाता है ताकि वे सामग्री पर बेहतर तरीके से लागू हो सकें और उन प्रक्रियाओं और परिभाषाओं को लिख सकें जो प्रारंभिक कोडिंग के दौरान विकसित हुई हैं।

चौथा, अभ्यास की अवधि में किसी समय जब अपेक्षाकृत कुछ नई समस्याएं उत्पन्न होती हैं, तो कोडर एक दूसरे या पर्यवेक्षक से परामर्श किए बिना डेटा के समान हिस्से पर काम करते हैं। कोडिंग की स्थिरता या विश्वसनीयता तब यह निर्धारित करने के लिए गणना की जाती है कि क्या सही बयाना में कोडिंग शुरू करना संभव है।

विश्वसनीयता या निरंतरता जांच के परिणामों के आधार पर, उन श्रेणियों को समाप्त करने का निर्णय लिया जा सकता है जो बहुत अविश्वसनीय लगती हैं या प्रशिक्षण कोडरों में अधिक समय बिताने या कोडर्स को खत्म करने के लिए जो सबसे असंगत हैं और इतने पर।

अंत में, समय-समय पर जाँच यह सुनिश्चित करने के लिए की जाती है कि कोडर अधिक अनुभव के साथ लापरवाह न हो जाएं या वे सामग्री में नई समस्याओं से निपटने के व्यक्तिगत अज्ञात तरीके विकसित न करें। एकरूपता सुनिश्चित करने के लिए, और कोडिंग शुरू होने के बाद किया गया निर्णय बिना किसी देरी के सभी कोडर को सूचित किया जाना चाहिए।

जाहिर है, एक निरंतरता और उपयुक्तता जिसके साथ दिए गए प्रकार का उत्तर किसी श्रेणी को दिया जाता है, विश्लेषण के परिणाम पर एक महत्वपूर्ण असर पड़ेगा, इसलिए, कोडिंग की विश्वसनीयता की जांच करना और कोडरों के बीच समझौते को बढ़ाना महत्वपूर्ण है। यथासंभव।

यह निश्चित रूप से, किसी भी स्तर की विश्वसनीयता को निर्धारित मानक के रूप में प्राप्त करना मुश्किल है। विभिन्न प्रकार की सामग्री विश्वसनीयता प्राप्त करने में कठिनाई के विभिन्न डिग्री पेश करती है। एक नियम के रूप में, कोडित की जाने वाली सामग्री को अधिक संरचित किया जाता है और इसलिए उपयोग की जाने वाली श्रेणियों को सरलता से अधिक विश्वसनीयता मिलती है।

यह ध्यान दिया जाना चाहिए कि एक अध्ययन में उपयोग किए जाने वाले कोड के प्रकार अलग-अलग होंगे कि क्या डेटा मशीन या हाथ से सारणीबद्ध किया जाना है। यदि डेटा को मैन्युअल रूप से सॉर्ट किया जाना है, तो कक्षाओं का शब्द-विवरण संतोषजनक है।

साथ ही अल्फा-बेट्स के संक्षिप्तीकरण या पत्र, जैसे, 'वाई फॉर यस, नो के लिए' एन 'आदि का उपयोग किया जा सकता है। दूसरी ओर, मशीन सारणीकरण की आवश्यकता है कि वर्गों को संख्यात्मक प्रतीकों में व्यक्त किया जाए, क्योंकि मशीनों को केवल संख्यात्मक डेटा के साथ खिलाया जा सकता है।

यांत्रिक सारणीकरण के लिए पंच कार्ड के उपयोग की आवश्यकता होती है। हालांकि, पंच कार्ड पर दिखाए जाने वाले विभिन्न वर्गों की संख्या सीमित है। किसी भी मामले में, मशीन सारणीकरण के लिए उपयोग किए जाने वाले सभी कोड हाथ सारणीकरण के लिए भी उपयोग किए जा सकते हैं।

यदि कोड ऐसे पंच कार्डों पर लगाए जाने हैं जिनमें दो आकार सामान्य उपयोग में हैं, अर्थात, 80 कॉलम कार्ड और 54 कॉलम कार्ड, तो जानकारी या प्रतिक्रिया के अधिकांश मदों के लिए कम वर्गों / श्रेणियों पर दस का उपयोग करना वांछनीय है।

पंच कार्ड में कुल 12 कोड बनाने वाले प्रत्येक कॉलम में 10 गिने स्थान और एक X और Y होते हैं जिनका उपयोग किया जा सकता है। किसी स्तंभ में एक से अधिक प्रकार की वस्तु प्राप्त करना जटिल प्रक्रिया है। उदाहरण के लिए, नैटिविटी और आयु कोड एक ही कॉलम में नहीं लगाए जा सकते हैं जब तक कि प्रत्येक के लिए केवल छह आयु-समूह का उपयोग न किया जाए।

चरण # 3. सारणीकरण:

डेटा के सांख्यिकीय विश्लेषण में तकनीकी प्रक्रिया का एक हिस्सा है। सारणीयन में आवश्यक तत्व सांख्यिकीय तालिकाओं के रूप में परिणामों का सारांश है।

यह केवल तब होता है जब कच्चे डेटा को समूहों में विभाजित किया जाता है और इन विभिन्न समूहों में गिरने वाले मामलों की संख्या से बना होता है, कि शोधकर्ता के लिए यह निर्धारित करना संभव है कि उसके परिणामों का क्या अर्थ है और उपभोक्ता को उसके निष्कर्षों को एक रूप में बता सकता है जो कर सकते हैं आसानी से समझा जा सकता है।

टेबुलेशन स्वाभाविक रूप से कच्चे डेटा के लिए श्रेणियां स्थापित करने, प्रतिक्रिया के कोडिंग और कोडिंग पर निर्भर करता है (यांत्रिक सारणीयन के लिए मशीनों के माध्यम से कार्ड चलाने और हाथ सारणीकरण के लिए सॉर्टिंग और टैलींग)।

अनुभवी शोधकर्ता आम तौर पर उसी समय सारणीयन योजनाओं का विकास करते हैं जब वे डेटा-संग्रह उपकरणों का मसौदा तैयार करते हैं या नमूना बनाते हैं। अनुभवहीन शोधकर्ताओं ने डेटा एकत्र किए जाने तक सारणीयन योजनाओं के साथ खुद की चिंता की। बेशक, शोधकर्ता के लिए सारणीकरण की संपूर्ण सीमा को दूर करना असंभव है जो बाद में वांछित होगा।

उसे अपनी शोध समस्या या जाँच के विषय के साथ पर्याप्त रूप से परिचित होना चाहिए, जो उन तालिकाओं को बनाने में सक्षम हो जो उन प्रश्नों के उत्तर प्रदान करेंगे, जिन्होंने अध्ययन को जन्म दिया। शोधकर्ता को पर्याप्त सारणीयन योजना तैयार करने में सक्षम होना चाहिए यदि वह पहले के शोधों के निष्कर्षों का उपयोग करता है जिसमें आम तत्व हैं जिनके लिए योजनाएं तैयार की जा रही हैं।

खोजपूर्ण अध्ययन में, एक बेहतर और सुरक्षित प्रक्रिया अंतिम अध्ययन में शामिल किए जाने वाले प्रकार की आबादी के नमूने पर डेटा-संग्रह साधन को बहाना है। इस तरह, किस तरह का सारणीकरण सार्थक होगा, इस संबंध में कुछ सुराग आम तौर पर प्राप्त किए जा सकते हैं।

सारणीकरण, पूरी तरह से मैनुअल तरीकों से किया जा सकता है; यह हाथ सारणीकरण के रूप में जाना जाता है। वैकल्पिक रूप से, यह यांत्रिक तरीकों से डेटा के थोक के लिए स्वचालित और तेज़ बिजली मशीनों का उपयोग करके किया जा सकता है, इस प्रक्रिया को यांत्रिक सारणीकरण के रूप में जाना जाता है।

शोधकर्ता को अपने अध्ययन के लिए विस्तृत सारणीयन योजना तैयार करने से पहले यह तय करना होगा कि वह किस पद्धति का उपयोग करेगा। यह निर्णय लागत, समय, कर्मियों आदि जैसे विभिन्न विचारों पर आधारित होगा।

दोनों हाथ सारणीयन के साथ-साथ यांत्रिक सारणीकरण प्रक्रियाओं की अपनी योग्यता और सीमाएं हैं। इन गुणों और अवगुणों के लिए शोधकर्ता का अलर्ट यह तय करने के लिए बेहतर है कि कौन सा तरीका उसकी समस्या के अनुकूल होगा।

हम सारणीयन के इन दो तरीकों की खूबियों की संक्षिप्त समीक्षा करेंगे:

(1) मैकेनिकल सारणीकरण में बहुत अधिक लिपिक कार्य और विशेष कार्य शामिल हैं। बेशक, यह गति की सुविधा देता है लेकिन गति हमेशा अतिरिक्त लिपिकीय कार्य के लिए पर्याप्त मुआवजा नहीं हो सकती है।

(2) यदि सारणीबद्ध कार्य शुरू होने से पहले वांछित संख्याओं और प्रकारों का निर्धारण नहीं किया जाता है, । मशीन-सारणीकरण अधिक समीचीन हो सकता है। लेकिन, यदि हाथ सारणीकरण को कुशल माना जाता है, तो जिस क्रम में विभिन्न प्रकार और गणना की जाती है, वह सारणीकरण से पहले निर्धारित किया जाता है।

(3) मशीन सारणीकरण का एक प्रमुख लाभ यह है कि यह क्रॉस-वर्गीकरण की सुविधा देता है। बड़े पैमाने पर अध्ययनों में, जहां कई चर सहसंबंधित या क्रॉस-वर्गीकृत किए जाते हैं, मशीन सारणीकरण काफी बेहतर है।

यह इस कारण से है कि चर के बीच कई अंतर संबंध की आवश्यकता वाले अध्ययनों में यांत्रिक सारणीकरण का उपयोग किया जाता है। लेकिन, यदि उत्तरदाताओं की कुल संख्या छोटी है, तो क्रॉस-क्लासिफिकेशन सिद्धांत के अनुसार उनकी एक मैन्युअल गिनती अपेक्षाकृत किफायती हो सकती है।

(४) जब प्रत्येक मामले के लिए कोडित जानकारी और कई पंच कार्डों की बहुत आवश्यकता होती है, तो हाथ सारणीकरण बेहतर हो सकता है।

(५) यदि डेटा को अपेक्षाकृत कम समय के नोटिस पर नए सारणीकरण के लिए तैयार रूप में रखना वांछित है, तो पंच कार्ड आमतौर पर उपयोगी होते हैं। समय-समय पर अध्ययन या सर्वेक्षण के लिए मैकेनिकल सारणीकरण उपयोगी होता है जिसमें एक ही प्रकार की जानकारी को लगातार अंतराल पर एकत्र करने की आवश्यकता होती है।

(६) छँटाई और गिनती की प्रक्रिया यदि मशीन द्वारा की जाती है तो हाथ से किए जाने पर त्रुटि उत्पन्न होने की संभावना कम होती है। बेशक, मशीन सारणीकरण में उत्पन्न हो सकते हैं और कर सकते हैं, जब वे करते हैं, तो उन्हें पहचानना और जांचना बहुत मुश्किल होता है।

सर्वेक्षण की कोडिंग, संपादन या फील्ड-वर्क चरणों में पाई गई कोई भी त्रुटि मशीन-सारणीकरण कार्य को रोक सकती है। यह अक्सर वांछनीय है, इसलिए, क्षेत्र-कार्य के साथ-साथ हाथ सारणीकरण के साथ आगे बढ़ना है।

(() सारणीकरण कार्यों की लागत शोधकर्ता की एक महत्वपूर्ण चिंता है। पंचर कार्ड के सबसे अधिक होने के बाद से मशीन के टेबुलेशन में अक्सर बहुत अधिक लागत शामिल होती है, छिद्रण और सत्यापन के लिए शुल्क, मशीन को छांटने और टेबुलेशन मशीन के लिए शुल्क और विशिष्ट प्रकार के मशीन ऑपरेटरों की विशेष सेवाओं को किराए पर देने के लिए खर्च अक्सर हाथ में शामिल लोगों की तुलना में बहुत अधिक जोड़ते हैं। सारणीकरण।

(() एक और महत्वपूर्ण विचार समय है। यांत्रिक सारणीकरण में सारणीकरण का काम बहुत कम समय में किया जाता है, लेकिन तैयारी के चरणों के साथ-साथ प्रशिक्षण, पर्यवेक्षण और कुछ प्रकार की मशीनों की अनुपलब्धता के कारण कार्य की अव्यवस्था के परिणामस्वरूप सभी अनिवार्य रूप से अपव्यय में योगदान कर सकते हैं। समय की।

(९) सुविधा के विचारों को शायद ही अनदेखा किया जा सकता है। यदि यांत्रिक सारणीयन परियोजना कार्यालय से कुछ कार्यालय तक कच्चे डेटा के प्रेषण की मांग करता है, तो पैकिंग, परिवहन आदि में शामिल असुविधाएं होती हैं।

(१०) अंत में, टिप्पणी की जाने वाली सामग्री की मात्रा को रिकॉर्ड किया जाना और विश्लेषण करना भी सारणीयन विधियों की पसंद को प्रभावित कर सकता है। कुछ राय-सर्वेक्षणों में, मुखबिरों की वाक्पटु टिप्पणियाँ महत्वपूर्ण हैं। अकेले हाथ सारणीकरण में उपयोग किए जाने वाले हाथ-कोड कार्ड ऐसी टिप्पणियों या टिप्पणियों के लिए जगह प्रदान कर सकते हैं।

सारणीकरण कार्य को संभालने वाली मशीनें कई प्रकार की होती हैं। हाल के वर्षों के दौरान इस क्षेत्र में विकास बेहद तेजी से हुआ है। कुछ मशीनें बस सॉर्ट करती हैं और कार्डों की गिनती करती हैं, अन्य लोग परिणामों को सॉर्ट, काउंट और प्रिंट करते हैं, फिर भी अन्य लोग सबसे जटिल सांख्यिकीय संचालन या गणना करने के लिए सुसज्जित हैं।

ये अंतिम-उल्लेखित मशीनें बेहद जटिल हैं और उन्हें एक विशेषज्ञ द्वारा लाइन में दिए गए ऑपरेशन के लिए प्रोग्राम किया जाना चाहिए। एक तालिका संख्यात्मक डेटा का एक प्रदर्शन है जो लेबल वाले कॉलम (ऊर्ध्वाधर) और पंक्तियों (क्षैतिज) में व्यवस्थित रूप से व्यवस्थित है।

एक साधारण या प्रारंभिक तालिका उन आवृत्तियों की सरल गणनाओं को इंगित करती है जिनके साथ प्रत्येक सेट में विभिन्न श्रेणियां डेटा में होती हैं, उदाहरण के लिए, नमूने में लोगों की संख्या जिन्होंने हाई स्कूल में भाग लिया है लेकिन उत्तीर्ण नहीं हुए हैं, उन लोगों की संख्या जो भाग लिया है कॉलेज लेकिन स्नातक वगैरह नहीं। नीचे दी गई तालिका में सिनेमा के लिए पचास उत्तरदाताओं की यात्राओं की आवृत्तियों को इंगित किया गया है।

शोध में, हम अक्सर दो या अधिक चर के बीच संबंध का पता लगाने में रुचि रखते हैं, उदाहरण के लिए, शिक्षा और आय और प्रजनन क्षमता, सरल सारणी (ऊपर सचित्र) एकल विशेषता के संबंध में उत्तरदाताओं का आवृत्ति वितरण दिखाते हैं, जैसे, शिक्षा या आय या प्रजनन क्षमता, हमें दो या अधिक चर के बीच संबंध देखने में मदद नहीं करती है।

संबंध देखने का तरीका क्रॉस-टेबल या ब्रेकडाउन टेबल तैयार करना है। ऐसी तालिकाएँ दो या दो से अधिक श्रेणियों में संयुक्त रूप से होने वाले मामलों के समूहन को संभव बनाती हैं, उदाहरण के लिए, उन मामलों की संख्या का सारणीकरण, जो शिक्षा में उच्च हैं, आय में कम हैं और 2 से 3 बच्चों के बीच हैं, या उन मामलों की संख्या शिक्षा में कम, आमदनी में कम और 4 से 5 बच्चों के बीच वगैरह। छात्रों को क्रॉस-टेबुलेशन का सबसे प्रारंभिक रूप कॉलेज टाइम-टेबल से परिचित है।

मान लीजिए कि एक शोधकर्ता तीन वैरिएबल, व्यवसाय, आय और प्रजनन क्षमता के बीच संबंध देखना चाहता है। उसे सारणीकरण की एक योजना नियोजित करनी चाहिए जो इन तीन चरों की विभिन्न श्रेणियों के सभी संभावित संयोजनों को वहन कर सके।

100 व्यक्तियों के काल्पनिक नमूने पर डेटा का क्रॉस-सारणीकरण निम्नानुसार प्रस्तुत किया जा सकता है:

उपरोक्त तालिका में, हमने पंक्तियों में बच्चों की संख्या का संकेत दिया है। प्रजनन क्षमता के इस चर को पांच श्रेणियों में बांटा गया है, अर्थात, कोई मुद्दा नहीं, 1 से 2 मुद्दे, 3 से 4, 5 से 6, 7 और ऊपर। तो बाएं हाथ पर मार्जिन में, हमारे पास प्रजनन की ये 5 श्रेणियां हैं। हमने कॉलम में 100 उत्तरदाताओं की आय का संकेत दिया है।

आय चर को पांच श्रेणियों में विभाजित किया गया है, अर्थात, रु। 200 से नीचे, रु। २०, ०००, ४०१-६००, ६०१-000००, -०--१०००। इस प्रकार, हमारे पास इन श्रेणियों के अनुरूप पाँच कॉलम हैं।

चूंकि हमारे पास एक और चर है, अर्थात, समायोजित करने के लिए व्यवसाय, आय के लिए कॉलम प्रत्येक को दो श्रेणियों के लिए दो भागों में उप-विभाजित किया गया है, जिसमें व्यवसायों को विभाजित किया गया है, अर्थात्, सफेद कॉलर व्यवसाय और ब्लू-कॉलर व्यवसाय ।

इस प्रकार, हमारे पास आय और व्यवसाय के अनुरूप दस ऊर्ध्वाधर स्तंभ हैं। प्रजनन चर की श्रेणियों के लिए हमारे पास क्षैतिज पंक्तियों की संख्या पाँच है। इस प्रकार, हमारे पास तालिका के शरीर को बनाने वाली पांच पंक्तियों के दस स्तंभ हैं।

स्तंभों और पंक्तियों के प्रतिच्छेदन ने 50 (पचास) कोशिकाओं या बक्से को प्रभावित किया है। इनमें से प्रत्येक बॉक्स या सेल में एक विशेष संख्या में ऐसे मामले होते हैं जो आय या व्यवसाय के संबंध में, या तो इन दोनों में या इन सभी में से किसी एक में अन्य कोशिकाओं से भिन्न होते हैं। आइए इस बारे में कुछ विचार प्राप्त करने के लिए तालिका पढ़ें कि यह क्या दर्शाता है।

100 मामलों के कुल नमूने में से, 25 ऐसे हैं जो 3 और 4 मुद्दों के बीच हैं। इन 25 में से, बाएं हाथ से पढ़ने वाले, 5 व्यक्तियों (3 और 4 बच्चों के साथ) की आय 200 / - रुपये से कम है और वे सफेदपोश व्यवसायों में कार्यरत हैं।

दो व्यक्तियों (3 और 4 बच्चों के साथ) की आय 200 रुपये से कम है और वे नीले-कॉलर व्यवसायों में कार्यरत हैं। अब दूसरी पंक्ति लेते हैं। कुल उत्तरदाताओं में से, 38 में 1 और 2 बच्चे हैं। 11 (7 वें सेल में) जिनके 1 से 2 बच्चे हैं, वे आय समूह से रु .01 से रु .00 तक हैं और वे सफेदपोश व्यवसाय में कार्यरत हैं।

इस अभ्यास से यह स्पष्ट हो जाना चाहिए कि डेटा में निहित चरों के बीच संबंधों की खोज या परीक्षण में क्रॉस-टेबुलेशन एक आवश्यक कदम है।

सारणीकरण एक तरह से सारांशित रूप में डेटा प्रस्तुत करने का एक साधन है जो आवश्यक सांख्यिकीय गणनाओं की सुविधा प्रदान करता है। हालाँकि, डेटा को अन्य तरीकों से प्रस्तुत किया जा सकता है, अर्थात, उन्हें सारणीबद्ध रूप में प्रस्तुत करने के बजाय, शोधकर्ता उन्हें आरेख या ग्राफ़ के रूप में प्रस्तुत कर सकता है। इस तरह के आरेख या ग्राफिक अभ्यावेदन में कम ज्ञानी पाठक के समझदार होने का गुण होता है।

लेकिन वे इस सीमा से पीड़ित हैं कि वे सांख्यिकीय गणना के आधार के रूप में इतने उपयोगी नहीं हैं। आइए अब हम अगले ऑपरेशन यानी डेटा के सांख्यिकीय विश्लेषण पर चर्चा करें। सारणीकरण इस दिशा में एक पूर्वापेक्षा या पहला कदम है।

चरण # 4. आंकड़ों का सांख्यिकीय विश्लेषण :

शोध में, हम प्रत्येक व्यक्ति प्रतिवादी से चिंतित नहीं हैं। अनुसंधान का उद्देश्य इससे व्यापक है। यही है, हम केवल इतना अधिक जानना चाहते हैं कि किसी दिए गए प्रतिवादी, उदाहरण के लिए, निरस्त्रीकरण के प्रति बेहद अनुकूल रवैया है और एक अन्य प्रतिवादी के पास एक ही मुद्दे के प्रति मामूली प्रतिकूल दृष्टिकोण है। लेकिन यह जानकारी सिर्फ पर्याप्त नहीं है।

सामाजिक विज्ञान शोध आम तौर पर उत्तरदाताओं की एक विशेष आबादी के बारे में जानकारी प्रदान करने के लिए निर्देशित किया जाता है। समग्रता का नमूना हमारे अध्ययन की समस्या से संबंधित कुछ प्रश्न पूछे जा सकते हैं, या किसी प्रकार के अवलोकन के अधीन हो सकते हैं।

चलिए मान लेते हैं कि हमने 'पोस्ट-ग्रेजुएट' कक्षाओं में पढ़ने वाले एक हजार कॉलेज छात्रों का एक नमूना लिया है, जो उनकी अध्ययन की आदतों के बारे में जानकारी हासिल करने की दृष्टि से प्रश्नों की एक श्रृंखला है। इस प्रकार हमारे शोध में 'पोस्ट-ग्रेजुएट' छात्रों की 'जनसंख्या' के बारे में जानकारी प्रदान करने की दिशा में निर्देशित किया जाएगा, जिनमें से हजार मामले एक नमूना हैं।

इस 'जनसंख्या' को चिह्नित करने के लिए एक आवश्यक कदम के रूप में, हमें उस अध्ययन की आदतों के बारे में जानकारी का वर्णन या संक्षेप में प्रस्तुत करना होगा जो हमने नमूना पर प्राप्त की है। सारणीकरण इस कदम का एक हिस्सा है। इसके अलावा, हमें प्राप्त आंकड़ों से 'जनसंख्या' के सामान्यीकरण की विश्वसनीयता का अनुमान लगाना चाहिए। सांख्यिकीय तरीके इन दोनों सिरों को पूरा करने में उपयोगी होते हैं।