एक टेस्ट की विश्वसनीयता का निर्धारण: 4 तरीके

एक परीक्षण की विश्वसनीयता गुणांक (कभी-कभी आत्म-सहसंबंध कहा जाता है) की गणना के लिए सामान्य उपयोग में चार प्रक्रियाएं हैं। ये हैं: 1. टेस्ट-रीटेस्ट (पुनरावृत्ति) 2. वैकल्पिक या समानांतर रूप 3. विभाजन-आधी तकनीक 4. तर्कसंगत विशिष्टता।

1. टेस्ट-रीस्ट विधि:

परीक्षण-रीटेस्ट विधि के माध्यम से विश्वसनीयता का अनुमान लगाने के लिए, परीक्षण के दो व्यवस्थापनों के बीच एक ही समय के अंतराल के साथ समान परीक्षा दो बार विद्यार्थियों के एक ही समूह को दी जाती है।

परिणामी परीक्षण स्कोर को सहसंबद्ध किया गया और यह सहसंबंध गुणांक स्थिरता का एक माप प्रदान करता है, अर्थात, यह इंगित करता है कि परीक्षण के परिणाम कितने स्थिर हैं। तो यह अन्यथा स्थिरता के एक उपाय के रूप में जाना जाता है।

इस मामले में विश्वसनीयता का अनुमान दोनों प्रशासनों के बीच अनुमत समय-अंतराल की लंबाई के अनुसार भिन्न होता है। सहसंबंध के उत्पाद पल विधि स्कोर के दो सेट की विश्वसनीयता का आकलन करने के लिए एक महत्वपूर्ण विधि है।

इस प्रकार, स्कोर के दो सेटों के बीच एक उच्च सहसंबंध इंगित करता है कि परीक्षण विश्वसनीय है। मीन्स, यह दर्शाता है कि पहले प्रशासन में प्राप्त अंक उसी परीक्षा के दूसरे प्रशासन में प्राप्त अंकों के साथ मिलते हैं।

इस विधि में समय अंतराल एक महत्वपूर्ण भूमिका निभाता है। यदि यह एक या दो दिन में बहुत छोटा है, तो परिणामों की स्थिरता कैरी-ओवर प्रभाव से प्रभावित होगी, अर्थात, विद्यार्थियों को पहले प्रशासन से दूसरे तक के कुछ परिणाम याद होंगे।

यदि समय अंतराल को एक वर्ष कहा जाता है, तो परिणाम न केवल परीक्षण प्रक्रियाओं और स्थितियों की असमानता से प्रभावित होंगे, बल्कि समय की अवधि में विद्यार्थियों में वास्तविक बदलावों से भी प्रभावित होंगे।

रिटेस्ट का समय अंतराल छह महीने से अधिक नहीं होना चाहिए। पखवाड़े (2 सप्ताह) के अवकाश का समय अंतराल विश्वसनीयता का सटीक सूचकांक देता है।

लाभ:

विश्वसनीयता गुणांक का आकलन करने के लिए आमतौर पर स्व-सहसंबंध या परीक्षण-रीस्ट विधि का उपयोग किया जाता है। यह विभिन्न स्थितियों में आसानी से उपयोग करने के योग्य है। क्रमिक परीक्षण के बीच कई दिनों के अंतराल के बाद पर्याप्त लंबाई का परीक्षण किया जा सकता है।

नुकसान:

1. यदि परीक्षण तुरंत दोहराया जाता है, तो कई विषय अपने पहले उत्तरों को याद करेंगे और नई सामग्री पर अपना समय बिताएंगे, इस प्रकार अपने स्कोर को बढ़ाने की प्रवृत्ति - कभी-कभी एक अच्छे सौदे से।

2. तत्काल स्मृति प्रभाव के अलावा, अभ्यास और सामग्री के साथ परिचित द्वारा प्रेरित आत्मविश्वास लगभग निश्चित रूप से स्कोर को प्रभावित करेगा जब परीक्षण दूसरी बार लिया जाता है।

3. प्राप्त विश्वसनीयता का सूचकांक कम सटीक है।

4. यदि परीक्षणों के बीच का अंतराल लंबा (छह महीने से अधिक) विकास कारक है और परिपक्वता स्कोर को प्रभावित करेगी और विश्वसनीयता सूचकांक को नीचे ले जाएगी।

5. यदि परीक्षण तुरंत या थोड़े समय के अंतराल के बाद दोहराया जाता है, तो कैरी-ओवर इफेक्ट / ट्रांसफर प्रभाव / मेमोरी / प्रैक्टिस प्रभाव की संभावना हो सकती है।

6. एक ही परीक्षा को दोहराते हुए, एक ही समूह पर दूसरी बार, छात्रों को उदासीन बना देता है और इस प्रकार वे पूरे दिल से भाग लेना पसंद नहीं करते हैं।

7. कभी-कभी, एकरूपता को बनाए नहीं रखा जाता है जो टेस्ट स्कोर को भी प्रभावित करता है।

8. पहले प्रशासन के बाद कुछ सवालों पर चर्चा करने की संभावना, जो विश्वसनीयता को प्रभावित करने वाले दूसरे प्रशासन में स्कोर बढ़ा सकते हैं।

2. वैकल्पिक या समानांतर रूप विधि:

समतुल्य रूप विधि के द्वारा विश्वसनीयता का अनुमान लगाने में परीक्षण के दो भिन्न लेकिन समतुल्य रूपों का उपयोग शामिल है। समानांतर रूप की विश्वसनीयता को वैकल्पिक रूप की विश्वसनीयता या समकक्ष प्रपत्र विश्वसनीयता या तुलनीय रूप की विश्वसनीयता के रूप में भी जाना जाता है।

इस पद्धति में एक परीक्षण के दो समानांतर या समकक्ष रूपों का उपयोग किया जाता है। समानांतर रूपों से हमारा मतलब है कि सामग्री, उद्देश्य, प्रारूप, कठिनाई स्तर और वस्तुओं के विभेदक मूल्य, परीक्षण की लंबाई आदि से संबंधित आर्क अब तक समान हैं।

समानांतर परीक्षणों में वस्तुओं के बीच समान औसत स्कोर, संस्करण और अंतर सह-संबंध होते हैं। यही है, दो समानांतर रूपों को सभी मामलों में सजातीय या समान होना चाहिए, लेकिन परीक्षण वस्तुओं का दोहराव नहीं। बता दें कि दो फॉर्म फॉर्म ए और फॉर्म बी हैं।

विश्वसनीयता गुणांक को परीक्षण के दो समकक्ष रूपों पर स्कोर के बीच गुणांक सहसंबंध के रूप में देखा जा सकता है। दो समान रूप संभवतः सामग्री, डिग्री, मानसिक प्रक्रियाओं, और कठिनाई स्तर और अन्य पहलुओं में समान हैं।

परीक्षण का एक रूप छात्रों पर प्रशासित किया जाता है और तुरंत परीक्षण के बाद दूसरे समूह को उसी समूह को आपूर्ति की जाती है। इस प्रकार प्राप्त अंकों को सहसंबद्ध किया जाता है जो विश्वसनीयता का अनुमान देता है। इस प्रकार, विश्वसनीयता को समानता का गुणांक कहा जाता है।

गुलिसेसेन 1950: ने समांतर परीक्षणों को समान साधन, समान रूपांतर और समान अंतर सह-संबंध वाले परीक्षणों के रूप में परिभाषित किया है।

गिलफोर्ड: वैकल्पिक रूप विधि सामग्री और प्रदर्शन की स्थिरता दोनों को इंगित करती है।

लाभ:

इस प्रक्रिया में टेस्ट-रेटेस्ट विधि पर कुछ फायदे हैं:

1. यहाँ एक ही परीक्षण दोहराया नहीं गया है।

2. मेमोरी, प्रैक्टिस, कैरीओवर इफेक्ट्स और रिकॉल फैक्टर को कम किया जाता है और वे स्कोर को प्रभावित नहीं करते हैं।

3. इस विधि द्वारा प्राप्त की गई विश्वसनीयता गुणांक लौकिक स्थिरता और विभिन्न वस्तुओं के नमूने या परीक्षण रूपों की प्रतिक्रिया की स्थिरता दोनों का माप है। इस प्रकार, यह विधि दो प्रकार की विश्वसनीयता को जोड़ती है।

4. उपलब्धि परीक्षणों की विश्वसनीयता के लिए उपयोगी।

5. यह विधि शैक्षिक और मनोवैज्ञानिक परीक्षणों की विश्वसनीयता निर्धारित करने के उपयुक्त तरीकों में से एक है।

सीमाएं:

1. एक परीक्षण के दो समानांतर रूप होना मुश्किल है। कुछ स्थितियों में (यानी रोर्स्च में) यह लगभग असंभव है।

2. जब सामग्री की कठिनाई, लंबाई के संदर्भ में परीक्षण बिल्कुल समान नहीं होते हैं, तो इन परीक्षणों से प्राप्त स्कोर के दो सेटों के बीच तुलना गलत निर्णय ले सकती है।

3. अभ्यास और कैरीओवर कारकों को पूरी तरह से नियंत्रित नहीं किया जा सकता है।

4. इसके अलावा, दो रूपों को एक साथ प्रशासित करना बोरियत पैदा करता है। यही कारण है कि लोग ऐसे तरीकों को पसंद करते हैं जिनमें परीक्षण के केवल एक प्रशासन की आवश्यकता होती है।

5. फॉर्म बी का प्रशासन करते समय परीक्षण की स्थिति समान नहीं हो सकती है। इसके अलावा, वृषण प्रशासन के समय दोनों समान शारीरिक, मानसिक या भावनात्मक स्थिति में नहीं हो सकते हैं।

6. परीक्षण के दूसरे रूप के टेस्ट स्कोर आम तौर पर उच्च होते हैं।

यद्यपि कठिन, सावधानीपूर्वक और सावधानीपूर्वक निर्मित समानांतर रूप हमें विश्वसनीयता का एक संतोषजनक माप प्रदान करेगा। अच्छी तरह से बनाए गए मानकीकृत परीक्षणों के लिए, समानांतर रूप विधि आमतौर पर विश्वसनीयता का निर्धारण करने का सबसे संतोषजनक तरीका है।

3. विभाजित-आधा विधि या उप-विभाजित परीक्षण विधि:

स्प्लिट-हाफ विधि पहले के दो तरीकों पर एक सुधार है, और इसमें स्थिरता और तुल्यता दोनों की विशेषताएं शामिल हैं। उपर्युक्त ने विश्वसनीयता का अनुमान लगाने के दो तरीकों पर चर्चा की है, कभी-कभी मुश्किल लगता है।

एक ही परीक्षण का दो बार उपयोग करना और परीक्षण के समकक्ष रूप प्राप्त करना संभव नहीं हो सकता है। इसलिए, इन कठिनाइयों को दूर करने और स्मृति प्रभाव के साथ-साथ परीक्षण को कम करने के लिए, परीक्षण के एकल प्रशासन के माध्यम से विश्वसनीयता का अनुमान लगाना वांछनीय है।

इस पद्धति में नमूने पर एक बार परीक्षण किया जाता है और यह सजातीय परीक्षणों के लिए सबसे उपयुक्त तरीका है। यह विधि एक परीक्षण स्कोर की आंतरिक स्थिरता प्रदान करती है।

परीक्षण की सभी वस्तुओं को आम तौर पर कठिनाई के बढ़ते क्रम में व्यवस्थित किया जाता है और नमूना पर एक बार प्रशासित किया जाता है। परीक्षण के बाद इसे दो तुलनीय या समान या समान भागों या हिस्सों में विभाजित किया जाता है।

स्कोर को व्यवस्थित किया जाता है या दो सेटों में आइटमों की विषम संख्या और अलग-अलग आइटमों की संख्या से प्राप्त किया जाता है। उदाहरण के लिए 100 वस्तुओं का परीक्षण किया जाता है।

1, 3, 5, .. 99 जैसी विषम संख्याओं के 50 वस्तुओं के आधार पर व्यक्ति के स्कोर और समान संख्या 2, 4, 6… 10 के आधार पर स्कोर अलग-अलग व्यवस्थित किए जाते हैं। भाग में 'ए' विषम संख्या आइटम को असाइन किया गया है और भाग 'बी' में समान संख्या में आइटम शामिल होंगे।

विषम और परीक्षण की वस्तुओं की संख्या पर दो अंक प्राप्त करने के बाद, सहसंबंध के सह-कुशल की गणना की जाती है। यह वास्तव में एक बैठने में प्राप्त स्कोर के दो बराबर हिस्सों के बीच संबंध है। विश्वसनीयता का अनुमान लगाने के लिए, स्पीयरमैन-ब्राउन भविष्यवाणी फार्मूला का उपयोग किया जाता है।

स्पीयरमैन-ब्राउन सूत्र द्वारा दिया गया है:

जिसमें r 11 = पूरे परीक्षण की विश्वसनीयता।

r 11/22 = दो आधे परीक्षणों के बीच सहसंबंध का गुणांक।

उदाहरण 1:

एक परीक्षण में 100 आइटम होते हैं। इन सभी वस्तुओं को कठिनाई के क्रम में व्यवस्थित किया जाता है क्योंकि पहले से सौवें तक एक जाता है। छात्र परीक्षण का जवाब देते हैं और परीक्षण स्कोर किया जाता है।

स्कोर छात्रों द्वारा विषम संख्या में प्राप्त किए जाते हैं और यहां तक ​​कि मदों की संख्या अलग-अलग होती है। स्कोर के इन दो सेटों के बीच पाया गया सहसंबंध का गुणांक 0.8 है।

पूरे परीक्षण की विश्वसनीयता (या)

इस सूत्र का उपयोग करते समय, यह ध्यान में रखा जाना चाहिए कि विषम और यहां तक ​​कि हिस्सों का विचरण बराबर होना चाहिए, अर्थात

यदि यह संभव नहीं है तो फलागन और रूलोन के फार्मूले को नियोजित किया जा सकता है। ये सूत्र सरल हैं और दो हिस्सों के बीच सहसंबंध के गुणांक को शामिल नहीं करते हैं।

लाभ:

1. यहां हम परीक्षण को दोहरा नहीं रहे हैं या इसके समानांतर रूप का उपयोग नहीं कर रहे हैं और इस प्रकार परीक्षणी का दो बार परीक्षण नहीं किया जाता है। जैसे, कैरी ओवर इफेक्ट या प्रैक्टिस इफेक्ट नहीं है।

2. इस विधि में, पर्यावरण या भौतिक परिस्थितियों के कारण, व्यक्ति की क्षमता के उतार-चढ़ाव को कम किया जाता है।

3. परीक्षण के एकल प्रशासन के कारण, दिन-प्रतिदिन के कार्य और समस्याएं हस्तक्षेप नहीं करती हैं।

4. परीक्षण के समानांतर रूपों के निर्माण की कठिनाई समाप्त हो जाती है।

सीमाएं:

1. एक परीक्षण को कई तरीकों से दो बराबर हिस्सों में विभाजित किया जा सकता है और प्रत्येक मामले में सहसंबंध के गुणांक भिन्न हो सकते हैं।

2. इस पद्धति का उपयोग गति परीक्षणों की विश्वसनीयता का अनुमान लगाने के लिए नहीं किया जा सकता है।

3. जैसा कि कीट को एक बार प्रशासित किया जाता है, मौका त्रुटियों को दो हिस्सों में एक ही तरह से प्रभावित कर सकता है और इस तरह विश्वसनीयता गुणांक को बहुत अधिक बढ़ा देता है।

4. इस पद्धति का उपयोग शक्ति परीक्षणों और विषम परीक्षणों में नहीं किया जा सकता है।

इन सभी सीमाओं के बावजूद, विभाजित-आधी विधि को परीक्षण विश्वसनीयता को मापने के सभी तरीकों में से सबसे अच्छा माना जाता है, क्योंकि विश्वसनीयता का निर्धारण करने के लिए डेटा अवसर पर प्राप्त किया जाता है और इस तरह से समय, श्रम और कठिनाइयों को कम करता है या बार-बार प्रशासन।

4. तर्कसंगत समानता की विधि:

इस विधि को "कुदर-रिचर्डसन विश्वसनीयता 'या' इंटर-आइटम संगतता 'के रूप में भी जाना जाता है। यह एकल प्रशासन पर आधारित एक विधि है। यह सभी वस्तुओं के लिए प्रतिक्रियाओं की स्थिरता पर आधारित है।

अंतर-आइटम संगतता खोजने के लिए सबसे आम तरीका कुदर और रिचर्डसन (1937) द्वारा विकसित सूत्र के माध्यम से है। यह विधि परीक्षण की वस्तुओं के अंतर-सहसंबंध और परीक्षण के सभी मदों के साथ प्रत्येक आइटम के सहसंबंध की गणना करने में सक्षम बनाती है। जे। क्रोनबाक ने इसे आंतरिक स्थिरता के गुणांक के रूप में कहा।

इस पद्धति में, यह माना जाता है कि सभी वस्तुओं में समान या समान कठिनाई मूल्य है, वस्तुओं के बीच सहसंबंध बराबर है, सभी आइटम अनिवार्य रूप से एक ही क्षमता को मापते हैं और परीक्षण प्रकृति में सजातीय है।

स्प्लिट-हाफ विधि की तरह यह विधि भी आंतरिक स्थिरता का माप प्रदान करती है।

सबसे लोकप्रिय फॉर्मूला है कुदर-रिचर्डसन यानी KR-21 जो नीचे दिया गया है:

क्यू = - पी

पी = 1 - क्यू

एक उदाहरण हमें पी और क्यू की गणना करने में मदद करेगा।

उदाहरण 2:

60 छात्रों ने एक परीक्षा दी और उनमें से 40 छात्रों ने परीक्षण के किसी विशेष आइटम पर सही प्रतिक्रिया दी है।

पी = 40/60 = 2/3

इसका मतलब है कि छात्रों के वाई हिस्से ने परीक्षण के एक विशेष आइटम के लिए सही प्रतिक्रिया दी है। जिसमें 20 छात्रों ने उस आइटम पर गलत प्रतिक्रिया दी है।

इस प्रकार q = 20/60 या 1 - 40/60

प्रत्येक आइटम के लिए हमें p और q के मान का पता लगाना है और pq को wepq प्राप्त करने के लिए सभी वस्तुओं पर सारांशित किया जाता है। प्रत्येक आइटम के लिए पी और क्यू को गुणा करें और सभी मदों के लिए योग करें। यह givespq देता है।

लाभ:

1. यह गुणांक कुछ संकेत प्रदान करता है कि परीक्षणों के आइटम आंतरिक रूप से सुसंगत या सजातीय कैसे हैं।

2. कुछ सैद्धांतिक पहलुओं में विभाजित-आधी तकनीक से तर्कसंगत समानता बेहतर है, लेकिन दो तरीकों से मिली विश्वसनीयता गुणांकों में वास्तविक अंतर अक्सर नगण्य होता है।

3. स्प्लिट-हाफ विधि बस समतुल्यता को मापता है लेकिन तर्कसंगत समतुल्यता विधि समतुल्यता और समरूपता दोनों को मापता है।

4. परीक्षण के रूप में किफायती विधि एक बार प्रशासित की जाती है।

5. इसमें न तो दो समान परीक्षणों के प्रशासन की आवश्यकता होती है और न ही परीक्षणों को दो बराबर हिस्सों में विभाजित करने की आवश्यकता होती है।

सीमाएं:

1. इस विधि द्वारा प्राप्त गुणांक आमतौर पर अन्य विधियों द्वारा प्राप्त गुणांक की तुलना में कुछ हद तक कम है।

2. यदि परीक्षणों के आइटम अत्यधिक सजातीय नहीं हैं, तो यह विधि कम विश्वसनीयता गुणांक प्राप्त करेगी।

3. कुदेर-रिचर्डसन और स्प्लिट-हाफ विधि गति परीक्षण के लिए उपयुक्त नहीं हैं।

4. विभिन्न KR सूत्र अलग विश्वसनीयता सूचकांक प्राप्त करते हैं।