एक अच्छे टेस्ट के शीर्ष 4 लक्षण

यह लेख एक अच्छे परीक्षण की चार महत्वपूर्ण विशेषताओं पर प्रकाश डालता है। चार विशेषताएं हैं: 1. विश्वसनीयता 2. वैधता 3. उद्देश्य 4. उपयोगिता।

विशेषता # 1. विश्वसनीयता:

विश्वसनीयता का शब्दकोश अर्थ स्थिरता, निर्भरता या विश्वास है। तो माप विश्वसनीयता में वह स्थिरता है जिसके साथ कोई भी परीक्षण मापता है जो भी मापता है। एक परीक्षण स्कोर को विश्वसनीय कहा जाता है जब हमारे पास स्कोर को स्थिर और विश्वास-योग्य होने के लिए विश्वास करने का कारण होता है। स्थिरता और विश्वास-योग्यता उस डिग्री पर निर्भर करती है जिस पर स्कोर समय-विश्वसनीयता का एक सूचकांक है 'मौका त्रुटि से मुक्त है। इसलिए विश्वसनीयता को एक ही चीज़ के दो मापों के बीच स्थिरता की डिग्री के रूप में परिभाषित किया जा सकता है।

उदाहरण के लिए, हमने ग्रुप-ए पर एक उपलब्धि परीक्षण किया और 55 का औसत स्कोर पाया। 3 दिनों के बाद हमने ग्रुप-ए पर एक ही परीक्षण किया और 55 का औसत स्कोर पाया। यह इंगित करता है कि मापने वाला उपकरण (उपलब्धि परीक्षण) एक स्थिर या भरोसेमंद परिणाम प्रदान कर रहा है। दूसरी ओर यदि दूसरे माप में परीक्षण 77 के आसपास एक औसत स्कोर प्रदान करता है तो हम कह सकते हैं कि परीक्षण स्कोर सुसंगत नहीं हैं।

ग्रोनलुंड और लिनन के शब्दों में (1995) "विश्वसनीयता माप की स्थिरता को संदर्भित करता है- अर्थात्, परीक्षण के स्कोर या अन्य मूल्यांकन परिणाम एक माप से दूसरे में कैसे होते हैं।"

सीवी गुड (1973) ने विश्वसनीयता को "उस योग्यता के रूप में परिभाषित किया है जिसके साथ एक मापने वाला उपकरण कुछ मापता है; वह डिग्री जिसके लिए परीक्षण या मूल्यांकन के अन्य उपकरण लगातार मापते हैं जो भी वह वास्तव में मापता है। "

Ebel और Frisbie (1991) के अनुसार "शब्द की विश्वसनीयता का अर्थ है संगति जिसमें परीक्षण स्कोर का एक सेट वे जो भी मापते हैं उसे मापते हैं।"

सैद्धांतिक रूप से, विश्वसनीयता को सच्चे स्कोर और प्रेक्षित स्कोर विचरण के अनुपात के रूप में परिभाषित किया गया है।

डेविस (1946) के अनुसार "परीक्षण स्कोर के एक सेट की माप के सापेक्ष पूर्वाग्रहों की डिग्री को विश्वसनीयता के रूप में परिभाषित किया गया है।"

इस प्रकार विश्वसनीयता निम्नलिखित सवालों के जवाब देती है:

ग्रोनलंड और लिन (1995)

यदि दो बार खोए हुए को प्रशासित किया जाता है तो परीक्षण स्कोर कैसे समान हैं?

यदि परीक्षण के दो बराबर रूपों को प्रशासित किया जाता है, तो परीक्षण स्कोर कैसे समान हैं?

किसी भी निबंध परीक्षण के स्कोर को किस हद तक। अलग-अलग शिक्षकों द्वारा बनाए जाने पर अंतर?

हमेशा पूरी तरह से सुसंगत परिणाम प्राप्त करना संभव नहीं है। क्योंकि शारीरिक स्वास्थ्य, स्मृति, अनुमान, थकान, भूलने आदि जैसे कई कारक हैं जो एक माप से दूसरे में परिणाम को प्रभावित कर सकते हैं। ये विलुप्त चर हमारे परीक्षण स्कोर में कुछ त्रुटि पेश कर सकते हैं। इस त्रुटि को माप त्रुटियों के रूप में कहा जाता है। इसलिए परीक्षण की विश्वसनीयता निर्धारित करते समय हमें माप में मौजूद त्रुटि की मात्रा पर ध्यान देना चाहिए।

विश्वसनीयता की प्रकृति:

3. विश्वसनीयता एक उपकरण के साथ प्राप्त परिणामों की स्थिरता को संदर्भित करता है, लेकिन उपकरण को ही नहीं

2. विश्वसनीयता परीक्षण स्कोर की एक विशेष व्याख्या को संदर्भित करता है। उदाहरण के लिए एक परीक्षण स्कोर जो समय की अवधि के लिए विश्वसनीय है, एक परीक्षण से दूसरे समकक्ष परीक्षण के लिए विश्वसनीय नहीं हो सकता है। ताकि विश्वसनीयता को सामान्य विशेषताओं के रूप में नहीं माना जा सके।

3. विश्वसनीयता विश्वसनीयता निर्धारित करने के लिए एक सांख्यिकीय अवधारणा है जिसे हम एक समूह को एक बार या एक से अधिक बार परीक्षण करते हैं। फिर समूह में किसी व्यक्ति की सापेक्ष स्थिति में बदलाव या किसी व्यक्ति के स्कोर में अपेक्षित भिन्नता की मात्रा के अनुसार स्थिरता का निर्धारण किया जाता है। किसी व्यक्ति की सापेक्ष स्थिति का स्थानांतरण 'विश्वसनीयता गुणांक' नामक सहसंबंध के गुणांक से संबंधित है और भिन्नता की मात्रा 'माप की मानक त्रुटि' द्वारा बताई गई है। ये दोनों प्रक्रियाएं सांख्यिकीय हैं।

4. विश्वसनीयता आवश्यक है लेकिन वैधता के लिए पर्याप्त स्थिति नहीं है। एक परीक्षण जो विश्वसनीय नहीं है वह मान्य नहीं हो सकता। लेकिन ऐसा नहीं है कि उच्च विश्वसनीयता वाले परीक्षण में उच्च वैधता होगी। क्योंकि एक अत्यधिक सुसंगत परीक्षण इसके अलावा कुछ और माप सकता है जिसे हम मापने का इरादा रखते हैं।

विश्वसनीयता निर्धारित करने के तरीके:

अधिकांश शैक्षिक परीक्षणों के लिए विश्वसनीयता गुणांक गुणवत्ता का सबसे खुलासा करने वाला सांख्यिकीय सूचकांक प्रदान करता है जो सामान्य रूप से उपलब्ध है। परीक्षण की विश्वसनीयता का अनुमान उनकी तकनीकी गुणवत्ता को पहचानने और उन्हें बेहतर बनाने के प्रयासों को प्रेरित करने के लिए आवश्यक जानकारी प्रदान करता है। एक परीक्षण स्कोर की स्थिरता या तो समूह में किसी व्यक्ति की सापेक्ष स्थिति की शिफ्ट के रूप में या किसी व्यक्ति के स्कोर में भिन्नता की मात्रा के संदर्भ में व्यक्त की जाती है।

विश्वसनीयता के इस आकलन के आधार पर दो सामान्य वर्गीकरण में आते हैं:

(मैं) सापेक्ष विश्वसनीयता या विश्वसनीयता गुणांक:

इस विधि में विश्वसनीयता को गुणांक के गुणांक के संदर्भ में कहा जाता है जिसे विश्वसनीयता गुणांक कहा जाता है। इसलिए हम सहसंबंध के गुणांक द्वारा किसी व्यक्ति के स्कोर की सापेक्ष स्थिति के स्थानांतरण को निर्धारित करते हैं।

(ii) मापन की पूर्ण विश्वसनीयता या मानक त्रुटि:

इस पद्धति में, माप की मानक त्रुटि के संदर्भ में विश्वसनीयता को बताया गया है। यह किसी व्यक्ति के स्कोर की भिन्नता की मात्रा को इंगित करता है।

सापेक्ष विश्वसनीयता या विश्वसनीयता निर्धारित करने के तरीके गुणांक:

विश्वसनीयता गुणांक निर्धारित करने के लिए हमें समान स्थिति में माप के दो सेट प्राप्त करने होंगे और फिर दो सेटों की तुलना करनी होगी। लेकिन यह केवल एक सैद्धांतिक स्थिति है, क्योंकि हमारे लिए दो समान स्थितियों पर दो माप प्राप्त करना असंभव है। ताकि सापेक्ष विश्वसनीयता निर्धारित करने के लिए कई तरीके विकसित किए गए हैं।

वे इस प्रकार हैं (ग्रोनलुंड और लिनन- 1995):

(i) परीक्षण का एक ही रूप दो बार एक ही समूह के व्यक्तियों को दिया जा सकता है।

(Ii) परीक्षण के दो अलग-अलग लेकिन समान रूपों को एक ही व्यक्ति को प्रशासित किया जा सकता है।

(iii) एकल परीक्षण के परीक्षण आइटम को दो अलग-अलग सेटों में विभाजित किया जाता है और दो सेटों के स्कोर परस्पर संबंधित होते हैं।

विधियां समान हैं कि उनमें से सभी डेटा के दो सेटों को सहसंबंधित करते हैं, या तो एक ही मूल्यांकन उपकरण से या एक ही प्रक्रिया के समकक्ष रूपों से प्राप्त किए जाते हैं। इस विश्वसनीयता गुणांक की जांच की जा रही संगतता के प्रकारों के संदर्भ में की जानी चाहिए।

विभिन्न प्रकारों द्वारा विभिन्न प्रकार की स्थिरता का निर्धारण किया जाता है। ये इस प्रकार हैं:

1. समय की संगति।

2. साधन के विभिन्न रूपों पर संगति।

3. साधन के भीतर संगति

विश्वसनीयता गुणांक निर्धारित करने के चार तरीके हैं, जैसे:

(ए) टेस्ट-रीस्ट विधि।

(b) समतुल्य रूप / समानांतर रूप विधि।

(c) विभाजित-आधी विधि।

(घ) तर्कसंगत साम्य / कुदेर-रिचर्डसन विधि।

(ए) टेस्ट-रीस्टेस्ट विधि:

यह परीक्षण की विश्वसनीयता निर्धारित करने का सबसे सरल तरीका है। इस पद्धति में विश्वसनीयता निर्धारित करने के लिए परीक्षण दिया जाता है और उसी समूह पर दोहराया जाता है। फिर स्कोर के पहले सेट और दूसरे सेट के स्कोर के बीच संबंध प्राप्त किया जाता है।

सहसंबंध का एक उच्च गुणांक परीक्षण स्कोर की उच्च स्थिरता को इंगित करता है। Gronlund के शब्दों में, .80 और .90 में स्थिरता के उपाय आमतौर पर उसी वर्ष के भीतर अवसरों पर मानकीकृत परीक्षणों के लिए रिपोर्ट किए जाते हैं। लेकिन यह विधि कुछ गंभीर कमियों से ग्रस्त है। सबसे पहले दो प्रशासनों के बीच अंतराल क्या होना चाहिए।

यदि इसे एक या दो दिन के अंतराल में प्रशासित किया जाता है, तो पुतली अपने पहले उत्तर को याद करेगी और अपना समय नई सामग्री पर खर्च करेगी। यह दूसरे प्रशासनों में अपना स्कोर बढ़ाएगा। यदि अंतराल एक वर्ष के लिए बहुत लंबा है, तो परिपक्वता प्रभाव सबसे प्रभावी स्कोर को प्रभावित करेगा और यह फिर से स्कोर को बढ़ाएगा।

दोनों मामलों में यह विश्वसनीयता को कम करेगा। तो दो प्रशासनों के बीच का समय अंतराल क्या होना चाहिए, यह काफी हद तक परीक्षण स्कोर के उपयोग और व्याख्या पर निर्भर करता है। स्थिति को नियंत्रित करने में इसकी कठिनाइयों के कारण, जो रेटेस्ट के स्कोर को प्रभावित करते हैं, अनुमान लगाने, विश्वसनीयता गुणांक में परीक्षण-रीस्टेस्ट विधि का उपयोग कम करते हैं।

(बी) समतुल्य रूप / समानांतर रूप विधि:

परीक्षण स्कोर की विश्वसनीयता का अनुमान समकक्ष रूपों विधि द्वारा लगाया जा सकता है। इसे अन्यथा वैकल्पिक रूपों या समानांतर रूपों विधि के रूप में भी जाना जाता है। जब परीक्षणों के दो समकक्ष रूपों का निर्माण किया जा सकता है तो दोनों के बीच संबंध को परीक्षण के आत्म-सहसंबंध के उपायों के रूप में लिया जा सकता है। इस प्रक्रिया में दो समान प्रकार के परीक्षणों को थोड़े-थोड़े समय के अंतराल में विद्यार्थियों के एक ही समूह में प्रशासित किया जाता है, फिर दोनों परीक्षणों के स्कोर सहसंबद्ध होते हैं। यह सहसंबंध समानता का सूचकांक प्रदान करता है। आमतौर पर मानकीकृत मनोवैज्ञानिक और उपलब्धि परीक्षणों के मामले में समतुल्य रूप उपलब्ध हैं।

प्रशासन के लिए चयनित दोनों परीक्षण सामग्री, कठिनाई, प्रारूप और लंबाई के संदर्भ में समानांतर होना चाहिए। जब परीक्षणों के दो रूपों के प्रशासनों के बीच समय अंतराल प्रदान किया जाता है, तो परीक्षण स्कोर का गुणांक विश्वसनीयता और तुल्यता का माप प्रदान करता है। लेकिन इस पद्धति के साथ बड़ी खामी परीक्षण के दो समानांतर रूपों को प्राप्त करना है। जब परीक्षण सामग्री, कठिनाई, लंबाई और इन परीक्षणों से प्राप्त अंकों के बीच तुलना के मामले में बिल्कुल समान नहीं हैं, तो गलत निर्णय हो सकते हैं।

(c) स्प्लिट-हाफ विधि:

ऐसी विधियां भी हैं जिनके द्वारा एक एकल परीक्षण के एकल प्रशासन द्वारा विश्वसनीयता निर्धारित की जा सकती है। ऐसी विधि में से एक विभाजन-आधी विधि है। इस विधि में एक परीक्षण सामान्य तरीके से विद्यार्थियों के एक समूह को दिया जाता है। फिर परीक्षण को दो समान मूल्यों में विभाजित किया जाता है और इन आधे परीक्षणों के लिए सहसंबंध पाया जाता है।

परीक्षण को विभाजित करने की सामान्य प्रक्रिया सभी विषम संख्याओं अर्थात 1, 3, 5, इत्यादि को एक छमाही में और सभी सम-संख्या वाली वस्तुओं अर्थात 2, 4, 6, 8 आदि को दूसरे छमाही में लेना है। स्पीयरमैन- ब्राउन फार्मूले का उपयोग करके हिस्सों को सहसंबद्ध किया जाता है।

उदाहरण के लिए, दोनों हिस्सों को सहसंबंधित करके हमने .70 का गुणांक पाया।

सूत्र (5.1) का उपयोग करके हम पूर्ण परीक्षण पर विश्वसनीयता गुणांक प्राप्त कर सकते हैं:

विश्वसनीयता गुणांक .82 जब आधे परीक्षण के बीच सहसंबंध का गुणांक है .70। यह इंगित करता है कि परीक्षण वस्तुओं का नमूना किस हद तक मापा जा रहा है सामग्री का भरोसेमंद नमूना है - आंतरिक स्थिरता।

ग्रोनलुंड (1995) का विचार है कि "विभाजित आधी सापेक्षताएँ समकक्ष प्रपत्र की तुलना में अधिक होती हैं क्योंकि विभाजन की आधी विधि एकल परीक्षण प्रपत्र के प्रशासन पर आधारित होती है।" ध्यान, कार्य की गति, प्रयास, थकान और परीक्षण सामग्री इत्यादि के लिए फार्म से अंतर के कारण।

(घ) तर्कसंगत समतुल्य / कुदेर रिचर्डसन विधि:

कुदर और रिचर्डसन द्वारा विकसित सूत्र का उपयोग करके विश्वसनीयता का निर्धारण करने के लिए तर्कसंगत समानता एक और तरीका है। स्प्लिट-हाफ विधि की तरह यह विधि भी आंतरिक स्थिरता का माप प्रदान करती है। इसके लिए न तो दो समान रूपों के प्रशासन की आवश्यकता होती है और न ही परीक्षणों को दो बराबर हिस्सों में विभाजित करने की आवश्यकता होती है। विश्वसनीयता गुणांक कुदेर-रिचर्डसन फॉर्मूला -20 का उपयोग करके निर्धारित किया जाता है जो इस तरह से पढ़ता है।

यह विधि उस डिग्री के बारे में जानकारी प्रदान करती है जिससे परीक्षण में आइटम समान विशेषताओं को मापते हैं। हालांकि इस पद्धति को लागू करने की सादगी ने इसे व्यापक रूप से फैला दिया है फिर भी इसकी कुछ सीमाएं हैं।

1. कुदेर-रिचर्डसन विधि और स्प्लिट-हाफ विधि गति परीक्षणों के लिए उपयुक्त नहीं हैं।

2. कुदेर-रिचर्डसन और स्प्लिट हाफ विधि दोनों ही दिन-प्रतिदिन पुतली की प्रतिक्रिया की स्थिरता को मापते नहीं हैं।

3. कुदेर-रिचर्डसन विधि गणना करने के लिए बोझिल है जब तक कि जानकारी पहले से ही पारित होने के अनुपात के बारे में उपलब्ध न हो।

मापन की पूर्ण विश्वसनीयता या मानक त्रुटियों को निर्धारित करने के तरीके:

अगर हम बार-बार परीक्षा देंगे तो हमें अंकों में कुछ बदलाव देखने को मिलेगा। क्योंकि प्राप्त अंक परीक्षार्थी के वास्तविक स्कोर प्लस का एक सूचकांक है: माप की त्रुटियां। महामहिम (1985) ने एक सच्चे स्कोर को "एक माप के रूप में परिभाषित किया है जो कि एक समान स्थिति के तहत समान परीक्षणों पर किसी व्यक्ति की माप की अनंत बड़ी संख्या के माध्यम से प्राप्त किया जाएगा। एक वास्तविक स्कोर, निश्चित रूप से, प्रयोगात्मक रूप से निर्धारित नहीं किया जा सकता है

यदि परीक्षण स्कोर में त्रुटि का एक बड़ा घटक शामिल है, तो इसकी विश्वसनीयता कम है और यदि इसमें थोड़ी सी भी त्रुटि शामिल है तो इसकी विश्वसनीयता अधिक है। इस प्रकार एक वास्तविक स्कोर हद से अधिक होने पर, प्राप्त अंकों में त्रुटि को विश्वसनीयता गुणांक द्वारा इंगित किया जा सकता है।

यह सही स्कोर, प्राप्त अंक और त्रुटि के बीच का संबंध गणितीय रूप से निम्नानुसार व्यक्त किया जा सकता है:

हम माप की मानक त्रुटि (एसई) का पता लगा सकते हैं जब वितरण का विश्वसनीयता गुणांक और मानक विचलन दिया जाता है।

माप की मानक त्रुटि की गणना करने का सूत्र (गैरेट -1985) इस प्रकार है:

उदाहरण के लिए, 200 हाई स्कूल के छात्रों के समूह में, गणित में एक उपलब्धि परीक्षा की विश्वसनीयता गुणांक .70, मीन = 65 और ओ = 20 है। लिपू 60 का स्कोर प्राप्त करता है। इस स्कोर का एसई क्या है।

सूत्र में मान डालकर (5.3):

तो लिपु का असली स्कोर 60 Lip 10.95 यानी 70.50 से 49.05 है।

कोई भी प्राप्त अंक हमें नहीं बताता कि सही स्कोर क्या है, लेकिन एसई का ज्ञान प्राप्त स्कोर और सच्चे स्कोर के बीच अंतर को इंगित करता है। जब एसई छोटा होता है, तो यह इंगित करता है कि वास्तविक स्कोर प्राप्त स्कोर के करीब है और यह भी इंगित करता है कि माप की त्रुटियों के कारण दो व्यक्तियों के स्कोर के बीच अंतर वास्तविक अंतर या अंतर है या नहीं।

विश्वसनीयता को प्रभावित करने वाले कारक:

कई कारक हैं जो विश्वसनीयता के उपायों को प्रभावित करते हैं। ताकि जब हम स्कोर की व्याख्या और उपयोग करें तो हमें सतर्क रहना चाहिए और परीक्षण की तैयारी और प्रशासन के माध्यम से उन कारकों में हेरफेर करना चाहिए।

परीक्षण की विश्वसनीयता को प्रभावित करने वाले प्रमुख कारक, स्कोर को तीन शीर्षकों में वर्गीकृत किया जा सकता है:

1. परीक्षण से संबंधित कारक।

2. वृषण से संबंधित कारक।

3. परीक्षण प्रक्रिया से संबंधित कारक।

1. परीक्षण से संबंधित कारक:

(ए) परीक्षण की लंबाई:

स्पीयरमैन ब्राउन फार्मूला इंगित करता है कि परीक्षण जितना लंबा होगा, विश्वसनीयता उतनी ही अधिक होगी। क्योंकि एक लंबी परीक्षा व्यवहार का पर्याप्त नमूना प्रदान करेगी। एक और कारण यह है कि अनुमान लगाने का कारक लंबी परीक्षा में निष्प्रभावी होने के लिए उपयुक्त है।

उदाहरण के लिए यदि हम छात्रों की संख्यात्मक क्षमता को मापने के लिए एक संगणना देंगे। जिन लोगों ने सही गणना की है वे संख्यात्मक क्षमता में परिपूर्ण हैं जो असफल रहे वे पूरी तरह से विफल हैं। यदि गणना एक कठिन है, तो अधिकांश छात्र असफल हो जाएंगे। यदि यह आसान है, तो अधिकांश छात्र इसकी सही गणना करेंगे। ताकि एकल आइटम स्कोर कभी भी विश्वसनीय परिणाम न दे।

(बी) परीक्षण की सामग्री:

गिल्डफोर्ड के अनुसार परीक्षण सामग्री की एकरूपता भी परीक्षण स्कोर की विश्वसनीयता बढ़ाती है। वैदिक सभ्यता पर 50 वस्तुओं का एक परीक्षण भारतीय इतिहास पर 50 वस्तुओं के परीक्षण की तुलना में अधिक विश्वसनीय स्कोर प्रदान करेगा। Ebel (1991) के अनुसार, "कुछ पाठ्यक्रमों में विषय वस्तु, जैसे कि गणित और विदेशी भाषा, अधिक कसकर आयोजित की जाती है, विषय वस्तु साहित्य या इतिहास की तुलना में तथ्यों, सिद्धांतों की क्षमताओं और उपलब्धियों की अधिक निर्भरता के साथ।" भी एक कारक है जो परिणाम उच्च विश्वसनीयता है।

(ग) मदों की विशेषताएं:

एक परीक्षण आइटम की अभिव्यक्ति का कठिनाई स्तर और स्पष्टता भी परीक्षण स्कोर की विश्वसनीयता को प्रभावित करती है। यदि समूह के सदस्यों के लिए परीक्षण आइटम बहुत आसान या कठिन हैं, तो यह कम विश्वसनीयता के स्कोर का उत्पादन करेगा। क्योंकि दोनों परीक्षणों में अंकों का प्रतिबंधित प्रसार है।

(डी) स्कोर का प्रसार:

ग्रोनलुंड और मिन (1995) के अनुसार, "अन्य चीजें समान होने के कारण, स्कोर का प्रसार जितना बड़ा होगा, विश्वसनीयता का अनुमान उतना अधिक होगा।" जब वह स्कोर का प्रसार बड़ा होता है, तो किसी व्यक्ति के उसी में रहने की अधिक संभावना होती है। एक परीक्षण से दूसरे परीक्षण में एक समूह में सापेक्ष स्थिति। हम कह सकते हैं कि माप की त्रुटियां व्यक्ति की सापेक्ष स्थिति को कम प्रभावित करती हैं जब स्कोर का प्रसार बड़ा होता है।

उदाहरण के लिए समूह ए में छात्रों ने 30 से 80 तक के अंक हासिल किए हैं और समूह बी के छात्र ने 65 से 75 तक के अंक हासिल किए हैं। यदि हम दूसरी बार परीक्षाओं का प्रबंधन करेंगे तो समूह ए में व्यक्तियों का परीक्षा स्कोर कई बिंदुओं से भिन्न हो सकता है, समूह के सदस्यों के सापेक्ष स्थिति में बहुत कम स्थानांतरण के साथ। इसकी वजह है कि ग्रुप ए में अंकों का प्रसार बड़ा है।

दूसरी ओर समूह बी में स्कोर परीक्षण के दूसरे प्रशासन पर स्थिति को स्थानांतरित करने की अधिक संभावना है। चूंकि अंकों का प्रसार उच्चतम स्कोर से सबसे कम स्कोर तक सिर्फ 10 अंक है, इसलिए कुछ बिंदुओं का परिवर्तन व्यक्तियों की सापेक्ष स्थिति में मौलिक बदलाव ला सकता है। इस प्रकार अधिक से अधिक प्रसार विश्वसनीयता है।

2. वसीयत से संबंधित कारक:

उपलब्धि में भिन्नता, व्यक्तियों की परीक्षण बुद्धिमानी, और छात्रों की प्रेरणा भी परीक्षण स्कोर की विश्वसनीयता को प्रभावित करती है।

टेस्टी के साथ कुछ महत्वपूर्ण कारक निम्नलिखित हैं जो परीक्षण विश्वसनीयता को प्रभावित करते हैं:

(ए) समूह की विषमता:

जब समूह एक सजातीय समूह होता है, तो परीक्षण के अंकों का प्रसार कम होने की संभावना होती है और जब समूह का परीक्षण किया जाता है तो एक विषम समूह होता है, जिसमें अंकों का प्रसार अधिक होने की संभावना होती है। इसलिए विषम समूह के लिए विश्वसनीयता गुणांक सजातीय समूह से अधिक होगा।

(बी) छात्रों की टेस्ट समझदारी:

परीक्षण लेने का अनुभव भी परीक्षण स्कोर की विश्वसनीयता को प्रभावित करता है। परिष्कृत परीक्षण लेने में छात्रों के अभ्यास से परीक्षण की विश्वसनीयता बढ़ जाती है। लेकिन जब एक समूह में सभी छात्रों के पास समान स्तर की परीक्षण बुद्धिमानी नहीं होती है, तो यह अधिक माप त्रुटियों की ओर जाता है।

(c) छात्रों का अभिप्रेरण:

जब छात्रों को परीक्षा देने के लिए प्रेरित नहीं किया जाता है, तो वे अपनी सर्वश्रेष्ठ उपलब्धि का प्रतिनिधित्व नहीं करेंगे। यह परीक्षण के अंकों को दर्शाती है।

3. परीक्षण प्रक्रिया से संबंधित कारक:

चूंकि परीक्षण से संबंधित कारक और परीक्षण से संबंधित कारक परीक्षण स्कोर की विश्वसनीयता को प्रभावित करते हैं, इसलिए परीक्षण प्रक्रिया से संबंधित कारक भी परीक्षण स्कोर को प्रभावित करते हैं। यदि परीक्षण उपयोगकर्ता इन कारकों को नियंत्रित कर सकते हैं, तो वे परीक्षण स्कोर की स्थिरता बढ़ा सकते हैं।

(ए) परीक्षण की समय सीमा:

Ebel और Frisbie (1991) के अनुसार, "अत्यधिक तेज़ परिस्थितियों में दिए गए एक परीक्षण से प्राप्त स्कोर सामान्य रूप से एक उच्च आंतरिक स्थिरता विश्वसनीयता गुणांक दिखाएगा, जो एक ही समूह को अधिक उदार समय सीमाओं के तहत एक ही समूह को दिए गए स्कोर से प्राप्त होगा।" जब छात्रों को परीक्षा देने के लिए अधिक समय मिल जाता है तो वे अधिक अनुमान लगा सकते हैं, जिससे परीक्षा स्कोर बढ़ सकता है। इसलिए एक परीक्षण में तेजी लाकर हम परीक्षण की विश्वसनीयता बढ़ा सकते हैं।

(बी) छात्रों को दिया धोखा अवसर:

परीक्षण प्रशासन के दौरान छात्रों द्वारा धोखा देने से माप त्रुटियां होती हैं। कुछ छात्रों को इसे सही उत्तर जानने के बिना धोखा पत्र से कॉपी करके या अन्य छात्रों से सुनकर सही उत्तर प्रदान कर सकते हैं। यह उन छात्रों के उच्च स्कोर का कारण बनेगा जो वास्तव में उनके लायक हैं। यह उनके वास्तविक स्कोर की तुलना में उच्च स्तर के थिएटरों का अवलोकन स्कोर बनाएगा।

विश्वसनीयता कितनी अधिक होनी चाहिए?

जाहिर है मूल्यांकन उपकरण कभी भी पूरी तरह विश्वसनीय नहीं होते हैं। एक परीक्षण कितना अविश्वसनीय हो सकता है और फिर भी उपयोगी हो सकता है यह मुख्य रूप से परीक्षण स्कोर से वांछित भेदभाव की सुंदरता पर निर्भर करता है। (रेम-मर्स। 1967) विश्वसनीयता गुणांक की डिग्री परीक्षण की प्रकृति, समूह के आकार और परिवर्तनशीलता पर निर्भर करती है, जिस उद्देश्य के लिए परीक्षण किया गया था और विश्वसनीयता के आकलन के लिए उपयोग की जाने वाली विधि। कम विश्वसनीयता के साथ एक परीक्षण में उच्च वैधता हो सकती है और इसलिए इसका उपयोग किया जा सकता है। लेकिन रिमर्स (1967) के शब्दों में 'स्कूल के उपयोग के लिए प्रकाशित अधिकांश मानकीकृत परीक्षण में आबादी के कम से कम .80 की विश्वसनीयता गुणांक हैं, जिसके लिए उन्हें डिज़ाइन किया गया है।

जब कोई अपने परिणामों की व्याख्या करने के लिए एक मानकीकृत परीक्षण का चयन कर रहा है, तो यह विश्वसनीयता अनुमान के संख्यात्मक मूल्य को देखने के लिए पर्याप्त नहीं है, किसी को यह भी ध्यान में रखना चाहिए कि उस अनुमान को कैसे प्राप्त किया गया था। ग्रोनलुंड (1976) ने विश्वसनीयता का आकलन करने के तरीकों के महत्व के बारे में टिप्पणी की है।

उनके अनुसार “स्प्लिट-हाफ विधि विश्वसनीयता गुणांक को सबसे बड़ा संख्यात्मक मान देती है। समतुल्य रूप विधि और परीक्षण पुन: परीक्षण विश्वसनीयता गुणांक को कम संख्यात्मक मूल्य देने के लिए करते हैं। आमतौर पर ये दो विधियाँ मध्यम से बड़ी विश्वसनीयता गुणांक प्रदान करती हैं। समतुल्य रूप विधि आमतौर पर किसी दिए गए परीक्षण के लिए सबसे छोटी विश्वसनीयता गुणांक प्रदान करती है। "

इसलिए यह कहा जा सकता है कि शिक्षक को एक मानकीकृत परीक्षा लेनी चाहिए, जिसकी विश्वसनीयता यथासंभव अधिक हो। लेकिन उसे इस विश्वसनीयता को विद्यार्थियों के समूहों के प्रकाश में गुणांक की व्याख्या करना चाहिए, जिस पर यह आधारित है, इस समूह की परिवर्तनशीलता और विश्वसनीयता का आकलन करने के तरीके।

विशेषता # 2. वैधता:

“मूल्यांकन उपकरण का चयन या निर्माण, सबसे महत्वपूर्ण प्रश्न है; परिणाम किस हद तक उन विशेष उपयोगों की सेवा करेंगे जिनके लिए उनका इरादा है? यह वैधता का सार है। "

वैधता एक मूल्यांकन कार्यक्रम की सबसे महत्वपूर्ण विशेषता है, जब तक कि एक परीक्षण मान्य नहीं होता है यह कोई उपयोगी कार्य नहीं करता है। मनोवैज्ञानिक, शिक्षक, मार्गदर्शन परामर्शदाता विभिन्न उद्देश्यों के लिए परीक्षा परिणामों का उपयोग करते हैं। जाहिर है, किसी भी उद्देश्य को आंशिक रूप से पूरा नहीं किया जा सकता है, भले ही परीक्षणों में वैधता की पर्याप्त उच्च डिग्री न हो। वैधता का अर्थ है एक परीक्षण की सत्यता-पूर्णता। इसका मतलब है कि परीक्षण किस सीमा तक मापता है, परीक्षण निर्माता क्या मापना चाहता है।

इसमें दो पहलू शामिल हैं:

क्या मापा जाता है और कितनी लगातार मापा जाता है। यह एक परीक्षण की विशेषता नहीं है, लेकिन यह परीक्षण स्कोर के अर्थ और उन तरीकों का उल्लेख करता है जो हम निर्णय लेने के लिए स्कोर का उपयोग करते हैं। विशेषज्ञों द्वारा दी गई परिभाषाओं के बाद वैधता की स्पष्ट तस्वीर मिलेगी।

Gronlund और Linn (1995) - "वैधता परीक्षण स्कोर और अन्य मूल्यांकन के परिणाम से एक विशेष उपयोग के संबंध में की गई व्याख्या की उपयुक्तता को संदर्भित करता है।"

Ebel और Frisbie (1991) - "शब्द की वैधता, जब परीक्षण स्कोर के एक सेट पर लागू होती है, तो स्थिरता (सटीकता) को संदर्भित करता है जिसके साथ स्कोर एक विशेष संज्ञानात्मक क्षमता को मापते हैं।"

सीवी गुड (1973) - शिक्षा के शब्दकोष में वैधता को "उस सीमा तक परिभाषित किया गया है जिसमें एक परीक्षण या अन्य मापक उपकरण उस उद्देश्य को पूरा करता है जिसके लिए इसका उपयोग किया जाता है।"

ऐनी अनास्तासी (1969) लिखती हैं "परीक्षण की वैधता की चिंता है कि परीक्षण क्या उपाय करता है और यह कितना अच्छा करता है।"

डेविस (1964) के अनुसार वैधता वह सीमा है, जिसके लिए परीक्षार्थियों के अंकों का रैंक क्रम जिसके लिए एक परीक्षण उपयुक्त है, संपत्ति या विशेषता में समान परीक्षार्थियों के रैंक क्रम के समान है जिसे परीक्षण को मापने के लिए उपयोग किया जा रहा है । इस गुण या विशेषता को कसौटी कहा जाता है। चूंकि किसी भी परीक्षण का उपयोग कई अलग-अलग उद्देश्यों के लिए किया जा सकता है, इसलिए यह इस प्रकार है कि इसमें प्रत्येक मानदंड के अनुरूप कई वैधताएं हो सकती हैं। "

फ्रीमैन (1962) परिभाषित करता है, "वैधता का एक सूचकांक डिग्री को दिखाता है कि एक परीक्षण मापता है कि वह क्या मापता है, जब स्वीकार किए गए मानदंडों के साथ तुलना की जाती है।"

लिंडक्विस्ट (1942) ने कहा है, "एक परीक्षण की वैधता को उस सटीकता के रूप में परिभाषित किया जा सकता है जिसके साथ वह मापता है जिसे वह मापने के लिए अभिप्रेत है, या जिस डिग्री को मापने के लिए वह इसे मापने के लिए अचूकता के पास है।"

उपरोक्त परिभाषाओं से यह स्पष्ट है कि एक मूल्यांकन उपकरण की वैधता वह डिग्री है जिससे वह मापता है कि इसे मापने का इरादा क्या है। वैधता हमेशा परिणामों के विशिष्ट उपयोग और हमारी प्रस्तावित व्याख्या की ध्वनि से संबंधित है।

यह भी आवश्यक नहीं है कि एक परीक्षण जो विश्वसनीय हो वह भी मान्य हो सकता है। उदाहरण के लिए मान लीजिए कि एक घड़ी दस मिनट आगे लगाई गई है। यदि घड़ी एक अच्छा समय का टुकड़ा है, तो यह जो समय बताता है वह विश्वसनीय होगा। क्योंकि यह एक निरंतर परिणाम देता है। लेकिन यह 'मानक समय' द्वारा आंका नहीं जाएगा। यह इंगित करता है "अवधारणा कि विश्वसनीयता एक आवश्यक है, लेकिन वैधता के लिए पर्याप्त स्थिति नहीं है।"

वैधता की प्रकृति:

1. वैधता परीक्षण के परिणामों की उपयुक्तता को संदर्भित करता है लेकिन साधन को नहीं।

2. वैधता सभी या किसी के आधार पर मौजूद नहीं है लेकिन यह डिग्री का मामला है।

3. परीक्षण सभी उद्देश्यों के लिए मान्य नहीं हैं। वैधता हमेशा विशिष्ट व्याख्या के लिए विशिष्ट होती है। उदाहरण के लिए एक शब्दावली परीक्षण के परिणाम शब्दावली का परीक्षण करने के लिए अत्यधिक मान्य हो सकते हैं लेकिन छात्र की रचना क्षमता का परीक्षण करने के लिए इतना मान्य नहीं हो सकता है।

4. वैधता विभिन्न प्रकार की नहीं है। यह एकात्मक अवधारणा है। यह विभिन्न प्रकार के साक्ष्यों पर आधारित है।

वैधता को प्रभावित करने वाले कारक:

विश्वसनीयता की तरह कई कारक भी हैं जो परीक्षण स्कोर की वैधता को प्रभावित करते हैं। कुछ कारक हैं जिनके बारे में हम सतर्क हैं और आसानी से बच सकते हैं। लेकिन कुछ कारक हैं जिनके बारे में हम अनभिज्ञ हैं और यह उनके इच्छित उपयोग के लिए परीक्षा परिणामों को अमान्य बनाता है।

इनमें से कुछ कारक निम्नलिखित हैं:

1. परीक्षण में कारक:

(i) छात्रों को परीक्षण का जवाब देने के लिए अस्पष्ट निर्देश।

(ii) पढ़ने की शब्दावली और वाक्य संरचना की कठिनाई।

(iii) बहुत आसान या बहुत कठिन परीक्षण आइटम।

(iv) परीक्षण वस्तुओं में अस्पष्ट कथन।

(v) किसी विशेष परिणाम को मापने के लिए अनुचित परीक्षण आइटम।

(Vi) परीक्षण करने के लिए अपर्याप्त समय प्रदान किया गया।

(vii) परीक्षण की लंबाई बहुत कम है।

(viii) टेस्ट आइटम कठिनाई के क्रम में व्यवस्थित नहीं हैं।

(ix) उत्तर के पहचानने योग्य पैटर्न।

परीक्षण प्रशासन और स्कोरिंग में कारक:

(i) व्यक्तिगत छात्रों को अनुचित सहायता, जो मदद मांगते हैं,

(ii) परीक्षण के दौरान विद्यार्थियों द्वारा धोखा देना।

(iii) निबंध प्रकार के उत्तरों की अविश्वसनीय स्कोरिंग।

(iv) परीक्षण पूरा करने के लिए अपर्याप्त समय।

(v) परीक्षण के समय शारीरिक और मनोवैज्ञानिक स्थिति का प्रतिकूल प्रभाव।

टेस्टी से संबंधित कारक:

(i) छात्रों की परीक्षा की चिंता।

(ii) छात्र की शारीरिक और मनोवैज्ञानिक स्थिति,

(iii) उत्तर सेट-वस्तुओं के जवाब में एक निश्चित पैटर्न का पालन करने की एक सुसंगत प्रवृत्ति।

विशेषता # 3. निष्पक्षता:

निष्पक्षता एक अच्छे परीक्षण की एक महत्वपूर्ण विशेषता है। यह परीक्षण स्कोर की वैधता और विश्वसनीयता दोनों को प्रभावित करता है। एक मापने वाले उपकरण की निष्पक्षता उस डिग्री तक पहुंचती है, जिसमें उत्तर प्राप्त करने वाले विभिन्न व्यक्ति एक ही परिणाम पर पहुंचते हैं। सीवी गुड (1973) परीक्षण में वस्तुनिष्ठता को परिभाषित करता है "व्यक्तिगत त्रुटि (व्यक्तिगत पूर्वाग्रह) से मुक्त करने के लिए साधन, यह है कि स्कोरर की ओर से व्यक्तिपरकता"।

Gronlund और Linn (1995) में कहा गया है, "एक परीक्षण की वस्तुनिष्ठता उस डिग्री को संदर्भित करती है, जिसमें समान रूप से सक्षम स्कोर समान परिणाम प्राप्त करते हैं। इसलिए एक परीक्षण को उद्देश्य माना जाता है जब यह स्कोरर की व्यक्तिगत राय और पूर्वाग्रह निर्णय के उन्मूलन के लिए बनाता है। इस संदर्भ में वस्तुनिष्ठता के दो पहलू हैं जिनका परीक्षण करते समय ध्यान में रखा जाना चाहिए। ”

(i) स्कोरिंग में वस्तुनिष्ठता।

(ii) वृषण द्वारा परीक्षण वस्तुओं की व्याख्या में वस्तुनिष्ठता।

(i) स्कोरिंग का उद्देश्य:

स्कोरिंग की वस्तुनिष्ठता का मतलब है कि एक ही व्यक्ति या अलग-अलग व्यक्ति किसी भी समय परीक्षण का स्कोर कर सकते हैं, त्रुटि का मौका दिए बिना उसी परिणाम पर पहुंच सकते हैं। वस्तुनिष्ठ होने के लिए एक परीक्षा आवश्यक रूप से इतनी होनी चाहिए कि केवल सही उत्तर दिया जा सके। दूसरे शब्दों में, उत्तर स्क्रिप्ट स्कोर करने वाले व्यक्ति का व्यक्तिगत निर्णय टेस्ट स्कोर को प्रभावित करने वाला कारक नहीं होना चाहिए। ताकि परीक्षण का परिणाम सरल और सटीक तरीके से प्राप्त किया जा सके अगर स्कोरिंग प्रक्रिया उद्देश्यपूर्ण हो। स्कोरिंग प्रक्रिया ऐसी होनी चाहिए जिसमें कोई संदेह न हो कि कोई वस्तु सही है या गलत या आंशिक रूप से सही है या आंशिक रूप से गलत है।

(ii) परीक्षण वस्तुओं की वस्तुनिष्ठता:

वस्तु वस्तुनिष्ठता से हमारा तात्पर्य यह है कि आइटम को निश्चित एकल उत्तर के लिए कॉल करना चाहिए। अच्छी तरह से निर्मित परीक्षण वस्तुओं को खुद को एक और केवल एक व्याख्या के लिए नेतृत्व करना चाहिए, जिसमें शामिल सामग्री को जानते हैं। इसका मतलब है कि परीक्षण आइटम अस्पष्टता से मुक्त होना चाहिए। किसी दिए गए परीक्षण आइटम का मतलब उन सभी छात्रों के लिए समान होना चाहिए जो परीक्षण निर्माता पूछना चाहता है। दोहरे अर्थ वाले वाक्य, एक से अधिक सही उत्तर वाले आइटम को परीक्षण में शामिल नहीं किया जाना चाहिए क्योंकि यह परीक्षण को व्यक्तिपरक बनाता है।

विशेषता # 4. उपयोगिता:

प्रयोज्यता उपकरणों को मापने की एक और महत्वपूर्ण विशेषता है। क्योंकि मूल्यांकन उपकरणों के व्यावहारिक विचारों की उपेक्षा नहीं की जा सकती है। परीक्षण का समय, अर्थव्यवस्था और प्रशासन के दृष्टिकोण से व्यावहारिक मूल्य होना चाहिए। इसे प्रयोज्य कहा जा सकता है।

इसलिए परीक्षण का निर्माण या चयन करते समय निम्नलिखित व्यावहारिक पहलुओं को ध्यान में रखा जाना चाहिए:

(i) प्रशासन में आसानी:

इसका मतलब है कि परीक्षा को प्रशासन के लिए आसान होना चाहिए ताकि सामान्य वर्ग-कक्ष शिक्षक इसका उपयोग कर सकें। इसलिए सरल और स्पष्ट निर्देश दिए जाने चाहिए। परीक्षण में बहुत कम उपप्रकार होना चाहिए। परीक्षण का समय बहुत मुश्किल नहीं होना चाहिए।

(ii) प्रशासन के लिए आवश्यक समय:

परीक्षण लेने के लिए उचित समय सीमा प्रदान की जानी चाहिए। यदि टेस्ट लेने के लिए पर्याप्त समय प्रदान करने के लिए हम परीक्षण को कम कर देंगे तो परीक्षण की विश्वसनीयता कम हो जाएगी। ग्रोनलुंड और लिनन (1995) की राय है कि "प्रकाशित परीक्षण द्वारा प्राप्त प्रत्येक व्यक्ति के स्कोर के लिए कहीं न कहीं 20 से 60 मिनट का परीक्षण समय शायद एक अच्छा मार्गदर्शक है"

(iii) व्याख्या और आवेदन में आसानी:

परीक्षण स्कोर का एक अन्य महत्वपूर्ण पहलू परीक्षण स्कोर की व्याख्या और परीक्षण के परिणाम के आवेदन हैं। यदि परिणामों को गलत तरीके से समझा जाता है, तो दूसरी तरफ यह हानिकारक है यदि इसे लागू नहीं किया जाता है, तो यह बेकार है।

(iv) समतुल्य रूपों की उपलब्धता:

समतुल्य प्रपत्र परीक्षण संदिग्ध परीक्षण स्कोर को सत्यापित करने में मदद करता है। यह सीखने के एक ही डोमेन पर विद्यार्थियों को रिटायर करते समय स्मृति के कारक को खत्म करने में भी मदद करता है। इसलिए सामग्री के संदर्भ में समान परीक्षा के समकक्ष रूप, कठिनाई का स्तर और अन्य विशेषताएं उपलब्ध होनी चाहिए।

(v) परीक्षण की लागत:

एक परीक्षा तैयारी, प्रशासन और स्कोरिंग दृष्टिकोण से किफायती होनी चाहिए।