एक अच्छे टेस्ट के 4 आवश्यक मापदंड

यह लेख एक अच्छे परीक्षण के चार आवश्यक मानदंडों पर प्रकाश डालता है। मानदंड हैं: - 1. विश्वसनीयता 2. वैधता 3. उद्देश्य 4. उपयोगिता।

मानदंड # 1. विश्वसनीयता:

विश्वसनीयता का शब्दकोश अर्थ स्थिरता, निर्भरता या विश्वास है। एक माप प्रक्रिया उस सीमा तक विश्वसनीय है जो दोहराया माप व्यक्ति के लिए लगातार परिणाम देता है।

एक परीक्षण को विश्वसनीय माना जाता है यदि यह अपने क्रमिक प्रशासन में लगातार परिणाम देता है। तो एक परीक्षण की विश्वसनीयता से हमारा मतलब है कि परीक्षण कितना भरोसेमंद या वफादार है। सामान्य तरीके से व्यक्त करने के लिए, यदि एक मापने वाला उपकरण लगातार मापता है, तो यह विश्वसनीय है।

जब एक परीक्षण विश्वसनीय होता है, तो एक समूह के सदस्यों द्वारा एक ही परीक्षण के साथ या एक ही परीक्षण के वैकल्पिक रूपों के साथ बनाए गए स्कोर उनके मूल मूल्यों से बहुत कम या बिल्कुल अलग नहीं होंगे।

उदाहरण 1:

अगर कोई गवाह किसी मुद्दे पर वही बयान देता है जब अदालत में एक वकील द्वारा बार-बार पूछा जाता है तो हम उसके बयान पर भरोसा करते हैं और उसके बयान को विश्वसनीय मानते हैं।

उदाहरण 2:

अगर कोई घड़ी हिंदुस्तान के समय की तुलना में हर दिन 10 मिनट देरी से आती है तो हम कह सकते हैं कि घड़ी एक विश्वसनीय उपकरण है।

उदाहरण 3:

मान लीजिए कि हम अमित से उसकी जन्मतिथि रिपोर्ट करने के लिए कहते हैं। वह 13 जुलाई, 1985 को होने की रिपोर्ट करता है। समय की एक चूक के बाद हमने एक ही सवाल पूछा और उन्होंने 13 जुलाई, 1985 को एक ही रिपोर्ट की।

हम सवाल को बार-बार रख सकते हैं और अगर जवाब वही है तो हमें लगता है कि अमित का बयान एक विश्वसनीय है।

परिभाषाएं:

1. थोर्नडाइक:

यह एक परीक्षण की संगति है जिसके साथ यह मापता है कि जो भी मापा जाना है। टेस्ट विश्वसनीयता को आमतौर पर उस डिग्री के रूप में माना जाता है, जिसमें परीक्षण क्षतिपूर्ति त्रुटियों से मुक्त होता है।

2. ग्रोनलंड और लिन:

विश्वसनीयता माप की स्थिरता को संदर्भित करता है- अर्थात, एक माप से दूसरे में लगातार परीक्षण स्कोर या अन्य मूल्यांकन परिणाम कैसे होते हैं।

3. अनास्तासी:

विश्वसनीयता समान व्यक्तियों द्वारा प्राप्त किए गए अंकों की स्थिरता को संदर्भित करता है जब अलग-अलग अवसरों पर एक ही परीक्षण के साथ या समकक्ष वस्तुओं के विभिन्न सेटों के साथ या परिवर्तनशील परीक्षा स्थितियों के तहत पुन: जांच की जाती है।

4. डेविस:

परीक्षण स्कोर के एक सेट के सापेक्ष पूर्वाधारों की डिग्री को विश्वसनीयता के रूप में परिभाषित किया गया है।

5. गिलफोर्ड:

विश्वसनीयता प्राप्त परीक्षण स्कोर में असली विचरण का अनुपात है।

उपर्युक्त चर्चा से यह स्पष्ट हो गया कि परीक्षण की विश्वसनीयता का मतलब है कि परीक्षण उसी जनसंख्या पर क्रमिक प्रशासन पर समान परिणाम देता है। अन्य शर्तें स्थिर रहती हैं, यदि एक ही परीक्षण को दो अलग-अलग अवसरों पर एक ही जनसंख्या पर प्रशासित किया जाता है और दोनों अवसरों पर व्यक्तियों द्वारा प्राप्त किए गए अंक कमोबेश समान रहते हैं, तो परीक्षण को विश्वसनीय कहा जाता है।

परीक्षण की विश्वसनीयता निम्नलिखित सवालों के जवाब देने की कोशिश करती है:

(i) अगर दो अलग-अलग मौकों पर एक ही टेस्ट दिया जाता है, तो विद्यार्थियों के स्कोर कैसे समान होंगे?

(ii) यदि समतुल्य वस्तुओं के एक अलग नमूने का चयन किया जाता है तो स्कोर कैसे भिन्न होंगे?

(iii) यदि किसी भिन्न स्कोरर द्वारा परीक्षण किया जाता है तो स्कोर कैसे भिन्न होंगे?

(iv) यदि अलग-अलग समय में एक ही स्कोरर द्वारा परीक्षण किया जाता है तो स्कोर कैसे भिन्न होंगे?

विश्वसनीयता के लक्षण:

विश्वसनीयता में निम्नलिखित विशेषताएं हैं:

(i) विश्वसनीयता का अनुमान हमेशा किसी विशेष प्रकार की स्थिरता को संदर्भित करता है।

(ii) यह मापने वाले उपकरण की सटीकता या सटीकता को संदर्भित करता है।

(iii) विश्वसनीयता से तात्पर्य परीक्षण के परिणामों से है न कि परीक्षण से।

(iv) यह आंतरिक स्थिरता का गुणांक है।

(v) माप के एक सेट की विश्वसनीयता तार्किक रूप से उस विचरण के अनुपात के रूप में होती है जो वास्तविक विचरण है।

(vi) यह चर त्रुटि या मौका त्रुटि या माप त्रुटि का माप है।

(vii) विश्वसनीयता डिग्री का विषय है। यह सभी या गैर-आधार में मौजूद नहीं है।

(viii) विश्वसनीयता परीक्षण की वैधता या सत्यता या शुद्धता को सुनिश्चित नहीं करती है।

(ix) विश्वसनीयता एक आवश्यक है लेकिन वैधता के लिए पर्याप्त शर्त नहीं है। कम विश्वसनीयता प्राप्त की गई वैधता की डिग्री को प्रतिबंधित कर सकती है, लेकिन उच्च विश्वसनीयता वैधता की संतोषजनक डिग्री के लिए कोई आश्वासन नहीं देती है।

(x) विश्वसनीयता प्राथमिक रूप से इस अर्थ में सांख्यिकीय है कि दो लगातार अवसरों पर प्राप्त किए गए अंक एक-दूसरे के साथ संबद्ध होते हैं। सहसंबंध के इस गुणांक को आत्म-सहसंबंध के रूप में जाना जाता है और इसके मूल्य को 'विश्वसनीयता गुणांक' कहा जाता है।

माप की विश्वसनीयता और त्रुटियां:

विश्वसनीयता की परिभाषा को तीन शीर्षकों के तहत वर्गीकृत किया जा सकता है:

(i) अनुभवजन्य,

(ii) तार्किक, और

(iii) सैद्धांतिक।

(i) अनुभवजन्य:

विश्वसनीयता की अनुभवजन्य परिभाषाएं समान अवसरों पर अलग-अलग अवसरों पर एक ही परीक्षण पर दिए गए स्कोर के दो सेटों के बीच सहसंबंध की सीमा को संदर्भित करती हैं।

(ii) सैद्धांतिक:

सैद्धांतिक अर्थ परीक्षण के स्कोर की स्थिरता या सटीकता को संदर्भित करता है। इसका अर्थ है एक परीक्षण स्कोर की निर्भरता।

(iii) तार्किक:

विश्वसनीयता का तार्किक अर्थ माप की त्रुटियों को दर्शाता है।

निम्नलिखित दृष्टांत विश्वसनीयता और माप की त्रुटियों की अवधारणा को समझने में हमें आगे बढ़ा सकते हैं:

उदाहरण के लिए श्री रोहित ने मानसिक परीक्षण में 52 हासिल किए। 52 क्या दर्शाता है? क्या यह उसकी वास्तविक क्षमता की बात करता है? क्या यह उसका असली स्कोर है? हो सकता है कि रोहित ने महज मौका पाकर 52 हासिल किए हों। ऐसा हो सकता है कि, रोहित, संयोग से, परीक्षण के 52 आइटमों को जानता था और आइटम थोड़ा अलग थे, इसलिए उन्होंने यह स्कोर हासिल नहीं किया।

ये सभी प्रश्न इस तथ्य से संबंधित हैं कि माप में कुछ प्रकार की त्रुटियाँ शामिल हैं। व्यक्तिगत, स्थिर, परिवर्तनशील और व्याख्यात्मक त्रुटियाँ। इस त्रुटि को माप त्रुटियों के रूप में कहा जाता है। इसलिए एक परीक्षण की विश्वसनीयता निर्धारित करते समय, हमें माप में मौजूद त्रुटियों की मात्रा को ध्यान में रखना चाहिए।

जब विश्वसनीयता का गुणांक सही होगा (यानी 1.00) माप सही हो जाता है और यह सभी प्रकार की त्रुटियों से मुक्त होता है। लेकिन हर क्षेत्र में माप में कुछ प्रकार की त्रुटियां शामिल हैं। इसलिए, विश्वसनीयता कभी भी परिपूर्ण नहीं होती है।

परीक्षण पर एक अंक को माप के सही स्कोर और त्रुटियों के सूचकांक के रूप में सोचा जा सकता है।

कुल स्कोर या वास्तविक प्राप्त स्कोर = ट्रू स्कोर + एरर स्कोर

यदि किसी अंक में 'सही स्कोर' का एक बड़ा घटक और त्रुटि का एक छोटा घटक है, तो यह उच्च है; और contrariwise, अगर एक परीक्षण स्कोर में 'सही स्कोर' और बड़े 'त्रुटि' घटक का एक छोटा घटक है, तो इसकी विश्वसनीयता कम है।

वास्तविक प्राप्त स्कोर, सही स्कोर और त्रुटि के संबंध गणितीय रूप से निम्नानुसार व्यक्त किए जा सकते हैं:

एक्स = एक्स + ई

जिसमें एक्स = एक परीक्षण पर एक व्यक्ति के लिए स्कोर प्राप्त किया।

एक्स X = एक ही व्यक्ति का सही स्कोर

ई = चर (मौका) त्रुटियों।

माप की त्रुटियां:

ट्रू स्कोर एक परीक्षण के समानांतर रूपों की अनंत संख्या पर प्राप्त अंकों का औसत है। प्रत्येक प्राप्त स्कोर वास्तविक स्कोर की तुलना में अधिक या कम होगा। सच्चे अंकों से प्राप्त अंकों के विचलन को "माप की त्रुटियां" कहा जाता है।

कभी-कभी माप की त्रुटियां कम और कभी-कभी अधिक हो सकती हैं। अन्य चीजें बराबर होती हैं, माप की त्रुटियां कम होती हैं, माप की विश्वसनीयता अधिक होती है।

माप की मानक त्रुटि:

माप की त्रुटियां (अर्थात वास्तविक स्कोर से प्राप्त अंकों की भिन्नता) सामान्य रूप से वितरित की जाएंगी और इन विविधताओं (या माप की त्रुटियों) के मानक विचलन को "माप की मानक त्रुटियां" कहा जाता है।

हम माप के मानक त्रुटि (माप के एसई) का पता लगा सकते हैं जब वितरण का विश्वसनीयता गुणांक और मानक विचलन दिया जाता है।

माप की मानक त्रुटि की गणना करने का सूत्र इस प्रकार है:

जिसमें which sc = किसी प्राप्त अंक का SE

1 = परीक्षण स्कोर का मानक विचलन

r 11 = समान परीक्षण की विश्वसनीयता गुणांक।

उदाहरण 4:

300 कॉलेज के छात्रों के समूह में, गणित में एक एप्टीट्यूड टेस्ट की विश्वसनीयता गुणांक है .75, टेस्ट एम 80 है और स्कोर वितरण का एसडी 16 है। जॉन 86 का स्कोर प्राप्त करता है। इस स्कोर का एसई क्या है ?

उपाय:

उपरोक्त सूत्र से हम पाते हैं कि

और अंतर लगभग 2: 1 है जो कि 300 के समूह में किसी भी व्यक्ति का प्राप्त अंक value 8 अंक (यानी, sc 1 एसई एससी ) से अधिक के अपने वास्तविक मूल्य को याद नहीं करता है। जॉन के असली स्कोर के लिए .95 विश्वास अंतराल 86 val 1.96 x 8 या 70 से 102 है।

300 छात्रों के पूरे समूह के लिए सामान्यीकरण करते हुए, हम उनके अंकों के 1/3 के बारे में 8 या अधिक बिंदुओं से त्रुटि होने की उम्मीद कर सकते हैं, और इस राशि से कम पर 2/3 त्रुटि होने की उम्मीद कर सकते हैं।

मानदंड # 2. वैधता:

वैधता का शब्दकोष "अच्छी तरह से आधारित", "प्रभावोत्पादक", "ध्वनि" है। यह "सत्यता" को संदर्भित करता है। इस प्रकार, जो कुछ भी सत्य है, अच्छी तरह से आधारित है और जो सही उद्देश्य को पूरा करता है वह वैध है।

हर परीक्षा के अपने कुछ उद्देश्य होते हैं। इसका निर्माण कुछ विशिष्ट उद्देश्य के लिए किया गया है और यह उस उद्देश्य के लिए मान्य है। यदि कोई परीक्षण मापता है कि वह क्या मापना चाहता है, तो इसे वैध कहा जाता है। वैधता इस बात पर प्रत्यक्ष जांच प्रदान करती है कि परीक्षण अपने कार्यों को कितनी अच्छी तरह पूरा करता है। वैधता एक परीक्षण के सार्वभौमिक बनने की पहली आवश्यकता है।

विश्वसनीयता आवश्यक हो सकती है लेकिन वैधता की पर्याप्त स्थिति नहीं। एक परीक्षण तब तक मान्य नहीं हो सकता जब तक कि यह विश्वसनीय न हो। यह विश्वसनीय हो सकता है लेकिन वैध नहीं कहा जा सकता। एक परीक्षण की प्रासंगिकता परीक्षण उपायों और उपायों की प्रक्रिया से संबंधित है।

संक्षेप में, हम यह कह सकते हैं कि एक परीक्षण का उद्देश्य भविष्यवाणी कार्य करना है और इस प्रकार यह मूल्य या वैधता उस डिग्री पर निर्भर करता है जिस पर यह कुछ प्रकार की वास्तविक जीवन स्थिति में प्रदर्शन का अनुमान लगाने में सफल होता है।

उदाहरण 5:

मान लीजिए कि एक गवाह एक अदालत में न्यायाधीश के सामने एक बयान देता है। यदि क्रमिक क्रॉस परीक्षाओं या क्रॉस पूछताछ पर, वह एक ही कथन को बार-बार दोहराता है तो उसे एक विश्वसनीय गवाह के रूप में बुलाया जाना है।

कोई शक नहीं, उनका बयान सही या गलत हो सकता है। जब उसका कथन सत्य होता है, तो उसे वैध गवाह कहा जाता है। लेकिन अगर उसका बयान लगातार गलत है, हालांकि वह विश्वसनीय है, लेकिन वैध नहीं है।

उदाहरण 6:

यदि कोई घड़ी 'मानक समय' से 10 मिनट आगे रहती है तो यह एक विश्वसनीय समय-टुकड़ा है। क्योंकि यह 10 मिनट के तेज के साथ हर रोज लगातार परिणाम देता है। हमारा उद्देश्य समय को सही तरीके से जानना है और हम इसे नहीं जान पाए। तो बहुत उद्देश्य से सेवा नहीं की जाती है। इस प्रकार यह 'मानक समय' द्वारा आंका गया मान्य नहीं होगा।

इस प्रकार, यह पाया गया है कि एक परीक्षण विश्वसनीय हो सकता है, लेकिन यह मान्य नहीं हो सकता है। हालांकि, वैध उपाय या परीक्षण हमेशा विश्वसनीय होते हैं। एक परीक्षण जो किसी दिए गए उद्देश्य के लिए मान्य है, दूसरे उद्देश्य के लिए मान्य नहीं हो सकता है।

एक परीक्षण जो गणित में छात्रों के कम्प्यूटेशनल कौशल को मापने के लिए तैयार किया गया है, केवल उस उद्देश्य के लिए मान्य हो सकता है, लेकिन गणितीय परीक्षण को मापने के लिए नहीं। तो, वैधता परीक्षण के बहुत उद्देश्य को संदर्भित करता है।

परिभाषाएं:

ऐनी अनास्तासी:

लिखते हैं "एक परीक्षण की वैधता चिंता का विषय है कि परीक्षण क्या मापता है और यह कितनी अच्छी तरह से करता है।"

Rummel:

"एक मूल्यांकन उपकरण की वैधता वह डिग्री है जिससे वह मापता है कि इसे मापने का इरादा क्या है।"

एफएस फ्रीमैन:

"वैधता का एक सूचकांक डिग्री को दिखाता है कि एक परीक्षण मापता है कि यह स्वीकार किए गए मानदंड के साथ तुलना में क्या मापता है।"

एलजे क्रोनबाक:

"वैधता वह सीमा है जिसके लिए एक परीक्षण मापता है कि वह क्या मापता है।"

EF लिंडक्विस्ट:

वैधता वह सटीकता है जिसके साथ वह मापता है जिसे मापने का इरादा है या उस डिग्री के रूप में जिसे मापने के लिए यह नापसंदता के करीब पहुंचता है।

पूर्वगामी चर्चा से हम मानते हैं कि वैधता "परीक्षण के बहुत उद्देश्य" को संदर्भित करती है और यदि उद्देश्य पूरा हो जाता है, तो परीक्षण को वैध माना जाना चाहिए। तो वैध होने के लिए एक परीक्षण वह काम करना चाहिए जो वह करना चाहता था।

एक परीक्षण की वैधता की अवधारणा, इसलिए, मुख्य रूप से परीक्षण की 'बुनियादी ईमानदारी' के लिए एक चिंता का विषय है। जो करने का वादा करता है उसके अर्थ में ईमानदारी। सटीक होने के लिए, वैधता से तात्पर्य है कि उपकरण कितनी अच्छी तरह मापता है कि वह क्या मापना चाहता है।

वैधता की प्रकृति:

1. वैधता से तात्पर्य परीक्षण के अंकों की सत्यता या शुद्धता से है, लेकिन साधन से नहीं।

2. वैधता डिग्री का मामला है। यह सभी या किसी के आधार पर मौजूद नहीं है। किसी विशेष क्षमता को मापने के लिए बनाया गया एक उपकरण को पूरी तरह से वैध या बिल्कुल वैध नहीं कहा जा सकता है। यह आम तौर पर कम या ज्यादा मान्य है।

3. यह 'निरंतर त्रुटि' का माप है जबकि विश्वसनीयता 'परिवर्तनीय त्रुटि' का माप है।

4. वैधता एक परीक्षण की विश्वसनीयता सुनिश्चित करती है। यदि कोई परीक्षण वैध है, तो यह विश्वसनीय होना चाहिए।

5. वैधता विभिन्न प्रकार की नहीं है। यह एकात्मक अवधारणा है। यह विभिन्न प्रकार के साक्ष्यों पर आधारित है।

6. सामान्य वैधता जैसी कोई चीज नहीं है। एक परीक्षण किसी उद्देश्य या स्थिति के लिए मान्य है, फिर भी यह अन्य उद्देश्यों के लिए मान्य नहीं है। दूसरे शब्दों में एक उपकरण किसी विशेष उद्देश्य या किसी विशेष स्थिति के लिए मान्य है; यह आम तौर पर मान्य नहीं है।

उदाहरण के लिए, शब्दावली परीक्षण के परिणाम शब्दावली का परीक्षण करने के लिए अत्यधिक मान्य हो सकते हैं, लेकिन छात्र की रचना क्षमता का परीक्षण करने के लिए इतना मान्य नहीं हो सकता है।

मानदंड # 3. निष्पक्षता:

निष्पक्षता एक अच्छी परीक्षा की सबसे महत्वपूर्ण विशेषता है। यह वैधता और विश्वसनीयता दोनों के लिए एक शर्त है। एक परीक्षण की वस्तुनिष्ठता का मतलब है कि विभिन्न व्यक्ति जो डिग्री देते हैं, वही परिणाम देता है।

सीवी गुड (1973):

सीवी गुड (1973) परीक्षण में वस्तुनिष्ठता को परिभाषित करता है "यह है कि किस हद तक उपकरण व्यक्तिगत त्रुटि (व्यक्तिगत पूर्वाग्रह) से मुक्त है जो स्कोरर की ओर से व्यक्तिपरकता है।"

ग्रोनलंड और लिन (1995):

"एक परीक्षण की निष्पक्षता उस डिग्री को संदर्भित करती है जिसके लिए समान रूप से सक्षम स्कोरर समान परिणाम प्राप्त करते हैं।"

इस प्रकार, यह कहा जा सकता है कि एक परीक्षण को उद्देश्य माना जाता है जब यह स्कोरर की व्यक्तिगत राय और पूर्वाग्रह निर्णय के उन्मूलन के लिए बनाता है।

एक परीक्षण की वस्तुनिष्ठता दो पहलुओं को संदर्भित करती है:

(i) वस्तुओं की वस्तुनिष्ठता, और

(ii) स्कोरिंग की वस्तुनिष्ठता।

(i) वस्तुओं की वस्तुनिष्ठता:

वस्तुओं की वस्तुनिष्ठता का अर्थ है कि आइटम को एक निश्चित एकल उत्तर के लिए कॉल करना होगा। वस्तुनिष्ठ वस्तुओं में दो या अधिक उत्तर नहीं हो सकते हैं। जब प्रश्न को अलग तरीके से कहा जाता है, तो स्कोरिंग में अंतर होगा।

उदाहरण के लिए:

"व्यक्तित्व की अवधारणा को समझाइए।"

यहां स्कोरर द्वारा दिए गए स्कोर काफी हद तक अलग-अलग होंगे क्योंकि प्रश्न स्पष्ट रूप से सही उत्तर की प्रकृति को इंगित नहीं करता है जो अपेक्षित है।

यहां बच्चा सवाल से संबंधित कुछ भी लिख सकता है। यदि उत्तर अलग-अलग परीक्षार्थियों द्वारा दिया जाता है, तो निश्चित रूप से अंक भिन्न होंगे।

अस्पष्ट प्रश्न, उचित दिशा का अभाव, डबल बैरल प्रश्न, दोहरे नकारात्मक के साथ प्रश्न, व्यापक निबंध प्रकार प्रश्न आदि में वस्तुनिष्ठता नहीं होती है। इसलिए, प्रश्नों को तैयार करते समय बहुत सावधानी बरती जानी चाहिए।

(ii) स्कोरिंग का उद्देश्य:

एक उपकरण वस्तुनिष्ठ होता है यदि वह समान स्कोर तब भी देता है जब विभिन्न स्कोरर आइटम स्कोर करते हैं। स्कोरिंग में निष्पक्षता, इस प्रकार, विभिन्न स्कोररों द्वारा स्कोरिंग में स्थिरता के रूप में माना जा सकता है।

अक्सर, वास्तविक स्थितियों में, हम पाते हैं कि स्कोरर की सनक या पूर्वाग्रह अंकन को प्रभावित करते हैं। कुछ विषयों के बारे में पूछे जाने वाले प्रश्न, जिनके लिए स्कोरर का झुकाव है, अन्य प्रश्नों की तुलना में अधिक अंक ला सकता है।

स्कोरिंग प्रणाली के प्रति इस प्रकार का तर्कहीन स्वभाव पाठ्यक्रम का उसका एक व्यक्तिपरक उपचार है, जो बदले में मूल्यांकन प्रक्रिया को प्रभावित करता है। इसलिए, मूल्यांकन में निष्पक्षता को सटीक मूल्यांकन के लिए सुनिश्चित किया जाना है।

उसी समय, विषयवस्तु की निंदा करने और पूरी तरह से बाहर करने की आवश्यकता नहीं है, क्योंकि इस तरह से वास्तविकता में अधिकांश मूल्यांकन किए जाते हैं। सावधान अवलोकन, अनुचित और निष्पक्ष सोच और स्थितियों और घटनाओं के तार्किक विश्लेषण के आधार पर विशेषण मूल्यांकन भी सटीक मूल्यांकन दे सकता है। इस तरह की अनुशासित विषयवस्तु स्कूल की स्थिति में भी महत्वपूर्ण भूमिका निभा सकती है।

मानदंड # 4. उपयोगिता:

यूज़ेबिलिटी-डिग्री जिसके लिए मूल्यांकन का उपकरण परीक्षण उपयोगकर्ताओं द्वारा सफलतापूर्वक उपयोग किया जा सकता है।

हमने अब तक एक अच्छी परीक्षा के तीन मुख्य मानदंड पढ़े हैं: वैधता, विश्वसनीयता और निष्पक्षता। एक उपकरण की एक अन्य महत्वपूर्ण विशेषता इसकी प्रयोज्य या व्यावहारिकता है। मूल्यांकन के साधनों का चयन करते समय किसी को व्यावहारिकता, प्रशासन में आसानी और स्कोरिंग, व्याख्या में आसानी, तुलनात्मक रूपों की उपलब्धता और परीक्षण की लागत जैसी कुछ व्यावहारिक बातों पर गौर करना चाहिए।

ये सभी विचार मूल्यांकन के साधनों का उपयोग करने के लिए एक शिक्षक को प्रेरित करते हैं और ऐसे व्यावहारिक विचारों को मूल्यांकन के उपकरण के "प्रयोज्य" के रूप में संदर्भित किया जाता है। दूसरे शब्दों में प्रयोज्यता का अर्थ है वह डिग्री, जिसके मूल्यांकन का उपकरण शिक्षक और स्कूल प्रशासकों द्वारा सफलतापूर्वक उपयोग किया जा सकता है।

(i) समझदारी:

परीक्षण वस्तुओं को अस्पष्टता से मुक्त होना चाहिए। वस्तुओं का परीक्षण करने की दिशा और परीक्षण की अन्य दिशाएँ स्पष्ट और समझने योग्य होनी चाहिए। प्रशासन के निर्देश और स्कोरिंग के लिए दिशा-निर्देश स्पष्ट रूप से बताए जाने चाहिए ताकि कोई भी आसानी से समझ सके और उनका पालन कर सके। इसके अलावा, परीक्षण प्रशासन की प्रक्रिया, स्कोरिंग और स्कोर व्याख्या परीक्षण उपयोगकर्ता की समझ के भीतर होनी चाहिए।

(ii) प्रशासन में आसानी:

यह उस आसानी को संदर्भित करता है जिसमें एक परीक्षण प्रशासित किया जा सकता है। प्रशासन के लिए प्रत्येक परीक्षण की अपनी शर्तें होती हैं। परीक्षण का चयन करते समय, एक को परीक्षणों के संग्रह से एक का चयन करना चाहिए, जिसे बहुत तैयारी और कठिनाइयों के बिना प्रशासित किया जा सकता है।

ए। प्रशासन की आसानी में प्रशासन के लिए स्पष्ट और संक्षिप्त निर्देश शामिल हैं। इसलिए, आदेश में कि एक परीक्षण आसानी से प्रशासक को निर्देश दिया जाता है और स्वाद के लिए दिशा आसान, स्पष्ट और पूर्ण होनी चाहिए।

ख। समय भी एक बहुत ही महत्वपूर्ण कारक है। स्कूलों में अधिकतम प्रशासन के लिए, यह प्रथा है कि एक सामान्य कक्षा के कमरे में एक परीक्षा ली जानी चाहिए।

(iii) स्कोरिंग में आसानी:

बेहतर प्रयोग करने के लिए एक परीक्षा में स्कोरिंग में आसानी होनी चाहिए। इसकी स्कोरिंग कुंजी रेडीमेड होनी चाहिए और इसका आसानी से आकलन किया जा सकता है। कभी-कभी, सवालों के जवाब देने के लिए सवालों के दाईं ओर स्थानों को चिह्नित किया जाता है।

कुछ मामलों में अलग-अलग शीट पर प्रतिक्रियाएं दी जाती हैं। एक आदर्श परीक्षण किसी के द्वारा या यहां तक ​​कि एक मशीन द्वारा भी किया जा सकता है, जिसे स्कोरिंग कुंजी प्रदान की गई है। स्कोरिंग को और अधिक आसान बनाने के लिए परीक्षण में प्रत्येक आइटम के बराबर अंक आवंटित किए जाने चाहिए।

व्यवहार्यता के अनुसार, हाथ से स्कोर करने वाले उपकरण या मशीन-स्कोरिंग डिवाइस प्रदान किए जा सकते हैं।

(iv) व्याख्या में आसानी:

यदि प्राप्त किए गए परीक्षण स्कोर को आसानी से समझा और व्याख्या किया जा सकता है, तो एक परीक्षण अच्छा कहा जाता है। इस प्रयोजन के लिए, टेस्ट मैनुअल में अंकों की व्याख्या के लिए पूर्ण मानदंड प्रदान करना चाहिए, जैसे आयु मानदंड, ग्रेड मानदंड, प्रतिशत मानदंड और मानक स्कोर मानदंड। मानदंडों में परीक्षण स्कोर की व्याख्या की सुविधा है।

(v) टेस्ट का गेट-अप:

परीक्षण में एक अच्छा गेटअप होना चाहिए। यह अच्छा और आकर्षक लुक होना चाहिए। अक्षर अनावश्यक रूप से बहुत छोटे या बहुत बड़े नहीं होने चाहिए। उपयोग किए गए कागज की गुणवत्ता, टाइपोग्राफी और प्रिंटिंग, अक्षर आकार, रिक्ति, चित्र और आरेख, इसकी बाध्यकारी, विद्यार्थियों की प्रतिक्रिया के लिए स्थान आदि की जांच की जानी है।

(vi) टेस्ट की लागत:

परीक्षण बहुत महंगा नहीं होना चाहिए। लागत को संभव सीमा तक कम किया जाना चाहिए, ताकि इसका व्यापक रूप से उपयोग किया जा सके।