नौकरी की सफलता की भविष्यवाणी (आरेख और सांख्यिकी के साथ)

नौकरी की सफलता की भविष्यवाणी में यह निर्धारित करना शामिल है कि भविष्यवक्ता किस हद तक कसौटी से संबंधित है। उदाहरण के लिए, मान लीजिए कि नई फ़ाइल क्लर्कों को नियुक्त करने के लिए एक चयन कार्यक्रम स्थापित करने में रुचि थी। आगे मान लीजिए कि यह लिपिक दक्षता के संभावित भविष्यवक्ता के रूप में लिपिक योग्यता के पेपर-एंड-पेंसिल परीक्षण का उपयोग करने का निर्णय लिया गया था, और यह दक्षता पर्यवेक्षकों की रेटिंग द्वारा निर्धारित की जानी थी। तालिका 2.3 इस ग्रहण की स्थिति के लिए कुछ काल्पनिक डेटा दिखाती है, लिपिकीय परीक्षण और दक्षता मानदंड दोनों पर बारह फ़ाइल क्लर्कों के लिए अंक देना चित्रा 2.5 तालिका 2.3 में डेटा का एक ग्राफ दिखाता है।

ध्यान दें कि एक व्यवस्थित प्रवृत्ति प्रतीत होती है। सामान्य तौर पर, उच्चतर व्यक्ति लिपिक परीक्षण पर, उच्च वह नौकरी प्रवीणता के उपाय पर स्कोर करता है। इसलिए हम यह मान सकते हैं कि परीक्षण प्रदर्शन (भविष्यवक्ता) और नौकरी प्रवीणता (कसौटी) के बीच एक निश्चित संबंध है। हम यह भी काट सकते हैं कि यदि हम उन लोगों का चयन करते हैं जो परीक्षण पर उच्च स्कोर करते हैं, तो हम उन लोगों को काम पर रखने के लिए अधिक उपयुक्त हैं, जो कि अगर हम परीक्षण स्कोर से स्वतंत्र रूप से लोगों को किराए पर लेते हैं तो वे अधिक कुशल होंगे।

रिश्ते की डिग्री की स्थापना:

किसी भी दो चर के बीच संबंध की डिग्री को उस हद तक परिभाषित किया जा सकता है, जब ये दोनों चर एक साथ व्यवस्थित रूप से भिन्न होते हैं। इसके लिए अधिक तकनीकी शब्द चर के बीच विद्यमान कोवरियनस की डिग्री है। स्कोर के किसी भी दो सेट के बीच सहसंयोजक की डिग्री का एक औपचारिक माप सहसंबंध के गुणांक के रूप में जाना जाता है। जब स्कोर के दो सेट अत्यधिक संबंधित होते हैं, तो हम कहते हैं कि वे अत्यधिक सहसंबद्ध हैं। सहसंबंध का सबसे आम उपाय पियर्सन उत्पाद पल सहसंबंध गुणांक है जो प्रतीक आर द्वारा निर्दिष्ट है।

रिश्ते के माप के रूप में, r + 1.00 और -1.00 के बीच भिन्न होता है। जब r + 1.00 होता है, तो स्कोर के दो सेट सकारात्मक और पूरी तरह से एक दूसरे से संबंधित होते हैं। जब आर -1.00 होता है, तो स्कोर के दो सेट नकारात्मक और पूरी तरह से एक दूसरे से संबंधित होते हैं। जब r = 0.00, स्कोर के दो सेटों का एक-दूसरे से कोई संबंध नहीं होता है। चित्र 2.6 आर के विभिन्न परिमाणों के ग्राफ को दर्शाता है।

नौकरी की सफलता की भविष्यवाणी में सहसंबंध गुणांक का संकेत महत्वपूर्ण नहीं है, लेकिन परिमाण है। आर का पूर्ण आकार जितना बड़ा होगा, भविष्यवक्ता से प्राप्त जानकारी के आधार पर कसौटी स्कोर की भविष्यवाणी बेहतर होगी।

सहसंबंध के औचित्य को समझने के लिए सहसंयोजक के एक सचित्र प्रतिनिधित्व और आर के संबंध पर विचार करना सहायक हो सकता है। किसी भी सेट के स्कोर में कुछ भिन्नता होगी - वास्तव में, जैसा कि हम पहले ही देख चुके हैं, कई लक्षणों पर लोगों के स्कोर बहुत ही उच्च स्कोर की एक छोटी संख्या के साथ एक सामान्य वितरण का पालन करते हैं, बहुत कम स्कोर, और अधिकांश वितरण के बीच में होने वाले अंकों का।

मान लीजिए कि हम इस प्रकार के मापदंड स्कोर के एक सेट में प्रतिनिधित्व करते हैं जैसा कि ऊपर दिखाया गया है जहां कुल क्षेत्र को 1.00 के रूप में परिभाषित किया गया है। हम ऐसा कर सकते हैं क्योंकि कच्चे स्कोर के किसी भी सेट को बदलना संभव है, ताकि उनके संस्करण का उपयोग 1.00 के बराबर हो जाए जो कि एज़ स्कोर परिवर्तन के रूप में जाना जाता है।

इसी तरह, मान लें कि हमारे पास भविष्यवक्ता स्कोर का एक सेट है, जो अलग-अलग होता है और सामान्य रूप से वितरित किया जाता है, और फिर से क्षेत्र को 1.00 के बराबर मात्रा के रूप में परिभाषित किया जाता है। अब हम आर ज्यामितीय रूप से स्कोर के दो सेटों के ओवरलैप (कोवरियन) की राशि से संबंधित होने का प्रतिनिधित्व कर सकते हैं।

एक आँकड़ा के रूप में r की एक अधिक सटीक परिभाषा यह है कि यह संबंधित चर (कभी-कभी ज्यामितीय माध्य कहा जाता है) के उत्पाद के वर्गमूल के दो चर के बीच सहसंयोजक की मात्रा का अनुपात है, जिसे नीचे दिए गए चित्र के रूप में देखा जा सकता है:

तालिका 2.3 में दिए गए आंकड़ों पर लौटते हुए, सूत्र का उपयोग करके स्कोर के इन दो सेटों के बीच सहसंबंध की गणना करना संभव है

पाठक को सलाह दी जाती है कि आर की व्याख्या प्रतिशत के रूप में नहीं की जा सकती है। यदि r = 0.50, तो इसका अर्थ यह नहीं है कि कसौटी में विचरण का 50 प्रतिशत चयन चर से अनुमानित है। आर का वर्ग, हालांकि, इसकी व्याख्या की जा सकती है। 0.50 का सहसंबंध, जब चुकता होता है, तो आर 2 = 0.25 देता है, जिसे चयन चर द्वारा अनुमानित मानदंड में भिन्नता के प्रतिशत के रूप में समझा जा सकता है।

आँकड़ा r 2 को कभी-कभी निर्धारण का गुणांक कहा जाता है क्योंकि यह एक चर में भिन्नता की मात्रा का प्रतिनिधित्व करता है जिसे दूसरे चर पर स्कोर को जानकर "निर्धारित" किया जा सकता है। चित्र 2.7 आर (संबंध का माप) और आर 2 के बीच संबंध को दर्शाता है। ध्यान दें कि यह पर्याप्त आकार के आर के प्राप्त करने के लिए संभव है और अभी भी कसौटी के विचरण के केवल एक छोटे अनुपात के लिए जिम्मेदार है।

प्रतिगमन:

जैसा कि हमने देखा है, सहसंबंध गुणांक आर दो चर के बीच संबंधों की डिग्री को मापता है। अपने आप से, हालांकि, यह हमें एक प्रक्रिया प्रदान नहीं करता है जिसके द्वारा हम दूसरे सेट से स्कोर के एक सेट की भविष्यवाणी कर सकते हैं। जिस तकनीक से यह किया जाता है उसे प्रतिगमन विश्लेषण कहा जाता है। प्रतिगमन को सहसंबंध से संबंधित होने के रूप में निम्नानुसार माना जा सकता है: सहसंबंध दो चर के बीच संबंध की मात्रा या डिग्री को मापता है, जबकि प्रतिगमन चर के बीच संबंधों के प्रकार का विवरण देता है जिसका उपयोग पूर्वानुमान बनाने के लिए किया जा सकता है।

प्रतिगमन को स्पष्ट करने के लिए, चित्र 2.8a में दिए गए अंकों पर विचार करें। जाहिर है कि इस मामले में भविष्यवक्ता और कसौटी के बीच एक सकारात्मक संबंध मौजूद है। दुर्भाग्य से, चित्रा 2.8 ए हमें इस तथ्य के अलावा सटीक संबंध के बारे में कोई जानकारी प्रदान नहीं करता है कि यह एक रैखिक एक है (आर हमेशा रैखिक की डिग्री को मापता है, जैसा कि वक्रता संबंध के विपरीत, दो चर के बीच)। यदि हम कुछ चयन डिवाइस से मानदंड स्कोर की भविष्यवाणी करना चाहते हैं, तो यह स्पष्ट है कि हमें भविष्यवक्ता और कसौटी के बीच विशेष रूप से देखे गए संबंधों का वर्णन करने की आवश्यकता है।

यह लाइन या फ़ंक्शन को खोजने के द्वारा पूरा किया जाता है जो डेटा बिंदुओं का सबसे अच्छा वर्णन करता है। इसे डेटा के लिए "सबसे अच्छी फिट की लाइन" कहा जाता है। चूंकि हम संबंध को रेखीय मान रहे हैं (हमने इसका परिमाण मापने के लिए r का उपयोग किया है), जिस प्रकार की लाइन का हम उपयोग करते हैं, वह सीधी होनी चाहिए, अर्थात किसी भी घुमावदार रेखा की अनुमति नहीं है। इस सर्वश्रेष्ठ-फिटिंग सीधी रेखा को प्रतिगमन रेखा कहा जाता है और इसका उपयोग भविष्यवक्ता से मानदंड का अनुमान लगाने के लिए किया जा सकता है।

चित्र 2.8 बी में दो अलग-अलग पंक्तियों को दिखाया गया है, जो अगर हम दो अलग-अलग व्यक्तियों से डेटा की जांच करने के लिए कहें, तो प्राप्त किया जा सकता है और फिर उन बिंदुओं के माध्यम से एक रेखा खींच सकते हैं जो उनकी राय में चर के बीच की प्रवृत्ति या संबंध का वर्णन करना सबसे अच्छा लगता है। जबकि सामान्य प्रवृत्ति समान है, हम पाते हैं कि दो लोग रिश्ते के अपने अनुमान में पूरी तरह से सहमत नहीं हैं।

यह असहमति, अनुमानित मानदंड स्कोर में असहमति के परिणामस्वरूप होगी जिसके आधार पर अनुमानित प्रतिगमन लाइन का उपयोग किया गया था। चयन साधन पर एक स्कोर एक्स के साथ एक नौकरी आवेदक को देखते हुए, हम इस आवेदक के लिए y 1 के मानदंड स्कोर की भविष्यवाणी करेंगे यदि हम पहले व्यक्ति के प्रतिगमन लाइन का उपयोग करने के लिए थे; अगर हम दूसरे व्यक्ति के प्रतिगमन लाइन का उपयोग करते हैं तो हम सबसे संभावित मानदंड स्कोर के रूप में y 2 की भविष्यवाणी करेंगे। कौन सा प्रतिगमन सही है?

यह जवाब देने के लिए एक कठिन सवाल है जब तक कि "सर्वश्रेष्ठ फिट" वास्तव में क्या है, यह तय करने का कोई आधार नहीं है। सौभाग्य से, सांख्यिकीविदों ने आम तौर पर सहमति व्यक्त की है कि एक सर्वश्रेष्ठ-फिटिंग लाइन वह है जो बिंदुओं के माध्यम से जाती है ताकि यह रेखा से बिंदुओं के वर्ग दूरी (y आयाम में) का योग कम से कम हो जाए जैसा कि चित्र 2.9 में दिखाया गया है।

एक पंक्ति जो isd 2 को न्यूनतम करती है उसे "न्यूनतम-वर्ग" प्रतिगमन रेखा कहा जाता है। ऐसी प्रतिगमन रेखाएँ गणितीय रूप से सीधे r से संबंधित होती हैं। हमारी भविष्यवाणी लाइन प्राप्त करने के लिए कम से कम वर्गों की विधि का उपयोग करना यह आश्वस्त करेगा कि विभिन्न लोग एक ही पंक्ति के साथ समाप्त हो जाएंगे (यह मानते हुए कि वे गणना में कोई त्रुटि नहीं करते हैं)। इसी तरह, किसी विशेष x मान के लिए अनुमानित मानदंड स्कोर उस पर निर्भर करता है जो भविष्यवाणी लाइन (चित्र 2.8c देखें) पर निर्भर करता है।

इस बिंदु पर पाठक पूछ सकता है, "जब हमें पहले से ही उनके पास मानदंड स्कोर की भविष्यवाणी करने की आवश्यकता है, तो इसका जवाब काफी सरल है।" भविष्यवक्ता और कसौटी के बीच संबंधों की सीमा के प्रारंभिक माप को स्पष्ट रूप से स्कोर के दोनों सेट की आवश्यकता होती है या फिर संबंध स्थापित नहीं हो सकते थे। क्या चयन उपकरण उपयोगी साबित होना चाहिए, फिर इसका उपयोग उन सभी नए आवेदकों के साथ किया जा सकता है जिनके लिए एक भविष्यवक्ता स्कोर हो सकता है, लेकिन जिनके लिए कोई मानदंड स्कोर मौजूद नहीं है।

हमारा उद्देश्य भविष्य के आवेदकों के मानदंड प्रदर्शन की भविष्यवाणी करना है। यदि एक नया आवेदक एक परीक्षण पर उच्च स्कोर करता है जो कसौटी पर एक उच्च सकारात्मक संबंध पाया गया था, तो हमें उससे एक सफल किराया होने की संभावना अधिक होने की उम्मीद करनी चाहिए।