सांख्यिकी में प्रयुक्त तकनीक

इस लेख में हम आंकड़ों की कुछ तकनीकों के बारे में चर्चा करेंगे। तकनीकों में से कुछ हैं: 1. केंद्रीय प्रवृत्ति के उपाय 2. भिन्नता 3. संभावना 4. आवृत्ति वितरण 5. समय श्रृंखला।

केंद्रीय प्रवृत्ति के उपाय:

औसत:

कोई भी सांख्यिकीय उपाय जो उस बिंदु की स्थिति के बारे में एक विचार देता है जिसके चारों ओर अन्य अवलोकनों को केंद्रीय प्रवृत्ति का माप कहा जाता है। सबसे अधिक इस्तेमाल किया जाने वाला माप 'औसत' या अंकगणितीय माध्य है।

एक सप्ताह के लिए दो श्रमिकों की दैनिक आय इस प्रकार है:

1 कर्मचारी 70 रुपये, 50, 100, 90, 50 मतलब कमाई = 76 रुपये

दूसरा श्रमिक 200 रु, 250, 50, 300, 150 माध्य आय = 190 रु

इस प्रकार, उपरोक्त उदाहरण से, हम यह निष्कर्ष निकाल सकते हैं कि औसतन दूसरा श्रमिक पहले की तुलना में अधिक कमाता है। एक औसत की गणना करने का उद्देश्य - जैसा कि कोई भी आसानी से देख सकता है - टिप्पणियों की श्रृंखला को एक एकल मान द्वारा प्रतिस्थापित करना है, जिसे सभी टिप्पणियों का प्रतिनिधि माना जाता है। ऊपर दिए गए उदाहरण से, यह देखा जा सकता है कि अंकगणितीय माध्य मध्य के पास का मान है और कुछ के अवलोकन इससे अधिक हैं जबकि कुछ छोटे हैं।

इस प्रकार, यह कहा जा सकता है कि एक चर पर टिप्पणियों के अंकगणितीय माध्य को टिप्पणियों की संख्या से विभाजित टिप्पणियों के योग के रूप में परिभाषित किया गया है।

पहले कार्यकर्ता के लिए, अंकगणितीय माध्य की गणना निम्नानुसार की गई है:

(रु। ÷० + ५० + १०० + ९ ० + ५०) Rs ५ = रु +६

जियोमेट्रिक माध्य (GM) टिप्पणियों के समूह के ज्यामितीय माध्य को सभी अवलोकनों के गुणनफल के रूप में परिभाषित किया गया है। मान लें कि अवलोकन x 1, x 2, x 3, …, x n हैं

जीएम की गणना निम्नानुसार की जा सकती है:

इसकी गणना लॉग टेबल की मदद से की जा सकती है।

विधि:

मोड को उन चर या अवलोकनों के मूल्य के रूप में परिभाषित किया जाता है जो सबसे अधिक बार होते हैं। उदाहरण के लिए, यदि प्रेक्षण २- ९, ६, २,,, २, २, obs, २, २ और ३ हैं, तो विधा २ देखी जाती है, जो कि अधिकतम संख्या के लिए हुई है, अर्थात ५ बार।

माध्य:

माध्य मध्य-सबसे अधिक परिवर्तनशील का मान है, जब अवलोकन एक आरोही या अवरोही क्रम में व्यवस्थित होते हैं। यह स्पष्ट है कि मूल्यों का आधा मध्य से कम होगा और मूल्यों का आधा अधिक होगा। इस प्रकार, यदि अवलोकन 3, 9, 6, 4, 5, 7 और 10 हैं, तो आरोही क्रम 3, 4, 5, 6, 7, 9 और 10 में मानों की व्यवस्था करते हैं, तो औसत मान देखा जाता है। चौथा अवलोकन और 6 के बराबर है।

हालांकि, यदि टिप्पणियों की संख्या समान है, तो दो मध्यतम मूल्य हैं और यह उन दो मूल्यों के अंकगणितीय माध्य लेने के लिए प्रथागत है। उदाहरण के लिए, यदि अवलोकन 10 उपरोक्त चर से छोड़ा गया है, तो दो मध्य-मान 5 और 6 हैं और औसतन मान 5 + 6 = 2 = 5.5 है।

डेटा को मापने और विश्लेषण करने के लिए अन्य महत्वपूर्ण सांख्यिकीय उपकरणों और उसमें परिवर्तनशीलता के तत्व में (i) श्रेणी, (ii) अर्ध-अंतर-चतुर्थक श्रेणी, (iii) औसत निरपेक्ष विचलन, (iv) मानक विचलन (v) शामिल हैं। ) आवृत्ति वितरण (दोनों सममित और विषम)।

सममित वितरण को समरूपता की एक रेखा के अस्तित्व की विशेषता है जो हिस्टोग्राम को दो भागों में विभाजित करती है और एक भाग दूसरे की दर्पण छवि है। हालांकि, वाणिज्य और अर्थशास्त्र में अधिकांश वितरण इस प्रकार के नहीं हैं। विषम वितरण को तिरछे वितरण के रूप में भी जाना जाता है। तिरछापन का अर्थ है समरूपता की कमी और तिरछा वितरण एक हिस्टोग्राम के एक तरफ एक लंबी पूंछ की विशेषता है।

मापने की क्षमता:

अंकगणित और ज्यामितीय मीन्स या मेडियन दो या दो से अधिक आबादी या टिप्पणियों की तुलना करने के आधार के रूप में कार्य करते हैं। लेकिन परिवर्तनशीलता या विचलन के अन्य उपाय इस हद तक व्यक्त करने में भी महत्वपूर्ण हैं कि अवलोकन एक दूसरे से किस हद तक भिन्न हैं। आंकड़ों में, फैलाव परिवर्तनशीलता या विचलन का पर्याय है।

परिवर्तनशीलता के महत्वपूर्ण उपाय निम्नलिखित हैं:

रेंज:

प्रेक्षणों के समूह के सबसे बड़े और सबसे छोटे मूल्यों के बीच के अंतर को 'रेंज' कहा जाता है।

अर्ध-अंतर चतुर्थक रेंज :

2 और 3 चतुर्थक में टिप्पणियों के मूल्य के बीच अंतर को अर्ध-अंतर-चतुर्थक सीमा कहा जाता है। यह टिप्पणियों के बहुत कम और बहुत अधिक मूल्यों के प्रभाव को हटाता है, जो संख्या में कम हैं।

निरपेक्ष विचलन मतलब:

मध्य निरपेक्ष विचलन का अर्थ है अवलोकनों के अंकगणितीय माध्य से भिन्नता।

उदाहरण: अवलोकन x 1, x 2 … x n हैं और अंकगणितीय माध्य x है।

सूत्र है:

और, इसलिए, औसत है

लेकिन But (x 1 - x̅) = 0, x 1, x 2, … .x n का मान जो भी हो

इसलिए, सूत्र, (x i - x the) का उपयोग परिवर्तनशीलता के उपाय के रूप में नहीं किया जा सकता है। यदि संकेतों (+ या -) को नजरअंदाज किया जाता है तो इस कठिनाई से बचा जा सकता है। यह तर्कसंगत है, क्योंकि एक विशेष विचलन x i - x indicates का संकेत केवल यह बताता है कि अवलोकन x i, x के बाईं ओर है या इसके दाईं ओर है और इसका केंद्रीय बिंदु (x) से विचलन की गणना करने में कोई प्रासंगिकता नहीं है किसी भी अवलोकन में

मानक विचलन:

उनके अंकगणितीय माध्य (x may) से टिप्पणियों का विचलन सकारात्मक (+) या नकारात्मक (-) हो सकता है। आंकड़ों में, अंकगणित माध्य से विचलन के संकेत केवल केंद्रीय प्रवृत्ति (x ign) से अवलोकन की दिशा को इंगित करते हैं और इसलिए नजरअंदाज कर दिए जाते हैं। X से विचलन के बीच के नकारात्मक (-) संकेतों को भी टाला जा सकता है, यदि निरपेक्ष मान लेने के बजाय विचलन के वर्गों को निम्नानुसार लिया जाए:

चूंकि परिवर्तनशीलता का माप मूल टिप्पणियों के समान इकाई में होना चाहिए, मानक विचलन की गणना निम्न सूत्र द्वारा की जाती है:

आवृत्ति वितरण के लिए, x 1 x 2 के साथ, …, x n कक्षाओं के मध्य मानों के रूप में और f 1 f 2, …, f n आवृत्तियों के रूप में, मानक विचलन (SD) की गणना निम्न सुधार द्वारा की जाती है उपरोक्त सूत्र:

मानक विचलन आंकड़ों में परिवर्तनशीलता का सबसे व्यापक रूप से उपयोग किया जाने वाला उपाय है। इसमें कई गुण हैं जो इसे सांख्यिकीय समस्याओं में सबसे पसंदीदा उपाय बनाते हैं।

उदाहरण:

पांच बिजनेस मैनेजमेंट छात्रों के आईक्यू स्तर निम्नानुसार हैं:

इसलिए, मानक विचलन: 13.22 है

13.22 एक ही इकाइयों में मानक विचलन है जिसे स्वयं टिप्पणियों के रूप में व्यक्त किया गया है। मूल्य 13.22 समान संख्यात्मक पैमाने पर एक बिंदु है।

उपरोक्त मानक विचलन 5 छात्रों की आबादी के भिन्नरूपों से काम किया गया है। हालांकि, व्यवहार में, मानक विचलन को अक्सर आबादी से गणना नहीं की जा सकती है, क्योंकि अधिकांश समय आबादी इतनी बड़ी होती है कि आमतौर पर नमूना विचलन की गणना के उद्देश्य से लिया जाता है।

नमूना डेटा के लिए, परिवर्तनशीलता को नमूना विचरण द्वारा मापा जाता है और मानक विचलन की गणना निम्न सूत्र का उपयोग करके की जाती है:

यह ध्यान दिया जाना चाहिए, क्योंकि नमूना डेटा का उपयोग किया गया है, 'एन' 'एन' के स्थान पर नमूना आकार को दर्शाता है जो जनसंख्या के पालन को दर्शाता है।

संभाव्यता की अवधारणा:

अक्सर, हमारे दैनिक जीवन में, हम कुछ भविष्य की घटनाओं की भविष्यवाणी ऐसे शब्दों के साथ करते हैं - जैसे कि यह संभवतया होगा ', ' इसकी संभावना बहुत अधिक है ', या' यह सभी संभाव्यता में घटित होगा ', एक निश्चित मात्रा में अस्पष्टता के साथ। बयान। ये कथन काफी हद तक व्यक्तिपरक हैं और अतीत में इसी तरह की स्थितियों का विश्लेषण करने के लिए हमारी शक्ति पर निर्भर करते हैं। एक घटना की संभावना की धारणा का महत्व और सांख्यिकीय उपकरणों के साथ इसे मापने के कुछ साधन वाणिज्यिक बैंकों के लिए अपार हैं।

एक ग्राहक को ऋण देते समय बैंकर उक्त ग्राहक द्वारा डिफ़ॉल्ट की संभावना जानना चाहते हैं, जिसे सांख्यिकीय गणनाओं का उपयोग करके संभाव्यता के अध्ययन के आधार पर मापा जाता है। यद्यपि प्राथमिक स्तर पर प्रायिकता को सटीक रूप से परिभाषित करना काफी कठिन है, लेकिन यादृच्छिक प्रयोग और आवृत्ति परिभाषा की तकनीकों का उपयोग करके पूर्वानुमान लगाने का प्रयास किया जा सकता है।

यादृच्छिक प्रयोग का मतलब एक ऐसा प्रयोग है जिसके सभी संभावित परिणाम ज्ञात हैं और जिसे समान परिस्थितियों में दोहराया जा सकता है, लेकिन परिणाम की सटीक भविष्यवाणी असंभव है। विभिन्न दिनों में एक कमोडिटी की कीमत को एक यादृच्छिक प्रयोग के परिणामों के रूप में माना जा सकता है। परिणामों को आमतौर पर E 1, E 2, E 3 …, E n द्वारा निरूपित किया जाएगा और यह माना जाएगा कि वे संख्या में परिमित हैं।

आवृत्ति वितरण:

यदि परिणाम 1 तब r होता है जब यादृच्छिक प्रयोग को n बार दोहराया जाता है, तो E 1 की संभावना अनुपात 'r / n' द्वारा परिभाषित की जाती है, क्योंकि दोहराव की संख्या अनिश्चित काल तक बढ़ जाती है। इस प्रकार, संभावना को सापेक्ष आवृत्ति की सीमा के रूप में परिभाषित किया जाता है जब प्रयोग को कई बार अनंत बार दोहराया जाता है।

समय श्रृंखला:

एक चर पर समय के विभिन्न बिंदुओं पर टिप्पणियों की एक श्रृंखला - जो समय पर निर्भर है - एक समय श्रृंखला का गठन करती है। इस प्रकार, इस तरह की टिप्पणियों के समय की मात्रा में बदलाव या बदलाव होते हैं, और अक्सर इसे ऐतिहासिक या कालानुक्रमिक डेटा कहा जाता है। इस प्रकार के आंकड़ों के लिए, चर में से एक समय है जिसे 't' द्वारा दर्शाया गया है और दूसरा, जो समय पर निर्भर है, का प्रतिनिधित्व 'Yt' द्वारा किया जाता है।

उदाहरण के लिए, विभिन्न मौसमों में फसल की पैदावार, विभिन्न महीनों में इस्पात का उत्पादन, चाय का त्रैमासिक निर्यात, वर्ष के विभिन्न महीनों में आइसक्रीम की बिक्री, आदि। उपरोक्त सभी उदाहरण कुछ आर्थिक या व्यावसायिक गतिविधि को संदर्भित करते हैं।, और ऐसे चर पर टिप्पणियों की एक श्रृंखला को आमतौर पर आर्थिक समय श्रृंखला डेटा कहा जाता है। समय श्रृंखला के आंकड़ों का एक और उदाहरण वर्ष के विभिन्न दिनों में इंच में वर्षा है।

इस प्रकार, यह स्पष्ट है कि कोई भी चर, जो समय पर निर्भर करता है, समय श्रृंखला डेटा बनाता है। समय श्रृंखला से इच्छुक समुदाय जैसे कि व्यापारिक समुदाय, बैंकर, उद्योगपति, आदि द्वारा तैयार किए गए मूल्यवान निष्कर्ष, डेटा से प्रवृत्ति माप की ओर ले जाते हैं, जो उनके निर्णयों को महत्वपूर्ण रूप से प्रभावित करते हैं।