Close

सांख्यिकी – परिभाषा, सांख्यिकी में प्रयुक्त डेटा के प्रकार, केंद्रीय प्रवृत्ति और फैलाव के उपाय (मतलब, मेडियन, मोड, रेंज), संभाव्यता सिद्धांत और नियम, सांख्यिकी के प्रकार, वर्णनात्मक सांख्यिकी, हीन सांख्यिकी (ची-स्क्वायर टेस्ट, एनोवा), भविष्य कहनेवाला सांख्यिकी, प्रिस्क्रिप्टिव सांख्यिकी, सहसंबंध और प्रतिगमन, सॉफ्टवेयर पैकेज

Home / glossary / सांख्यिकी – परिभाषा, सांख्यिकी में प्रयुक्त डेटा के प्रकार, केंद्रीय प्रवृत्ति और फैलाव के उपाय (मतलब, मेडियन, मोड, रेंज), संभाव्यता सिद्धांत और नियम, सांख्यिकी के प्रकार, वर्णनात्मक सांख्यिकी, हीन सांख्यिकी (ची-स्क्वायर टेस्ट, एनोवा), भविष्य कहनेवाला सांख्यिकी, प्रिस्क्रिप्टिव सांख्यिकी, सहसंबंध और प्रतिगमन, सॉफ्टवेयर पैकेज

सांख्यिकी क्या है ?

सांख्यिकी आपके सिर को चारों ओर लपेटने के लिए एक कठिन विषय हो सकता है, लेकिन अवधारणाओं की कम से कम बुनियादी समझ होना महत्वपूर्ण है . यह मार्गदर्शिका आपको आँकड़ों की मूल बातों से परिचित कराएगी और आपको कुछ शब्दजाल को नष्ट करने में मदद करेगी :

  • सांख्यिकीय मॉडल :

एक सांख्यिकीय मॉडल एक गणितीय मॉडल है जिसका उपयोग डेटा का वर्णन या भविष्यवाणी करने के लिए किया जाता है . कई अलग-अलग प्रकार के सांख्यिकीय मॉडल हैं, लेकिन उन सभी में एक चीज समान है : वे सभी संभावनाओं पर आधारित हैं .

  • पैरामीटर :

पैरामीटर एक सांख्यिकीय मॉडल में चर हैं जिन्हें डेटा से अनुमान लगाया जा सकता है . उदाहरण के लिए, एक रैखिक प्रतिगमन मॉडल में, पैरामीटर ढलान और अवरोधन हैं .

  • अनुमानक :

एक अनुमानक एक आँकड़ा है जिसका उपयोग जनसंख्या पैरामीटर का अनुमान लगाने के लिए किया जाता है . उदाहरण के लिए, नमूना माध्य जनसंख्या का एक अनुमानक है .

  • पूर्वाग्रह :

पूर्वाग्रह एक अनुमानक के अपेक्षित मूल्य और अनुमानित जनसंख्या पैरामीटर के सही मूल्य के बीच का अंतर है . एक अनुमानक पक्षपाती है यदि उसका अपेक्षित मूल्य जनसंख्या पैरामीटर के वास्तविक मूल्य के बराबर नहीं है .

  • भिन्न :

भिन्नता एक मापक है कि एक अनुमानक के मूल्यों को कैसे फैलाया जाता है . उच्च विचरण के साथ एक अनुमानक कम विचरण के साथ एक से कम विश्वसनीय है

  • केंद्रीय सीमा प्रमेय :

सेंट्रल लिमिट प्रमेय में कहा गया है कि जनसंख्या के अंतर्निहित वितरण की परवाह किए बिना, एक आंकड़े का नमूना वितरण लगभग सामान्य रूप से वितरित किया जाएगा . इसका मतलब यह है कि, भले ही डेटा एक गैर-सामान्य आबादी से आता है, आप यह मान सकते हैं कि मापदंडों का आकलन करते समय इसे सामान्य रूप से वितरित किया जाता है .

  • आत्मविश्वास अंतराल :

एक विश्वास अंतराल मूल्यों की एक श्रृंखला है जो डेटा के एक नमूने से गणना की जाती है, जहां सच्चे जनसंख्या पैरामीटर को झूठ बोलने के लिए सोचा जाता है . इन अंतरालों की गणना नमूने के माध्यम से की जाती है और मानक त्रुटियों की एक निश्चित संख्या को जोड़कर / घटाते हैं . नमूना आकार जितना बड़ा होगा, आत्मविश्वास अंतराल उतना ही संकीर्ण होगा .

  • परिकल्पना परीक्षण :

परिकल्पना परीक्षण एक विधि है जिसका उपयोग यह परीक्षण करने के लिए किया जाता है कि क्या एक अशक्त परिकल्पना को अस्वीकार किया जा सकता है या नहीं . इसमें नमूना डेटा से एक परीक्षण सांख्यिकीय की गणना करना और एक ज्ञात वितरण से मूल्यों के साथ तुलना करना शामिल है . यदि परीक्षण आँकड़ा अपेक्षित सीमा से बाहर है, तो हम अशक्त परिकल्पना को अस्वीकार कर सकते हैं और एक वैकल्पिक परिकल्पना को स्वीकार कर सकते हैं .

ये सांख्यिकी में उपयोग किए जाने वाले कुछ सामान्य शब्द हैं . इन अवधारणाओं से परिचित होना महत्वपूर्ण है ताकि आप सांख्यिकीय मॉडल और विधियों का उपयोग समझ सकें और बना सकें .

सांख्यिकी में प्रयुक्त डेटा के प्रकार क्या हैं ?

दो प्रकार के डेटा हैं : गुणात्मक और मात्रात्मक . गुणात्मक डेटा वर्णनात्मक है और गैर-संख्यात्मक जानकारी, जैसे शब्द या लेबल से संबंधित है . इसे आगे श्रेणीबद्ध और क्रमिक डेटा में विभाजित किया जा सकता है . श्रेणीबद्ध डेटा को सीमित संख्या में श्रेणियों में विभाजित किया जाता है, जैसे कि बाल रंग (गोरा, श्यामला, लाल, आदि), जबकि क्रमिक डेटा में एक परिभाषित क्रम होता है, जैसे कि 1, 2, एक दौड़ में तीसरा स्थान . मात्रात्मक डेटा संख्यात्मक है और इसे असतत और निरंतर डेटा में विभाजित किया जा सकता है . असतत डेटा में पूरे नंबर (कोई दशमलव स्थान) नहीं होते हैं जबकि निरंतर डेटा में दशमलव स्थान शामिल होते हैं .

गुणात्मक डेटा के उदाहरणों में लिंग, नस्ल, राय, शिक्षा स्तर, बालों का रंग और व्यक्तिपरक लेबल जैसे “ अच्छा ” या “ बुरा शामिल हैं। ” मात्रात्मक डेटा के उदाहरणों में वजन, ऊंचाई, आयु और भाई-बहनों की संख्या शामिल है .

गुणात्मक डेटा को सांख्यिकीय विश्लेषण, सहसंबंध, गैर-पैरामीट्रिक परीक्षण और प्रतिगमन विश्लेषण जैसे गुणात्मक तरीकों का उपयोग करके हेरफेर और विश्लेषण किया जा सकता है . मात्रात्मक डेटा का अर्थ, माध्य और मोड विश्लेषण, सहसंबंध, पैरामीट्रिक परीक्षण और प्रतिगमन विश्लेषण जैसे मात्रात्मक तरीकों का उपयोग करके हेरफेर और विश्लेषण किया जा सकता है .

किसी विशेष अध्ययन या विश्लेषण के लिए उपयोग किए जाने वाले डेटा का प्रकार अध्ययन के उद्देश्य और लक्ष्यों पर निर्भर करेगा . गुणात्मक और मात्रात्मक डेटा दोनों एक समस्या में अंतर्दृष्टि प्रदान करने में उपयोगी हो सकते हैं . हालांकि, अध्ययन के उद्देश्यों को देखते हुए सबसे उपयुक्त प्रकार के डेटा का चयन करना महत्वपूर्ण है .

कोई फर्क नहीं पड़ता कि किस प्रकार के डेटा का उपयोग किया जाता है, यह सुनिश्चित करना महत्वपूर्ण है कि यह विश्वसनीय, वैध और पूर्वाग्रह से मुक्त हो . इसे एक व्यवस्थित और विस्तृत तरीके से एकत्र किया जाना चाहिए, और सटीक रूप से व्याख्या और विश्लेषण किया जाना चाहिए . यह सुनिश्चित करने के लिए डेटा सटीकता आवश्यक है कि परिणाम सार्थक और सहायक दोनों हैं .

केंद्रीय प्रवृत्ति और फैलाव (मतलब, मेडियन, मोड, रेंज) के उपाय क्या हैं ?

केंद्रीय प्रवृत्ति के तीन मुख्य उपाय हैं : माध्य, माध्य और मोड . माध्य संख्याओं के एक सेट का अंकगणितीय औसत है, और केंद्रीय प्रवृत्ति का सबसे अधिक इस्तेमाल किया जाने वाला उपाय है . माध्य संख्या के एक सेट में मध्य मान है, और माध्य की तुलना में आउटलेर से कम प्रभावित होता है . संख्याओं के एक सेट में मोड सबसे अधिक बार होने वाला मान है .

सीमा फैलाव का एक उपाय है, और संख्याओं के एक सेट में सबसे बड़े और सबसे छोटे मूल्यों के बीच अंतर है . फैलाव के अन्य उपायों में मानक विचलन और विचरण शामिल हैं .

संभाव्यता सिद्धांत और नियमों के बारे में क्या ?

गणित में, संभाव्यता सिद्धांत यादृच्छिक घटनाओं का अध्ययन है . संभावना सिद्धांत का उपयोग उन प्रणालियों के व्यवहार का वर्णन करने के लिए किया जाता है जो संयोग से शासित होते हैं . दूसरे शब्दों में, यह भाग्य का गणित है .

संभावना दो प्रकार की होती है : शास्त्रीय और अनुभवजन्य . शास्त्रीय संभावना सैद्धांतिक मॉडल पर आधारित है, जैसे कि सिक्का टॉस या कार्ड का डेक . अनुभवजन्य संभावना मनाया डेटा पर आधारित है, जैसे कि पोल या प्रयोग से .

संभावना अनुपात, प्रतिशत या बाधाओं के संदर्भ में व्यक्त की जा सकती है . उदाहरण के लिए, किसी घटना के समय का अनुपात परीक्षणों की संख्या से अधिक होता है, उस घटना के होने की संभावना है . प्रतिशत केवल 100% से गुणा अनुपात है% . ऑड्स उन तरीकों की संख्या का अनुपात है जो किसी घटना को उन घटनाओं की संख्या से विभाजित कर सकते हैं जो घटित नहीं हो सकती हैं .

संभावना के चार बुनियादी नियम हैं : इसके अलावा, गुणा, सामान्यीकरण और बेयस प्रमेय . ये नियम हमें एक साथ होने वाली विभिन्न घटनाओं के लिए संभावनाओं की गणना करने की अनुमति देते हैं .

अतिरिक्त नियम कहता है कि यदि दो संभावित परिणाम (ए और बी) हैं और हम इस संभावना को जानना चाहते हैं कि या तो ए या बी होगा, हम बस व्यक्तिगत संभावनाओं को एक साथ जोड़ते हैं :

P (A या B) = P (A) + P (B) – P (A और B) .

गुणन नियम कहता है कि यदि दो संभावित परिणाम (ए और बी) हैं और हम इस संभावना को जानना चाहते हैं कि ए और बी दोनों होंगे, हमें व्यक्तिगत संभावनाओं को एक साथ गुणा करने की आवश्यकता है :

पी (ए और बी) = पी (ए) * पी (बी) .

सामान्यीकरण नियम कहता है कि यदि दो से अधिक संभावित परिणाम (ए, बी और सी) हैं, तो हमें सभी व्यक्तिगत संभावनाओं को एक साथ जोड़ने की आवश्यकता है :

P (A या B या C) = P (A) + P (B) + P (C) .

अंत में, बेयस प्रमेय सशर्त संभावनाओं की गणना के लिए एक सूत्र है . इसमें कहा गया है कि यदि हम जानते हैं कि किसी घटना की संभावना बी ने एक और घटना ए दी है (पी (बी \ ए)), और हम घटना ए होने की पूर्व संभावना (पी (ए)) को जानते हैं, फिर हम घटना बी होने (पी (बी)) की पीछे की संभावना की गणना कर सकते हैं . इसे निम्नानुसार व्यक्त किया जा सकता है :

पी (बी \ ए) = पी (ए और बी) / पी (ए)

सांख्यिकी के विभिन्न प्रकार क्या हैं ?

चार अलग-अलग प्रकार के आँकड़े हैं :

  • वर्णनात्मक सांख्यिकी :

इस प्रकार के आंकड़े साधन, मेडियन और मोड जैसे उपकरणों का उपयोग करके एक नमूने से डेटा को सारांशित करते हैं .

  • हीन सांख्यिकी :

इस प्रकार का आँकड़ा एक बड़ी आबादी के बारे में भविष्यवाणियाँ करने के लिए एक छोटे नमूने का उपयोग करता है . यह अनुमान और परिकल्पना परीक्षण जैसी तकनीकों को नियोजित करता है .

  • भविष्य कहनेवाला सांख्यिकी :

इस प्रकार के आंकड़े भविष्य की घटनाओं की भविष्यवाणी करने वाले मॉडल बनाने के लिए ऐतिहासिक डेटा का उपयोग करते हैं . इसका उपयोग मौसम पूर्वानुमान और स्टॉक मार्केट विश्लेषण जैसे क्षेत्रों में किया जाता है .

  • प्रिस्क्रिप्टिव सांख्यिकी :

इस प्रकार की आँकड़ा उन कार्यों की सिफारिश करने के लिए भविष्य कहनेवाला और हीन तकनीक को जोड़ती है जिन्हें वांछित परिणाम प्राप्त करने के लिए लिया जा सकता है . इसका उपयोग संचालन अनुसंधान और निर्णय विश्लेषण जैसे क्षेत्रों में किया जाता है .

ये चार मुख्य प्रकार के आँकड़े हैं लेकिन इन श्रेणियों के भीतर भी कई और हो सकते हैं .

वर्णनात्मक सांख्यिकी के बारे में जानने के लिए मुख्य बिंदु क्या हैं ?

वर्णनात्मक आँकड़े गणित की एक शाखा है जो डेटा के संग्रह, विश्लेषण, व्याख्या, प्रस्तुति और संगठन से संबंधित है . यह डेटा का वर्णन करने के बारे में है .

दो मुख्य प्रकार के वर्णनात्मक आँकड़े हैं : अविभाज्य और द्विवर्षीय . Univariate आँकड़े डेटा के साथ सौदा करते हैं जिन्हें एक चर में निर्धारित या वर्गीकृत किया जा सकता है, जबकि bivariate आँकड़े दो चर के साथ सौदा करते हैं .

यूनीवेरिएट आंकड़ों में उपयोग किए जाने वाले सामान्य विवरणकों में माध्य, माध्य, मोड, रेंज, IQR (इंटरक्वेर्टाइल रेंज) और मानक विचलन शामिल हैं . माध्य संख्याओं के एक सेट का अंकगणितीय औसत है, जबकि माध्य संख्याओं के एक सेट का मध्य मान है . मोड संख्याओं के एक सेट में सबसे अधिक बार होने वाला मूल्य है . रेंज संख्याओं के एक सेट में सबसे बड़े और सबसे छोटे मूल्यों के बीच का अंतर है . IQR का उपयोग फैलाव को मापने के लिए किया जाता है और इसकी गणना 75 वें प्रतिशत से 25 वें प्रतिशत को घटाकर की जाती है . मानक विचलन यह मापता है कि संख्याओं का एक सेट माध्य से कितनी दूर तक फैला हुआ है .

द्विभाजक आंकड़ों में, सामान्य विवरणकों में सहसंबंध और प्रतिगमन शामिल हैं . सहसंबंध दो चर के बीच संबंधों की ताकत और दिशा को मापता है, जबकि प्रतिगमन दूसरे चर के आधार पर एक चर के मूल्य की भविष्यवाणी करता है .

डेटा सेट का वर्णन करने के लिए यूनीवेरिएट और बीवरिएट दोनों आँकड़ों का उपयोग किया जा सकता है; हालाँकि, उनमें से प्रत्येक की अपनी ताकत और कमजोरियाँ हैं . आपके डेटा से आप जो जानकारी सीखने की कोशिश कर रहे हैं, उसके आधार पर उपयुक्त प्रकार के वर्णनात्मक सांख्यिकीय का चयन करना महत्वपूर्ण है .

वर्णनात्मक आँकड़े डेटा को उपयोगी जानकारी में बदलने के लिए सहायक होते हैं . वे बड़ी मात्रा में डेटा को संक्षेप में प्रस्तुत करने और बनाने में मदद करते हैं, जिससे शोधकर्ताओं को अपने निष्कर्षों के बारे में सार्थक निष्कर्ष निकालने में मदद मिलती है .

हीन सांख्यिकी (ची-स्क्वायर टेस्ट, एनोवा) के बारे में जानने के लिए प्रमुख बिंदु क्या हैं ?

अधिमानी आंकड़ों को समझने के लिए, पहले कुछ बुनियादी अवधारणाओं को समझना महत्वपूर्ण है . केंद्रीय प्रवृत्ति के उपाय, जैसे कि माध्य और माध्य, हमें अपने डेटा के “केंद्र” का वर्णन करने का एक तरीका देते हैं . विविधता के उपाय, जैसे कि सीमा और मानक विचलन, हमें यह वर्णन करने का एक तरीका देते हैं कि हमारा डेटा कैसे फैला है . सहसंबंध और प्रतिगमन हमें दो चर के बीच संबंधों को मापने की अनुमति देते हैं .

बुनियादी आंकड़ों की इस समझ के साथ, हम हीन आंकड़ों पर आगे बढ़ सकते हैं . सबसे आम प्रकार के हीन सांख्यिकीय परीक्षण ची-स्क्वायर परीक्षण और एनोवा हैं .

ची-स्क्वायर परीक्षण का उपयोग यह निर्धारित करने के लिए किया जाता है कि दो या अधिक श्रेणीबद्ध चर के बीच कोई महत्वपूर्ण अंतर है या नहीं . उदाहरण के लिए, हम एक आबादी में पुरुषों और महिलाओं के अनुपात की तुलना करने के लिए ची-स्क्वायर परीक्षण का उपयोग कर सकते हैं जो बाएं हाथ के हैं .

ANOVA का उपयोग दो या अधिक समूहों के साधनों की तुलना करने के लिए किया जाता है . उदाहरण के लिए, हम विभिन्न ग्रेड में छात्रों के लिए औसत सैट स्कोर की तुलना करने के लिए एनोवा का उपयोग कर सकते हैं .

ची-स्क्वायर परीक्षण और एनोवा दोनों के लिए आवश्यक है कि परिणामों को विश्वसनीय बनाने के लिए कुछ मान्यताओं को पूरा किया जाए . इन मान्यताओं में विचरण की समरूपता और डेटा की सामान्यता जैसी चीजें शामिल हैं . किसी भी अधिमानी सांख्यिकीय परीक्षणों को चलाने से पहले इन मान्यताओं की जांच करना महत्वपूर्ण है .

कुल मिलाकर, हीन आँकड़े हमें डेटा से निष्कर्ष निकालने के लिए उपकरण देते हैं . वे हमें आबादी के बारे में निष्कर्ष बनाने की अनुमति देते हैं जब हमारे पास केवल नमूना डेटा उपलब्ध होता है . यह शोधकर्ताओं और सांख्यिकीविदों के लिए एक अविश्वसनीय रूप से शक्तिशाली उपकरण है .

भविष्य कहनेवाला सांख्यिकी के बारे में जानने के लिए प्रमुख बिंदु क्या हैं ?

भविष्य कहनेवाला आँकड़े डेटा में पैटर्न और रिश्तों की पहचान करने के लिए उपयोग किए जाने वाले तरीकों की एक विस्तृत विविधता को शामिल करते हैं, और फिर भविष्य की घटनाओं के बारे में भविष्यवाणियां करने के लिए उन पैटर्न का उपयोग करते हैं . भविष्य कहनेवाला आंकड़ों के बारे में जानने के लिए प्रमुख बिंदुओं में शामिल हैं :

  • प्रिडिक्टिव एनालिटिक्स एक क्रिस्टल बॉल नहीं है, बल्कि एक ऐसा उपकरण है जो संगठनों को अधिक सूचित निर्णय लेने में मदद कर सकता है .
  • प्रिडिक्टिव एनालिटिक्स का उपयोग विभिन्न प्रकार के उद्योगों में किया जाता है, जिसमें स्वास्थ्य सेवा, बीमा, खुदरा और विनिर्माण शामिल हैं .
  • प्रीडिक्टिव एनालिटिक्स का उपयोग दोनों अल्पकालिक भविष्यवाणियों के लिए किया जा सकता है (जैसे कि ग्राहक को अगले उत्पाद को खरीदने की संभावना है) और दीर्घकालिक भविष्यवाणियां (जैसे कि रोगियों को विकसित होने का खतरा है कुछ रोग) .
  • कई अलग-अलग तकनीकें हैं जो प्रतिगमन विश्लेषण, समय श्रृंखला विश्लेषण, मशीन सीखने और कृत्रिम बुद्धिमत्ता सहित भविष्य कहनेवाला विश्लेषिकी की छतरी के नीचे आती हैं .
  • भविष्य कहनेवाला विश्लेषिकी का उपयोग करते समय डेटा महत्वपूर्ण है – आपके पास जितना अधिक डेटा होगा, आपकी भविष्यवाणियां उतनी ही बेहतर होंगी .
  • भविष्य कहनेवाला विश्लेषिकी का लाभ उठाते समय तकनीकों और उपकरणों के मिश्रण का उपयोग करना महत्वपूर्ण है, इस समस्या के आधार पर जिसे हल करने की आवश्यकता है .
  • भविष्य कहनेवाला विश्लेषिकी संगठनों को दक्षता में सुधार करने, लागत कम करने और बेहतर निर्णय लेने में मदद कर सकता है .
  • भविष्य कहनेवाला विश्लेषण का उपयोग करते समय नैतिक विचारों को हमेशा ध्यान में रखा जाना चाहिए .

प्रिस्क्रिप्टिव स्टैटिस्टिक्स के बारे में जानने के लिए प्रमुख बिंदु क्या हैं ?

जब आंकड़ों की बात आती है, तो वहां बहुत सारी जानकारी होती है जो भ्रामक हो सकती है . लेकिन, इस महत्वपूर्ण विषय के बारे में जानने से आपको रोकना नहीं चाहिए ! प्रिस्क्रिप्टिव आँकड़े गणित की एक शाखा है जो डेटा के आधार पर भविष्यवाणियां और सिफारिशें करने से संबंधित है . निर्धारित आंकड़ों के बारे में जानने के लिए यहां प्रमुख बिंदु दिए गए हैं :

  • प्रिस्क्रिप्टिव आँकड़े भविष्यवाणियों और सिफारिशों को बनाने के लिए गणितीय मॉडल का उपयोग करते हैं .
  • प्रिस्क्रिप्टिव सांख्यिकीय मॉडल द्वारा की गई भविष्यवाणियां और सिफारिशें पिछले आंकड़ों पर आधारित हैं .
  • विभिन्न प्रकार के प्रिस्क्रिप्टिव सांख्यिकीय मॉडल हैं, प्रत्येक अपनी ताकत और कमजोरियों के साथ .
  • निर्णय लेने के लिए उनका उपयोग करने से पहले प्रिस्क्रिप्टिव सांख्यिकीय मॉडल की सीमाओं को समझना महत्वपूर्ण है .
  • प्रिस्क्रिप्टिव सांख्यिकीय मॉडल का उपयोग किसी भी क्षेत्र या उद्योग में किया जा सकता है, और निर्णय निर्माताओं को मूल्यवान अंतर्दृष्टि प्रदान करता है .
  • प्रिस्क्रिप्टिव आंकड़ों के साथ डेटा का सटीक विश्लेषण करने के लिए, डेटा की मजबूत समझ और मॉडल के पीछे अंतर्निहित मान्यताओं का होना आवश्यक है .
  • प्रिस्क्रिप्टिव सांख्यिकीय मॉडल बनाते या उपयोग करते समय डेटा या मॉडलिंग मान्यताओं में संभावित पूर्वाग्रहों से अवगत होना महत्वपूर्ण है .
  • प्रिस्क्रिप्टिव सांख्यिकीय मॉडल के साथ की गई भविष्यवाणियों या सिफारिशों के किसी भी नैतिक निहितार्थ पर विचार करना भी महत्वपूर्ण है .

सहसंबंध और प्रतिगमन क्या हैं ?

सहसंबंध और प्रतिगमन की अवधारणाएं निकट से संबंधित हैं, और दो चर के बीच संबंधों की ताकत को मापने के लिए उपयोग किया जाता है . सहसंबंध एक माप है कि दो चर रैखिक रूप से कितनी अच्छी तरह से संबंधित हैं, जबकि प्रतिगमन एक तकनीक है जिसका उपयोग दूसरे के मूल्य के आधार पर एक चर के मूल्य की भविष्यवाणी करने के लिए किया जाता है .

डेटा सेट में विभिन्न चर के बीच संबंधों को समझने के लिए सहसंबंध और प्रतिगमन दोनों का उपयोग किया जा सकता है . उदाहरण के लिए, आप ऊंचाई और वजन के बीच संबंध को समझने के लिए सहसंबंध का उपयोग कर सकते हैं, या किसी की ऊंचाई के आधार पर किसी के वजन की भविष्यवाणी करने के लिए प्रतिगमन का उपयोग कर सकते हैं . दोनों मामलों में, आप दो चर के बीच रैखिक संबंध की ताकत को मापेंगे .

सहसंबंध को सहसंबंध गुणांक नामक एक आंकड़े का उपयोग करके मापा जाता है, जो -1 और 1 के बीच मूल्यों को लेता है . एक सकारात्मक सहसंबंध गुणांक इंगित करता है कि जैसे-जैसे एक चर बढ़ता है, दूसरा चर भी बढ़ता है; एक नकारात्मक सहसंबंध गुणांक इंगित करता है कि जैसे-जैसे एक चर बढ़ता है, दूसरा घटता जाता है . सहसंबंध गुणांक का परिमाण इंगित करता है कि दो चर के बीच रैखिक संबंध कितना मजबूत है . उदाहरण के लिए, एक छोटा सहसंबंध गुणांक (0 के करीब) एक कमजोर रैखिक संबंध का संकेत देगा, जबकि एक बड़ा गुणांक (-1 या 1 के करीब) एक मजबूत रैखिक संबंध का संकेत देगा .

प्रतिगमन एक अधिक जटिल सांख्यिकीय तकनीक है जिसका उपयोग अन्य चर के मूल्यों के आधार पर एक चर के मूल्य की भविष्यवाणी करने के लिए किया जा सकता है . उदाहरण के लिए, आप किसी की ऊंचाई और उम्र के आधार पर किसी के वजन की भविष्यवाणी करने के लिए प्रतिगमन का उपयोग कर सकते हैं . इस प्रकार की भविष्यवाणी को भविष्य कहनेवाला मॉडलिंग कहा जाता है, और इसका उपयोग भविष्य की घटनाओं या रुझानों के बारे में भविष्यवाणियां करने के लिए किया जा सकता है . प्रतिगमन मॉडल का उपयोग डेटा सेट में विभिन्न चर के बीच संबंधों को समझने के लिए भी किया जा सकता है, साथ ही यह पहचानने के लिए कि किसी विशेष परिणाम की भविष्यवाणी करने के लिए कौन से चर सबसे महत्वपूर्ण हैं . सामान्य तौर पर, प्रतिगमन डेटा का विश्लेषण और समझने के लिए एक शक्तिशाली उपकरण है .

कुल मिलाकर, सहसंबंध और प्रतिगमन दो निकट संबंधी तकनीकें हैं जिनका उपयोग दो या अधिक चर के बीच रैखिक संबंधों की ताकत को मापने के लिए किया जाता है . दोनों का उपयोग डेटा सेट में विभिन्न चर के बीच संबंधों को समझने के लिए किया जा सकता है, साथ ही भविष्य की घटनाओं या रुझानों के बारे में भविष्यवाणियां करने के लिए भी किया जा सकता है .

सांख्यिकीय सॉफ्टवेयर पैकेज क्या हैं ?

आज बाजार पर कई अलग-अलग प्रकार के सांख्यिकीय सॉफ्टवेयर पैकेज उपलब्ध हैं . कुछ विशिष्ट प्रकार के डेटा विश्लेषण के लिए डिज़ाइन किए गए हैं, जबकि अन्य सामान्य उद्देश्य हैं . सांख्यिकीय सॉफ़्टवेयर पैकेज चुनते समय, यह विचार करना महत्वपूर्ण है कि आप किस प्रकार के विश्लेषण कर रहे हैं और क्या पैकेज में आवश्यक कार्यक्षमता है .

सबसे लोकप्रिय सांख्यिकीय सॉफ्टवेयर पैकेज एसएएस, एसपीएसएस और आर हैं . एसएएस एक वाणिज्यिक पैकेज है जिसका व्यापक रूप से उद्योग और शिक्षा में उपयोग किया जाता है . यह डेटा विश्लेषण के लिए एक शक्तिशाली उपकरण है लेकिन खरीद के लिए महंगा हो सकता है . SPSS एक अन्य वाणिज्यिक पैकेज है जिसका व्यापक रूप से उपयोग किया जाता है . इसमें उपयोगकर्ता के अनुकूल इंटरफेस है और डेटा विश्लेषण के लिए कई सुविधाएँ प्रदान करता है . आर एक स्वतंत्र और ओपन-सोर्स सॉफ्टवेयर पैकेज है जो उद्योग और शिक्षा दोनों में तेजी से लोकप्रिय हो रहा है . यह डेटा विश्लेषण के लिए क्षमताओं की एक विस्तृत श्रृंखला प्रदान करता है और किसी के लिए भी स्वतंत्र रूप से उपलब्ध है .

एक सांख्यिकीय सॉफ्टवेयर पैकेज का चयन करते समय, आपके बजट पर विचार करना महत्वपूर्ण है, जिस प्रकार के डेटा का आप विश्लेषण कर रहे हैं, और आपके द्वारा किए जा रहे विश्लेषण के प्रकार . एसएएस, एसपीएसएस, और आर सांख्यिकीय सॉफ्टवेयर पैकेज के लिए सभी उत्कृष्ट विकल्प हैं और आपकी आवश्यकताओं के आधार पर विभिन्न लाभ प्रदान करते हैं .

निष्कर्ष

सांख्यिकी एक चुनौतीपूर्ण और डराने वाली अवधारणा हो सकती है, लेकिन सही ज्ञान और समझ के साथ, यह होना जरूरी नहीं है . इस लेख ने आंकड़ों को यह बताकर नष्ट करने का लक्ष्य रखा है कि सांख्यिकीय अवधारणाएं क्या हैं और डेटा विश्लेषण में उपयोग किए जाने वाले कुछ सामान्य उपकरणों का अवलोकन प्रदान करती हैं .

हमारे बेल्ट के तहत इन मूल बातों के साथ, हम अब आत्मविश्वास से डेटासेट पर बुनियादी विश्लेषणात्मक तकनीकों का उपयोग कर सकते हैं जो हमें व्यावसायिक निर्णयों या अनुसंधान प्रश्नों में महत्वपूर्ण अंतर्दृष्टि प्रदान करेंगे जो हमारे रास्ते में आ सकते हैं !

Related posts:

हितधारक प्रभाव मैट्रिक्स - परिभाषा, हितधारकों के प्रकार और सिम में उनकी भूमिकाएं, हितधारक प्रभाव, रण...
पोर्टर के चार कोनों मॉडल परिभाषा - मॉडल के घटक, प्रतिस्पर्धी लाभ, लाभ, चुनौतियां, पोर्टर के पांच बलो...
विपणन स्वचालन परिभाषा - लाभ, प्रकार, कार्यान्वयन, सामान्य समस्याएं और समाधान, सर्वोत्तम अभ्यास
पाइपलाइन विपणन परिभाषा - लाभ, चुनौतियां, पाइपलाइन रणनीतियों के प्रकार, सफल पाइपलाइन मॉडल निर्माण, पा...
पीआरएम - प्रॉस्पेक्ट रिलेशनशिप मैनेजमेंट डेफिनिशन - पीआरएम के लाभ, पीआरएम सिस्टम का उपयोग करने के लि...
पारस्परिक प्रक्रिया मॉडल परिभाषा - पांच मुख्य घटक, सीमाएं और चुनौतियां, मानसिक स्वास्थ्य अनुप्रयोग

सभी को नमस्कार ! मैं Academypedia.info वेबसाइट का निर्माता और वेबमास्टर हूं। टेक्नोलॉजी इंटेलिजेंस एंड इनोवेशन में विशेषज्ञता (एक्स-मार्सिले, फ्रांस विश्वविद्यालय से सूचना और सिस्टम साइंस में मास्टर 1 डिप्लोमा), मैं आपको आईसीटी या टेक्नोलॉजिकल इंटेलिजेंस के उपकरणों की खोज या नियंत्रण करने की अनुमति देने वाले ट्यूटोरियल लिखता हूं। इसलिए इन लेखों का उद्देश्य सार्वजनिक और कानूनी जानकारी की बेहतर खोज, विश्लेषण (सत्यापन), सॉर्ट और स्टोर करने में आपकी सहायता करना है। वास्तव में, हम अच्छी जानकारी के बिना अच्छे निर्णय नहीं ले सकते!

scroll to top