उपयोगी टिप्स

Microsoft Excel में मानक विचलन की गणना

मानक विचलन कॉर्पोरेट दुनिया में उन सांख्यिकीय शब्दों में से एक है, जो आपको उन लोगों की विश्वसनीयता बढ़ाने की अनुमति देता है जो एक वार्तालाप या प्रस्तुति के दौरान इसे सफलतापूर्वक पेंच करने में कामयाब रहे, और उन लोगों की एक अस्पष्ट गलतफहमी छोड़ देता है जो यह नहीं जानते हैं कि यह पूछने के लिए शर्मिंदा है। वास्तव में, अधिकांश प्रबंधक मानक विचलन की अवधारणा को नहीं समझते हैं, और यदि आप उनमें से एक हैं, तो आपको झूठ में रहना बंद कर देना चाहिए। आज के लेख में, मैं आपको बताऊंगा कि कैसे यह अंडरएक्टेड सांख्यिकीय उपाय आपको उन आंकड़ों को बेहतर ढंग से समझने में मदद करेगा, जिनके साथ आप काम कर रहे हैं।

मानक विचलन क्या मापता है?

कल्पना कीजिए कि आपके पास दो स्टोर हैं। और नुकसान से बचने के लिए, यह महत्वपूर्ण है कि स्टॉक शेष का स्पष्ट नियंत्रण हो। यह पता लगाने की कोशिश में कि प्रबंधकों में से कौन सा सूची को बेहतर ढंग से प्रबंधित करता है, आपने पिछले छह हफ्तों के शेयरों का विश्लेषण करने का फैसला किया है। दोनों दुकानों के लिए स्टॉक की औसत साप्ताहिक लागत लगभग समान है और लगभग 32 पारंपरिक इकाइयों की मात्रा है। पहली नज़र में, प्रवाह का औसत मूल्य दर्शाता है कि दोनों प्रबंधक एक ही तरह से काम करते हैं।

लेकिन अगर आप ध्यान से दूसरी दुकान की गतिविधियों का अध्ययन करते हैं, तो आप देख सकते हैं कि हालांकि औसत मूल्य सही है, प्रवाह परिवर्तनशीलता बहुत अधिक है (10 से 58 घन मीटर तक)। इस प्रकार, हम यह निष्कर्ष निकाल सकते हैं कि औसत मूल्य हमेशा डेटा का सही मूल्यांकन नहीं करता है। यह वह जगह है जहां मानक विचलन बचाव के लिए आता है।

मानक विचलन दिखाता है कि हमारे नमूने में औसत के सापेक्ष मूल्यों को कैसे वितरित किया जाता है। दूसरे शब्दों में, हम समझ सकते हैं कि सप्ताह से सप्ताह तक अपवाह मूल्य का प्रसार कितना बड़ा है।

हमारे उदाहरण में, हमने औसत के साथ मानक विचलन की गणना करने के लिए एक्सेल फ़ंक्शन एसटीडी का उपयोग किया।

पहले प्रबंधक के मामले में, मानक विचलन 2 था। यह हमें बताता है कि नमूने में प्रत्येक मूल्य औसत मूल्य से 2 से औसत विचलन करता है। क्या यह अच्छा है? आइए मुद्दे को एक अलग कोण से देखें - 0 का मानक विचलन, हमें बताता है कि नमूने में प्रत्येक मूल्य इसके औसत मूल्य (हमारे मामले में, 32.2) के बराबर है। तो, 2 का मानक विचलन 0 से बहुत अलग नहीं है, और यह इंगित करता है कि अधिकांश मूल्य औसत मूल्य के पास हैं। मानक विचलन 0 के करीब, औसत विश्वसनीय अधिक। इसके अलावा, 0 के करीब मानक विचलन एक छोटे डेटा परिवर्तनशीलता को इंगित करता है। यही है, 2 के मानक विचलन के साथ प्रवाह दर पहले प्रबंधक के एक अविश्वसनीय अनुक्रम को इंगित करता है।

दूसरे स्टोर के मामले में, मानक विचलन 18.9 था। यही है, रनऑफ की लागत सप्ताह से सप्ताह तक औसत मूल्य से 18.9 औसत से विचलित हो जाती है। पागल बिखराव! 0 से मानक विचलन जितना दूर होगा, औसत मान उतना ही कम होगा। हमारे मामले में, 18.9 का आंकड़ा इंगित करता है कि औसत मूल्य (प्रति सप्ताह 32.8 घन) बस पर भरोसा नहीं किया जा सकता है। यह हमें यह भी बताता है कि साप्ताहिक अपवाह अत्यधिक परिवर्तनशील है।

यह संक्षेप में मानक विचलन की अवधारणा है। यद्यपि यह अन्य महत्वपूर्ण सांख्यिकीय मापों (फैशन, मेडियन ...) का एक विचार प्रदान नहीं करता है, वास्तव में, मानक विचलन अधिकांश सांख्यिकीय गणनाओं में एक निर्णायक भूमिका निभाता है। मानक विचलन के सिद्धांतों को समझना आपके व्यवसाय में कई प्रक्रियाओं के सार पर प्रकाश डालेगा।

मानक विचलन की गणना कैसे करें?

तो, अब हम जानते हैं कि मानक विचलन आंकड़ा क्या कहता है। आइए देखें कि यह कैसे माना जाता है।

10. के चरणों में 10 से 70 तक के डेटा सेट पर विचार करें। जैसा कि आप देख सकते हैं, मैंने पहले ही सेल H2 (नारंगी) में STANDOTLON फ़ंक्शन का उपयोग करके उनके लिए मानक विचलन की गणना की है।

एक्सेल के 21.6 पर आने के लिए जो चरण हैं वे नीचे वर्णित हैं।

कृपया ध्यान दें कि सभी गणनाओं को बेहतर समझ के लिए कल्पना की जाती है। वास्तव में, एक्सेल पर्दे के पीछे के सभी चरणों को छोड़कर, तुरंत गणना करता है।

सबसे पहले, Excel नमूने का औसत मूल्य पाता है। हमारे मामले में, औसत 40 हो गया, जो अगले चरण में प्रत्येक नमूना मूल्य से घटाया गया है। प्राप्त प्रत्येक अंतर को चुकता और संक्षिप्त किया जाता है। हमें 2800 के बराबर राशि मिली, जिसे नमूना तत्वों की संख्या से विभाजित किया जाना चाहिए माइनस 1। चूंकि हमारे पास 7 तत्व हैं, इसलिए यह पता चला है कि हमें 2800 से 6 को विभाजित करने की आवश्यकता है। परिणाम से हमें वर्गमूल का पता चलता है, यह आंकड़ा मानक विचलन होगा।

उन लोगों के लिए जो विज़ुअलाइज़ेशन का उपयोग करके मानक विचलन की गणना करने के सिद्धांत पर पूरी तरह से स्पष्ट नहीं हैं, मैं इस मूल्य को खोजने की गणितीय व्याख्या देता हूं।

एक्सेल मानक विचलन गणना कार्य

एक्सेल में कई प्रकार के मानक विचलन सूत्र हैं। आपको बस = STANDOTLON डायल करना होगा और आप अपने लिए देखेंगे।

यह ध्यान देने योग्य है कि STANDOTLON.V और STANDOTLON.G फ़ंक्शंस (सूची में पहले और दूसरे फ़ंक्शंस) क्रमशः STDOTLON और STANDOTLONP फ़ंक्शंस की सूची में (पांचवें और छठे फ़ंक्शंस) हैं, जो Excel के पुराने संस्करणों के साथ संगतता के लिए छोड़ दिए गए थे।

सामान्य तौर पर, .B और .G फ़ंक्शन के अंत में अंतर नमूना या जनसंख्या के मानक विचलन की गणना करने के सिद्धांत को इंगित करता है। मैंने पहले से ही फैलाव गणना के पिछले लेख में इन दो सरणियों के बीच का अंतर समझाया।

STANDOTLON और STDOTLONP फ़ंक्शन (सूची में तीसरा और चौथा फ़ंक्शन) की एक विशेषता यह है कि जब सरणी के मानक विचलन की गणना करते हैं, तो तार्किक और पाठ मानों को ध्यान में रखा जाता है। शाब्दिक और वास्तविक तार्किक मान 1 के बराबर हैं, और गलत तार्किक मान 0. के बराबर हैं। मेरे लिए ऐसी स्थिति की कल्पना करना मुश्किल है जब मुझे इन दो कार्यों की आवश्यकता हो सकती है, इसलिए, मुझे लगता है कि उन्हें अनदेखा किया जा सकता है।

28 टिप्पणियाँ

रेनाट, शुभ दोपहर।
मुझे लेख पसंद है, और सबसे महत्वपूर्ण बात यह है कि सामग्री किस तरह प्रस्तुत की जाती है। गणना दृश्य भी दृष्टिकोण की नवीनता से प्रसन्न था, हालांकि इसे समझने के लिए और अधिक समय की आवश्यकता थी (शास्त्रीय सोवियत शिक्षा)। मैं मानता हूं कि कोई भी वास्तव में मानक विचलन के बारे में नहीं जानता है, लेकिन व्यर्थ ...

शुभ दोपहर
सूत्र में एक त्रुटि है: रूट के संकेत के तहत, चुकता विचलन को योग करना आवश्यक है

मानक विचलन का निर्धारण

तुरंत निर्धारित करें कि मानक विचलन क्या है और इसका सूत्र कैसा दिखता है। यह मान श्रृंखला के सभी मूल्यों और उनके अंकगणितीय माध्य के अंतर के वर्गमूल माध्य का वर्गमूल है। इस संकेतक के लिए एक समान नाम है - मानक विचलन। दोनों नाम पूरी तरह से बराबर हैं।

लेकिन, स्वाभाविक रूप से, एक्सेल में, उपयोगकर्ता को इसकी गणना करने की आवश्यकता नहीं है, क्योंकि कार्यक्रम उसके लिए सब कुछ करता है। आइए जानें कि एक्सेल में मानक विचलन की गणना कैसे करें।

विधि 1: फ़ंक्शन विज़ार्ड

  1. उस शीट पर सेल का चयन करें जहां समाप्त परिणाम प्रदर्शित किया जाएगा। बटन पर क्लिक करें "फ़ंक्शन सम्मिलित करें"फ़ंक्शन लाइन के बाईं ओर स्थित है।

खुलने वाली सूची में, प्रविष्टि देखें STANDOTKLON.V या STANDOTKLON.G। सूची में एक फ़ंक्शन भी है STDEV, लेकिन यह संगतता उद्देश्यों के लिए एक्सेल के पिछले संस्करणों से बचा हुआ है। रिकॉर्ड चुने जाने के बाद, बटन पर क्लिक करें «ठीक».

  • गणना का परिणाम उस सेल में प्रदर्शित किया जाएगा जो मानक विचलन को खोजने के लिए प्रक्रिया की शुरुआत में हाइलाइट किया गया था।
  • विधि 2: सूत्र टैब

    आप टैब के माध्यम से मानक विचलन मान की गणना भी कर सकते हैं "फॉर्मूला".

      परिणाम प्रदर्शित करने और टैब पर जाने के लिए सेल का चयन करें "फॉर्मूला".

  • उसके बाद, तर्क विंडो शुरू होती है। आगे के सभी कार्यों को उसी तरह से किया जाना चाहिए जैसे पहले अवतार में होता है।
  • विधि 3: सूत्र को मैन्युअल रूप से दर्ज करें

    एक ऐसा तरीका भी है जिसमें आपको तर्क विंडो को कॉल करने की आवश्यकता नहीं है। ऐसा करने के लिए, सूत्र को मैन्युअल रूप से दर्ज करें।

      परिणाम प्रदर्शित करने के लिए सेल का चयन करें और इसमें लिखें या सूत्र में निम्न पैटर्न के अनुसार अभिव्यक्ति को बार करें:

    = STANDOTLON.G (नंबर 1 (cell_address1), नंबर 2 (cell_address2, ...)
    या
    = STDB.V (नंबर 1 (cell_address1), नंबर 2 (cell_address2), ...)।

    कुल में, यदि आवश्यक हो तो 255 तर्क तक लिखे जा सकते हैं।

  • रिकॉर्डिंग हो जाने के बाद, बटन पर क्लिक करें दर्ज कीबोर्ड पर।
  • जैसा कि आप देख सकते हैं, एक्सेल में मानक विचलन की गणना करने का तंत्र बहुत सरल है। उपयोगकर्ता को केवल आबादी से संख्या या उन कोशिकाओं के लिंक को दर्ज करने की आवश्यकता है जो उन्हें शामिल करते हैं। सभी गणना कार्यक्रम द्वारा ही की जाती है। गणना किए गए संकेतक क्या हैं और गणना के परिणामों को व्यवहार में कैसे लागू किया जा सकता है, यह महसूस करना अधिक कठिन है। लेकिन इस बात की समझ पहले से ही सॉफ्टवेयर के साथ काम करने की तुलना में आंकड़ों के क्षेत्र से अधिक है।

    लेखक को धन्यवाद, सामाजिक नेटवर्क पर लेख साझा करें।

    अधिकतम और न्यूनतम मूल्य

    आइए अधिकतम और न्यूनतम सूत्रों से शुरू करें। विश्लेषण किए गए डेटा सेट से अधिकतम सबसे बड़ा मूल्य है, न्यूनतम सबसे छोटा है। ये डेटा के एकत्रीकरण में चरम मान हैं जो उनकी भिन्नता की सीमाओं को दर्शाते हैं। उदाहरण के लिए, किसी चीज़ के लिए न्यूनतम / अधिकतम कीमतें, किसी समस्या का सबसे अच्छा या सबसे बुरा समाधान चुनना, आदि।

    इन संकेतकों की गणना के लिए विशेष कार्य हैं - मैक्स और मिन क्रमशः। पहुँच सीधे टेप से है, एवोसुम्मा की ड्रॉप-डाउन सूची में।

    यदि आप फ़ंक्शन सम्मिलन का उपयोग करते हैं, तो आपको "सांख्यिकीय" श्रेणी में बदलना चाहिए।

    सामान्य तौर पर, अधिकतम या न्यूनतम क्रियाओं को कॉल करने के लिए अंकगणितीय माध्य की गणना करने की आवश्यकता नहीं होगी।

    मतलब रैखिक विचलन

    औसत रैखिक विचलन विश्लेषण किए गए डेटा सेट में अंकगणितीय माध्य से निरपेक्ष (मोडुलो) विचलन का औसत है। गणितीय सूत्र का सूत्र है:

    एक - औसत रैखिक विचलन,

    एक्स - विश्लेषित संकेतक,

    एक्स - संकेतक का औसत मूल्य,

    n - विश्लेषण किए गए डेटा सेट में मूल्यों की संख्या।

    एक्सेल में, इस फ़ंक्शन को कहा जाता है AVEDEV.

    AVERAGE फ़ंक्शन का चयन करने के बाद, उस डेटा श्रेणी को इंगित करें जिस पर गणना होनी चाहिए। ओके पर क्लिक करें।

    शायद हर कोई नहीं जानता कि एक यादृच्छिक चर का विचलन क्या है, इसलिए मैं समझाता हूं - यह गणितीय अपेक्षा के आसपास डेटा के प्रसार का एक उपाय है। हालांकि, आमतौर पर केवल एक नमूना उपलब्ध होता है, इसलिए निम्न फैलाव सूत्र का उपयोग किया जाता है:

    s 2 - अवलोकन संबंधी डेटा से गणना नमूना नमूना,

    एक्स - व्यक्तिगत मूल्य

    एक्स- नमूने का अंकगणित माध्य,

    n - विश्लेषण किए गए डेटा सेट में मूल्यों की संख्या।

    इसी एक्सेल फ़ंक्शन है DISP.G। अपेक्षाकृत छोटे नमूनों (लगभग 30 टिप्पणियों तक) का विश्लेषण करते समय, निष्पक्ष नमूना विचरण का उपयोग किया जाना चाहिए, जिसकी गणना निम्न सूत्र का उपयोग करके की जाती है।

    अंतर, जैसा कि देखा जा सकता है, केवल हर में है। एक्सेल में नमूना निष्पक्ष विचरण की गणना के लिए एक फ़ंक्शन है DISP.V.

    हम वांछित विकल्प (सामान्य या चयनात्मक) का चयन करते हैं, सीमा को इंगित करते हैं, "ओके" बटन पर क्लिक करें। परिणामस्वरूप मूल्य विचलन के प्रारंभिक वर्ग के कारण बहुत बड़ा हो सकता है। आंकड़ों में फैलाव एक बहुत महत्वपूर्ण संकेतक है, लेकिन इसका उपयोग आमतौर पर इसके शुद्ध रूप में नहीं, बल्कि आगे की गणना के लिए किया जाता है।

    मानक विचलन

    मानक विचलन (RMS) विचरण की जड़ है। इस सूचक को मानक विचलन भी कहा जाता है और सूत्र द्वारा गणना की जाती है:

    जनसंख्या के हिसाब से

    आप बस विचरण से रूट निकाल सकते हैं, लेकिन एक्सेल में मानक विचलन के लिए तैयार कार्य हैं: STANDOTKLON.G और STANDOTKLON.V (क्रमशः सामान्य और नमूना कुल के अनुसार)।

    मैं दोहराता हूं, मानक और मानक विचलन समानार्थक शब्द हैं।

    अगला, हमेशा की तरह, वांछित सीमा निर्दिष्ट करें और "ओके" पर क्लिक करें। मानक विचलन का विश्लेषण संकेतक के रूप में माप की एक ही इकाई है, इसलिए, यह स्रोत डेटा के साथ तुलनीय है। इसके बारे में नीचे।

    भिन्नता का गुणांक

    ऊपर चर्चा किए गए सभी संकेतक स्रोत डेटा के पैमाने से बंधे हैं और विश्लेषण की गई आबादी की भिन्नता का एक आलंकारिक विचार प्राप्त करने की अनुमति नहीं देते हैं। डेटा तितर बितर उपयोग के सापेक्ष माप प्राप्त करने के लिए भिन्नता का गुणांकविभाजित करके गणना की गई मानक विचलन पर अंकगणित माध्य। भिन्नता के गुणांक का सूत्र सरल है:

    एक्सेल में भिन्नता के गुणांक की गणना के लिए कोई तैयार कार्य नहीं है, जो एक बड़ी समस्या नहीं है। औसत मान द्वारा मानक विचलन को विभाजित करके गणना की जा सकती है। ऐसा करने के लिए, सूत्र पट्टी में लिखें:

    कोष्ठक में डेटा की एक श्रेणी को इंगित किया गया है। यदि आवश्यक हो, तो नमूना (एसटीडी बी) के मानक विचलन का उपयोग करें।

    भिन्नता के गुणांक को आमतौर पर प्रतिशत के रूप में व्यक्त किया जाता है, इसलिए सूत्र वाले सेल को प्रतिशत प्रारूप में तैयार किया जा सकता है। वांछित बटन "होम" टैब पर रिबन पर स्थित है:

    वांछित सेल का चयन करने और राइट-क्लिक करने के बाद आप संदर्भ मेनू से "फ़ॉर्मेट सेल" का चयन करके प्रारूप भी बदल सकते हैं।

    मूल्यों के बिखराव के अन्य संकेतकों के विपरीत भिन्नता का गुणांक, डेटा भिन्नता के एक स्वतंत्र और बहुत जानकारीपूर्ण संकेतक के रूप में उपयोग किया जाता है। आंकड़ों में, यह आमतौर पर स्वीकार किया जाता है कि यदि भिन्नता का गुणांक 33% से कम है, तो डेटा सेट सजातीय है, यदि 33% से अधिक है, तो यह विषम है। यह जानकारी डेटा के प्रारंभिक विवरण और आगे के विश्लेषण के लिए संभावनाओं को निर्धारित करने के लिए उपयोगी हो सकती है। इसके अलावा, भिन्नता का गुणांक, प्रतिशत में मापा जाता है, आपको उनके पैमाने और इकाइयों की परवाह किए बिना विभिन्न डेटा के फैलाव की डिग्री की तुलना करने की अनुमति देता है। उपयोगी संपत्ति।

    दोलन गुणांक

    आज डेटा के बिखरने का एक और संकेतक दोलन गुणांक है। यह औसत से भिन्नता की सीमा (अधिकतम और न्यूनतम मूल्य के बीच का अंतर) का अनुपात है। कोई तैयार एक्सेल फॉर्मूला नहीं है, इसलिए आपको तीन कार्य करने होंगे: MAX, MIN, AVERAGE।

    दोलन गुणांक औसत के सापेक्ष भिन्नता की सीमा को दर्शाता है, जिसका उपयोग विभिन्न डेटा सेटों की तुलना करने के लिए भी किया जा सकता है।

    सामान्य तौर पर, एक्सेल का उपयोग करते हुए, कई आंकड़ों की गणना बहुत सरलता से की जाती है। यदि कुछ स्पष्ट नहीं है, तो आप फ़ंक्शन डालने में खोज करने के लिए हमेशा विंडो का उपयोग कर सकते हैं। खैर, मदद करने के लिए Google।