சராசரி அகற்சி

கட்டற்ற கலைக்களஞ்சியமான விக்கிப்பீடியாவில் இருந்து.
தாவிச் செல்லவும்: வழிசெலுத்தல், தேடல்
சாதாரண விநியோக தளம் (அல்லது பெல் கர்வ்). ஒவ்வொரு வண்ணமிடப்பட்ட பட்டையும் நியமச்சாய்வின் ஒரு பரப்பைப் பெற்றிருக்கிறது.
இடைநிலை 50 (நீலநிறத்தில் காட்டப்பட்டுள்ளது) உடனான தரவுத் தொகுதி மற்றும் சராசரி அகற்சி (σ) 20.

தொடர்பான பல தரவுகள் கிடைக்கும்பொழுது (எடுத்துக்காட்டாக ஒரு வகுப்பில் உள்ள மாணவர்களின் மதிப்பெண்கள்) அவற்றின் சராசரி மதிப்பானது ஒவ்வொரு தரவில் இருந்தும் எவ்வளவு விலகி உள்ளது (அகன்று உள்ளது) என்பதை, கூடியுள்ளதா குறைந்துள்ளதா என்று பாராமல் வெறும் பரும அளவாக மட்டும் எவ்வளவு மாறியுள்ளது என்பதை ஒரு முறைசார்ந்து கணிக்கும் கணக்கீடு சராசரி அகற்சி அல்லது திட்ட விலக்கம் என்பது. இக்கருத்து, நிகழ்தகவுக் கோட்பாடு மற்றும் புள்ளிவிவரங்களில் புள்ளிவிவர தொகுப்பாக்கம், தரவுத் தொகுதி அல்லது நிகழ்தகவுப் பரவல் (probability distribution) ஆகிய பல துறைகளில் அடிப்படைக் கருத்தாகப் பயன்படுகின்றது. சராசரி அகற்சி என்பது ஒவ்வொரு தரவுப் புள்ளியும் அத் தரவுகளின் சராசரியில் இருந்து மாறுபடும் அளவினை தற்பெருக்கிப் (இருமடி), பின் இப்படி ஒவ்வொரு தரவுக்கும் கிடைக்கும் அளவைக் கூட்டி அவற்றின் சராசரி வர்க்க மூலம் (square root) எடுப்பது சராசரி அகற்சி ஆகும். மாறுபாடு அல்லது பரப்பீட்டின் அளவீடாகச் சராசரி அகற்சி பரவலாக பயன்படுத்தப்படுகிறது.

எளிய முறைகளில் இது "சராசரியிலிருந்து" (இடைநிலை) எந்தளவிற்கு அதிகமாக மாறுபட்டிருக்கிறது என்பதைக் காட்டுகிறது. விநியோகத்தின் இடைநிலையிலிருந்து வரும் சராசரி மதிப்பெண் வேறுபாட்டினால் அவை எந்த அளவிற்கு இடைநிலையிலிருந்து வேறுபட்டிருக்கின்றன என்றும் கருதப்படலாம். குறைவான சராசரி அகற்சி தரவுப் புள்ளிகள் இடைநிலைக்கு மிகவும் நெருங்கிச் செல்பவையாக இருப்பதையும், அதிக அளவு சராசரி அகற்சி மதிப்புக்களின் பெரிய அளவின் ஊடாக தரவு பரந்து விரிந்திருக்கிறது என்பதையும் குறிப்பிடுகிறது.

எடுத்துக்காட்டாக அமெரிக்காவில் உள்ள வயதுவந்த ஆண்களின் சராசரி உயரம் ஏறத்தாழ 3 in (8 cm) ஆகும். இத்தரவின் சராசரி அகற்சி கிட்டத்தட்ட 70 inches (178 cm) ஆக இருக்கிறது. இதன் பொருள் என்னவென்றால், பெரும்பாலான ஆண்கள் (ஏறத்தாழ 68 சதவிகிதம், பொதுச்சீர் பகிர்பரவல் (Normal Distribution)இருப்பதாகக் கொண்டு கணிப்பது) நடுவெண் (mean) (67) இன் 3 in (8 cm)க்குள்ளான உயரத்தைக் கொண்டிருக்கின்றனர் - ஒருமடங்கு சராசரி அகற்சி மதிப்பை நோக்கினால், அதேசமயம் ஏறத்தாழ எல்லா ஆண்களும் (கிட்டத்தட்ட 95 சதவிகிதம்) நடுவெண் (64) இன் 6 in (15 cm)க்குள்ளான உயரத்தைக் கொண்டிருக்கின்றனர் - 2 மடங்கு சராசரி அகற்சி என்பதை இது குறிக்கிறது. சராசரி அகற்சி சுழியம் என்றால் எல்லா ஆண்களும் துல்லியமாக 70 in (178 cm) உயரத்திற்கு இருப்பார்கள். சராசரி அகற்சி 20 in (51 cm) என்றால் ஆண்கள் ஏறத்தாழ 50 உடன் மிக மிக அதிகமான மாறுபாட்டு அளவுகளைக் கொண்டிருப்பார்கள். மாதிரி தொகுப்பாக்கத்தின் 99 சதவிகிதத்திற்கு கணக்கிடப்படும் மூன்று மடங்கு சராசரி அகற்சிகள் ஆய்வுசெய்யப்பட்டு பகிர்பரவல் பொதுச்சீரானது என்று தீர்வுசெய்யப்பட்டிருக்கிறது (பார்ப்பதற்கு மணி போலோ மலை போலோ தோற்றம் அளிப்பது).

மேலும் தொகுப்பாக்கத்தின் மாறுபாட்டை வெளிப்படுத்துவதற்கு புள்ளிவிவர முடிவுறுதிகளிலான நம்பகத்தை அளவிடுவதற்கு சராசரி அகற்சி பொதுவாகப் பயன்படுத்தப்படுகிறது. எடுத்துக்காட்டாக, ஓட்டெடுப்பு தரவிலான பிழை விளிம்பு அதே ஓட்டெடுப்பு பல்வேறு முறைகளுக்கு நடத்தப்பட்டால் முடிவுகளில் ஏற்படும் எதிர்நோக்கு சராசரி அகற்சியைக் கணக்கிடுவதன் மூலம் தீர்மானிக்கப்படுகிறது. தெரிவிக்கப்பட்ட பிழை விளிம்பு சராசரி அகற்சியைக் காட்டிலும் இரண்டு மடங்காக இருக்கிறது – நம்பக இடைவெளியின் 95 சதவிகிதத்தினுடைய சுற்றளவு. அறிவியலில்,பொதுவாக ஆராய்ச்சியாளர்கள் பரிசோதனைத் தரவின் சராசரி அகற்சியைகத் தெரிவிக்கின்றனர் என்பதோடு சராசரி அகற்சியில் இருந்து வெகுதொலைவிற்கு செல்லும் விளைவுகள் மட்டுமே புள்ளிக் குறிப்பியல் நோக்கில் முக்கியத்துவம் வாய்ந்தவை என்று கருதப்படுகின்றன - அளவீடுகளிலான சாதாரண தற்போக்கு (தன்னேர்ச்சியான) பிழை அல்லது மாறுபாடு இயல்பான மாறுபாட்டிலிருந்து இந்த முறையில் வேறுபடுத்திக்காட்டப்படுகிறது. எளிதில் மாறும் இயல்புள்ள முதலீட்டு அளவீடாக முதலீட்டிலான ஆதாய விகிதத்தில் சராசரி அகற்சி தோன்றுமிடமான இது நிதித்துறையில் முக்கியத்துவம் வாய்ந்ததாக இருக்கிறது.

சராசரி அகற்சி என்ற சொற்பதம் கார்ல் பியர்சன்[1] தன்னுடைய விரிவுரைகளில் இதைப் பயன்படுத்தியதைத்[2] தொடர்ந்து 1894 ஆம் ஆண்டில் அவருடைய எழுத்துக்களில் முதன்முதலாக காணப்படுகிறது. இதே கருத்தாக்கத்திற்கான மாற்றுப் பெயர்களுக்கான மாற்றீடாகவும் இது இருந்திருக்கிறது: எடுத்துக்காட்டாக காஸ் இடைநிலைப் பிழை என்பதைப் பயன்படுத்தினார்.[3] சராசரி அகற்சியின் பயன்மிக்க உடைமைப்பொருள் மாறுபாட்டைப் போன்று அல்லாமல் தரவில் உள்ளதைப் போன்று ஒரே யூனிட்களாக வெளிப்படுத்தப்படுகிறது என்பதாகும். இருப்பினும் சதவிகிதத்துடனான அளவீடுகளுக்கு சராசரி அகற்சியானது அலகுகளாக சதவிகிதப் புள்ளியைப் பெற்றிருக்கும்.

தொகுப்பாக்கத்திலிருந்து தரவின் மாதிரி மட்டுமே கிடைக்கும் என்றால் தொகுப்பாக்க சராசரி அகற்சி மாதிரி சராசரி அகற்சி எனப்படும் மேம்படுத்தப்பட்ட அளவுருவினால் கணக்கிடப்பட்டதாக இருக்கும், கீழே விவரிக்கப்பட்டுள்ளது.

பொருளடக்கம்

[தொகு] அடிப்படை எடுத்துக்காட்டுகள்

பின்வரும் மதிப்புக்களைக் கொண்ட தொகுப்பாக்கத்தை எடுத்துக்கொள்வோம்:

2,\;4,\;4,\;4,\;5,\;5,\;7,\;9.

மொத்தத்தில் இந்த 8 தரவுப்புள்ளிகளில் சராசர்ரி மதிப்பு :

\frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

தொகுப்பாக்க சராசரி அகற்சியைகக் கணக்கிட சராசரியிலிருந்து ஒவ்வொரு தரவுப் புள்ளிக்குமான வேறுபாட்டை முதலில் கணக்கிட்டு அதன் முடிவை இருமடி ஆக்கவும் (ஏன் இருமடியாக்க வேண்டுமெனில், கூடுதல் குறைதல் என்பதைக் கொள்ளாமல், மாறுபாட்டின் பரும அளவை மட்டும் கருத்தில் கொள்ள):


\begin{array}{ll}
(2-5)^2 = (-3)^2 = 9 & (5-5)^2 = 0^2 = 0 \\
(4-5)^2 = (-1)^2 = 1 & (5-5)^2 = 0^2 = 0 \\
(4-5)^2 = (-1)^2 = 1 & (7-5)^2 = 2^2 = 4 \\
(4-5)^2 = (-1)^2 = 1 & (9-5)^2 = 4^2 = 16
\end{array}

பின்னர் மதிப்புக்களின் எண்ணிக்கையைக் கொண்டு இந்த மதிப்புக்களின் கூடுதலை எத்தனைத் தரவுகள் உள்ளனவோ அவற்றால் வகுத்து சராசரி அகற்சியை அளிப்பதற்கான வர்க்க மூலத்தைப் பெறவும்:

 \sqrt{\frac{9+1+1+1+0+0+4+16}{8}} = 2.

இவ்வாறு மேலேயிருப்பது தொகுப்பாக்க சராசரி அகற்சி 2 ஐப் பெற்றிருக்கிறது.

மேலே இருப்பது முழுமையான தொகுப்பாக்கமாக கருதப்படுகிறது. சில மூலாதார தொகுப்பாக்கத்திலிருந்து தற்போக்கு மாதிரியாக்கம் மூலம் இந்த 8 மதிப்புக்களும் பெறப்பட்டால் மாதிரி சராசரி அகற்சி வகுக்கும் எண்ணாக 8க்கு பதிலாக 7 ஐப் பயன்படுத்தும் (அதாவது மொத்தத் தரவுகளின் எண்ணிக்கையில்ல் ஒன்று குறைவாக. இது தரவுகளுக்கு இடையே உள்ள இடைவெளிகளின் எண்ணிக்கை). விரிவாகக் காண்பதற்கு தொகுப்பாக்க சராசரி அகற்சி மதிப்பீட்டுப் பிரிவைப் பார்க்கவும்.

[தொகு] வரையறை

[தொகு] நிகழ்தகவு விநியோகம் அல்லது தற்போக்கு மாறுபாடு

X என்பது இடையீட்டு மதிப்பு μ உடனான தற்போக்கு மாறுபாடாக இருக்கிறது:

\operatorname{E}[X] = \mu\,\!

இங்கிருக்கும் ஆபரேட்டரான E சராசரி அல்லது X இன் எதிர்நோக்கு மதிப்பைக் குறிக்கிறது. எனவே X இன் சராசரி அகற்சி பின்வரும் தொகைமானம்

\sigma = \sqrt{\operatorname{E}\left[(X - \mu)^2\right]}.

அதாவது, சராசரி அகற்சி σ (சிக்மா) (Xμ )2 இன் சராசரி மதிப்பினுடைய வர்க்க மூலம் ஆகும்.

இந்த நிகழ்வில் ஒவ்வொரு மதிப்பும் ஒரே நிகழ்தகவைக் கொண்டிருப்பதால் முற்றான தரவுத் தொகுதி x_1, x_2, \ldots, x_N இல் தற்போக்கு மதிப்புக்களை X எடுத்துக்கொள்ளுமிடத்தில் சராசரி அகற்சி

\sigma = \sqrt{\frac{(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2}{N}},

அல்லது, கூட்டுத்தொகை குறிப்பீட்டைப் பயன்படுத்தி,

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2},

நிகழ்தகவு விநியோகத்தின் (ஒற்றைமாறுபாட்டு) சராசரி அகற்சி தற்போக்கு மாறுபாடு கொண்டிருக்கும் விநியோகம் போன்றதேயாகும். இத்தகைய எதிர்நோக்கு மதிப்புக்கள் இருக்க வேண்டிய தேவையில்லை என்பதால் எல்லா தற்போக்கு மாறுபாடுகளும் நியமச்சாய்வைக் கொண்டிருப்பதில்லை. உதாரணத்திற்கு, காச்சி விநியோகத்தைத் தொடரும் தற்போக்கு மாறுபாட்டின் சராசரி அகற்சி அதனுடைய எதிர்நோக்கு மதிப்பு வரையறுக்கப்படாதது என்பதால் வரையறுக்கப்படாமலேயே இருக்கிறது.

[தொகு] தொடர்ச்சியான தற்போக்கு மாறுபாடு

தொடர்ச்சியான விநியோகிப்புகள் விநியோகிப்பின் நிலையளவுருவினுடைய செயல்பாடாக நியமச்சாய்வை கணக்கிடுவதற்கான சூத்திரத்தை வழங்குகிறது. பொதுவாக, நிகழ்தகவு திண்மை செயல்பாடு p (x ) உடனான தொடர்ச்சியான உண்மை-மதிப்பு தற்போக்கு மாறுபாடு X இன் சராசரி அகற்சி

\sigma = \sqrt{\int (x-\mu)^2 \, p(x) \, dx}\,,

பின்வருமிடத்தில்

\mu = \int x \, p(x) \, dx\,,

மற்றும் X இன் அளவுக்கும் மேலாகச் செல்லும் x க்காக எடுக்கப்பட்ட முழு எண்கள் வரையறு முழு எண்களாக உள்ளவிடத்திலும்.

[தொகு] பிரிநிலை தற்போக்கு மாறுபாடு அல்லது தரவுத் தொகுதி

பிரிநிலை தற்போக்கு மதிப்பின் சராசரி அகற்சி இடைநிலையிலிருந்து வந்த அதனுடைய மதிப்புக்களின் இருமடிமூலச் சராசரியாக (ஆர்எம்எஸ்) இருக்கிறது.

தற்போக்கு மாறுபாடு X ஆனது சமமான நிகழ்தகவோடு N மதிப்புக்களில் \textstyle x_1,\dots,x_N (இயல்பெண்களாக உள்ளவை) எடுத்துக்கொள்ளப்படுகிறது என்றால் அதனுடைய சராசரி அகற்சி σ பின்வருமாறு கணக்கிடப்படலாம்:

  1. \scriptstyle\overline{x}, மதிப்புக்களின் இடைநிலையைக் கணடுபிடிக்கவும்.
  2. x_i இன் ஒவ்வொரு மதிப்பிற்கும் (\scriptstyle x_i - \overline{x}) இடைநிலையிலிருந்து அதனுடைய நியமச்சாய்வைக் கணக்கிடவும்.
  3. இந்த சராசரி அகற்சிகளின் இருமடிகளை கணக்கிடவும்.
  4. இருமடி செய்யப்பட்ட சாய்வுகளின் இடைநிலையைக் கண்டுபிடிக்கவும். இந்த தொகைமானம் σ 2 மாறுபாடாகும்.
  5. மாறுபாட்டின் வர்க்க மூலத்தை எடுத்துக்கொள்ளவும்.

இந்தக் கணக்கீடு பின்வரும் சூத்திரத்தால் விளக்கப்பட்டிருக்கிறது:

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}\,,

\scriptstyle \overline{x} என்பது xi மதிப்புக்களின் எண்கணித இடைநிலையாக இருக்குமிடத்தில் பின்வருமாறு வரையறுக்கப்படுகிறது:

\overline{x} = \frac{x_1+x_2+\cdots+x_N}{N} = \frac{1}{N}\sum_{i=1}^N x_i\,.

எல்லா மதிப்புக்களும் சமமான நிகழ்தகவைக் கொண்டிருக்காத ஆனால் xi மதிப்பின் நிகழ்தகவு pi க்கு சமமாக இருந்தால் சராசரி அகற்சி பின்வருமாறு கணக்கிடப்படலாம்:

\sigma = \sqrt{\frac{\sum_{i=1}^N p_i(x_i - \overline{x})^2}{\sum_{i=1}^N p_i}}\,,மற்றும்
s = \sqrt{\frac{N' \sum_{i=1}^N p_i(x_i - \overline{x})^2}{(N'-1)\sum_{i=1}^N p_i}}\,,

பின்வருமிடத்தில்

\overline{x} =\frac{ \sum_{i=1}^N p_i x_i}{\sum_{i=1}^N p_i}\,,

மற்றும் N' என்பது பூஜ்ஜியமல்லாத எடைமானக் கூறுகளின் எண் ஆகும்.

ஒரு தரவுத் தொகுதியின் சராசரி அகற்சி என்பது ஒவ்வொரு மதிப்பிற்குமான புள்ளி நிறை அதனுடைய தரவுத் தொகுதியில் உள்ள பெருக்கத்திற்கு ஏற்றதாக உள்ளவிடத்தில் தரவுத் தொகுதியிலிருந்து பெற்ற மதிப்புக்கள் என்று துல்லியமாக அனுமானிக்கக்கூடிய பிரிநிலை தற்போக்கு மாறுபாட்டினுடையதைப் போன்றே இருப்பதாகும்.

[தொகு] எடுத்துக்காட்டு

3, 7, 7, மற்றும் 19 மதிப்புக்களைக் கொண்டிருக்கும் தரவுத் தொகுதியின் சராசரி அகற்சியை நாம் கண்டுபிடிக்க விரும்புகிறோம் என்றால்.

படி-1: 3, 7, 7, 19 ஆகிய தரவாகத் தந்திருந்தால், அவற்றின்ன் சராசரியை கண்டுபிடிக்கவும்

\frac{3+7+7+19}{4} = 9.

படி-2: சராசரியில் இருந்து ஒவ்வொரு எண்ணிற்குமான விலகலைக் (அகற்சியைக்) கண்டுபிடிக்கவும்,

 \begin{align} 3 - 9  = -6 \\ 7 - 9  = -2 \\ 7 - 9  = -2 \\ 19 - 9  = 10. \end{align}

padi-3: ஒவ்வொரு தரவும் சராசரியில் இருந்து அகலும் அல்லது விலகும் திசையை (குறைவா, கூடுதலா) என்னும் செய்தியை நீக்க ஒவ்வொரு அகற்சியையும் (விலகலையும்) இருமடி செய்யவும் (கழித்தல் திசையுள்ள எண்கள் இதனால் நேர்ம எண்களாகவும் மாறிவிடும்):

 \begin{align} (-6)^2  = 36 \\ (-2)^2 & = 4 \\ (-2)^2  = 4 \\ 10^2 & = 100. \end{align}

படி-4: இருமடி செய்யப்பட்ட விலக்கங்களின் அல்லது அகற்சிகளின் சராசரியைக் கண்டுபிடிக்கவும்,

 \frac{36+4+4+100}{4} = 36.

படி-5: வர்கமூலம் காணும்பொழுது நேர்ம மதிப்புள்ளதை எடுத்துக்கொள்ளவும் (முன்பு இருமடி ஆக்கியதால் அவற்ரின் வர்க மூலம் எடுபப்தன் மூலம் அகற்சியீன் அளவை அறிகின்றோம்),

\sqrt{36} = 6.\,

ஆகவே இந்த த்ரவுகளின் சராசரி (இந்தத் தொகுதியின் அல்லது கணத்தின்) சராசரி அகற்சி 6 ஆகும். இந்த எடுத்துக்காட்டின் படி கிடைக்கும் சராசரி அகற்சியானது பொதுவாக தனிய மாறுபாடு (absolute deviation) என்னும் மற்றொரு கணக்கீடு தரும் சராசரி விலகலில் இருந்து மாறுபடுகின்றது என்பதையும் காட்டும் (இந்தத் தனிய மாறுபாடு இவ்வெடுத்துக்காட்டில் 5 ஆக உள்ளது; இந்தத் தனிய மாறுபாடு என்பது சராசரியில் இருந்து தரவுகள் மாறுபடும் அளவை இருமடியாக்காமல் அதன் திசைநீக்கிய பரும அளவை மட்டும் காணும் முறை).

மேலே உள்ள தரவுத் தொகுதி பெரிய தொகுப்பாக்கத்திலிருந்து ஒரு மாதிரியை மட்டுமே குறிப்பிடுகிறது என்றால் இந்த உதாரணத்திற்கு 6.93 ஐத் தந்திருக்கக்கூடிய தொகுப்பாக்க நியமச்சாய்வை மதிப்பிடுவதற்கு மேம்படுத்தப்பட்ட சராசரி அகற்சி கணக்கிடப்படும் (கீழே விளக்கப்பட்டுள்ளது).

[தொகு] சூத்திரத்தை எளிதாக்குதல்

இருமடி செய்யப்பட்ட சாய்வுகளின் கூடுதல் கணக்கீட்டை பின்வருமாறு எளிதாக்கலாம்:

\begin{align} \sum_{i=1}^N (x_i - \overline{x})^2 & = {} \sum_{i=1}^N (x_i^2 - 2 x_i\overline{x} + \overline{x}^2) \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - \left(2 \overline{x} \sum_{i=1}^N x_i\right) + N\overline{x}^2 \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - 2 \overline{x} (N\overline{x}) + N\overline{x}^2 \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - 2N\overline{x}^2 + N\overline{x}^2 \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - N\overline{x}^2. \end{align}

பின்வருவதை வழங்கும் நியமச்சாய்விற்கான அசல் சூத்திரத்திற்கு இதை பயன்படுத்தவும்:

 \sigma = \sqrt{\frac{1}{N} \left(\left(\sum_{i=1}^N x_i^2\right) - N\overline{x}^2\right)} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - \overline{x}^2}.

(இருமடிகளின் சராசரி சராசரியின் சதுரத்தைக் குறைக்கிறது) என்பதன் வர்க்க மூலத்தை எடுத்துக்கொள்கையில் இது நினைவில்கொள்ளப்படலாம்.

[தொகு] தொகுப்பாக்க சராசரி அகற்சி மதிப்பிடுதல்

தொகுப்பாக்கத்தின் ஒவ்வொரு உறுப்பும் மாதிரியாக்கப்படுகின்ற நிகழ்வுகளில் (நிலைப்படுத்தப்பட்ட சோதனை) உள்ள மொத்த தொகுப்பாக்கத்தின் சராசரி அகற்சியையும் ஒருவர் கண்டுபிடிக்க முடியும். இது செய்யப்பட இயலாத நிகழ்வுகளில் சராசரி அகற்சி σ தொகுப்பாக்கத்திலிருந்து எடுக்கப்பெற்ற தற்போக்கு மாதிரியை பரிசோதனை செய்வதன் மூலம் கணக்கிடப்படுகிறது. சில மதிப்பான்கள் கீழே தரப்பட்டுள்ளன:

[தொகு] மாதிரியாக்கத்தின் சராசரி அகற்சியினால்

மாதிரியின் சராசரி அகற்சி σ க்கு சிலபோது பயன்படுத்தப்படும் மதிப்பான் s n ஆல் குறிப்பிடப்பட்டு பின்வருமாறு வரையறுக்கப்படுகிறது:

 s_n = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}.

இந்த மதிப்பான் "மாதிரி சராசரி அகற்சியைக்" காட்டிலும் ஒரேவிதமான சிறிய இடைநிலை இருமடியாக்கப்பட்ட பிழையைக் கொண்டதாக இருக்கிறது என்பதுடன் தொகுப்பாக்கம் வழக்கமாக விநியோகிக்கப்படுகையில் அதிகஅளவாக-ஒத்தத்தன்மை மதிப்பீடாக இருக்கிறது. ஆனால் இந்த மதிப்பான் சிறிய அல்லது மிதமாக-அளவிடப்பட்ட மாதிரிக்கு பயன்படுத்தப்படும்போது குறைவானதாக இருக்கவே முனைகிறது: இது ஒரு பக்கச்சார்பான மதிப்பான் ஆகும்.

[தொகு] மாதிரி சராசரி அகற்சியினால்

ஒரு மாதிரி சராசரி அகற்சி சரிசெய்யப்பட்ட பதிப்பில் பயன்படுத்தப்படும் σ-க்கான மிகவும் பொதுவான மதிப்பான் "s" ஆல் குறிப்பிடப்பட்டு பின்வருமாறு வரையறுக்கப்பட்டுள்ளது:

 s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2},

\scriptstyle\{x_1,\,x_2,\,\ldots,\,x_N\} மாதிரியாகவும் \scriptstyle\overline{x} மாதிரியின் இடைநிலையாகவும் உள்ளவிடத்தில். இந்த சரிசெய்தல் (N க்கு பதிலாக N − 1 ஐ பயன்படுத்துதல்) பெஸல்ஸ் சரிசெய்தல் எனப்படுகிறது. இந்த சரிசெய்தலுக்கான காரணம் உள்ளுறையும் தொகுப்பாக்கத்தின் மாறுபாடு σ2 க்கான நடுநிலையான மதிப்பானாக s 2 இருக்கிறது, இந்த மாறுபாடு இருந்து மாற்றீட்டுடன் மாதிரி மதிப்புக்கள் சுதந்திரமாக வரையப்படுகிறது என்றால் மட்டுமே. இருப்பினும், s சராசரி அகற்சி σ க்கான நடுநிலையான மதிப்பாண் அல்ல ; இது தொகுப்பாக்க சராசரி அகற்சியைக் குறைத்து மதிப்பிடவே முனைகிறது.

"மாதிரியின் சராசரி அகற்சி" என்ற பதம் சரிசெய்யப்படாத மதிப்பானுக்காக பயன்படுத்தப்படுகிறது (N ஐப் பயன்படுத்துவது) என்பதையும், அதேசமயத்தில் "மாதிரி சராசரி அகற்சி" சரிசெய்யப்பட்ட மதிப்பானுக்கு ((N − 1)ஐப் பயன்படுத்துவது) பயன்படுத்தப்படுகிறது என்பதையும் கவனிக்கவும். N − 1 என்ற வகுக்கும் எண் மீதிகளின் திசையன்களில் (வெக்டாரில்) சுதந்திர அளவுகளின் எண்ணாக இருக்கிறது, \scriptstyle(x_1-\overline{x},\,\dots,\,x_N-\overline{x}).

[தொகு] இண்டர்குவார்டைல் அளவுகளினால்

புள்ளிவிவரம்

 \frac\text{IQR}{1.35}

(1.35 ஒரு தோராய அளவு) ஐக்யுஆர் இண்டர்குவார்டைல் அளவாக இருக்குமிடத்தில் தொகுப்பாக்கம் சாதாரணமாக விநியோகிக்கப்பட்டால் σ இன் சீரான அளவீடாக இருக்கிறது. இண்டர்குவார்டைல் அளவு ஐக்யுஆர் என்பது தரவின் மூன்றாவது குவார்டைலும் தரவின் முதல் குவார்டைலும் ஆகும். நியமச்சாய்வினால் கிடைக்கும் ஒன்றின் வகையிலான மதிப்பானின் அஸிம்டாடிக் ரிலேடிவ் எஃபீஷியன்ஸி (ஏஆர்இ) 0.37. ஆகவே சாதாரணமான தரவிற்கு மாதிரி நியமச்சாய்விலிருந்து வரும் ஒன்றைப் பயன்படுத்திக்கொள்வது சிறந்தது; தரவானது கெட்டியான பின்பகுதியாக இருக்கும்போது இந்த மதிப்பான் மிகவும் பயன்மிக்கதாக இருக்கும்.[4][not in citation given][dubious ]

[தொகு] பிற மதிப்பான்கள்

மேலும் தகவல்களுக்கு: Unbiased estimation of standard deviation

தற்போக்கு மாறுபாடு சாதாரணமாக விநியோகிக்கப்படுகையில் σக்கான நடுநிலை மதிப்பான் தெரியவருகிறது என்றாலும் சூத்திரம் சிக்கலானதாகவும் சிறிய சரிசெய்தல்களும் இருக்கிறது: மேலும் விவரங்களுக்கு பார்க்க நடுநிலையான சராசரி அகற்சி மதிப்பீடு. மேலும், நடுநிலைத்தன்மை (வார்த்தை வகையில்), எப்போதும் விரும்பத்தகுந்ததாக இல்லை: பார்க்க மதிப்பானின் பக்கச்சார்பு.

[தொகு] சராசரி அகற்சியின் உடைமைப்பொருள்கள்

மாறிலி c மற்றும் தற்போக்கு மாறுபாடுகள் X மற்றும் Y :

 \operatorname{stdev}(X + c) = \operatorname{stdev}(X) \,,
 \operatorname{stdev}(cX) = |c|\,\operatorname{stdev}(X) \,,
 \operatorname{stdev}(X + Y) = \sqrt{\operatorname{var}(X) + \operatorname{var}(Y) + 2\operatorname{cov}(X,Y)} \,,

\operatorname{var} மற்றும் \operatorname{cov} முறையே மாறுபாடுகள் மற்றும் துணைமாறுபாடுகளுக்கென்று, இருக்கையில்.

[தொகு] பொருள்விளக்கமும் பயன்பாடும்

பெரிய சராசரி அகற்சி தரவுப் புள்ளிகள் இடைநிலையிலிருந்து தொலைவில் இருக்கின்றன என்பதையும், சிறிய சராசரி அகற்சி அவை இடைநிலைக்கு வெகு நெருக்கமாக நிரம்பியிருக்கின்றன என்பதையும் காட்டுகிறது.

உதாரணத்திற்கு பின்வரும் தொகுப்பாக்கங்கள் ஒவ்வொன்றிற்கும் {0, 0, 14, 14}, {0, 6, 8, 14} மற்றும் {6, 6, 8, 8} இடைநிலை 7. அவற்றின் சராசரி அகற்சிகள் முறையே 7, 5, மற்றும் 1. மூன்றாவது தொகுப்பாக்கம் மற்ற இரண்டைக் காட்டிலும் மிகச்சிறிய நியமச்சாய்வாக இருக்கிறது, ஏனென்றால் அதனுடைய மதி்ப்புக்கள் அனைத்தும் 7க்கு நெருக்கமாக இருக்கின்றன. ஒரு தளர்வான வகையில், தரவுப் புள்ளிகள் இருக்க முனைகின்ற இடைநிலையிலிருந்து எந்த அளவிற்கு தொலைவில் இருக்கிறது என்பதை சராசரி அகற்சி நமக்குச் சொல்கிறது. இது தரவுப்புள்ளிகள் கொண்டிருப்பவை போன்று அதே அலகுகளைப் பெற்றிருக்கிறது. உதாரணத்திற்கு ஒரு தரவுத் தொகுதி {0, 6, 8, 14} பல வருடங்களுக்கான நான்கு உடன்பிறந்தோரின் தொகுப்பாக்க வயதுகளைக் குறிப்பிடுகிறது என்றால் அதன் சராசரி அகற்சி 5 ஆண்டுகளாகும்.

மற்றொரு உதாரணத்தில், தொகுப்பாக்கம் {1000, 1006, 1008, 1014} மீட்டர்களில் அளவிடப்பட்ட நான்கு தடகள வீரர்கள் கடந்த தொலைவுகளைக் குறிப்பிடுகிறது. இது இடைநிலையாக 1007 மீட்டர்கள் மற்றும் இடைநிலை 5 மீட்டர்களைக் கொண்டிரு்ககிறது.

சராசரி அகற்சி நிச்சயமின்மையின் அளவீடாகவும் செயல்படலாம். இயற்பியலில், உதாரணத்திற்கு திரும்ப நிகழும் அளவீட்டின் குழுவினுடைய தெரிவிக்கப்பட்ட சராசரி அகற்சி அந்த அளவீடுகளின் துல்லியத்தை வழங்குவதாக இருக்க வேண்டும். கோட்பாட்டுரீதியான முன்னூகிப்புடன் அளவீடுகள் உடன்படுகின்றனவா என்பதைத் தீர்மானிக்கும்போது அந்த அளவீடுகளின் சராசரி அகற்சி மிகவும் முக்கியத்துவம் வாய்ந்ததாகிறது: அளவீடுகளின் இடைநிலை முன்னூகிப்பிலிருந்து வெகு தொலைவில் இருந்தால் (நியமச்சாய்வில் அளவிடப்பட்ட தொலைவோடு), பரிசோதிக்கப்படும் கோட்பாட்டை அநேகமாக திருத்த வேண்டியிருக்கும். முன்னூகிப்பு சரியானதாக இருந்து சராசரி அகற்சி உரிய முறையில் அளவுரு செய்யப்பட்டிருந்தால் தோன்றும் என்று நியாயமான முறையில் எதிர்பார்க்கக்கூடிய மதிப்புக்களின் அளவுகளைத் தாண்டி அவை செல்கின்றன என்பதால் இது அர்த்தமுள்ளதாக இருக்கிறது. பார்க்க முன்னூகிப்பு இடைவெளி.

[தொகு] பயன்பாடு உதாரணம்

மதிப்புக்களின் தொகுப்பினுடைய நியமச்சாய்வை புரிந்துகொள்ளும் நடைமுறை மதிப்பு "சராசரியிலிருந்து" (இடைநிலை) எந்தளவிற்கு மாறுபட்டிருக்கிறது என்பதை ஏற்றுக்கொள்வதில் அடங்கியிருக்கிறது.

[தொகு] காலநிலை

ஒரு எளிய உதாரணமாக, நகரங்களுக்கான சராசரி வெப்பநிலையைக் கவனத்தில் கொள்ளவும். இரண்டு நகரங்களில் ஒவ்வொன்றும் 15 °Cஐக் கொண்டிருக்கையில், கடற்கரைக்கு அருகாமையில் இருக்கும் நகரங்களுக்கான அளவுகள் நாட்டிற்குள்ளாக இருக்கும் நகரங்களைக் காட்டிலும் சிறியதாக இருக்கிறது என்பதைப் புரிந்துகொள்ள உதவியாக இருக்கிறது, இது சராசரி ஒரேவிதமானதாக இருக்கையில் மாறுபாட்டிற்கான வாய்ப்பு கடற்கரையில் இருப்பவற்றைக் காட்டிலும் நாட்டிற்குள்ளாக இருப்பவற்றிற்கு அதிகம் என்பதை தெளிவுபடுத்துகிறது.

எனவே சராசரி 15 என்பது 25 °C உயர் அளவுகளும் 5 °C குறைந்த அளவுகளும் கொண்ட நகரத்திற்கு தோன்றுகிறது என்பதுடன் அதிகபட்சம் 18 மற்றும் குறைந்தபட்சம் 12 கொண்ட மற்ற நகரத்திற்கும் இது தோன்றுகிறது. பரந்தகன்ற மாறுபாட்டைக் கொண்ட நகரத்திற்கான சராசரி மற்றும் அதனால் ஏற்படும் நியமச்சாய்வானது சிறிய மாறுபாட்டையும் குறைந்தளவு நியமச்சாய்வையும் நகரம் கொண்டிருக்கையில் வெப்பநிலை முன்னூகிப்பின் மீதான நம்பகத்தன்மையை வழங்காது என்பதை ஏற்றுக்கொள்ள இந்த சராசரி அகற்சி நமக்கு உதவுகிறது.

[தொகு] விளையாட்டுகள்

விளையாட்டு அணிகளை பரிசீலனை செய்வது இதைக் காண்பதற்கான மற்றொரு முறையாகும். எந்த வகைப்பாட்டுத் தொகுப்பிலும், சில விஷயங்களில் உயர் தரவரிசையையும் மற்ற விஷயங்களில் மோசமான தரவரிசையையும் பெற்ற அணிகள் இருக்கும். வாய்ப்புக்கள் என்னவெனில், களத்தில் முன்னணியில் இருக்கும் அணிகள் இத்தகைய வேற்றுமையைக் காட்டாது, ஆனால் பெரும்பாலான வகைப்பாடுகளில் நன்றாக செயல்படும். ஒவ்வொரு வகைப்பாட்டிலுமான அவற்றின் தரவரிசைகளின் சராசரி அகற்சி குறைவது அவர்கள் மிகவும் சீராகவும் சமநிலையோடும் இருக்க முனைவதைக் காட்டுகிறது. அதேசமயத்தில் அதிக சராசரி அகற்சி கொண்ட அணிகள் மிகவும் முன்னூகிக்கப்பட இயலாதவையாக இருக்கும். உதாரணத்திற்கு, பெரும்பாலான வகைப்பாடுகளில் ஒரே விதத்தில் மோசமாக செயல்படும் அணி குறைவான நியமச்சாய்வைப் பெற்றிருக்கும். பெரும்பாலான வகைப்பாடுகளில் ஒரே சீராக இருக்கும் அணியும்கூட குறைவான நியமச்சாய்வைப் பெற்றிருக்கும். இருப்பினும், அதிகப்படியான நியமச்சாய்வைக் கொண்டிருக்கும் அணி நிறைய புள்ளிகளைப் பெறும் (வலுவான எதிர்ப்பு) வகையைச் சேர்ந்த அணியாக இருக்கலாம் ஆனால் நிறைய விட்டுக்கொடுப்பதாகவும் (பலவீனமான தற்காப்பு) இருக்கலாம், அல்லது அதற்கு நேர்மாறாக, இது மோசமான எதிர்ப்பைக் கொண்டிருக்கலாம் என்றாலும் புள்ளிகளைப் பெறுவதற்கு சிக்கலானதாக இருப்பதன் மூலம் இழப்பீடு செய்யலாம்.

எந்த ஒரு நாளிலும் எந்த அணி வெல்லும் என்பதை முன்னூகிப்பது பல்வேறு அணி "நிலைகளின்" தரவரிசைகளின் நியமச்சாய்வையும் பார்ப்பதை உள்ளிட்டிருக்கலாம் புள்ளிகளைப் பெறுவதன் வலுவான குறிப்பான்களாக இருப்பவற்றை தடுப்பது எது என்பதைப் புரிந்துகொள்வதற்கான முயற்சிக்கான பலங்களுக்கு எதிராக பலவீனங்கள் பொருந்துகின்றவிடத்தில்.

கார் பந்தயத்தில் அடுத்தடுத்த சுற்றுக்களில் ஓட்டுநர் தீர்மானிக்கப்படுகிறார். சுற்று நேரங்களின் குறைவான சராசரி அகற்சிடனான ஓட்டுநர் உயர் சராசரி அகற்சி உள்ள ஓட்டுநரைக் காட்டிலும் அதிக சமச்சீர் நிலையைக் கொண்டவராக இருக்கிறார். இந்தத் தகவல் சுற்றுநேரங்களைக் குறைப்பதற்கான வாய்ப்புக்கள் உள்ள இடத்தைக் புரிந்துகொள்வதற்கு உதவலாம்.

[தொகு] நிதி

நிதித்துறையில் சராசரி அகற்சி என்பது வழங்கப்பட்ட பாதுகாப்புப் பத்திரங்களோடு (பங்குகள், பாண்டுகள், சொத்து மற்றும் இன்னபிற) இணைந்துள்ள அபாயத்தை குறிப்பிடுவதாகும், அல்லது பங்குப்பட்டியல்களோடு (செயல்பாட்டுரீதியில் நிர்வகிக்கப்பட்ட பரஸ்பர நிதிகள், குறியீட்டெண் பரஸ்பர நிதிகள், அல்லது இடிஎஃப்கள்) இணைந்துள்ள அபாயத்தைக் குறிப்பதாகும். முதலீடுகளின் பட்டியலை பயன்மிக்க முறையில் எவ்வாறு கையாளுவது என்பதைப் தீர்மானிப்பதில் அபாயம் என்பது ஒரு முக்கியமான காரணியாகும், ஏனென்றால் சொத்து மற்றும்/அல்லது பங்குப்பட்டியலின் மீதான ஆதாயங்களில் ஏற்படும் மாறுபாடுகளைத் தீர்மானிக்கிறது என்பதுடன் முதலீட்டு முடிவுகளுக்கான கணித அடிப்படையை முதலீட்டாளர்களுக்கு வழங்குகிறது (இடைநிலை-மாறுபாட்டு இணக்கமாக்கம் எனப்படுவது). அபாயத்தின் ஒட்டுமொத்தமான கருத்தாக்கம் இது அதிகரிக்கும்போது சொத்தின் மீதான எதிர்பார்க்கப்பட்ட ஆதாயமானது அபாய பிரீமியம் பெறப்பட்டதன் விளைவாக அதிகரிக்கும் - வேறுவகையில் சொல்வதென்றால், முதலீடு அதிக அளவிலான அபாயத்தைக் கொண்டிருக்கும்போது அல்லது ஆதாயத்தின் நிச்சயத்தன்மை நிலவும்போது முதலீட்டின் மீதான ஆதாயத்தை முதலீட்டாளர் அதிகமாக எதிர்பார்க்க வேண்டும். முதலீடுகளை மதிப்பிடும்போது, முதலீட்டாளர்கள் எதிர்பார்ப்பு ஆதாயம் மற்றும் எதிர்கால ஆதாயங்களின் நிச்சயத்தன்மை ஆகிய இரண்டையுமே மதிப்பிட வேண்டும். எதிர்கால ஆதாயங்களின் நிச்சயத்தன்மையில்லாததின் அளவுரு மதிப்பீட்டை சராசரி அகற்சி வழங்குகிறது.

உதாரணத்திற்கு, ஒரு முதலீட்டாளர் இரண்டு பங்குகளுக்கிடையே ஒன்றை தேர்வு செய்ய வேண்டும் என்று அனுமானிப்போம். கடந்த 20 ஆண்டுகளில் பங்கு A 20 சதவிகிதப் புள்ளிகள் சராசரி அகற்சிடன் 10 சதவிகித சராசரி ஆதாயத்தைக் கொண்டிருக்கிறது, அதே காலகட்டத்தில் பங்கு B 12 சதவிகித ஆதாயத்தையும் ஆனால் 30 சதவிகிதப் புள்ளிகள் உயர் நியமச்சாய்வையும் பெற்றிருக்கிறது. அபாயம் மற்றும் ஆதாயத்தின் அடிப்படையில் ஒரு முதலீட்டாளர் பங்கு A ஐ பாதுகாப்பான தேர்வாக தீர்மானிக்கலாம், ஏனென்றால் பங்கு B இன் 2 சதவிகித புள்ளிகள் ஆதாயம் கூடுதலான 10 சதவிகிதப் புள்ளிகள் நியமச்சாய்விற்கு தகுதியானது அல்ல (எதிர்பார்க்கப்பட்ட ஆதாயத்தின் பெரிய அபாயம் அல்லது நி்ச்சமின்மை). பங்கு B ஆனது ஒரே சூழ்நிலையில் பங்கு A ஐக் காட்டிலும் மிகத்தொடர்ச்சியாக தொடக்க முதலீட்டிற்கும் குறைந்துபோவதற்கான வாய்ப்புள்ளது (ஆனால் தொடக்க முதலீட்டையும் தாண்டிச்செல்கிறது) என்பதுடன் சராசரியின் மீது 2 சதவிகித ஆதாயத்திற்கு மட்டுமே மதிப்பிடப்படுகிறது. இந்த உதாரணத்தில், எதிர்கால வருட ஆதாயங்களின் ஏறத்தாழ மூன்றில் இரண்டு பங்கிற்கு 20 சதவிகிதப் புள்ளி கூடவோ அல்லது குறைவாகவோ ஏறத்தாழ 10 சதவிகித ஆதாயம் கிடைக்கும் என்று பங்கு A எதிர்பார்க்கப்படுகிறது. எதிர்காலத்தில் கிடைக்கக்கூடிய மிக அதிகமாக சாத்தியமுள்ள ஆதாயங்கள் அல்லது முடிவுகளை பரிசீலனை செய்கையில் ஒரு முதலீட்டாளர் 10 சதவிகிதத்துடன் அல்லது குறைவாக 60 சதவிகிதப் புள்ளிகள் அல்லது 70 சதவிகிதம் முதல் (-)50 சதவிகிதம் வரை எதிர்பார்க்க வேண்டும், இது சராசரி ஆதாயத்திலிருந்து மூன்று சராசரி அகற்சிகளுக்கான முடிவுகளை உள்ளிட்டிருக்கிறது (கிட்டத்தட்ட 99.7 சதவிகித சாத்தியமுள்ள ஆதாயங்கள்).

குறிப்பிட்ட கால அளவுகளுக்கு பத்திரத்தின் சராசரி ஆதாயத்தைக் (அல்லது எண்கணித இடைநிலை) கணக்கிடுவது சொத்தின் மீதான எதிர்பார்க்கப்பட்ட ஆதாயத்தை உருவாக்கும். ஒவ்வொரு காலகட்டத்திற்கும், மாறுபாடுகளில் அசல் ஆதாயத்திலிருந்து எதிர்பார்க்கப்பட்ட ஆதாயத்தைக் கழிக்க வேண்டும். சொத்தின் ஒட்டுமொத்த அபாயத்தின் மீதான முடிவின் விளைவைக் கண்டுபிடிக்க ஒவ்வொரு காலகட்டத்திலும் உள்ள மாறுபாட்டை இருமடி செய்யவேண்டும். ஒரு காலகட்டத்திலான மாறுபாட்டின் பெருக்கம் செக்யூரிட்டி அதிக அபாயத்தைக் கொண்டிருப்பதைக் குறிப்பிடுகிறது. இருமடி செய்யப்பட்ட மாறுபாடுகளின் சராசரியை எடுத்துக்கொள்வது சொத்தோடு இணைந்துள்ள ஒட்டுமொத்த அபாய அலகுகளின் அளவீட்டிற்கு காரணமாகிறது. இந்த மாறுபாட்டின் வர்க்க மூலத்தைக் கண்டுபிடிப்பது முதலீட்டின் நியமச்சாய்விற்கு காரணமாகுமா என்பது கேள்வியே.

தொகுப்பாக்க சராசரி அகற்சி பரவலாக ஏற்றுக்கொள்ளப்பட்ட தொழில்நுட்ப பகுப்பாய்வுக் கருவியான போலிங்கர் பேண்ட்களின் பரப்பை அமைப்பதற்கு பயன்படுத்தப்படுகிறது. உதாரணத்திற்கு, மேல்புற போலிங்கர் பேண்ட் பின்வருமாறு வழங்கப்பட்டிருக்கிறது:

\bar{x} + n * \sigma{x}

[தொகு] வடிவகணித பொருள் விளக்கம்

சில வடிவகணிக கூர்நோக்குகளைப் பெறுவதற்கு நாம் மூன்று மதிப்புக்களின் தொகுப்பாக்கத்தோடு தொடங்கலாம், x 1, x 2, x 3. இது பின்வருவதை வரையறுக்கிறது P = (x 1, x 2, x 3) in R 3. இந்த வரிசையை கவனத்தில் கொள்ளவும் L = {({0}r, r , r ) : r in R }. இது மூலம் வழியாக செல்லும் "முக்கிய மூலைவிட்டமாகும்". நமக்கு வழங்கப்பட்ட மூன்று மதிப்புக்கள் சமமானவையாக இருக்கின்றன என்றால் சராசரி அகற்சி பூஜ்ஜியமாகவும் P ஆனது L இலும் இருக்கும். எனவே நியமச்சாய்வானது P முதல் L வரையிலான தொலைவிற்கு தொடர்புடையதாக இருக்கிறது என்பதை அனுமானிப்பது முடியாதது அல்ல. P இல் இருந்து L கோட்டிற்கு செங்கோணமாக நகர்த்துவதில் ஒன்று ஒரு புள்ளியைத் தொடுகிறது:

R = (\overline{x},\overline{x},\overline{x})

நாம் தொடங்கியவற்றுடனான மதிப்புக்களின் ஒத்தநிலைகள் இடைநிலையாக உள்ளவை. P மற்றும் R க்கு இடையிலுள்ள தொலைவு (P மற்றும் கோடு L க்கு இடையிலுள்ள தொலைவைப் போன்றது) σ√3 ஆல் தரப்பட்டுவிடுவதை ஒரு சிறிய அல்ஜீப்ரா காட்டிவிடுகிறது. ஒரு அனலாக்ஸ் சூத்திரம் (3 ஆனது N ஆல் மாற்றீடு செய்யப்படுவது) N மதிப்புக்களின் தொகுப்பாக்கத்திற்கும் செல்லுபடியாகக்கூடியதாக இருக்கிறது; நாம் பிறகு R N இல் செயல்பட வேண்டும். சராசரி அகற்சி

[தொகு] சிபிசேவ்ஸின் சமனின்மை

ஒரு கருத்தறிதல் என்பது இடைநிலையிலிருந்து சில சராசரி அகற்சிகளைக் காட்டிலும் அரிதாக அதிகப்படியானதாக இருக்கிறது. சிபிசேவ்ஸின் சமனின்மை சராசரி அகற்சி வரையறுக்கப்படுகின்ற எல்லா விநியோகங்களுக்குமான எல்லைகளை இன்றியமைததாக்குகிறது.

குறைந்தபட்சம் 50 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து √2 நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.
குறைந்தபட்சம் 75 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து 2 நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.
குறைந்தபட்சம் 89 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து 3 நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.
குறைந்தபட்சம் 94 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து 4 நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.
குறைந்தபட்சம் 96 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து 5 நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.
குறைந்தபட்சம் 97 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து 6 நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.

அத்துடன் பொதுவாக:

குறைந்தபட்சம் (1 − 1/k 2) × 100 சதவிகித மதிப்புக்களாவது இடைநிலையிலிருந்து k நியமச்சாய்விற்குள்ளாக இருக்க வேண்டும்.[5]

[தொகு] சாதாரணமாக விநியோகிக்கப்படும் தரவிற்கான விதிகள்

கருநீலம் இடைநிலையிலிருந்து ஒரு நியமச்சாய்விற்கும் குறைவாக இருக்கிறது.சாதாரண விநியோகத்திற்கு இது தொகுதியின் 68.27 சதவிகிதத்தைப் பெற்றிருக்கிறது; இடைநிலையிலிருந்து (நடுத்தரமான கருநீலம்) இரண்டு சராசரி அகற்சி 95.45 சதவிகிதத்தைக் கொண்டிருக்கிறது; மூன்று சராசரி அகற்சி (லேசான, நடுத்தரமான கருநீலம்) 99.73 சதவிகிதத்தைக் கொண்டிருக்கிறது; நான்கு சராசரி அகற்சி 99.994 சதவிகிதத்தைக் கொண்டிருக்கிறது.இடைநிலையிலிருந்து வந்த ஒரு நியமச்சாய்வாக உள்ள வளைவின் இரண்டு புள்ளிகளும் உட்புறமாய் வளைந்திருக்கும் புள்ளிகளாகும்.

பல தனிப்பட்ட, அடையாளப்பூர்வமாக விநியோகிக்கப்பட்ட தற்போக்கு மாறுபாடுகளின் விநியோக கூடுதல் சாதாரண விநியோகத்தை நோக்கியதாக இருப்பதாக மைய வரையறு தேற்றம் கூறுகிறது. தரவு விநியோகிப்பு ஏறத்தாழ இயல்பானதாக இருந்தால் மதிப்புக்களின் 68 சதவிகிதம் 1 நியமச் சாய்விற்குள்ளாக இருக்கும் (கணிதவியல்ரீதியில், μ இயல்கணித இடைநிலையாக இருக்குமிடத்தில் μ ± σ), ஏறத்தாழ 95 சதவிகித மதிப்புக்கள் இரண்டு நியமச்சாய்விற்குள்ளாக, ஏறத்தாழ 99.7 சதவிகிதம் 3 நியமச்சாய்விற்குள்ளாக இருக்கிறது (μ ± 3σ). இது 68-95-99.7 விதி , அல்லது அனுபவவாத விதி எனப்படுகிறது.

z இன் பல்வேறு மதிப்புக்களுக்கு, சீரமைப்பு இடைவெளி (−z σ, z σ) உள்ளாகவும் வெளியிலும் எதிர்பார்க்கப்படும் மதிப்புக்களின் சதவிகிதம் பின்வருமாறு:

z σ CIக்குள்ளான விகிதாச்சாரம் CIக்கு வெளியிலான விகிதாச்சாரம் CIக்கு வெளியிலான விகிதம்
21 22 1 / 3.1514871
1.645σ 90% 10% 1 / 10
1.960σ 95% 5% 1 / 20
24 4.5500264% 1 / 21.977894
2.576σ 99% 1% 1 / 100
#27 28 1 / 370.398
3.2906σ 99.9% 0.1% 1 / 1000
29 30% 1 / 15,788
99.9999426697% 0.0000573303% 1 / 17,44,278
99.9999998027% 0.0000001973% 1 / 506,800,000
99.999 999 999 7440% 0.0000000002560% 1 / 3,90,60,00,00,000

எல்லைகளுக்குள்ளான சதவிகிதம் பின்வரும் சூத்திரத்தால் வரையறுக்கப்படுகிறது: %perc = erf(  / √2) × 50% + 50%

[தொகு] நியமச்சாய்விற்கும் இடைநிலைக்கும் இடையிலுள்ள உறவு

ஒரு தரவுத் தொகுதியின் இடைநிலை மற்றும் சராசரி அகற்சிகள் ஒன்றாகவே தெரிவிக்கப்படுகின்றன. ஒரு குறிப்பிட்ட பொருளில், தரவின் மையம் ஏறத்தாழ இடைநிலையை அளவிடுகிறது என்றால் சராசரி அகற்சி புள்ளிவிவர கலைவின் "இயல்பான" அளவீடாக இருக்கிறது. இடையீட்டினால் ஏற்படும் சராசரி அகற்சி வேறு எந்த புள்ளியிலிருந்தும் கிடைப்பவற்றைக் காட்டிலும் சிறியதாக இருக்கிறது. துல்லியமான அறிக்கை பின்வருமாறு: ஒருவேளை x 1, ..., x n இயல்பெண்களாக வரையறை செய்யும் செயல்பாடு:

\sigma(r) = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - r)^2}.

நுண்கணிதத்தைப் பயன்படுத்துவது அல்லது இந்த ஸ்கொயரை முழுமையாக்குவதன் மூலம் இடைநிலையில் σ(r ) பிரத்யேகமான குறைந்தபட்ச அளவைக் கொண்டிருப்பதைக் காட்டுவது சுலபம்:

r = \overline{x}.\,

மாதிரியின் மாறுபாட்டுக் குணகம் இடைநிலைக்கான நியமச்சாய்வின் விகிதமாக இருக்கிறது. நெருக்கமாக ஒன்றிணைந்துள்ள இடையீடுகளுடன் தொகுப்பாங்களுக்கு இடையிலுள்ள மாறுபாட்டு அளவோடு ஒப்பிடுவதற்கு பயன்படுத்தப்படுகின்ற இது பரிணாமமற்ற எண் ஆகும். ஒரேவிதமான சராசரி அகற்சிகளும் வேறுபட்ட இடைநிலைகளும் உள்ள தொகுப்பாக்கங்களை நீங்கள் ஒப்பிட்டால் மாறுபாட்டின் குணகம் சிறிய இடைநிலையுடனான தொகுப்பாத்திற்கு பெரியதாக இருக்கும் என்பதே இதற்கான காரணம். இவ்வாறு தரவு மாறுபாட்டை ஒப்பிடுவதில் மாறுபாட்டின் குணகம் கவனத்தோடு பயன்படுத்தப்பட வேண்டும் என்பதோடு வேறு முறைக்கு மாற்றியமைப்பதே சிறந்தது.

விநியோகிப்பை மாதிரியாக்குவதன் மூலம் நாம் இடைநிலையை பெற விரும்பினால் இடைநிலையின் சராசரி அகற்சி பின்வருவனவற்றால் விநியோகிப்பின் நியமச்சாய்வை சார்ந்ததாக இருக்கிறது

 \sigma_{\text{mean}}=\frac{\sigma}{\sqrt{N}}

இடைநிலையை மதிப்பிட பயன்படுத்தப்படும் மாதிரியில் கருத்தறிதல் எண்ணாக N உள்ள நிலையில்.

[தொகு] விரைவான கணக்கீட்டு முறை

மேலும் பார்க்க: Algorithms for calculating variance

பின்வரும் இரண்டு சூத்திரங்கள் செயல்படு (தொடர்ச்சியான) நியமச்சாய்வைக் குறிப்பிடுவனவாக இருக்கலாம். x இன் N மதிப்புக்களின் தொகுப்பின் ஊடாக கணக்கிடப்படும் மூன்று ஆற்றல் தொகைகள் s 0,1,2 x k என்று குறிப்பிடப்படுகின்றன.

\ s_j=\sum_{k=1}^N{x_k^j}.

s 0 ஆனது x ஐ ஜீரோ ஆற்றலுக்கு உயர்த்துகிறது என்பதுடன் x 0 எப்போதுமே 1, s 0 ஆனது N க்கு மதிப்பிடப்படுகிறது.

இந்த மூன்று செயல்படு கூட்டுத்தொகைகளின் வழங்கப்பட்ட முடிவுகளில், s 0,1,2 மதிப்புக்கள் செயல்படு நியமச்சாய்வின் தற்போதைய மதிப்பை கணக்கிடுவதற்கு எப்போது வேண்டுமானாலும் பயன்படுத்தப்படலாம். s j க்கான இந்த வரையறை இரண்டு வெவ்வேறு பகுதிகளைக் குறிப்பிடுவதாக இருக்கலாம் (கூட்டுத்தொகை கணக்கீடு s j , மற்றும் \sigma கணக்கீடு).

\sigma= \frac{1}{s_0}\sqrt{s_0s_2-s_1^2}

இதேபோன்று மாதிரி நியமச்சாய்விற்கு,

s = \sqrt{\frac{s_0s_2-s_1^2}{s_0(s_0-1)}}.

கணிப்பொறி அமலாக்கத்தில் மூன்று s j கூட்டுத்தொகைகள் பெரிதடைகிறது என்பதால், நாம் ரவுண்ட்-ஆஃப் பிழை, எண்கணிக மிகையோட்டம், மற்றும் எண்கணித குறையோட்டம் ஆகியவற்றை பரிசீலனைக்கு எடுத்துக்கொள்ள வேண்டும். கீழேயுள்ள முறை குறைக்கப்பட்ட ரவுண்டிங் பிழைகளோடு செயல்படு கூட்டுத்தொகைகளை கணக்கிடுகிறது:

 A_0=0\,
 A_i=A_{i-1}+\frac{x_i-A_{i-1}}{i}

A என்பது இடைநிலை மதிப்பாக இருக்குமிடத்தில்.

 Q_0=0\,
 Q_i=Q_{i-1}+\frac{i-1}{i} (x_i-A_{i-1})^2\,

அல்லது

 Q_i=Q_{i-1}+ (x_i-A_{i-1})(x_i-A_i)\,

மாதிரி மாறுபாடு:

 s^2_n=\frac{Q_n}{n-1}

நியம மாறுபாடு

 \sigma^2_n=\frac{Q_n}{n}.

[தொகு] எடைமான கணக்கீடு

xi மதிப்புக்கள் சமமற்ற எடைமானங்களான wi உடன் எடைமானக் கணக்கிடப்படும்போது ஆற்றல் கூட்டுத்தொகைகளான s 0,1,2 ஒவ்வொன்றும் பின்வருமாறு கணக்கிடப்படுகிறது:

\ s_j=\sum_{k=1}^N{w_i x_k^j}.\,

சராசரி அகற்சி சமன்பாடு மாற்றமின்றியே இருக்கிறது. s 0 இப்போது எடைமானங்களின் கூட்டுத்தொகையாகவும் N மாதிரிகளின் எண்ணாகவும் இல்லாதிருப்பதை கவனிக்கவும்.

குறைக்கப்பட்ட ரவண்டிங் பிழைகளுடனான பெருக்க முறையும் மேலும் சில சிக்கல்களோடு பயன்படுத்தப்படலாம்.

எடைமானங்களின் செயல்படு கூட்டுத்தொகை பின்வருமாறு கணக்கிடப்பட வேண்டும்:

W_0 = 0\,
W_i = W_{i-1} + w_i\,

மேலே பயன்படுத்தப்பட்டுள்ள 1/i ஆனது wi /Wi ஆல் மாற்றீடு செய்யப்பட வேண்டும்:

A_0 = 0\,
A_i = A_{i-1}+\frac{w_i}{W_i}(x_i-A_{i-1})\,
Q_0 = 0\,
Q_i =Q _{i-1} + \frac{w_i W_{i-1}}{W_i}(x_i-A_{i-1})^2 = Q_{i-1}+w_i(x_i-A_{i-1})(x_i-A_i)\,

இறுதிப் பிரிவில்,

\sigma^2_n=\frac{Q_n}{W_n}\,

மற்றும்

s^2_n = \frac{n'}{n'-1}\sigma^2_n\,

n என்பது ஆக்கக்கூறுகளின் மொத்த எண்ணாக இருக்கையிலும், n' என்பது ஜீரோ-அல்லாத எடைமானங்களோடு ஆக்கக்கூறுகளின் எண்ணாக இருக்கையிலும். மேலேயுள்ள சூத்திரங்கள் எடைமானங்கள் 1க்கு சமமானதாக எடுத்துக்கொள்ளப்பட்டால் மேலே தரப்பட்டுள்ள எளிதான சூத்திரங்களுக்கு சமமானதாகிறது.

[தொகு] வரம்புகள்

இடைநிலைகளைப் போன்று இல்லாது சராசரி அகற்சிகள் ஒன்றிணைக்கப்பட இயலாதவை என்பது அதனுடைய ஒரு வரம்புகளில் ஒன்றாகும். உதாரணத்திற்கு, சராசரி அமெரிக்க ஆணின் 70 அங்குல இடைநிலை உயரம் (சராசரி அகற்சி 3) மற்றும் சராசரி அமெரிக்க பெண்ணின் 65 அங்குல இடைநிலை உயரம் (சராசரி அகற்சி 2) நமக்குத் தெரியவருகிறது என்றால் பொதுவாக (பால்வேறுபாடு இன்றி) அமெரிக்கர்களின் இடைநிலை மற்றும் நியமச்சாய்வை தெரிந்துகொள்ள வேண்டும் என்ற ஆர்வம் எல்லோருக்கும் ஏற்படுவது இயல்பானதே. அமெரிக்கரின் இடைநிலையை ஒவ்வொன்றிற்கும் 0.5 என்பதன் மூலம் பெண்களுக்கான இடைநிலையைப் பெருக்குவதன் மூலம் (ஆண்களும் பெண்களும் அமெரிக்க மக்கள்தொகையில் 50 சதவிகிதமாக இருக்கிறார்கள் என்பதால்) பெறலாம் என்பதோடு இந்த கூட்டுத்தொகையை இரண்டு முடிவுகளுக்கு எடுத்துச்செல்லலாம்: 70(0.5) + 65(0.5)= 67.5; இருப்பினும் அமெரிக்கர்களின் சராசரி அகற்சி 3(0.5)+ 2(0.5)= 2.5 என்பதாக இருப்பதில்லை. இதற்கு மாற்றாக, அமெரிக்கர்களின் சராசரி அகற்சி ஆண்களுக்கோ அல்லது பெண்களுக்கோ உரிய நியமச்சாய்வைக் காட்டிலும் பெரியதாக இருக்கலாம், ஏனென்றால் இரண்டு பாலினங்களின் மாறுபாடுகளையும் இது உள்ளிட்டிருக்கிறது. வெவ்வேறு துணைத்தொகுப்பாக்கங்களுக்கான சராசரி அகற்சிகளை ஒன்றிணைப்பதற்கு அறியப்பட்ட முறை என்று எதுவுமில்லை.

[தொகு] மேலும் பார்க்க

  • நுட்பமும் துல்லியமும்
  • மாறுபாட்டைக் கணக்கிடுவதற்கான இலக்கமானம்
  • இடவமைப்பு மற்றும் அளவை நிலையளவுருவிலான சமனின்மை
  • பெஸல்ஸ் பிழைநீக்கம்
  • செபிஸேவ்ஸ் சமனின்மை
  • கான்ஃபிடன்ஸ் இண்டர்வெல்
  • குமுலண்ட்
  • சாய்வு (புள்ளியியல்)
  • பிழை சட்டகம்
  • வடிவகணித சராசரி அகற்சி
  • கர்ட்டாஸிஸ்
  • இடைநிலை முற்றான பிழை
  • இடைநிலை
  • மைய சராசரி
  • தொகுப்பாக்கப்பட்ட சராசரி அகற்சி
  • பண்படுத்தப்படாத மதிப்பெண்கள்
  • வர்க்கமூல இடைநிலை இருமடி
  • மாதிரி அளவு
  • சாமுவேல்ஸன் சமனின்மை
  • செறிவாக்கம் (வண்ணக் கோட்பாடு)
  • ஸ்கீனெஸ்
  • நியமப் பிழை
  • நியம மதிப்பெண்
  • நியமச்சாய்வின் நடுநிலையான மதிப்பீடு
  • மாறுபாடு
  • எளிதில் மாறும் தன்மை (நிதி)
  • காற்று திசையின் நியமச்சாய்வை கணக்கிடுவதற்கான யமார்டினோ முறை

[தொகு] பார்வைக் குறிப்புகள்

  1. Pearson, Karl (1894). "On the dissection of asymmetrical frequency curves". Phil. Trans. Roy. Soc. London, Series A 185: 719–810. 
  2. Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 0-19-920613-9. 
  3. Miller, Jeff. "Earliest Known Uses of Some of the Words of Mathematics".
  4. தாஸ்குப்தா & ஹாஃப் (2006), "அஸிம்டோடிக் எக்ஸ்பேன்ஸன்ஸ் ஃபார் காரலேஷன்ஸ் பெட்வீன் டிஃபரண்ட் மெஷர்ஸ் ஆஃப் ஸ்பிரட்". ஜர்னல் ஆஃப் ஸ்டேடிஸ்டிகல் பிளானிங் அண்ட் இன்ஃபரன்ஸ் . தொகுப்பு. 136, பக். 2197–2213
  5. கேரமனி, சயீத் (2000). ஃபண்டமண்டல்ஸ் ஆஃப் பிராபபிலிட்டி (2வது பதிப்பு). பிரின்டைஸ் ஹால்: நியூஜெர்ஸி. ப. 438.

[தொகு] வெளிப்புற இணைப்புகள்

"http://ta.wikipedia.org/w/index.php?title=சராசரி_அகற்சி&oldid=1022509" இருந்து மீள்விக்கப்பட்டது
சொந்தப் பயன்பாட்டுக் கருவிகள்
பெயர்வெளிகள்

மாற்றுக்கள் மாற்றுருவங்கள்
செயல்கள்
வழிசெலுத்தல்
கருவிப் பெட்டி
மற்ற மொழிகளில்