நியமவிலகல்

கட்டற்ற கலைக்களஞ்சியமான விக்கிப்பீடியாவில் இருந்து.
(திட்ட விலக்கம் இலிருந்து வழிமாற்றப்பட்டது)
தாவிச் செல்லவும்: வழிசெலுத்தல், தேடல்
இயல்நிலைப் பரவல் வரைபடத்தில் ஒவ்வொரு வண்ணமிடப்பட்ட பட்டையும் 1 நியமவிலகல் அகலம் கொண்டுள்ளது.
சராசரி 50 (நீலநிறத்தில் காட்டப்பட்டுள்ளது) கொண்ட தரவுத் தொகுதியின் நியமவிலகல் (σ) 20.

புள்ளியியல் மற்றும் நிகழ்தகவுக் கோட்பாட்டில், நியமவிலகல் அல்லது திட்ட விலக்கம் (standard deviation, σ) என்பது, ஒரு தரவிலுள்ள ஒவ்வொரு மதிப்பும் அத்தரவின் சராசரி மதிப்பிலிருந்து எவ்வளவு விலகி உள்ளது என்பதைக் கணிப்பதாகும். இக்கருத்துரு, நிகழ்தகவுக் கோட்பாடு, புள்ளிவிவர தொகுப்பாக்கம், நிகழ்தகவுப் பரவல் (probability distribution) ஆகிய பல துறைகளில் அடிப்படைக் கருத்தாகப் பயன்படுகின்றது. நியமவிலகல், பரவற்படியின் வர்க்கமூலமாக அமைகிறது. பரவற்படி போன்று இல்லாமல், தரவின் அலகிலேயே அமைவது, நியமவிலகலின் ஒரு சிறப்புப் பண்பு.

தரவின் ஒவ்வொரு தரவுப் புள்ளியும் அத் தரவின் சராசரியில் இருந்து மாறுபடும் அளவினை வர்க்கப்படுத்தி, பின் அவ்வாறு கிடைக்கும் வர்க்கங்களின் சராசரியின் வர்க்கமூலம் காணக் கிடைக்கும் அளவு, அத்தரவின் நியமவிலகல் ஆகும். ’மாறுபாடு’ அல்லது ’பரவல்’ ன் அளவீடாக நியமவிலகல் பயன்படுத்தப்படுகிறது. பொதுவாகச், சராசரியிலிருந்து தரவு எந்தளவிற்கு மாறுபட்டிருக்கிறது என்பதை நியமவிலகலின் மதிப்புக் காட்டுகிறது. குறைவான நியமவிலகல், தரவுப் புள்ளிகள் சராசரிக்கு மிகவும் நெருங்கிச் செல்பவையாக இருப்பதையும், அதிக அளவு நியமவிலகல் தரவு பரந்து விரிந்திருக்கிறது என்பதையும் காட்டும்.

தரவுகளின் மாறுபாட்டைக் காண்பதற்கு மட்டுமின்றி, புள்ளிவிவரங்களின் வாயிலாக அடையப்படும் முடிவுகளின் நம்பகத்தன்மையை அளவிடுவதற்கும் நியமவிலகல் பயன்படுகிறது. எடுத்துக்காட்டாக, ஓட்டெடுப்பு தரவின் பிழை விளிம்பானது அதே ஓட்டெடுப்பு பல்வேறு முறை நடத்தப்பட்டால் கிடைக்கக்கூடிய முடிவுகளின் தரவின் எதிர்நோக்கு நியமவிலகலைக் கணக்கிடுவதன் மூலம் தீர்மானிக்கப்படுகிறது. அவ்விதம் காணப்படும் பிழை விளிம்பு நியமவிலகலைக் காட்டிலும் இரண்டு மடங்காக, அதாவது நம்பக இடைவெளியின் ஆரத்தின் 95 சதவிகித அளவாக இருக்கும். அறிவியலில், பொதுவாக ஆராய்ச்சியாளர்கள் பரிசோதனை மூலம் கிடைக்கும் தரவின் நியமவிலகலையே தெரிவிக்கின்றனர் என்பதோடு நியமவிலகலின் வீச்சிலிருந்து வெகுதொலைவில் அமையும் விளைவுகள் மட்டுமே புள்ளிக் குறிப்பியல் நோக்கில் முக்கியத்துவம் வாய்ந்தவையாகக் கருதப்படுகின்றன. பொருளியலிலும் நியமவிலகல் முக்கியத்துவம் கொண்டுள்ளது. ஒரு குறிப்பிட்ட முதலீட்டில் கிடைக்கும் ஆதாய வட்டிவிகிதத் தரவின் நியமவிலகல், அம்முதலீட்டின் மாறக்கூடிய நிலையின் (volatility) அளவீடாக அமையும்.

ஒரு முழுமைத்தொகுதியின் மாதிரித் தரவு மட்டுமே கிடைக்கும் என்ற நிலையில், முழுமைத்தொகுதியின் நியமவிலகல், மாதிரி நியமவிலகல் எனப்படும் மேம்படுத்தப்பட்ட அளவுருவினால் கணக்கிடப்படுகிறது.

பொருளடக்கம்

வரலாறு[தொகு]

1894 ஆம் ஆண்டில் கார்ல் பியர்சனால்[1] அவரது விரிவுரைகளைத் [2] தொடர்ந்து அவரது படைப்புகளில் முதன்முதலாக நியமவிலகல் என்ற சொல், பயன்படுத்தப்பட்டது. இதே கருத்தாக்கத்திற்கு வழங்கப்பட்டு வந்த பழைய பெயர்களுக்கு மாற்றீடாகவும் இச்சொல் அமைந்துள்ளது. எடுத்துக்காட்டாக காஸ், நியமவிலகல் தரும் அதே கருத்துருவைக் குறிக்க ’இடைநிலைப் பிழை’ என்ற பெயரைப் பயன்படுத்தியிருந்தார்.[3]

அடிப்படை எடுத்துக்காட்டுகள்[தொகு]

பின்வரும் மதிப்புக்களைக் கொண்ட தரவினை எடுத்துக்கொள்வோம்:

2,\;4,\;4,\;4,\;5,\;5,\;7,\;9.

இந்த 8 தரவுப்புள்ளிகளின் சராசரி மதிப்பு :

\frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

சராசரியிலிருந்து ஒவ்வொரு தரவுப் புள்ளிக்குமான வேறுபாட்டை முதலில் கணக்கிட்டு அதன் முடிவை இருமடி ஆக்க ( கூடுதல் குறைதல் என்பதைக் கொள்ளாமல், மாறுபாட்டின் பரும அளவை மட்டும் கருத்தில் கொள்ள இருமடியாக்கப்படுகிறது):


\begin{array}{ll}
(2-5)^2 = (-3)^2 = 9 & (5-5)^2 = 0^2 = 0 \\
(4-5)^2 = (-1)^2 = 1 & (5-5)^2 = 0^2 = 0 \\
(4-5)^2 = (-1)^2 = 1 & (7-5)^2 = 2^2 = 4 \\
(4-5)^2 = (-1)^2 = 1 & (9-5)^2 = 4^2 = 16
\end{array}

பின்னர் இந்த வேறுபாடு மதிப்புக்களின் கூடுதலை எத்தனைத் தரவுகள் உள்ளனவோ அவற்றால் வகுத்து நியமவிலகலை அளிப்பதற்கான வர்க்க மூலம் காண நியமவிலகலின் மதிப்பு கிடைக்கிறது:

 \sigma = \sqrt{\frac{9+1+1+1+0+0+4+16}{8}} = 2.

மேற்கண்ட தரவு முழுமைத்தொகுதியாக (population) இருந்தால் மட்டுமே இம்முறையில் நியமவிலகல் காணலாம். அவ்வாறு காணப்படும் நியமவிலகல், முழுமைத்தொகுதி நியமவிலகல் ஆகும்.

அவ்வாறின்றி எடுத்துக்கொண்ட தரவு, மாதிரித் தரவாக (sample) இருந்தால்:

சராசரியிலிருந்து ஒவ்வொரு தரவுப்புள்ளிக்கும் உள்ள வித்தியாசங்கள் கண்டுபிடித்து, அவற்றின் வர்க்கங்களின் கூடுதலை 7 ஆல் வகுத்துப் பின் வர்க்கமூலம் காண நியமவிலகல் கிடைக்கும் (8 தரவுப் புள்ளிகளுக்கு இடையேயுள்ள இடைவெளிகளின் எண்ணிக்கை = 8-1 = 7). இந்த நியமவிலகல், மாதிரி நியமவிலகல் எனப்படும்.

மற்றொரு எடுத்துக்காடு: அமெரிக்காவில் ஒரு வயது வந்த ஆணின் உயரத்தின் சாராசரி 70", நியமவிலகல் 3", மேலும் அமெரிக்க வயதுவந்த ஆண்களின் உயரம் என்னும் சமவாய்ப்புமாறி ஒரு இயல்நிலைப் பரவலாக அமையுமானால்:

அமெரிக்காவிலுள்ள ஆண்களின் உயரம் பின்வருமாறு அமையும்:

  • 68 சதவீதத்தினரின் உயரம் (70-3,70+3) = (67"–73") இடைவெளியிலும்
  • 95 சதவீதத்தினரின் உயரம் (70-6,70+6) = (64"–76") இடைவெளியிலும்
  • 99.7 சதவீதத்தினரின் உயரம் (70-9,70+9) = (61"–79") இடைவெளியிலும் அமையும்.

நியமவிலகலின் மதிப்பு பூச்சியமாக இருந்தால் அனைவரின் உயரமும் சரியாக 70" ஆக இருக்கும். நியமவிலகலின் மதிப்பு 20" எனில், அவர்களின் உயரம் மிகுந்த அளவில் (50"–90") வேறுபடும்.

வரையறை[தொகு]

நிகழ்தகவுப் பரவல் அல்லது சமவாய்ப்பு மாறி[தொகு]

X என்ற சமவாய்ப்பு மாறியின் கூட்டுச்சராசரி μ எனில்:

\operatorname{E}[X] = \mu\,\!

இங்கு செயலி E, X இன் சராசரி அல்லது எதிர்பார்ப்பு மதிப்பைக் குறிக்கிறது.

X இன் நியமவிலகல் பின்வருமாறு அமைகிறது:

\sigma = \sqrt{\operatorname{E}\left[(X - \mu)^2\right]}.

அதாவது, நியமவிலகல் σ (சிக்மா) (Xμ )2 இன் சராசரி மதிப்பினுடைய வர்க்க மூலம் ஆகும்.

ஒரு நிகழ்தகவுப் பரவலின் நியமவிலகல் அப்பரவலின் சமவாய்ப்பு மாறியின் நியமவிலகலாகவே இருக்கும். அனைத்து சமவாய்ப்பு மாறிகளுக்கும் எதிர்பார்ப்பு மதிப்பு இருக்க வேண்டிய அவசியமில்லாததால் அவ்வாறன சமவாய்ப்பு மாறிகளுக்கு நியமவிலகல் கிடையாது. கோஷி பரவலில் அமையும் சமவாய்ப்பு மாறி இதற்கு எடுத்துக்காட்டாக அமையும்.

தனித்த சமவாய்ப்பு மாறி[தொகு]

தனித்த சமவாய்ப்பு மாறி X இன் மதிப்புகள் x_1, x_2, \ldots, x_N ஆகவும் அவற்றுக்கான நிகழ்தகவுகள் சமமாகவும் அமைந்தால் X இன் நியமவிலகல்:

\sigma = \sqrt{\frac{(x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2}{N}},

அல்லது, கூட்டுத்தொகை குறிப்பீட்டைப் பயன்படுத்தி,

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2},

சமமான நிகழ்தவிற்குப் பதிலாக வெவ்வேறான நிகழ்தகவுகளைக் பின்வருமாறு கொண்டிருந்தால்:

x1 இன் நிகழ்தகவு p1,
x2 இன் நிகழ்தகவு p2, .......
xN இன் நிகழ்தகவு pN.
\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2} , {\rm \ \ where\ \ } \mu = \sum_{i=1}^N p_i x_i.

தொடர்ச்சியான சமவாய்ப்பு மாறி[தொகு]

தொடர்ச்சியான மெய்மதிப்புச் சமவாய்ப்பு மாறி X இன் நிகழ்தகவு அடர்த்திச் சார்பு p(x) எனில் X இன் நியமவிலகல்:

\sigma = \sqrt{\int_\mathbf{X} (x-\mu)^2 \, p(x) \, dx}, {\rm \ \ where\ \ } \mu = \int_\mathbf{X} x \, p(x) \, dx,

எடுத்துக்காட்டு[தொகு]

3, 7, 7, மற்றும் 19 மதிப்புக்களைக் கொண்டிருக்கும் தரவுத் தொகுதியின் நியமவிலகலை நாம் கண்டுபிடிக்க விரும்புகிறோம் என்றால்.

படி-1: 3, 7, 7, 19 இன் சராசரியை கண்டுபிடிக்கவும்

\frac{3+7+7+19}{4} = 9.

படி-2: சராசரியில் இருந்து ஒவ்வொரு எண்ணிற்குமான விலகலைக் (அகற்சியைக்) கண்டுபிடிக்கவும்,

 \begin{align} 3 - 9  = -6 \\ 7 - 9  = -2 \\ 7 - 9  = -2 \\ 19 - 9  = 10. \end{align}

படி-3: ஒவ்வொரு தரவும் சராசரியில் இருந்து அகலும் அல்லது விலகும் திசையை (குறைவா, கூடுதலா) என்னும் செய்தியை நீக்க ஒவ்வொரு அகற்சியையும் (விலகலையும்) இருமடி செய்யவும் (கழித்தல் திசையுள்ள எண்கள் இதனால் நேர்ம எண்களாகவும் மாறிவிடும்):

 \begin{align} (-6)^2  = 36 \\ (-2)^2 & = 4 \\ (-2)^2  = 4 \\ 10^2 & = 100. \end{align}

படி-4: இருமடி செய்யப்பட்ட விலக்கங்களின் அல்லது அகற்சிகளின் சராசரியைக் கண்டுபிடிக்கவும்,

 \frac{36+4+4+100}{4} = 36.

படி-5: வர்க்கமூலம் காணும்பொழுது நேர்ம மதிப்புள்ளதை எடுத்துக்கொள்ளவும் (முன்பு இருமடி ஆக்கியதால் அவற்றின் வர்க்கமூலம் எடுப்பதன் மூலம் அகற்சியீன் அளவை அறிகின்றோம்),

\sqrt{36} = 6.\,

ஆகவே இந்த தரவின் நியமவிலகல் 6 ஆகும்.

இந்த எடுத்துக்காட்டின் படி கிடைக்கும் நியமவிலகலானது பொதுவாக தனிய மாறுபாடு (absolute deviation) என்னும் மற்றொரு கணக்கீடு தரும் சராசரி விலகலில் இருந்து மாறுபடுகின்றது என்பதையும் காட்டும் (இந்தத் தனிய மாறுபாடு இவ்வெடுத்துக்காட்டில் 5 ஆக உள்ளது; இந்தத் தனிய மாறுபாடு என்பது சராசரியில் இருந்து தரவுகள் மாறுபடும் அளவை இருமடியாக்காமல் அதன் திசைநீக்கிய பரும அளவை மட்டும் காணும் முறை).

சூத்திரத்தை எளிதாக்குதல்[தொகு]

இருமடி செய்யப்பட்ட சாய்வுகளின் கூடுதல் கணக்கீட்டை பின்வருமாறு எளிதாக்கலாம்:

\begin{align} \sum_{i=1}^N (x_i - \overline{x})^2 & = {} \sum_{i=1}^N (x_i^2 - 2 x_i\overline{x} + \overline{x}^2) \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - \left(2 \overline{x} \sum_{i=1}^N x_i\right) + N\overline{x}^2 \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - 2 \overline{x} (N\overline{x}) + N\overline{x}^2 \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - 2N\overline{x}^2 + N\overline{x}^2 \\ & {} = \left(\sum_{i=1}^N x_i^2\right) - N\overline{x}^2. \end{align}

நியமவிலகலின் கணக்கிடுதலை எளிதாக்க, அசல் சூத்திரத்திற்குப் பதில் பின்வருவதைப் பயன்படுத்தலாம்:

 \sigma = \sqrt{\frac{1}{N} \left(\left(\sum_{i=1}^N x_i^2\right) - N\overline{x}^2\right)} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - \overline{x}^2}.

முழுமைத்தொகுதியின் நியமவிலகல் மதிப்பிடுதல்[தொகு]

முழுத்தொகுதியின் ஒவ்வொரு உறுப்பினரையும் மாதிரிகாண (sampled) முடியுமானால் அத்தொகுதி முழுமைக்குமான நியமவிலகலைக் கணக்கிடலாம். அது இயலாத போது முழுமைத்தொகுதியிலிருந்து சமவாய்ப்பு முறையில் எடுக்கப்பட்ட ஒரு மாதிரித் தரவின் நியமவிலகல் கணக்கிடப்படுகிறது. அவ்வாறு காண்பதற்கான கணக்கீட்டு முறைகள் கீழே தரப்படுகின்றன.

மாதிரியாக்கத்தின் நியமவிலகலினால்[தொகு]

σ இன் மதிப்பாக சிலபோது பயன்படுத்தப்படும் மாதிரியின் நியமவிலகலானது s n ஆல் குறிப்பிடப்பட்டு பின்வருமாறு வரையறுக்கப்படுகிறது:

 s_n = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}.

இந்த மதிப்பான் "மாதிரி நியமவிலகலைக்" காட்டிலும் சிறியளவில் சீரான சராசரி வர்க்கப்பிழையைக் கொண்டதாக இருக்கிறது. முழுமைத்தொகுதி இயல்நிலைப் பரவலாக அமையும்பொழுது அதிகஅளவாக-ஒத்தத்தன்மை மதிப்பீடாக இருக்க்கூடிய இந்த மதிப்பான், மாதிரியின் அளவு சிறியதாக அமையும்பொழுது குறைபட்ட மதிப்பான் ( biased estimator) ஆக அமைகிறது.

மாதிரி நியமவிலகலினால்[தொகு]

σ - காண பெரும்பாலும் முக்கியமாக பயன்படுத்தப்படும் மதிப்பான் "s" ஆனது பின்வருமாறு வரையறுக்கப்பட்டுள்ளது:

 s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2},

\scriptstyle\{x_1,\,x_2,\,\ldots,\,x_N\} மாதிரியாகவும் \scriptstyle\overline{x} அதன் சராசரியாகவும் உள்ளன. இது மாதிரி நியமவிலகல் என அழைக்கப்படுகிறது.

N − 1 என்ற வகுக்கும் எண் மீதிகளின் திசையன்களின் சுதந்திர அளவுகளின் எண்ணுக்கு ஒத்ததாக உள்ளது.

\scriptstyle(x_1-\overline{x},\,\dots,\,x_N-\overline{x}).


N க்கு பதிலாக N − 1 ஐ பயன்படுத்தும் இந்த சரிசெய்தல், பெஸல்ஸ் சரிசெய்தல் எனப்படுகிறது. முழுமைத்தொகுதியிலிருந்து மாதிரித் தரவின் உறுப்புகள் திருப்பி வைக்கப்படும் முறையில் சார்பிலா முறையில் எடுக்கப்பட்டிருந்தால், முழுமைத்தொகுதியின் நியமவிலகல் σ2 க்கான நடுநிலையான மதிப்பானாக s 2 இருக்கிறது என்பதே இந்த சரிசெய்தலுக்கான காரணமாகும்.

பண்புகளும் முற்றொருமைகளும்[தொகு]

மாறிலி c மற்றும் சமவாய்ப்பு மாறிகள் X மற்றும் Y :

 \operatorname{stdev}(c) = 0 \,
 \operatorname{stdev}(X + c) = \operatorname{stdev}(X) \,,
 \operatorname{stdev}(cX) = |c|\,\operatorname{stdev}(X) \,,

இரு சமவாய்ப்பு மாறிகளின் கூடுதலின் நியமவிலகலை அவற்றின் தனித்தனி நியமவிலகல்கள் மற்றும் அவற்றின் உடன் மாறுபாட்டெண்ணுடன் தொடர்புபடுத்தலாம்:

 \operatorname{stdev}(X + Y) = \sqrt{\operatorname{var}(X) + \operatorname{var}(Y) + 2\operatorname{cov}(X,Y)} \,,

\operatorname{stdev}(X) = \sqrt{E[(X-E(X))^2]} = \sqrt{E[X^2] - (E[X])^2}.

மாதிரி நியமவிலகல் காண:


\operatorname{stdev}(X) = \sqrt{\frac{N}{N-1}} \sqrt{E[(X-E(X))^2]}.

சமமான நிகழ்தகவு கொண்ட முடிவுறு முழுமைத்தொகுதியின் நியமவிலகல் காண:


\sqrt{\frac{1}{N}\sum_{i=1}^N(x_i-\overline{x})^2} = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2\right) - \overline{x}^2} = \sqrt{\frac{1}{N} \sum_{i=1}^N x_i^2 - \left(\frac{1}{N} \sum_{i=1}^{N} x_i\right)^2}.

பொருள்விளக்கமும் பயன்பாடும்[தொகு]

பெரிய நியமவிலகல் தரவுப் புள்ளிகள் சராசரியிலிருந்து தொலைவில் இருக்கின்றன என்பதையும், சிறிய நியமவிலகல் அவை சராசரிக்கு வெகு நெருக்கமாக நிரம்பியிருக்கின்றன என்பதையும் காட்டுகிறது.

உதாரணத்திற்கு பின்வரும் முழுத்தொகுதிகள் {0, 0, 14, 14}, {0, 6, 8, 14} மற்றும் {6, 6, 8, 8} ஒவ்வொன்றிற்கும் சராசரி 7. அவற்றின் நியமவிலகல்கள் முறையே 7, 5, மற்றும் 1. மூன்றாவது தொகுப்பாக்கம் மற்ற இரண்டைக் காட்டிலும் மிகச்சிறிய நியமவிலகல் கொண்டுள்ளது. ஏனென்றால் அதனுடைய மதி்ப்புக்கள் அனைத்தும் சராசரி 7 -க்கு நெருக்கமாக இருக்கின்றன. ஒரு தரவின் தரவுப் புள்ளிகள் சராசரியிலிருந்து எந்த அளவிற்கு தொலைவில் இருக்கிறது என்பதை நியமவிலகல் நமக்குச் சொல்கிறது. மேலும் நியமவிலகல் தரவுப்புள்ளிகளின் அலகுயே பெற்றிருக்கிறது. எடுத்துக்காட்டாக, ஒரு தரவுத் தொகுதி {0, 6, 8, 14} நான்கு உடன்பிறந்தோரின் வயதுகளை ஆண்டுகளில் குறிப்பிடுகிறது என்றால் அதன் நியமவிலகல் 5 ஆண்டுகளாகும்.

மற்றொரு உதாரணத்தில், தொகுப்பாக்கம் {1000, 1006, 1008, 1014} மீட்டர்களில் அளவிடப்பட்ட நான்கு தடகள வீரர்கள் கடந்த தொலைவுகளைக் குறிப்பிடுகிறது. இது இடைநிலையாக 1007 மீட்டர்கள் மற்றும் நியமவிலகல் 5 மீட்டர்களைக் கொண்டிரு்க்கிறது.

நியமவிலகல் நிச்சயமின்மையின் அளவீடாகவும் செயல்படலாம். இயற்பியலில், திரும்ப நிகழும் அளவீடுகளின் தெரிவிக்கப்பட்ட நியமவிலகல் அந்த அளவீடுகளின் துல்லியத்தைக் காட்டும். கோட்பாட்டுரீதியான முன்னூகிப்புடன் அளவீடுகள் உடன்படுகின்றனவா என்பதைத் தீர்மானிக்கும்போது அந்த அளவீடுகளின் நியமவிலகல் மிகவும் முக்கியத்துவம் வாய்ந்ததாகிறது: அளவீடுகளின் சராசரி முன்னூகிப்பிலிருந்து வெகு தொலைவில் இருந்தால் (தொலைவு நியமவிலகலின் அளவில் கணக்கிடப்படும்போது), பரிசோதிக்கப்படும் கோட்பாட்டை அநேகமாக திருத்த வேண்டியிருக்கும். முன்னூகிப்பு சரியானதாக இருந்து நியமவிலகல் உரிய முறையில் அளவுரு செய்யப்பட்டிருந்தால் நியாயமான முறையில் எதிர்பார்க்கக்கூடிய மதிப்புக்களின் அளவுகளைத் தாண்டி அவை செல்கின்றன என்பதால் இது அர்த்தமுள்ளதாக இருக்கிறது.

பயன்பாடு உதாரணம்[தொகு]

தரவின் மதிப்புக்கள் சராசரியிலிருந்து எந்தளவிற்கு மாறுபட்டிருக்கிறது என்பதை அறிந்து கொள்வதுதான் நியமவிலகலின் அளவைப் புரிந்து கொள்வதில் அடங்கியிருக்கிறது.

காலநிலை[தொகு]

ஒரு எளிய உதாரணமாக, நகரங்களுக்கான சராசரி உச்ச வெப்பநிலையைக் கவனத்தில் கொள்ளவும். இரண்டு நகரங்களில் ஒன்று கடற்கரைக்கு அருகிலும் மற்றொன்று உள்நாட்டிலும் உள்ளது என்க. இரு நகரங்களில் கடற்கரைக்கு அருகில் உள்ள நகரத்தின் வெப்பநிலை வித்தியாசத்தின் வீச்சு, உள்நாட்டைக் காட்டிலும் குறைவாக இருக்கும். இரு நகரங்களுக்கும் உச்ச வெப்பநிலையின் சராசரி சமமாக இருக்கலாம். ஆனால் நியமவிலகலின் அளவு கடற்கரை நகருக்குக் குறைவாகவும் உள்நாட்டு நகருக்கு அதிகமாகவும் இருக்கும். ஏனெனில் கடற்கரை நகரின் வெப்பநிலை அளவுகள் அதிக ஏற்ற இறக்கம் இல்லாமல் இருக்கும். ஆனால் உள்நாட்டு வெப்பநிலை அளவுகள் அதிக ஏற்ற இறக்கத்தோடு இருக்கும்.

விளையாட்டுகள்[தொகு]

நியமவிலகலைப் பயன்படுத்தி விளையாட்டு அணிகளை பரிசீலனை செய்யலாம். எந்த வகைப்பாட்டுத் தொகுப்பிலும், சில விஷயங்களில் உயர் தரவரிசையையும் மற்ற விஷயங்களில் மோசமான தரவரிசையையும் பெற்ற அணிகள் இருக்கும். வாய்ப்புக்கள் என்னவெனில், களத்தில் முன்னணியில் இருக்கும் அணிகள் இத்தகைய வேற்றுமையைக் காட்டாது, ஆனால் பெரும்பாலான வகைப்பாடுகளில் நன்றாக செயல்படும். ஒவ்வொரு வகைப்பாட்டிலுமான அவற்றின் தரவரிசைகளின் நியமவிலகல் குறைவது அவர்கள் மிகவும் சீராகவும் சமநிலையோடும் இருக்க முனைவதைக் காட்டுகிறது. அதேசமயத்தில் அதிக நியமவிலகல் கொண்ட அணிகள் மிகவும் முன்னூகிக்கப்பட இயலாதவையாக இருக்கும். உதாரணத்திற்கு, பெரும்பாலான வகைப்பாடுகளில் ஒரே விதத்தில் மோசமாக செயல்படும் அணி குறைவான நியமவிலகலைப் பெற்றிருக்கும். பெரும்பாலான வகைப்பாடுகளில் ஒரே சீராக இருக்கும் அணியும்கூட குறைவான நியமவிலகலைப் பெற்றிருக்கும். இருப்பினும், அதிகப்படியான நியமவிலகலைக் கொண்டிருக்கும் அணி நிறைய புள்ளிகளைப் பெறும் (வலுவான எதிர்ப்பு) வகையைச் சேர்ந்த அணியாக இருக்கலாம் ஆனால் நிறைய விட்டுக்கொடுப்பதாகவும் (பலவீனமான தற்காப்பு) இருக்கலாம், அல்லது அதற்கு நேர்மாறாக, இது மோசமான எதிர்ப்பைக் கொண்டிருக்கலாம் என்றாலும் புள்ளிகளைப் பெறுவதற்கு சிக்கலானதாக இருப்பதன் மூலம் இழப்பீடு செய்யலாம்.

எந்த ஒரு நாளிலும் எந்த அணி வெல்லும் என்பதை முன்னூகிப்பது பல்வேறு அணி "நிலைகளின்" தரவரிசைகளின் நியமச்சாய்வையும் பார்ப்பதை உள்ளிட்டிருக்கலாம் புள்ளிகளைப் பெறுவதன் வலுவான குறிப்பான்களாக இருப்பவற்றை தடுப்பது எது என்பதைப் புரிந்துகொள்வதற்கான முயற்சிக்கான பலங்களுக்கு எதிராக பலவீனங்கள் பொருந்துகின்றவிடத்தில்.

கார் பந்தயத்தில் அடுத்தடுத்த சுற்றுக்களில் ஓட்டுநர் தீர்மானிக்கப்படுகிறார். சுற்று நேரங்களின் குறைவான நியமவிலகலுடனான ஓட்டுநர் உயர் நியமவிலகல் உள்ள ஓட்டுநரைக் காட்டிலும் அதிக சமச்சீர் நிலையைக் கொண்டவராக இருக்கிறார். இந்தத் தகவல் சுற்றுநேரங்களைக் குறைப்பதற்கான வாய்ப்புக்கள் உள்ள இடத்தைக் புரிந்துகொள்வதற்கு உதவலாம்.

நிதி[தொகு]

நிதித்துறையில் நியமவிலகல் என்பது வழங்கப்பட்ட பாதுகாப்புப் பத்திரங்களோடு (பங்குகள், பாண்டுகள், சொத்து மற்றும் இன்னபிற) இணைந்துள்ள அபாயத்தை குறிப்பிடுவதாகும், அல்லது பங்குப்பட்டியல்களோடு (செயல்பாட்டுரீதியில் நிர்வகிக்கப்பட்ட பரஸ்பர நிதிகள், குறியீட்டெண் பரஸ்பர நிதிகள், அல்லது இடிஎஃப்கள்) இணைந்துள்ள அபாயத்தைக் குறிப்பதாகும். முதலீடுகளின் பட்டியலை பயன்மிக்க முறையில் எவ்வாறு கையாளுவது என்பதைப் தீர்மானிப்பதில் அபாயம் என்பது ஒரு முக்கியமான காரணியாகும், ஏனென்றால் சொத்து மற்றும்/அல்லது பங்குப்பட்டியலின் மீதான ஆதாயங்களில் ஏற்படும் மாறுபாடுகளைத் தீர்மானிக்கிறது என்பதுடன் முதலீட்டு முடிவுகளுக்கான கணித அடிப்படையை முதலீட்டாளர்களுக்கு வழங்குகிறது. அபாயத்தின் ஒட்டுமொத்தமான கருத்தாக்கம், இது அதிகரிக்கும்போது சொத்தின் மீதான எதிர்பார்க்கப்பட்ட ஆதாயமானது அபாய பிரீமியம் பெறப்பட்டதன் விளைவாக அதிகரிக்கும் - வேறுவகையில் சொல்வதென்றால், முதலீடு அதிக அளவிலான அபாயத்தைக் கொண்டிருக்கும்போது அல்லது ஆதாயத்தின் நிச்சயத்தன்மை நிலவும்போது முதலீட்டின் மீதான ஆதாயத்தை முதலீட்டாளர் அதிகமாக எதிர்பார்க்க வேண்டும். முதலீடுகளை மதிப்பிடும்போது, முதலீட்டாளர்கள் எதிர்பார்ப்பு ஆதாயம் மற்றும் எதிர்கால ஆதாயங்களின் நிச்சயத்தன்மை ஆகிய இரண்டையுமே மதிப்பிட வேண்டும். எதிர்கால ஆதாயங்களின் நிச்சயமில்லாத்தன்மையின் அளவுரு மதிப்பீட்டை நியமவிலகல் வழங்குகிறது.

உதாரணத்திற்கு, ஒரு முதலீட்டாளர் இரண்டு பங்குகளுக்கிடையே ஒன்றை தேர்வு செய்ய வேண்டும் என்று அனுமானிப்போம். கடந்த 20 ஆண்டுகளில் பங்கு A 20 சதவிகிதப் புள்ளிகள் நியமவிலகலுடன் 10 சதவிகித சராசரி ஆதாயத்தைக் கொண்டிருக்கிறது, அதே காலகட்டத்தில் பங்கு B 12 சதவிகித ஆதாயத்தையும் ஆனால் 30 சதவிகிதப் புள்ளிகள் உயர் நியமவிலகலைப் பெற்றிருக்கிறது. அபாயம் மற்றும் ஆதாயத்தின் அடிப்படையில் ஒரு முதலீட்டாளர் பங்கு A ஐ பாதுகாப்பான தேர்வாக தீர்மானிக்கலாம், ஏனென்றால் பங்கு B இன் 2 சதவிகித புள்ளிகள் ஆதாயம் கூடுதலான 10 சதவிகிதப் புள்ளிகள் நியமவிலகலிற்கு தகுதியானது அல்ல (எதிர்பார்க்கப்பட்ட ஆதாயத்தின் பெரிய அபாயம் அல்லது நி்ச்சமின்மை). பங்கு B ஆனது ஒரே சூழ்நிலையில் பங்கு A ஐக் காட்டிலும் மிகத்தொடர்ச்சியாக தொடக்க முதலீட்டிற்கும் குறைந்துபோவதற்கான வாய்ப்புள்ளது (ஆனால் தொடக்க முதலீட்டையும் தாண்டிச்செல்கிறது) என்பதுடன் சராசரியின் மீது 2 சதவிகித ஆதாயத்திற்கு மட்டுமே மதிப்பிடப்படுகிறது. இந்த உதாரணத்தில், எதிர்கால வருட ஆதாயங்களின் ஏறத்தாழ மூன்றில் இரண்டு பங்கிற்கு 20 சதவிகிதப் புள்ளி கூடவோ அல்லது குறைவாகவோ ஏறத்தாழ 10 சதவிகித ஆதாயம் கிடைக்கும் என்று பங்கு A எதிர்பார்க்கப்படுகிறது. எதிர்காலத்தில் கிடைக்கக்கூடிய மிக அதிகமாக சாத்தியமுள்ள ஆதாயங்கள் அல்லது முடிவுகளை பரிசீலனை செய்கையில் ஒரு முதலீட்டாளர் 10 சதவிகிதத்துடன் அல்லது குறைவாக 60 சதவிகிதப் புள்ளிகள் அல்லது 70 சதவிகிதம் முதல் (-)50 சதவிகிதம் வரை எதிர்பார்க்க வேண்டும், இது சராசரி ஆதாயத்திலிருந்து மூன்று நியமவிலகல்களுக்கான முடிவுகளை உள்ளிட்டிருக்கிறது (கிட்டத்தட்ட 99.7 சதவிகித சாத்தியமுள்ள ஆதாயங்கள்).

குறிப்பிட்ட கால அளவுகளுக்கு பத்திரத்தின் சராசரி ஆதாயத்தைக் கணக்கிடுவது சொத்தின் மீதான எதிர்பார்க்கப்பட்ட ஆதாயத்தை உருவாக்கும். ஒவ்வொரு காலகட்டத்திற்கும், அசல் ஆதாயத்திலிருந்து எதிர்பார்க்கப்பட்ட ஆதாயத்தைக் கழித்து மாறுபாடு காண வேண்டும். சொத்தின் ஒட்டுமொத்த அபாயத்தின் மீதான முடிவின் விளைவைக் கண்டுபிடிக்க, ஒவ்வொரு காலகட்டத்திலும் உள்ள மாறுபாட்டை இருமடி செய்யவேண்டும். ஒரு காலகட்டத்திலான மாறுபாட்டின் பெருக்கம் செக்யூரிட்டி அதிக அபாயத்தைக் கொண்டிருப்பதைக் குறிப்பிடுகிறது. இருமடி செய்யப்பட்ட மாறுபாடுகளின் சராசரி, ஒட்டுமொத்த அபாயத்தின் அளவீட்டைத் தரும். இந்த மாறுபாட்டின் வர்க்கமூலம் முதலீட்டின் நியமவிலகலாகும்.

முழுத்தொகுதி நியமவிலகல், பரவலாக ஏற்றுக்கொள்ளப்பட்ட தொழில்நுட்ப பகுப்பாய்வுக் கருவியான போலிங்கர் பேண்டுகளின் அகலத்தை அமைப்பதற்கு பயன்படுத்தப்படுகிறது. உதாரணத்திற்கு, மேல்புற போலிங்கர் பேண்டு பின்வருமாறு வழங்கப்பட்டிருக்கிறது:

\bar{x} + n * \sigma{x}

வடிவகணித பொருள் விளக்கம்[தொகு]

நியமவிலகலின் வடிவகணித விளக்கம் காண, x 1, x 2, x 3 மதிப்புகளுடைய தரவை எடுத்துக் கொள்ளலாம். இவை R 3 இல், ஒரு புள்ளி P = (x 1, x 2, x 3) ஐக் குறிக்கும். L = {({0}r, r , r ) : r in R } தரும் கோட்டையும் கணக்கில் கொள்ள, இது ஆதிப்புள்ளி வழியாக செல்லும் "முக்கிய மூலைவிட்டமாகும்".

எடுத்துக்கொள்ளப்பட்ட மூன்று மதிப்புகள் x 1, x 2, x 3 சமமானவையாக இருந்தால் இத்தரவின் நியமவிலகல் பூச்சியமாகவும், புள்ளி P ஆனது L கோட்டிலும் இருக்கும். எனவே நியமவிலகலானது P முதல் L வரையிலான தொலைவிற்கு தொடர்புடையதாக இருக்கிறது.

\overline{x} என்பது எடுத்துக்கொண்ட மூன்று மதிப்புகளின் சராசரி எனில், P இல் இருந்து L கோட்டிற்குள்ள செங்குத்து தொலைவு, கோட்டின் மீதுள்ள புள்ளி R = (\overline{x},\overline{x},\overline{x}) க்கும், புள்ளி P க்கும் இடையேயுள்ள தொலைவாகும். இத்தொலைவு, x 1, x 2, x 3 திசையனின் நியமவிலகலை அத்திசையனின் பரிமாண எண்ணால் பெருக்கக் கிடைக்கும். அதாவது:

PR = \sqrt3 \sigma
\sigma = \frac {PR}{\sqrt3}

சிபிசேவ்ஸின் சமனின்மை[தொகு]

ஒரு தரவின் மதிப்புகள், அரிதாகவே மிகச் சிறிய நியமவிலகல்கள் அளவை விட அதிகமாகச் சராசரியிலிருந்து விலகியிருக்கும். சிபிசேவ்ஸின் சமனின்மையின்படி, நியமவிலகல் வரையறுக்கப்படுகின்ற எல்லா பரவல்களிலும் தரவுப் புள்ளிகள் குறிப்பிட்ட நியமவிலகல் அளவிற்குள் அமையும் குறைந்தபட்ச அளவு கீழ்க்கண்டவாறு அமையும்:

முழுமைத்தொகுதியின் குறைந்தபட்ச அளவு சராசரியிலிருந்து தொலைவு
50% √2
75% 2
89% 3
94% 4
96% 5
97% 6
\scriptstyle 1-\frac{1}{k^2}[4] \scriptstyle k
\scriptstyle l \scriptstyle \frac{1}{\sqrt{1-l}}

இயல்நிலைப் பரவலாக அமையும் தரவிற்கான விதிகள்[தொகு]

கருநீலப்பகுதி சராசரியிலிருந்து ஒரு நியமவிலகல் அகலத்திற்கு இருக்கிறது. இது தரவின் 68.27 சதவிகித தரவுப்புள்ளிகளைப் பெற்றிருக்கிறது; சராசரியிலிருந்து (நடுத்தரமான கருநீலம்) இரண்டு நியமவிலகல் அகலப்பகுதி 95.45 சதவிகிதத்தைக் கொண்டிருக்கிறது; மூன்று நியமவிலகல் (லேசான, நடுத்தரமான கருநீலம்) 99.73 சதவிகிதத்தைக் கொண்டிருக்கிறது; நான்கு நியமவிலகல் 99.994 சதவிகிதத்தைக் கொண்டிருக்கிறது. சராசரியிலிருந்து வந்த ஒரு நியமவிலகல் அளவில் வளைவரையின் மீதுள்ள இரண்டு புள்ளிகளும் வளைவுமாற்றுப் புள்ளிகளாக அமையும்.

மைய எல்லைத் தேற்றத்தின்படி, ஒன்றுக்கொன்று தொடர்பில்லாத, ஒரேமாதிரியான பரவலாக அமையும் பல சமவாய்ப்பு மாறிகளின் சராசரிகளின் பரவல், மணிவடிவ இயல்நிலைப் பரவலாகவும் அப்பரவலின் நிகழ்தகவு அடர்த்திச் சார்பு கீழ்க்கண்டவாறும் அமையும்:

f(x;\mu,\sigma^2) = \frac{1}{\sigma\sqrt{2\pi}} e^{ -\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2 }

இங்கு μ, சமவாய்ப்பு மாறிகளின் எதிர்பார்ப்பு மதிப்பு; σ, பரவலின் நியமவிலகலை n1/2 ஆல் வகுக்கக் கிடைப்பது (n, சமவாய்ப்பு மாறிகளின் எண்ணிக்கை).

ஒரு பரவல் கிட்டத்தட்ட இயல்நிலைப் பரவலாக இருந்தால்:

  • அதன் 68 சதவீதத் தரவுகள் அதன் சராசரியின் இருபுறமும் ஒரு நியமவிலகல் அகல அளவில் (அதாவது μ ± σ) அமைந்திருக்கும்.
  • அதன் 95 சதவீதத் தரவுகள் அதன் சராசரியின் இருபுறமும் இரு நியமவிலகல் அகல அளவில் (அதாவது μ ± 2σ) அமைந்திருக்கும்.
  • அதன் 99.7 சதவீதத் தரவுகள் அதன் சராசரியின் இருபுறமும் மூன்று நியமவிலகல் அகல அளவில் (அதாவது μ ± 3σ) அமைந்திருக்கும்.

இது 68-95-99.7 விதி என அழைக்கப்படுகிறது.

z இன் பல்வேறு மதிப்புக்களுக்கு, சீரமைப்பு இடைவெளி (−z σ, z σ) இன் உள்ளாகவும் வெளியிலும் அமையக்கூடிய மதிப்புக்களின் சதவிகிதம் பின்வருமாறு:

z σ CIக்குள் அமையும் சதவீதம் CIக்கு வெளியில் அமையும் சதவீதம் CIக்கு வெளியில் அமையும் விகிதம்
21 22 1 / 3.1514871
1.645σ 90% 10% 1 / 10
1.960σ 95% 5% 1 / 20
24 4.5500264% 1 / 21.977894
2.576σ 99% 1% 1 / 100
#27 28 1 / 370.398
3.2906σ 99.9% 0.1% 1 / 1000
29 30% 1 / 15,788
99.9999426697% 0.0000573303% 1 / 17,44,278
99.9999998027% 0.0000001973% 1 / 506,800,000
99.999 999 999 7440% 0.0000000002560% 1 / 3,90,60,00,00,000

நியமவிலகலிற்கும் இடைநிலைக்கும் இடையிலுள்ள உறவு[தொகு]

ஒரு தரவுத் தொகுதியின் இடைநிலை மற்றும் நியமவிலகல்கள் சேர்ந்தே தெரிவிக்கப்படுகின்றன. ஒரு குறிப்பிட்ட பொருளில், தரவின் மையம் ஏறத்தாழ சராசரிக்கு அண்மையில் அமையுமானல் தரவுகள் எந்த அளவு பரந்து அமைந்திருக்கின்றன என்பதை நியமவிலகல் அளவீடாகத் தருகிறது.

  • சராசரியிலிருந்து கணக்கிடப்படும் நியமவிலகல், வேறு எந்த புள்ளியிலிருந்தும் கணக்கிடப்படும் நியமவிலகலை விடச் சிறியதாக இருக்கும்.

x 1, ..., x n மெய்யெண்களாகக் கொண்டு கீழ்க்காணும் சார்பு வரையறுக்கப்பட்டால்:

\sigma(r) = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - r)^2}.

வகை நுண்கணிதம் அல்லது வர்க்க நிரப்பி முறையைப் பயன்படுத்தி சராசரி r = \overline{x}\, இல், சார்பு \sigma(r) தனித்ததொரு சிறும மதிப்பைக் கொண்டிருக்கும் எனக் காட்டலாம்.

  • மாறுபாட்டுக் கெழு (CV)

நியமவிலகலுக்கும் சராசரிக்குமான விகிதமாக மாறுபாட்டுக் கெழு வரையறுக்கப்படுகிறது.

c_v = \frac{\sigma}{\mu} விகிதமாக உள்ளதால் இது அலகில்லாத அளவாகும்.
  • சராசரியின் துல்லியம்

சராசரியின் துல்லியத்தை சராசரியின் நியமவிலகல் மூலம் கணக்கிடலாம்.

சராசரியின் நியமவிலகல்:

 \sigma_{\text{mean}}=\frac{\sigma}{\sqrt{N}}

N சராசரி கணக்கிடப் பயன்படுத்தப்பட்ட மாதிரித் தரவிலுள்ள தரவுப் புள்ளிகளின் எண்ணிக்கை.

கீழே தரப்பட்டுள்ள முடிவுகளைப் பயன்படுத்தி சராசரியின் நியமவிலகலைத் தருவிக்கலாம்:

\begin{align}
\operatorname{var}(X) &\equiv \sigma^2_X\\
\operatorname{var}(X_1+X_2) &\equiv \operatorname{var}(X_1) + \operatorname{var}(X_2)\\
\operatorname{var}(cX_1) &\equiv c^2 \, \operatorname{var}(X_1)
\end{align}
நிறுவல்

\begin{align}
\operatorname{var}(\text{mean})
 &= \operatorname{var}\left (\frac{1}{N} \sum_{i=1}^N X_i \right)
   = \frac{1}{N^2}\operatorname{var}\left (\sum_{i=1}^N X_i \right ) \\
 &= \frac{1}{N^2}\sum_{i=1}^N \operatorname{var}(X_i)
   = \frac{N}{N^2} \operatorname{var}(X)
   = \frac{1}{N} \operatorname{var} (X).
\end{align}
\sigma_\text{mean} = \frac{\sigma}{\sqrt{N}}.

விரைவான கணக்கீட்டு முறை[தொகு]

x இன் N மதிப்புக்கள்: x1, ..., xN, மற்றும்
s0, s1, s2 ஆகிய மூன்று கூட்டுத்தொகைகள் பின்வருமாறு தரப்படுகின்றன:
\ s_j=\sum_{k=1}^N{x_k^j}.

s 0 ஆனது x ஐ பூச்சிய அடுக்குக்கு உயர்த்துகிறது. x 0 எப்போதுமே 1 என்பதால், s 0 ஆனது N க்கு மதிப்பிடப்படுகிறது.

இந்த மூன்று கூட்டுத்தொகைகளின் மதிப்புகளைக் கொண்டு முழுத்தொகுதியின் நியமவிலகலையும் மாதிரி நியமவிலைகலையும் பின்வரும் வாய்ப்பாடுகள் மூலம் கணக்கிடலாம்.

முழுமைத்தொகுதியின் நியமவிலகல்:

\sigma= \frac{1}{s_0}\sqrt{s_0s_2-s_1^2}

மாதிரி நியமவிலகல்:

s = \sqrt{\frac{s_0s_2-s_1^2}{s_0(s_0-1)}}.

கணிப்பொறி அமலாக்கத்தில் மூன்று s j கூட்டுத்தொகைகள் பெரிதடைகிறது என்பதால், நாம் ரவுண்ட்-ஆஃப் பிழை, எண்கணிக மிகையோட்டம், மற்றும் எண்கணித குறையோட்டம் ஆகியவற்றை பரிசீலனைக்கு எடுத்துக்கொள்ள வேண்டும். கீழேயுள்ள முறை குறைக்கப்பட்ட ரவுண்டிங் பிழைகளோடு செயல்படு கூட்டுத்தொகைகளை கணக்கிடுகிறது:

 A_0=0\,
 A_i=A_{i-1}+\frac{x_i-A_{i-1}}{i}

இங்கு A என்பது சராசரி.

 Q_0=0\,
 Q_i=Q_{i-1}+\frac{i-1}{i} (x_i-A_{i-1})^2\,

அல்லது

 Q_i=Q_{i-1}+ (x_i-A_{i-1})(x_i-A_i)\,

மாதிரி பரவற்படி:

 s^2_n=\frac{Q_n}{n-1}

முழுத்தொகுதி பரவற்படி:

 \sigma^2_n=\frac{Q_n}{n}.

எடைமான கணக்கீடு[தொகு]

xi மதிப்புக்கள் சமமற்ற எடைகள் wi உடன் எடையிடப்பட்டால் கூட்டுத்தொகைகளான s0, s1, s2 ஒவ்வொன்றும் பின்வருமாறு கணக்கிடப்படுகிறது:

\ s_j=\sum_{k=1}^N{w_i x_k^j}.\,

நியமவிலகல் சமன்பாடு மாற்றமின்றியே இருக்கிறது. s 0 இப்போது எடைகளின் கூட்டுத்தொகையாகவும் N -மாதிரிகளின் எண்ணாகவும் இல்லாதிருப்பதை கவனிக்கவும்.

குறைக்கப்பட்ட ரவண்டிங் பிழைகளுடனான பெருக்க முறையும் மேலும் சில சிக்கல்களோடு பயன்படுத்தப்படலாம்.

எடைமானங்களின் செயல்படு கூட்டுத்தொகை பின்வருமாறு கணக்கிடப்பட வேண்டும்:

W_0 = 0\,
W_i = W_{i-1} + w_i\,

மேலே பயன்படுத்தப்பட்டுள்ள 1/i ஆனது wi /Wi ஆல் மாற்றீடு செய்யப்பட வேண்டும்:

A_0 = 0\,
A_i = A_{i-1}+\frac{w_i}{W_i}(x_i-A_{i-1})\,
Q_0 = 0\,
Q_i =Q _{i-1} + \frac{w_i W_{i-1}}{W_i}(x_i-A_{i-1})^2 = Q_{i-1}+w_i(x_i-A_{i-1})(x_i-A_i)\,

இறுதிப் பிரிவில்,

\sigma^2_n=\frac{Q_n}{W_n}\,

மற்றும்

s^2_n = \frac{n'}{n'-1}\sigma^2_n\,

n என்பது ஆக்கக்கூறுகளின் மொத்த எண்ணிக்கை, n' என்பது பூச்சியமல்லாத எடைகள் கொண்ட ஆக்கக்கூறுகளின் எண்ணிக்கை.

எடைகள் அனைத்தும் 1க்கு சமமானதாக எடுத்துக்கொள்ளப்பட்டால் இந்த வாய்ப்பாடுகள், மேலே தரப்பட்டுள்ள எளிதான வாய்ப்பாடுகளுக்கு சமமானதாகிறது.

வரம்புகள்[தொகு]

இடைநிலைகளைப் போன்று இல்லாது நியமவிலகல்கள் ஒன்றிணைக்கப்பட இயலாதவை என்பது அதனுடைய ஒரு வரம்புகளில் ஒன்றாகும். உதாரணத்திற்கு, சராசரி அமெரிக்க ஆணின் 70 அங்குல இடைநிலை உயரம் (நியமவிலகல் 3) மற்றும் சராசரி அமெரிக்க பெண்ணின் 65 அங்குல இடைநிலை உயரம் (நியமவிலகல் 2) நமக்குத் தெரியவருகிறது என்றால் பொதுவாக (பால்வேறுபாடு இன்றி) அமெரிக்கர்களின் இடைநிலை மற்றும் நியமச்சாய்வை தெரிந்துகொள்ள வேண்டும் என்ற ஆர்வம் எல்லோருக்கும் ஏற்படுவது இயல்பானதே. அமெரிக்கரின் இடைநிலையை ஒவ்வொன்றிற்கும் 0.5 என்பதன் மூலம் பெண்களுக்கான இடைநிலையைப் பெருக்குவதன் மூலம் (ஆண்களும் பெண்களும் அமெரிக்க மக்கள்தொகையில் 50 சதவிகிதமாக இருக்கிறார்கள் என்பதால்) பெறலாம் என்பதோடு இந்த கூட்டுத்தொகையை இரண்டு முடிவுகளுக்கு எடுத்துச்செல்லலாம்: 70(0.5) + 65(0.5)= 67.5; இருப்பினும் அமெரிக்கர்களின் நியமவிலகல் 3(0.5)+ 2(0.5)= 2.5 என்பதாக இருப்பதில்லை. இதற்கு மாற்றாக, அமெரிக்கர்களின் நியமவிலகல் ஆண்களுக்கோ அல்லது பெண்களுக்கோ உரிய நியமச்சாய்வைக் காட்டிலும் பெரியதாக இருக்கலாம், ஏனென்றால் இரண்டு பாலினங்களின் மாறுபாடுகளையும் இது உள்ளிட்டிருக்கிறது. வெவ்வேறு துணைத்தொகுப்பாக்கங்களுக்கான நியமவிலகல்களை ஒன்றிணைப்பதற்கு அறியப்பட்ட முறை என்று எதுவுமில்லை.

பார்வைக் குறிப்புகள்[தொகு]

  1. Pearson, Karl (1894). "On the dissection of asymmetrical frequency curves". Phil. Trans. Roy. Soc. London, Series A 185: 719–810. 
  2. Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 0-19-920613-9. 
  3. Miller, Jeff. "Earliest Known Uses of Some of the Words of Mathematics".
  4. Ghahramani, Saeed (2000). Fundamentals of Probability (2nd Edition). Prentice Hall: New Jersey. p. 438.

வெளி இணைப்புகள்[தொகு]

"http://ta.wikipedia.org/w/index.php?title=நியமவிலகல்&oldid=1557973" இருந்து மீள்விக்கப்பட்டது