தரவு பகுப்பாய்வு

கட்டற்ற கலைக்களஞ்சியமான விக்கிப்பீடியாவில் இருந்து.

 

தரவு பகுப்பாய்வு (Data analysis) என்பது பயனுள்ள தகவல்களைக் கண்டுபிடிப்பதையும் , முடிவுகளைத் தெரிவிப்பதையும் , முடிவெடுப்பதையும் ஆதரவளிப்பதயும் நோக்கமாகக் கொண்டு தரவைச் சீர்படுத்துதல், படிமமாக்குதல் முறைகளை ஆய்வு செய்யும் செயல்முறையாகும்.[1] தரவு பகுப்பாய்வு பல கூறுகளையும் அணுகுமுறைகளையும் கொண்டுள்ளது. இது பல்வேறு தொழில்நுட்பங்களைப் பல்வேறு பெயர்களில் உள்ளடக்கியது. இவை பல்வேறு வணிக, அறிவியல், சமூக அறிவியல் களங்களில் பயன்படுத்தப்படுகின்றன.[2] இன்றைய வணிக உலகில் , தரவு பகுப்பாய்வு முடிவுகளை மிகவும் அறிவியல் முறையில் எடுப்பதிலும் , வணிகங்கள் மிகவும் திறம்பட செயல்பட உதவுவதிலும் பங்கு வகிக்கிறது.[3]

தரவுச் சுரங்கம் என்பது ஒரு குறிப்பிட்ட தரவு பகுப்பாய்வு நுட்பமாகும். இது புள்ளியியல் படிமமாக்கத்திலும், அறிவுக் கண்டுபிடிப்பிலும் கவனம் செலுத்துகிறது , இது முற்றிலும் விளக்க நோக்கங்களைக் காட்டிலும் முன்கணிப்புக்கானதாகும். அதேவேளையில் வணிக நுண்ணறிவு தரவுப் பகுப்பாய்வை உள்ளடக்கியதாகும். இது முதன்மையான வணிகத் தகவல்களில் கவனம் செலுத்துகிறது.[4] புள்ளியியல் பயன்பாடுகளில் தரவுப் பகுப்பாய்வை விளக்கமுறைப் புள்ளிவிவரங்கள் சார்ந்து, தேட்டத் தரவு பகுப்பாய்வு (EDA), உறுதிப்படுத்தல் தரவு பகுப்பாய்வு (CDA) எனப் பிரிக்கலாம்.[5] தேட்டத் தரவு பகுப்பாய்வு தரவுகளில் புதிய கூறுகளைக் கண்டுபிடிப்பதில் கவனம் செலுத்துகிறது , அதே நேரத்திலவூறுதிப்படுத்தல் தரவு பகுப்பாய்வு(CDA) ஏற்கனவே உள்ள கருதுகோள்களை உறுதிப்படுத்துவதிலோ அல்லது பொய்யாக்குவதிலோ கவனம் செலுத்துகிறது.[6] முன்கணிப்புப் பகுப்பாய்வு முன்கணிப்புக்கான அல்லது வகைப்பாட்டிற்கான புள்ளியியல் படிமங்களின் பயன்பாட்டில் கவனம் செலுத்துகிறது. அதே நேரத்தில் உரை பகுப்பாய்வு புள்ளிவிவர மொழியியலையும் கட்டமைப்பு நுட்பங்களையும் பயன்படுத்தி உரை வாயில்களிலிருந்து தகவல்களைப் பிரித்தெடுக்கவும் வகைப்படுத்தவும் செய்கிறது. மேற்கூறிய அனைத்தும் தரவு பகுப்பாய்வின் வகைகள் ஆகும்.[7]

தரவு ஒருங்கிணைப்பு என்பது தரவு பகுப்பாய்விற்கு ஒரு முன்னோடியாகும். மேலும் தரவு பகுப்பாய்வு தரவு காட்சிப்படுத்தலுடனும் தரவு பரப்புதலுடனும் நெருக்கமாக இணைக்கப்பட்டுள்ளது.[8]

தரவு பகுப்பாய்வுச் செயல்முறை[தொகு]

தரவு அறிவியல் செயல்முறை ஃப்ளோசார்ட் - தரவு அறிவியல் செய்வதிலிருந்து - ஷட் & ஓ ' நெய்ல் (2013)

பகுப்பாய்வு என்பது ஒரு முழுப்பொருளையும் தனிப்பட்ட செய்முறைக்காக அதன் தனித்தனி கூறுகளாகப் பிரிப்பதைக் குறிக்கிறது.[9] தரவு பகுப்பாய்வு என்பது மூலத் தரவைப் பெறுவதற்கான ஒரு செயல்முறையாகும். இம்முறை பின்னர் இதைப் பயனர்களால் முடிவெடுப்பதற்கு ஏற்ற பயனுள்ள தகவல்களாக மாற்றுகிறது.[1] செய்முறைக் கருதுகோள்கள் அல்லது கோட்பாடுகளை நிறுவாத கேள்விகளுக்குப் பதிலளிக்க தரவு திரட்டப்பட்டுப் பகுப்பாய்வு செய்யப்படுகிறது.[10]

புள்ளியியல் வல்லுனர் ஜான் தூக்கே 1961 இல் தரவு பகுப்பாய்வைப் பின்வருமாறு வரையறுத்தார்.

" தரவுகளைப் பகுப்பாய்வு செய்வதற்கான செயல்முறைகள், இத்தகைய செயல்முறைகளின் முடிவுகளை விளக்கும் நுட்பங்கள், பகுப்பாய்வை எளிதாக்குவதற்கும் மிகவும் துல்லியமாக்குவதற்கும் உதவும் துல்லியமான தரவுகளைத் திரட்டலைத் திட்டமிடுவதற்கான வழிகள்ஆகிய பகுத்தறிவதற்குப் பொருந்தும் அனைத்து பொறிமுறைகளும், புள்ளியியல் முடிவகளும்.[11]

கீழே விவரிக்கப்பட்டுள்ள பல கட்டங்களை வேறுபடுத்திக் காட்டலாம். கட்டங்கள் மீண்டும் மீண்டும் நிகழ்கின்றன. ஏனெனில் பிற்காலக் கட்டங்களிலிருந்து வரும் பின்னூட்டங்கள் முந்தைய கட்டங்களில் கூடுதல் வேலைகளை ஏற்படுத்தக்கூடும்.[12] தரவுச் சுரங்கத்தில் பயன்படுத்தப்படும் கிரிசுப்பு(CRISP) கட்டமைப்பும் இதே போன்ற படிநிலைகளைக் கொண்டுள்ளது.

தரவு தேவைகள்[தொகு]

பகுப்பாய்விற்கான உள்ளீடுகளாக தரவு கட்டாயமாகத் தேவைப்படுகிறது. இது பகுப்பாய்வுகளை இயக்குவோரின் (அல்லது பகுப்பாய்வில் முடிக்கப்பட்ட பலன்களைப் பயன்படுத்தும் வாடிக்கையாளர்களின்) தேவைகளின் அடிப்படையில் குறிப்பிடப்படுகிறது.[13][14] தரவு திரட்டப்படும் பொதுவான வகை ஒரு செய்முறை அலகு (எ. கா. ஒரு தனியர்ர் அல்லது மக்கள் தொகை எனக் குறிப்பிடப்படுகிறது. மக்கள்தொகை சார்ந்த குறிப்பிட்ட மாறிகள் (எ. கா. அகவை, வருமானம்) குறிப்பிடப்பட்டு பெறப்படலாம். அவை தரவு எண்ணாகவோ (அதாவது, எண்களுக்கான அடையாள உரை ) அல்லது வகைப்படுத்தப்பட்டதாகவோ அமையலாம் .[12]

தரவு திரட்டல்[தொகு]

பல்வேறு தரவுகளிலிருந்து தகவல்கள் திரட்டப்படுகின்றன.[15] ஆய்வு மற்றும் ஆராய்ச்சிக்கான தரவு வாயில்களின் பட்டியல் கிடைக்கிறது. தேவைகள் ஒரு நிறுவனத்திற்குள் தகவல் தொழில்நுட்ப பணியாளர்கள் போன்ற தரவுகளின் பாதுகாவலர்களுக்கு ஆய்வாளர்களால் தெரிவிக்கப்படலாம்.[16] போக்குவரத்து கேமராக்கள் , செயற்கைக்கோள்கள் , பதிவு செய்யும் சாதனங்கள் உள்ளிட்ட சூழலில் உள்ள உணரிகளிலிருந்தும் தரவு திரட்டப்படலாம். நேர்காணல்கள் வழியும் இணைய வாயில்களிலிருந்து பதிவிறக்கம் வழியும் அல்லது ஆவணங்களைப் படித்தும் தகவல்களைத் திரட்டலாம் பெறலாம்.

தரவுச் செயலாக்கம்[தொகு]

மூலத் தகவல்களைச் செயல்படுத்தும் நுண்ணறிவு அல்லது அறிவாக மாற்ற பயன்படுத்தப்படும் நுண்ணறிவு சுழற்சியின் கட்டங்கள் கருத்தியலாக தரவு பகுப்பாய்வின் கட்டங்களை ஒத்தவை.

தொடக்கத்தில் தரவு பெறப்படும்போது அது பகுப்பாய்விற்றபடி கையாளப்பட வேண்டும் அல்லது ஒழுங்கமைக்கப்பட வேண்டும்.[17] எடுத்துக்காட்டாக , இவை தரவை வரிசைகள் மற்றும் நெடுவரிசைகளில் அட்டவணை வடிவத்தில் பெரும்பாலும் விரிதாள் அல்லது புள்ளியியல் மென்பொருளைப் பயன்படுத்தி வைப்பதை உள்ளடக்கலாம் (மேலும், இது பகுப்பாய்விற்காகக் கட்டமைக்கப்பட்ட தரவு என அழைக்கப்படுகிறது) .

தரவுச் சீர்செயல்[தொகு]

  செயலாக்கப்பட்டு ஒழுங்கமைக்கப்பட்டவுடன் தரவு முழுமையடையாமல் இருக்கலாம். நகல்களைக் கொண்டிருக்கலாம் அல்லது பிழைகளைக் கொண்டிருக்கலாம்.[18][19] தரவை உள்ளிட்டு தேக்கும் விதத்தில் உள்ள சிக்கல்களிலிருந்து சீர்செய்யப்பட வேண்டிய தேவை எழும்.[18] தரவுச் சீர்செயல் என்பது இந்த பிழைகளைத் தடுப்பதும் சரிசெய்வதும் ஆகும். பொதுவான பணிகளில் தரவுகளின் தவறான தன்மையை அடையாளம் காணுதலில், தற்போதுள்ள தரவுகளின் ஒட்டுமொத்தத் தரம், வரிசை, நெடுவரிசை பிரிவுகள் ஆகியவை அடங்கும்.[20] இத்தகைய தரவுச் சிக்கல்களை பல்வேறு பகுப்பாய்வு நுட்பங்களாலும்ம் அடையாளம் காணலாம். எடுத்துக்காட்டாக , நிதி தகவல்களுடன் குறிப்பிட்ட மாறிகளுக்கான மொத்தங்களை, நம்பகமானவை என்று நம்பப்படும் தனித்தனியாக வெளியிடப்பட்ட எண்களுடன் ஒப்பிடலாம்.[21][22] முன்னரே தீர்மானிக்கப்பட்ட வரம்புகளுக்கு மேலே அல்லது அதற்குக் கீழே உள்ள இயல்பற்ற தொகைகளையும் மதிப்பாய்வு செய்யலாம். பல வகையான தரவு சீர்செயல் முறைகள் உள்ளன , அவை தொகுப்பில் உள்ள தரவின் வகையைப் பொறுத்து அமையும். இது தொலைபேசி எண்கள், மின்னஞ்சல் முகவரிகள், முதலாளிகள் அல்லது எனப் பிற மதிப்புகளாகவும் இருக்கலாம்.[23][24] தவறான முறையில் உள்ளீடு செய்யப்படுவதற்கான அதிக வாய்ப்பைக் கொண்டதாகத் தோன்றும் தரவை அகற்றுவதற்கு வெளிப்புறக் கண்டறிதலுக்கான அளவியலான தரவு முறைகளைப் பயன்படுத்தலாம்.[25] தவறாக தட்டச்சு செய்யப்பட்ட சொற்களின் அளவைக் குறைக்க உரை தரவு எழுத்துப்பிழை சரிபார்ப்புகளைப் பயன்படுத்தலாம். இருப்பினும் , சொற்கள் சரியானவையா என்று சொல்வது அரிதே.[26]

தேட்டத் தரவு பகுப்பாய்வு[தொகு]

தரவுத்தொகுப்புகள் சீர்செய்யப்பட்டவுடன் அவற்றை பகுப்பாய்வு செய்யலாம். பெறப்பட்ட தரவுகளில் உள்ள செய்திகளைப் புரிந்துகொள்ள ஆய்வாளர்கள் தேட்டத் தரவு பகுப்பாய்வு எனப்படும் பல்வேறு நுட்பங்களைப் பயன்படுத்தலாம்.[27] தரவு தேட்டச் செயல்முறை கூடுதல் தரவு சீர்செயல்ளின் அல்லது தரவு கூடுதல் கோரிக்கைகள் விளைவாக இருக்கலாம் இவ்வாறு இந்தப் பிரிவின் முன்னணிப் பத்தியில் தர்வைச் சீர்செய்யும் பன்னிச் செயல்முறை குறிப்பிடப்பட்டுள்ளது. தொடக்கநிலைத்.[28] தரவைப் புரிந்துகொள்ள உதவும் வகையில் நிரல் அல்லது நடுவன் போன்ற விளக்கமுறைப் புள்ளிவிவரங்களை உருவாக்க முடியும்.[29][30] தரவு காட்சிப்படுத்தல் என்பது ஒரு நுட்பமாகும். இதில் ஆய்வாளர்கள் தரவுகளுக்குள் உள்ள செய்திகளைப் பற்றிய கூடுதல் நுண்ணறிவுகளைப் பெறுவதற்காகத் தரவை வரைகலை வடிவத்தில் ஆராய்கின்றனர்.[12]

படிமமாக்கமும் நெறிநிரல்களும்[தொகு]

கணித வாய்பாடுகள் அல்லது படிமங்கள் (நெரிநிரல்(அல்காரிதம்) என்று அழைக்கப்படுகின்றன) மாறிகளுக்கிடையேயான உறவுகளை அடையாளம் காண தரவுகளைப் பயன்படுத்தப்படலாம் , எடுத்துக்காட்டாக, ஒட்டுறவு அல்லது காரண-காரிய முறைமையைப் பயன்படுத்துதலைக் கூறலாம்.[31][32] பொதுவாக , செயல்படுத்தப்பட்ட படிமத்தின் துல்லியத்தைப் பொறுத்து, சில எஞ்சிய பிழையுடன் பிற மாறியின் அடிப்படையில் ஒரு குறிப்பிட்ட மாறியை மதிப்பிடுவதற்கும் படிமங்கள் உருவாக்கப்படலாம் (எ. கா. தரவு = படிமம் + பிழை).[33][10]

உய்த்துணர்வுப் புள்ளிவிவரங்கள் குறிப்பிட்ட மாறிகளுக்கு இடையிலான உறவுகளை அளவிடும் நுட்பங்களைப் பயன்படுத்துவதை உள்ளடக்கியது.[34] எடுத்துக்காட்டாக , விளம்பரத்தில் மாற்றம் ஏற்பட்டுள்ளதா என்பதை படிமமாகக் காட்டுவதற்கு பின்னேகும் பகுப்பாய்வு பயன்படுத்தப்படலாம். (தற்சார்பு மாறி X) விற்பனையில் உள்ள மாறுபாட்டிற்கான விளக்கத்தை வழங்குகிறது (சார்பு மாறி Y).[35] கணிதத்தில் , Y ( விறபனை) என்பது X என்ற விளம்பரப்படுத்துதலின் செயல்பாடு ஆகும்.[36] இது (Y = aX + b + error) என விவரிக்கப்படலாம். அங்குக் கணிதவியல் படிமம் வடிவமைக்கப்பட்டுள்ளது , அதாவது X இன் மதிப்புகளின் குறிப்பிட்ட வரம்பிற்கு படிமம் Y இன் மதிப்பைக் கணிக்கும்போது (a), (b) ஆகியன பிழையைக் குறைக்கும்.[37]

தரவு ஆக்கம்[தொகு]

தரவு ஆக்கம் என்பது கணினிவழி தரவு உள்ளீடுகளழீட்டு வெளியீடுகளை உருவாக்கும் வழிமுறையாகும். இவை மீண்டும் சூழலுக்குள் ஊட்டப்படும்.[38] தரவு ஆக்கம் ஒரு படிமத்தையோ நெறிநிரலையோ பயன்படுத்தலாம். எடுத்துகாட்டாக , வாடிக்கையாளர் கொள்முதல் வரலாறு பற்றிய தரவை பகுப்பாய்வு செய்யும் ஒரு பயன்பாடு வாடிக்கையாளர் நுகரவியலும் கொள்முதல்களைப் பரிந்துரைக்கப் பயன்படுத்துகிறது.[39]

தகவல் தொடர்பு[தொகு]

தரவு பகுப்பாய்வு செய்யப்பட்ட பிறகு முடிவுகளைப் புரிந்துகொள்ள தரவு காட்சிப்படுத்தல் பயன்படுத்தப்படுகிறது.[40]

தரவு பகுப்பாய்வு செய்யப்பட்டவுடன், அந்தப் பகுப்பாய்வு முடிவுகளைப் பயனர்களுக்கு அவர்களின் தேவைகளைச் ச்சந்திக்க பல வடிவங்களில் தெரிவிக்கலாம்.[41] பயனர்கள் கூடுதல் பகுப்பாய்விற்கு வழிவகுக்கும் பின்னூட்டங்களைக் கொடுக்கலாம். எனவே , பகுப்பாய்வுச் சுழற்சியின் பெரும்பகுதி, அத்தாவது தரவு ஆக்கத்தின் பெரும்பகுதி இதுபோல பன்னிச்(பலமுறைச்) செய்தலாகும் .[12]

முடிவுகளை எவ்வாறு அறிவிப்பது என்பதை தீர்மானிக்கும் போது , பார்வையாளர்களுக்கு செய்தியை இன்னும் தெளிவாகவும் திறமையாகவும் தொடர்பு கொள்ள உதவும் வகையில் பல்வேறு தரவு காட்சிப்படுத்தல் நுட்பங்களை செயல்படுத்துவது குறித்து ஆய்வாளர் கருதி பார்க்கலாம்.[42] தரவு காட்சிப்படுத்தல் தகவல் காட்சிகளைப் பயன்படுத்துகிறது (அட்டவணைகள், வரைபடங்கள் போன்ற வரைவியல் தரவுகளில் உள்ள முதன்மைச் செய்திகளைதசறிவிப்பதற்கு உதவுகிறது.[43] அட்டவணைகள் ஒரு பயனரின் குறிப்பிட்ட எண்களை வினவவும் கவனம் செலுத்தவும் உதவும் ஒரு மதிப்புமிக்க கருவியாகும். அதே வேளையில் விளக்கப்படங்கள் (எ. கா. பட்டை விளக்கப்படங்கள் அல்லது வரி விளக்கப்படங்கள்) தரவுகளில் உள்ள அளவுசார் செய்திகளை விளக்க உதவும்.

அளவியலான செய்திகள்[தொகு]

 

காலப்போக்கில் அமெரிக்க கூட்டாட்சி செலவினங்கள் மற்றும் வருவாயில் உள்ள போக்குகளை நிரூபிக்கும் ஒரு வரி விளக்கப்படத்துடன் விளக்கப்பட்ட ஒரு நேரத் தொடர்.
இரண்டு மாறிகளுக்கு (பணவீக்கம் மற்றும் வேலையின்மை) இடையிலான தொடர்பை விளக்கும் ஒரு சிதறல் வரைவு.

பயனர்கள் ஒரு தரவுத் தொகுப்பிலிருந்து புரிந்துகொள்ள அல்லது அறிவிக்க உதவும் எட்டு வகையான அளவுசார் செய்திகளை சுட்டீவன் பூ விவரிந்துள்ளார். மேலும் செய்தியைத் தெரிவிக்க உதவும் தொடர்புடைய வரைபடங்களை.[44] தேவைகளைக் குறிப்பிடும் வாடிக்கையாளர்களும் தரவு பகுப்பாய்வு செய்யும் ஆய்வாளர்களும் செயல்முறையின் போது இந்த செய்திகளைக் கூறக் கருத்தில் கொள்ளலாம்.[45]

  1. நேரத் தொடர்: 10 ஆண்டு காலப்பகுதியில் வேலையின்மை விகிதம் ஒரு குறிப்பிட்ட காலப்பகுதியில் ஒரு ஒற்றை மாறியாகப் பதிவு செய்யலாம். இந்த மாறியின் போக்கை நிறுவ அல்லது விளக்க வரி விளக்கப்படத்தைப் பயன்படுத்தலாம்.[46]
  2. தரவரிசை: வகைப்படுத்தப்பட்ட உட்பிரிவுகள் விற்பனை செயல்திறனின் தரவரிசை போன்று ஏறுவரிசை அல்லது இறங்கு வரிசையில் தரவரிசைப்படுத்தப்படுகின்றன (விற்பனையாளர்களின் திறனை அளவிடும் வகை) ஒவ்வொரு விற்பனையாளருக்கும் ஒரு குறிப்பிட்ட உட்பிரிவுடன் ஒரே காலகட்டத்தில்.[47] விற்பனையாளர்கள் இடையிலான ஒப்பீட்டைக் காட்ட, ஒரு பட்டை விளக்கப்படத்தைப் பயன்படுத்தலாம்.
  3. பகுதி- முதல் முழுமை வரை: இங்கு,வகைப்படுத்தப்பட்ட உட்பிரிவுகள் ஒட்டுமொத்தத்தின் விகிதமாக அளவிடப்படுகின்றன (அதாவது, நூற்ருவீதத்தில் ). ஒரு பை விளக்கப்படம் அல்லது பட்டை விளக்கப்படம் சந்தையில் போட்டியாளர்களால் உருவகப்படுத்தப்படும் சந்தைப் பங்கு போன்ற விகிதங்களின் ஒப்பீட்டைக் காட்டலாம்.[48]
  4. விலகல்: குறிப்பிட்ட காலத்திற்கு ஒரு வணிகத்தின் பல துறைகளுக்கான உண்மையான, வரவு செலவுத் திட்ட செலவினங்களின் ஒப்பீடு போன்ற ஒரு குறிப்புக்கு எதிராக வகைப்படுத்தப்பட்ட உட்பிரிவுகள் ஒப்பிடப்படுகின்றன. ஒரு பட்டை விளக்கப்படம் உண்மையான, குறிப்பு தொகையின் ஒப்பீட்டைக் காட்ட முடியும்.[49]
  5. நிகழ்வெண் பரவல்: பங்குச் சந்தை வருவாய் 0 - 10% - 11 - 20% போன்ற இடைவெளிகளுக்கு இடையில் இருக்கும் ஆண்டுகளின் எண்ணிக்கை போன்ற குறிப்பிட்ட இடைவெளியில் ஒரு குறிப்பிட்ட மாறியின் நோக்கீடுகளின் எண்ணிக்கையைக் காட்டுகிறது. இந்த பகுப்பாய்விற்கு ஒரு ஹிஸ்டோகிராம் ஒரு வகை பட்டை விளக்கப்படம் பயன்படுத்தப்படலாம்.[50]
  6. ஒட்டுறவுகள்: இரண்டு மாறிகளால் குறிப்பிடப்படும் அவதானிப்புகளுக்கு இடையிலான ஒப்பீடு (அவை ஒரே அல்லது எதிர் திசைகளில் நகர்கின்றனவா என்பதை தீர்மானிக்க). எடுத்துக்காட்டாக , வேலையின்மை (X) மற்றும் பணவீக்கம் (Y) மாதப் படிமத்தைத் திட்டமிடுதல். இந்த செய்தியை விளக்க, ஒரு சிதறல் வரைவு பொதுவாக பயன்படுகிறது.[51]
  7. இயல்பளவு ஒப்பீடு: தயாரிப்பு குறியீட்டின் அடிப்படையில் விற்பனை அளவு போன்ற குறிப்பிட்ட வரிசையில் வகைப்படுத்தப்பட்ட உட்பிரிவுகளை ஒப்பிடுதல். இந்த ஒப்பீட்டிற்கு ஒரு பட்டை விளக்கப்படம் பயன்படும்.[52]
  8. புவியியல் அல்லது புவிப்பரப்பியல்: இவை வரைபடம் அல்லது அமைப்பில் ஒரு மாறியின் ஒப்பீடு, அதாவது, மாநில வாரியாக வேலையின்மை விகிதம் அல்லது ஒரு கட்டிடத்தின் பல்வேறு தளங்களில் உள்ள நபர்களின் எண்ணிக்கை போன்றவை. ஒரு நிலவரைவுப்படம் என்பது இதற்குப் பயன்படும் ஒரு பொதுவான வரைவியல் முறையாகும்.[53][54]

அளவியலான தரவை பகுப்பாய்வு செய்யும் நுட்பங்கள்[தொகு]

எழுத்தாளர் ஜொனாதன் கூமி , அளவு தரவைப் புரிந்துகொள்வதற்கான சிறந்த பின்வரும் நடைமுறைகளின் வரிசையைப் பரிந்துரைத்துள்ளார்:[55]

  • பகுப்பாய்வு செய்வதற்கு முன் பிறழ்வுகளுக்கான மூலத் தரவைச் சரிபார்க்கவும்.
  • சூத்திரம் சார்ந்த தரவுகளின் நெடுவரிசைகளை சரிபார்ப்பது போன்ற முதன்மைக் கணக்கீடுகளை மீண்டும் செய்யவும்.
  • முதன்மை மொத்தம் துணை மொத்தங்களின் கூட்டுத்தொகை என்பதை உறுதிப்படுத்தவும்.
  • காலப்போக்கில் விகிதங்கள் போன்ற கணிக்கக்கூடிய வழியில் தொடர்புடைய எண்களுக்கு இடையிலான உறவுகளைச் சரிபார்க்கவும்.
  • ஒரு நபருக்கான தொகைகளைப் பகுப்பாய்வு செய்வது அல்லது மொத்த உள்ளக உற்பத்தியுடன் தொடர்புடைய அல்லது ஒரு அடிப்படை ஆண்டுடன் தொடர்புடைய இலக்கு மதிப்பாக ஒப்பிடுவதை எளிதாக்க எண்களை இயல்பாக்கவும்.
  • சமபங்கு மீதான வருவாய் குறித்த தூடுபோன்ட்டுப் பகுப்பாய்வு போன்ற முடிவுகளுக்கு வழிவகுத்த காரணிகளைப் பகுப்பாய்வு செய்து சிக்கல்களை கூறுகளாக உடைக்கவும்.[22]

செய்முறையின் கீழ் உள்ள மாறிகளுக்கு , ஆய்வாளர்கள் பொதுவாக சராசரி, செந்தர விலகல் போன்ற விளக்கமுறைப் புள்ளிவிவரங்களைப் பெறுகிறார்கள்.[56] தனிப்பட்ட மதிப்புகள் சராசரியைச் சுற்றி எவ்வாறு குவிகின்றன என்பதைப் பார்க்க முதன்மை மாறிகளின் பரவலையும் அவர்கள் பகுப்பாய்வு செய்யலாம்.[57]

தரவு பகுப்பாய்விற்கு பயன்படுத்தப்படும் MECE கொள்கையின் ஒரு எடுத்துக்காட்டு.

மெக்கின்சி அண்ட் கம்பெனியின் அறிவுரையாளர்கள் ஒரு அளவியல் சிக்கலை அதன் கூறுகளாக உடைப்பதற்கான ஒரு நுட்பத்திற்குப் தமக்குள் விலகிய ஒட்டுமொத்த விரிவுக் (MECE) கொள்கை என்று பெயரிட்டனர்.[58] ஒவ்வொரு அடுக்கையும் அதன் கூறுகளாகப் பிரிக்கலாம். ஒவ்வொரு துணை கூறுகளும் ஒன்றுக்கொன்று சிறப்பானதாக இருக்க வேண்டும். மேலும் அவை மேலே உள்ள அடுக்குடன் கூட்டப்பட வேண்டும்.[59] இந்த உறவு " தமக்குள் விலகிய ஒட்டுமொத்த விரிவு " (MECE) என்று குறிப்பிடப்படுகிறது. எடுத்துக்காட்டாக , வரையறையின்படி ஈட்டத்தை(இலாபத்தை) மொத்த வருவாயாகவும் மொத்தச் செலவாகவும் பிரிக்கலாம்.[60] மொத்த வருவாயை அதன் கூறுகளான A, B, C (இவை ஒன்றுக்கொன்று தமக்குள் விலகியவை) ஆகியவற்றின் வருவாயால் பகுப்பாய்வு செய்யலாம்.. மேலும் இவற்றை மொத்த வருவாயில் சேர்க்க வேண்டும் (ஒட்டுமொத்தமாக விரிவானவை).[61]

சில பகுப்பாய்வு சிக்கல்களைத் தீர்க்க ஆய்வாளர்கள் வலுவான புள்ளியியல் அளவீடுகளைப் பயன்படுத்தலாம்.[62] உண்மையான விவகாரங்கள் பற்றிய ஒரு குறிப்பிட்ட கருதுகோள் ஆய்வாளரால் உருவாக்கப்பட்டு , அந்த நிலைமை உண்மையா அல்லது பொய்யா என்பதை தீர்மானிக்க தரவு திரட்டப்படும்போது கருதுகோள் செய்முறை பயன்படுத்தப்படுகிறது.[63] எடுத்துக்காட்டாக , " வேலையின்மை பணவீக்கத்தில் எந்த விளைவையும் ஏற்படுத்தாது " என்று கருதலாம் , இது பிலிப்சு வரைவு எனப்படும் பொருளியல் கருத்துடன் தொடர்புடையது.[64] கருதுகோள் செய்முறையில் வகை I, வகை II பிழைகளின் சாத்தியக்கூறுகளைக் கருத்தில் கொள்வதும் அடங்கும் , இது கருதுகோளை ஏற்றுக்கொள்வதா அல்லது நிராகரிப்பதா என்பதை தரவு ஏற்கிறதா என்பது தொடர்புடையது.[65]

தற்சார்பு மாறி X எந்த அளவிற்கு சார்பு மாறி Y ஐ மாற்றுகிறது என்பதைத் தீர்மானிக்க முயற்சிக்கும்போது பின்னேகும் பகுப்பாய்வு பயன்படுத்தப்படலாம் (எ. கா. " வேலையின்மை விகிதத்தில் ஏற்படும் மாற்றங்கள்(X) பணவீக்க விகிதத்தை(Y)) எந்த விகிதத்தில் மாற்றுகிறது .[66] இது ஒரு சமன்பாட்டுக் கோடு அல்லது வரைவை தரவுகளுக்குப் படிமமாகப் பொருத்துவதற்கான முயற்சியாகும் , அதாவது Y என்பது X இன் சார்பாகும்.[67][68]

தேவையான கட்டுத்தளை பகுப்பாய்வு (NCA) பகுப்பாய்வாளர் எந்த அளவிற்கு தர்சார்பு Xமாறியை Y மாறி ஏற்கிறது என்பதை தீர்மானிக்க முயற்சிக்கும்போது பயன்படும். (எ. கா. " ஒரு குறிப்பிட்ட வேலையின்மை விகிதம் எந்த அளவிற்கு ஒரு குறிப்பிட்ட பணவீக்க விகிதத்திற்குத் தேவை).[66] அதேவேளை (பல மடங்கு பின்னேகும் பகுப்பாய்வு சேர்க்கைத் தருக்கத்தைப் பயன்படுத்துகிறது , அங்கு ஒவ்வொரு எக்ஸ் மாறியும் விளைவை உருவாக்க முடியும். மேலும், எக்ஸ் ஒன்றுக்கொன்று தம்முள் ஈடுசெய்ய முடியும் (அவை போதுமானவை ஆனால் கட்டாயமானவையில்லை.) தேவையான கட்டுத்தளைப் பகுப்பாய்வு (NCA) ஒன்று அல்லது அதற்கு மேற்பட்ட எக்ஸ் - மாறிகள் விளைவை ஏற்க வேண்டிய கண்டிப்புத் தருக்கத்தைப் பயன்படுத்துகிறது; ஆனால் அதை உருவாக்காது. (அவை கட்டயமானவை ஆனால் போதுமானவை அல்ல).[69] ஒவ்வொரு தேவையான கட்டுத்தளையும் இருக்க வேண்டும்; ஆனால், ஈடுசெய்ய வாய்ப்பில்லை.[70]

தரவு பயனர்களின் பகுப்பாய்வு நடவடிக்கைகள்[தொகு]

மேலே கோடிட்டுக் காட்டப்பட்ட பொதுவான செய்திக்கு மாறாக , பயனர்கள் ஒரு தரவு தொகுப்பிற்குள் குறிப்பிட்ட தரவு புள்ளிகளைக் கொண்டிருக்கலாம். இத்தகைய குறைந்த அளவிலான பயனர் பகுப்பாய்வு நடவடிக்கைகள் பின்வரும் அட்டவணையில் வழங்கப்பட்டுள்ளன. வகைபிரித்தல், மதிப்புகளை மீட்டெடுப்பது, தரவுப் புள்ளிகளைக் கண்டறிதல், தரவுப் புள்ளிகளை ஏற்பாடு செய்தல் ஆகிய மூன்று செயல்பாடுகளால் ஒழுங்கமைக்கப்படலாம். .[71][72][73][74]

# பணி பொது விவரிப்பு முன்வடிவச் சுருக்கம் எடுத்துகாட்டுகள்
1 மீட்பு மதிப்பு Given a set of specific cases, find attributes of those cases. What are the values of attributes {X, Y, Z, ...} in the data cases {A, B, C, ...}? - What is the mileage per gallon of the Ford Mondeo?

- How long is the movie Gone with the Wind?

2 வடிகட்டி Given some concrete conditions on attribute values, find data cases satisfying those conditions. Which data cases satisfy conditions {A, B, C...}? - What Kellogg's cereals have high fiber?

- What comedies have won awards?

- Which funds underperformed the SP-500?

3 கொணர்மதிப்பைக் கணி Given a set of data cases, compute an aggregate numeric representation of those data cases. What is the value of aggregation function F over a given set S of data cases? - What is the average calorie content of Post cereals?

- What is the gross income of all stores combined?

- How many manufacturers of cars are there?

4 அறுதிமம் கன்டறி Find data cases possessing an extreme value of an attribute over its range within the data set. What are the top/bottom N data cases with respect to attribute A? - What is the car with the highest MPG?

- What director/film has won the most awards?

- What Marvel Studios film has the most recent release date?

5 வரிசைபடுத்து Given a set of data cases, rank them according to some ordinal metric. What is the sorted order of a set S of data cases according to their value of attribute A? - Order the cars by weight.

- Rank the cereals by calories.

6 நெடுக்கம் கண்டறி Given a set of data cases and an attribute of interest, find the span of values within the set. What is the range of values of attribute A in a set S of data cases? - What is the range of film lengths?

- What is the range of car horsepowers?

- What actresses are in the data set?

7 பரவலை பான்மைப்படுத்து Given a set of data cases and a quantitative attribute of interest, characterize the distribution of that attribute's values over the set. What is the distribution of values of attribute A in a set S of data cases? - What is the distribution of carbohydrates in cereals?

- What is the age distribution of shoppers?

8 பிறழ்வுகளைக் கண்டறி Identify any anomalies within a given set of data cases with respect to a given relationship or expectation, e.g. statistical outliers. Which data cases in a set S of data cases have unexpected/exceptional values? - Are there exceptions to the relationship between horsepower and acceleration?

- Are there any outliers in protein?

9 கொத்தாக்கு Given a set of data cases, find clusters of similar attribute values. Which data cases in a set S of data cases are similar in value for attributes {X, Y, Z, ...}? - Are there groups of cereals w/ similar fat/calories/sugar?

- Is there a cluster of typical film lengths?

10 ஒட்டுறவுபடுத்து Given a set of data cases and two attributes, determine useful relationships between the values of those attributes. What is the correlation between attributes X and Y over a given set S of data cases? - Is there a correlation between carbohydrates and fat?

- Is there a correlation between country of origin and MPG?

- Do different genders have a preferred payment method?

- Is there a trend of increasing film length over the years?

11 சூழல்வயமாக்கம்[74] Given a set of data cases, find contextual relevancy of the data to the users. Which data cases in a set S of data cases are relevant to the current users' context? - Are there groups of restaurants that have foods based on my current caloric intake?

பயனுள்ள பகுப்பாய்விற்கான தடைகள்[தொகு]

பயனுள்ள பகுப்பாய்விற்கான தடைகள் தரவு பகுப்பாய்வு செய்யும் ஆய்வாளர்களிடையே அல்லது பார்வையாளர்களிடையே இருக்கலாம். அறிவாற்றல் சார்புகள், எண்ணற்ற தன்மை ஆகியவற்றிலிருந்து உண்மையை வேறுபடுத்துவது அனைத்துத் தரவு பகுப்பாய்விற்கும் அறைகூவல்களாகும்.[75]

குழப்பமான உண்மையும் கருத்தும்[தொகு]

 

உங்களது கருத்துக்கு நீங்கள் உரிமை வாய்ந்தவரே, ஆனால் உங்கள் சொந்த உண்மைகளுக்கு உரிமையுள்ளவர் அன்று.

தானியேல் பாட்ரிக் மொய்னிதன்

பயனுள்ள பகுப்பாய்விற்குக் கேள்விகளுக்கு பதிலளிக்க பொருத்தமான உண்மைகளைப் பெறுவது தேவைப்படுகிறது - ஒரு முடிவு அல்லது முறையான கருத்து அல்லது செய்முறை கருதுகோள்களை ஏற்கிறது.[76][77] வரையறையின்படி உண்மைகள் மறுக்க முடியாதவை , அதாவது பகுப்பாய்வில் ஈடுபட்டுள்ள எந்தவொரு நபரும் அவற்றை ஒப்புக் கொள்ள முடியும்.[78] எடுத்துக்காட்டாக , 2010 ஆகத்தில் பேராயப் பாதீட்டு அலுவலகம் (சிபிஓ) புஷ்ஷின் 2001, 2003 ஆம் ஆண்டுகளுக்கான வரிக் குறைப்புகளை 2011 - 2020 காலத்திற்கு நீட்டித்திருப்பது தேசியக் கடனில் சுமார் 3 டிரில்லியன் டாலர்களை சேர்க்கும் என்று மதிப்பிட்டது.[79] உண்மையில் இதைத்தான் சிபிஓ அறிக்கை செய்ததாக அனைவரும் ஒப்புக் கொள்ள முடியும் , அவர்கள் அனைவரும் அறிக்கையை ஆராய முடியும். எனவே,இது ஒரு உண்மையாக மாறுகிறது. சிபிஓ அலுவலகத்துடன் மக்கள் உடன்படுகிறார்களா அல்லது உடன்படவில்லையா என்பது அவர்களின் சொந்த கருத்து.[80]

மற்றோர் எடுத்துகாட்டு , பொது வணிக நிறுவனங்களின் நிதி அறிக்கைகள் அனைத்து விஷயங்களிலும் நியாயமாக கூறப்பட்டுள்ளதா என்பது குறித்து ஒரு பொது நிறுவனத்தின் தணிக்கையாளர் ஒரு முறையான கருத்தை அடைய வேண்டும்.[81] இதற்கு அவர்களின் கருத்தை ஆதரிக்க உண்மைத் தரவு, சான்றுகளின் விரிவான பகுப்பாய்வு தேவைப்படுகிறது. உண்மைகளிலிருந்து கருத்துக்களுக்குப் பாய்ச்சலைச் செய்யும்போது , கருத்து தவறாகும் வாய்ப்பு எப்போதும் உள்ளது.[82]

அறிவாற்றல் சார்புகள்[தொகு]

பகுப்பாய்வை மோசமாக பாதிக்கக்கூடிய பல்வேறு அறிவாற்றல் சார்புகள் உள்ளன. எடுத்துக்காட்டாக , உறுதிப்படுத்தல் சார்பு என்பது ஒருவரின் முன்கூட்டிய கருத்துக்களை உறுதிப்படுத்தும் வகையில் தகவல்களைத் தேடும் அல்லது விளக்கும் போக்கு ஆகும். கூடுதலாக , தனிநபர்கள் தங்கள் கருத்துக்களை ஆதரிக்காத தகவல்களை இழிவுபடுத்தலாம்.[83]

இந்த சார்புகளைப் பற்றியும் அவற்றை எவ்வாறு சமாளிப்பது என்பதையும் அறிந்திருக்க ஆய்வாளர்கள் குறிப்பாகப் பயிற்றுவிக்கப்படலாம். ஓய்வுபெற்ற சிஐஏ ஆய்வாளர் ரிச்சர்ட்ஸ் ஹியூயர் தனது புத்தகமான உளவியல் உளவியல் பகுப்பாய்வில் , ஆய்வாளர்கள் தங்கள் அனுமானங்களையும் அனுமானச் சங்கிலிகளையும் தெளிவாக வரையறுக்க வேண்டும் என்றும் முடிவுகளில் உள்ள நிச்சயமற்ற தன்மையின் அளவு மற்றும் மூலத்தைக் குறிப்பிட வேண்டும் என்றும் எழுதினார். மாற்றுக் கண்ணோட்டங்களை வெளிப்படுத்தவும் விவாதிக்கவும் உதவும் நடைமுறைகளை அவர் வலியுறுத்தினார்.[84]

எண்கல்வி இன்மை[தொகு]

பயனுள்ள ஆய்வாளர்கள் பொதுவாக பல்வேறு எண் நுட்பங்களில் திறமையானவர்கள். இருப்பினும் பார்வையாளர்கள் எண்ணிக்கை அல்லது எண்ணியல் கல்வியறிவு இல்லாமல் இருக்கலாம் - அவர்கள் எண்கல்வியற்றவர்கள் என்று கூறப்படுகிறது.[85] தரவுகளை அறிவிப்பவர்களும் தவறான எண் நுட்பங்களைப் பயன்படுத்தி வேண்டுமென்றே தவறாக வழிநடத்தவோ அல்லது தவறாக தெரிவிக்கவோ முயற்சி செய்யலாம்.[86]

எடுத்துக்காட்டாக , ஒரு எண் உயர்கிறதா அல்லது வீழ்ச்சியடைகிறதா என்பது முத்ன்மைக் காரணியாக இருக்காது. அரசு வருவாய் அளவு அல்லது பொருளியல் சார்ந்த செலவினங்கள் (GDP) அல்லது பெருநிறுவன நிதி அறிக்கைகளில் உள்ள வருவாய் சார்ந்த செலவின் அளவு போன்ற மற்றொரு எண்ணுடன் தொடர்புள்ள எண்ணிக்கை மிக முதன்மையானதாக இருக்கலாம்.[87] இந்த எண்நுட்பம் இயல்பாக்கம் அல்லது பொது அளவாக்கம் என குறிப்பிடப்படுகிறது.[22] பணவீக்கத்திற்கு சரிசெய்வது (அதாவது உண்மையான, பெயரளவு தரவுகளை ஒப்பிடுவது அல்லது மக்கள் தொகை அதிகரிப்பு , மக்கள்தொகையியல் ஆகிய பலவற்றைக் கருத்தில் கொள்வது) போன்ற பல நுட்பங்கள் ஆய்வாளர்களால் பயன்படுத்தப்படுகின்றன.[88] மேலே உள்ள பிரிவில் விவரிக்கப்பட்டுள்ள பல்வேறு அளவு செய்திகளைத் தீர்க்க ஆய்வாளர்கள் பல்வேறு நுட்பங்களைப் பயன்படுத்துகின்றனர்.[89]

ஆய்வாளர்கள் வெவ்வேறு கற்பிதங்கள் அல்லது சூழ்நிலைகளின் கீழ் தரவைப் பகுப்பாய்வு செய்யலாம். எடுத்துக்காட்டாக , ஆய்வாளர்கள் நிதி அறிக்கையைப் பகுப்பாய்வு செய்யும்போது , அவர்கள் பெரும்பாலும் எதிர்கால பணப்புழக்கத்தின் மதிப்பீட்டை அடைய உதவும் வகையில் வெவ்வேறு கற்பிதங்களின் கீழ் நிதி அறிக்கைகளை மறுசீரமைப்பார்கள் , பின்னர் அவர்கள் நிறுவனத்தின் அல்லது அதன் பங்குகளின் மதிப்பீட்டைத் தீர்மானிக்க சில வட்டி விகிதத்தின் அடிப்படையில் தற்போதைய மதிப்புக்கு தள்ளுபடி செய்கிறார்கள்.[90][91] இதேபோல் , அரசாங்கத்தின் வருவாய் ஒதுக்கீடுகளிலும் பற்றாக்குறைகளிலும் பல்வேறு கொள்கை விருப்பங்களின் விளைவுகளை பாதீட்டு அலுவலகம் செய்கிறது. மேலும், முதன்மை நடவடிக்கைகளுக்கான மாற்று எதிர்காலச் சூழ்நிலைகளையும் உருவாக்குகிறது.[92]

பிற தலைப்புகள்[தொகு]

திறனுறு கட்டிடங்கள்[தொகு]

கட்டிடங்களில் ஆற்றல் நுகர்வைக் கணிப்பதற்காக தரவு பகுப்பாய்வு அணுகுமுறையைப் பயன்படுத்தலாம்.[93] தரவு பகுப்பாய்வுச் செயல்முறையின் பல்வேறு படிநிலைகள் உயர்திறக் கட்டிடங்களை அடைவதற்காக மேற்கொள்ளப்படுகின்றன இங்குக் கட்டிட மேலாண்மையும் கட்டுப்பாட்டு நடவடிக்கைகளும் வெப்பமூட்டல் காற்ருப்பதனம், விளக்கமைப்பு, பாதுகாப்பு ஆகியவற்றில் கட்டிடப் பயனர்களின் தேவைகளைப் நிறைவு செய்வதாலும் ஆற்றல், நேரம் போன்ற வளங்களை மேம்படுத்துவதாலும் தானாகவே உகப்புநிலை பகுத்தப்படுகின்றன.[94]

பகுப்பாய்வும் வணிக நுண்ணறிவும்[தொகு]

பகுப்பாய்வு என்பது " தர்வுகளை விரிவாகப் பயன்படுத்தி, முடிவுகளையும் செயல்முறைகளையும் மேற்கொள்ள, புள்ளியியல், அளவியலான பகுப்பாய்வையும் விளக்கல், முன்கணிப்பு படிமங்களையும் உண்மை அடிப்படையிலான மேலாண்மையையும் விரிவாகப் பயன்படுத்தும் புலமாகும். இது வணிக நுண்ணறிவின் துணைக்குழுவாகவும் தொழில்நுட்பங்களும் செயல்முறைகளும் இனந்த தொகுப்பாகவும் முடிவெடுப்பதற்கு வணிக செயல்திறனைப் புரிந்துகொள்ளவும் பகுப்பாய்வு செய்யவும் தரவைப் பயன்படுத்துகிறது.[95]

கல்வி[தொகு]

தரவு காட்சிப்படுத்தல் பயனர்களின் பகுப்பாய்வு நடவடிக்கைகள்

கல்வியில் பெரும்பாலான கல்வியாளர்கள் மாணவர் தரவைப் பகுப்பாய்வு செய்யும் நோக்கத்திற்காக ஒரு தரவு அமைப்பை அணுகலாம்.[96] இந்த தரவு அமைப்புகள்( உட்திவு அடையாளங்கள், துணைநிரப்பு ஆவணங்கள், முதன்மைத் தொகுப்பு / காட்சி, உள்ளடக்க முடிவுகளை எடுக்கும் உதவி அமைப்பு போன்றன) கல்வியாளர்களின் தரவு பகுப்பாய்வுகளின் துல்லியத்தை மேம்படுத்தும் தரவு வடிவத்தை கல்வியாளர்களுக்கு வழங்குகின்றன.[97]

பயிற்சியாளர் குறிப்புகள்[தொகு]

இந்தப் பகுதியில் பயிற்சியாளர்களுக்கு உதவக்கூடிய தொழில்நுட்ப விளக்கங்கள் உள்ளன. ஆனால் இவை விக்கிப்பீடியா கட்டுரையின் வழக்கமான மரபுக்கு அப்பாற்பட்டவை.[98]

முதன்மைத் தரவு பகுப்பாய்வு[தொகு]

தொடக்கநிலைத் தரவு பகுப்பாய்வு கட்டத்திற்கும் முதன்மைப் பகுப்பாய்வுக் கட்டத்திற்கும் இடையிலான மிக தலையாய வேறுபாடு என்னவென்றால், தொடக்கநிலைத் தரவுப் பகுப்பாய்வின் போது மூல ஆராய்ச்சி கேள்விக்கு பதிலளிப்பதை நோக்கமாகக் கொண்ட எந்தவொரு பகுப்பாய்விலிருந்தும் ஒருவர் விலகிச் செல்கிறார்.[99] தொடக்கநிலைத் தரவு பகுப்பாய்வுக் கட்டம் பின்வரும் நான்கு கேள்விகளால் வழிநடத்தப்படுகிறது:

தரவுகளின் தரம்[தொகு]

தரவுகளின் தரத்தை விரைவில் சரிபார்க்க வேண்டும். தரவு தரத்தை, நிகழ்வெண், விளக்கமுறை புள்ளியியல் ( நிரல், செந்தர விலகல், நடுமன் போன்றன), இயல்புநிலை( சாய்மை, குர்த்தோசிசுமுறை, அலைவெண் வரைவுகள் போன்றன) போன்ற பல்வேறு வகையான பகுப்பாய்வுகளைப் பயன்படுத்தி, பல்வேறு வழிகளில் மதிப்பிட முடியும்.[100]

  • அறுதிநிலை நோக்கீடுகளின் பகுப்பாய்வு: தரவுகளில் உள்ள விளிபுநிலை நோக்கீடுகள் இயற்பரவலைத் தொந்தரவு செய்கின்றனவா என்று பார்க்க, பகுப்பாய்வு செய்யவேண்டும்.[101]
  • குறிமுறைத் திட்டங்களில் உள்ள வேறுபாடுகளை ஒப்பிடுதலும் திருத்துதலும்: மாறிகள் தரவு தொகுப்பின் வெளிப்புற மாறிகளின் குறிமுறைத் திட்டங்களுடன் ஒப்பிடப்படவேண்டும். மேலும் குறியீட்டு திட்டங்கள் ஒப்பிடப்படாவிட்டால் சரிசெய்யப்படவேண்டும்.[102]
  • பொதுமுறை வேறுபாட்டிற்கான சோதனை செய்யவேண்டும்..

தொடக்கநிலைத் தரவு பகுப்பாய்வு கட்டத்தில் தரவு தரத்தை மதிப்பிடுவதற்கான பகுப்பாய்வுகளின் தேர்வு, முதன்மைப் பகுப்பாய்வு கட்டத்தில் நடத்தப்படும் பகுப்பாய்வுகளைப் பொறுத்தது.

அளவீடுகளின் தரம்[தொகு]

அளவீட்டுக் கருவி ஆய்வின் குவியம் அல்லது ஆராய்ச்சி கேள்வி அல்ல எனில், அளவீட்டு கருவிகளின் தரம் தொடக்கநிலைத் தரவு பகுப்பாய்வுக் கட்டத்தில் மட்டுமே சரிபார்க்கப்பட வேண்டும். . [103] அளவீட்டு கருவிகளின் அமைப்பு தரவரைவில் தெரிவிக்கப்பட்ட கட்டமைப்புடன் ஒத்திருக்கிறதா என்பதை ஒருவர் சரிபார்க்க வேண்டும்.

அளவீட்டு தரத்தை மதிப்பிடுவதற்கு இரண்டு வழிகள் உள்ளன:

  • உறுதிப்படுத்தும் காரணி பகுப்பாய்வு
  • ஒருபடித்தான பகுப்பாய்வு (உட்புற ஒருபடிநிலைமை) ஒரு அளவீட்டு கருவியின் நம்பகத்தன்மையின் அறிகுறியைக் கொடுக்கிறது. இந்த பகுப்பாய்வின் போது , உருப்படிகளின் மாறுபாடுகள், ஒரு உருப்படி ஒரு அளவிலிருந்து நீக்கப்படும் போது, அளவுகோல்களின் குரோன்பாக்கின் ஆல்பா, குரோன்பேக்கின் ஆல்பாவில் ஏற்படும் மாற்றம் ஆகியவற்றை ஒருவர் ஆய்வு செய்கிறார் .[104]

தொடக்க்கநிலை உருமாற்றங்கள்[தொகு]

தரவு, அளவீடுகளின் தரத்தை மதிப்பிட்ட பிறகு , காணாமல் போன தரவைக் கண்டரியவோ அல்லது ஒன்று அல்லது அதற்கு மேற்பட்ட மாறிகளின் தொடக்கநிலை மாற்றங்களைச் சரிசெய்யவோ முடிவு செய்யலாம் , இருப்பினும் இதை முதன்மைப் பகுப்பாய்வு கட்டத்திலும் செய்யலாம்.[105]

  • சதுர வேர் மாற்றம் (விநியோகம் இயல்பானதிலிருந்து மிதமாக வேறுபட்டால்)
  • பதிவு - மாற்றம் (விநியோகம் இயல்பானவற்றிலிருந்து கணிசமாக வேறுபட்டால்)
  • தலைகீழ் மாற்றம் (விநியோகம் இயல்பானதிலிருந்து கடுமையாக வேறுபட்டால்)
  • வகைப்படுத்தல் (வரிசை / இருதரப்பு) (விநியோகம் இயல்பிலிருந்து கடுமையாக வேறுபட்டால் மற்றும் எந்த மாற்றமும் உதவாது)

ஆய்வை செயல்படுத்துவது ஆராய்ச்சி வடிவமைப்பின் நோக்கங்களை நிறைவு செய்கிறதா?[தொகு]

எடுத்துக்காட்டாக , சீரற்றமயமாக்கல் செயல்முறையின் வெற்றியை ஒருவர் சரிபார்க்க வேண்டும் எனில்,, பின்னணி, கணிசமான மாறிகள் குழுக்களுக்குள்ளும் அமைப்பு முழுவதும் சமமாக பகிரப்படுகிறதா என்பதைச் சரிபார்க்க வேண்டும்.[106] ஆய்வுக்கு ஒரு சீரற்ற செயல்முறை தேவையில்லை அல்லது பயன்படுத்தவில்லை என்றால் , ஒருவர் சீரற்ற படிமத்தின் வெற்றியை சரிபார்க்க வேண்டும் , எடுத்துக்காட்டாக , ஆர்வமுள்ள மக்கள்தொகையின் அனைத்து துணைக்குழுக்களும் படிமத்தில் குறிப்பிடப்படுகிறதா என்பதைச் சரிபார்க்க வேண்டும்.[107]சரிபார்க்கப்பட வேண்டிய பிற வாய்ப்புள்ள பின்வரும் தரவு சிதைவுகள் சரிபார்க்கப்படவேண்டும்:

  • இடைநிற்றல் (இது ஆரம்ப தரவு பகுப்பாய்வு கட்டத்தில் அடையாளம் காணப்பட வேண்டும்)
  • பொருள் பதிலளிக்காதது (இது சீரற்றதாக இருந்தாலும் இல்லாவிட்டாலும் ஆரம்ப தரவு பகுப்பாய்வு கட்டத்தில் மதிப்பீடு செய்யப்பட வேண்டும்)
  • சிகிச்சையின் தரம் (கையாளுதல் சோதனைகளைப் பயன்படுத்துதல்.

தரவுப் பதக்கூறின் பான்மை[தொகு]

எந்தவொரு அறிக்கையிலும் அல்லது கட்டுரையிலும் படிமத்தின் கட்டமைப்பு துல்லியமாக விவரிக்கப்பட வேண்டும்.[108][109] துணைக்குழு பகுப்பாய்வு முதன்மைப் பகுப்பாய்வு கட்டத்தில் செய்யப்படும்போது, குறிப்பாக துணைக்குழுக்களின் அளவு வரை, படிமத்தின் கட்டமைப்பைத் துல்லியமாக தீர்மானிப்பது மிகவும் இன்றியமையாதது .[110]தரவு மாதிரியின் பண்புகளை பின்வருவனவற்றைப் பார்த்து மதிப்பீடு செய்யலாம்:

  • முதன்மை மாறிகளின் அடிப்படை புள்ளிவிவரங்கள்
  • சிதறடிக்கப்பட்ட வரைவுகள
  • ஒட்டுறவுகளும் கூட்டிணைவுகளும்
  • குறுக்கு - அட்டவணைப்படுத்தல்கள் 127

தொடக்கநிலைத் தரவு பகுப்பாய்வின் இறுதிக் கட்டம்[தொகு]

இறுதிக் கட்டத்தில் தொடக்கநிலைத் தரவு பகுப்பாய்வின் கண்டுபிடிப்புகள் ஆவணப்படுத்தப்பட்டு , தேவையானவற்றுக்கு முன்னுரிமை அளிக்கப்படுகின்றன. மேலும், வாய்ப்புள்ள திருத்த நடவடிக்கைகள் எடுக்கப்படுகின்றன.[111]மேலும் , முதன்மைத் தரவு பகுப்பாய்வுகளுக்கான மூலத் திட்டம் இன்னும் விரிவாக குறிப்பிடப்படலாம் அல்லது மீண்டும் எழுதப்படலாம்.[112]இதைச் செய்ய , முதன்மைத் தரவு பகுப்பாய்வுகள் பற்றிய பல முடிவுகள் எடுக்கப்படலாம்..

  • இயல்நிலைப் பரவல் சாராத நேர்வு: மாறிகளின் வகைகளை ஒழுங்கானவையா, எதிரிணைகளா என வகைப்படுத்த வேண்டும். பகுப்பாய்வு முறையை மாற்றியமைக்கவேண்டும்.
  • தரவு காணாமல் போகும் நேர்வு: காணாமல் போன தரவை ஒருவர் புறக்கணிக்க வேண்டுமா அல்லது இடைக்கணிப்பு செய்ய வேண்டுமா அப்படியெனில், எந்த இடைக்கணிப்பு நுட்பத்தைப் பயன்படுத்த வேண்டும் என முடிவெடுக்க வேண்டும்.
  • பொய்த்தகவல்கள் நிலை: ஒருவர் வலுவான பகுப்பாய்வு நுட்பங்களைப் பயன்படுத்த வேண்டுமா என முடிவெடுக்க வேண்டும்.
  • உருப்படிகள் அளவுகோலில் பொருந்தா நிலை: உருப்படிகளைத் தவிர்த்து அளவீட்டு கருவியை மாற்றியமைக்க வேண்டுமா அல்லது அவற்றை மற்ற அளவீட்டுக் கருவிகளுடன் ஒப்பீட்டு உறுதிப்படுத்த வேண்டுமா என முடிவெடுக்க வேண்டும்
  • மிகச் சிறிய துணைக்குழுக்கள் நிலை: குழுக்களுக்கிடையேயான வேறுபாடுகள் பற்றிய கருதுகோளை ஒருவர் கைவிட வேண்டுமா அல்லது சரியான சோதனைகள் வழி அல்லது தொடக்கச் சிறுபடிம நுட்பங்களைப் பயன்படுத்த வேண்டுமா எனமுடிவெடுக்க வேண்டும்.
  • சீரற்ற செயல்முறை குறைபாடுள்ளதாகத் தோன்றினால்: ஒருவர் முனைவு மதிப்பெண்களைக் கணக்கிட்டு அவற்றை முதன்மைப் பகுப்பாய்வுகளில் இணைமாறிகளாகச் சேர்க்க வேண்டுமா என முடிவெடுக்க வேண்டும்

நேரியலற்ற பகுப்பாய்வு[தொகு]

தொடக்கநிலைத் தரவு பகுப்பாய்வுக் கட்டத்தில் பல பகுப்பாய்வுகளைப் பயன்படுத்தலாம்:

  • ஒற்றைமாறியல்பு புள்ளியியல் (ஒற்றை மாறி)
  • இருமாறியல்பு கூட்டிணைவுகள் (ஒட்டுறவுகள்)
  • வரைகலை நுட்பங்கள் (சிதறல் வரைவுகள்)

ஒவ்வொரு மட்டத்திற்கும் சிறப்பு புள்ளியியல் நுட்பங்கள் கிடைப்பதால் பகுப்பாய்வுகளுக்கு மாறிகளின் அளவீட்டு நிலைகளை கணக்கில் எடுத்துக்கொள்வது இன்றியமையாதது ஆகும்.

  • பெயரளவு மற்றும் வரிசை மாறிகள்
    • அதிர்வெண் எண்ணிக்கை (எண்கள், நூற்றுவீதங்கள்)
    • கூட்டிணைவுகள்
      • சுற்றுவட்டத் தடங்கள் ( குறுக்கு அட்டவணைப்படுத்தல்கள்)
      • படிநிலை லாக்லைனர் பகுப்பாய்வு (பேரளவாக 8 மாறிகளுக்கு கட்டுப்படுத்தப்பட்டுள்ளது)
      • loglinear பகுப்பாய்வு (பொருத்தமான / முதன்மை மாறிகள், வாய்புள்ள குழப்பங்களை அடையாளம் காண)
    • துல்லியமான சோதனைகள் அல்லது தொடக்கநிலைப்படுத்துதல் (துணைக்குழுக்கள் சிறியதாக இருந்தால்)
    • புதிய மாறிகளின் கணக்கீடு
  • தொடர்ச்சியான மாறிகள்
    • பரவல்நிலை
      • புள்ளியியல் (நிரல், செந்தர விலக்கம், வேறுபாடு, சாய்மை, குர்த்தோசிசுமுறை போன்றன)
      • தண்டு, இலை காட்சிப் பெட்டிகள்
      • பெட்டி வரைவுகள்

நேரியல் அல்லாத பகுப்பாய்வு[தொகு]

ஒரு நேரியலற்ற அமைப்பிலிருந்து தரவு பதிவு செய்யப்படும்போது நேரியல் அல்லாத பகுப்பாய்வு பெரும்பாலும் கட்டாயம் தேவை. நேரியல் அல்லாத அமைப்புகள் எளிய நேரியல் முறைகளைப் பயன்படுத்தி பகுப்பாய்வு செய்யும்போது, இருமைப் பிளவுகள் , குழப்பம் , கிளையலைகள் துணைக் கிளையலைகள் உள்ளிட்ட சிக்கலான இயங்கியல் விளைவுகளை வெளிப்படுத்தலாம். நேரியல் அல்லாத தரவு பகுப்பாய்வு நேரியல் அல்லாத அமைப்பு அடையாளத்துடன் நெருக்கமாகத் தொடர்புடையது.[113]

தொடக்கநிலைத் தரவு பகுப்பாய்வு[தொகு]

முதன்மைப் பகுப்பாய்வுக் கட்டத்தில் , ஆராய்ச்சி கேள்விக்குப் பதிலளிப்பதை நோக்கமாகக் கொண்ட பகுப்பாய்வுகள் மேற்கொள்ளப்படுகின்றன , அத்துடன் ஆராய்ச்சி அறிக்கையின் முதல் வரைவை எழுதத் தேவையான வேறு பொருத்தமான பகுப்பாய்வும் செய்யப்படும்.

தேடல், உறுதிப்படுத்தல் அணுகுமுறைகள்[தொகு]

முதன்மைப் பகுப்பாய்வு கட்டத்தில் ஒரு தேட்டம்(தேடல்) அல்லது உறுதிப்படுத்தல் அணுகுமுறையைப் பின்பற்றலாம். பொதுவாக தரவு திரட்டப்படுவதற்கு முன்பு அணுகுமுறை தீர்மானிக்கப்படுகிறது.[114] ஒரு தேட்டப் பகுப்பாய்வில் தரவைப் பகுப்பாய்வு செய்வதற்கு முன்கருதுகோள் எதுவும் கூறப்பட மாட்டாது. மேலும் தரவு நன்கு விவரிக்கும் படிமங்களுக்காகத் தேடப்படுகிறது.[115] ஒரு உறுதிப்படுத்தல் பகுப்பாய்வில் தரவு பற்றிய தெளிவான கருதுகோள்கள் சோதிக்கப்படுகின்றன.[116]

தேட்டத் தரவு பகுப்பாய்வு கவனமாக விளக்கப்பட வேண்டும். ஒரே நேரத்தில் பல படிமங்களைச் சோதிக்கும்போது , அவற்றில் குறைந்தது ஒன்றையாவது குறிப்பிடத்தக்கதாகக் கண்டுபிடிப்பதற்கான அதிக வாய்ப்பு உள்ளது. ஆனால் இது வகை 1 பிழை காரணமாகவும் இருக்கலாம்.[117] பல படிமங்களைச் சோதிக்கும் போது எப்போதும் கணிசமானதைச் சரிசெய்வது முதன்மையானதாகும். எடுத்துக்காட்டாக, ஒரு பான்ஃபெரோனி திருத்தத்தைக் கூறலாம்.[118] மேலும் , ஒரு தேட்டப் பகுப்பாய்வை, அதே தரவுத்தொகுப்பில் உறுதிப்படுத்தல் பகுப்பாய்வுடன், ஒருவர் பின்பற்றக்கூடாது.[119] ஒரு தேட்டப் பகுப்பாய்வு ஒரு கோட்பாட்டிற்கான எண்ணக்கருக்களைக் கண்டறியப் பயன்படுத்தப்படுகிறது , ஆனால் அது அந்தக் கோட்பாட்டைச் சோதிக்க செய்யப்படுவதன்று.[119] ஒரு படிமத்தை ஒரு தரவுத்தொகுப்பில் ஆய்வு செய்யும்போது , அதே தரவுத்தளத்தில் உறுதிப்படுத்தல் பகுப்பாய்வுடன் அந்த பகுப்பாய்வைத் தொடர்ந்து உறுதிப்படுத்தல், பகுப்பாய்வின் முடிவுகள் முதல் இடத்தில் தேட்டப் படிமத்தை விளைவித்த அதே வகை 1 பிழை காரணமாகவும் இருக்கலாம் என்று கொள்ளவேண்டும்.[119] எனவே உறுதிப்படுத்தல் பகுப்பாய்வு அசல் ஆய்வு பகுப்பாய்வை விட அதிக தகவல் தருவதாக இருக்காது.

முடிவுகளின் நிலைத்தன்மை[தொகு]

முடிவுகள் எவ்வளவு பொதுமைப்படுத்தக்கூடியவை என்பதற்கான சில அறிகுறிகளைப் பெறுவது முதன்மையானது. இது பெரும்பாலும் சரிபார்க்க கடினமாக இருந்தாலும் , முடிவுகளின் நிலைப்புத்தன்மையைப் பார்க்கலாம். முடிவுகள் நம்பகமானவையா, மீண்டும் உருவாக்கக்கூடியவையா என்பதை அறிய இரண்டு முதன்மை வழிகள் உள்ளன.[120]

  • குறுக்கு சரிபார்ப்பு. தரவை பல பகுதிகளாகப் பிரிப்பதால் , ஒரு பகுப்பாய்வு தரவின் ஒரு பகுதியை அடிப்படையாகக் கொண்ட (பொருத்தப்பட்ட படிமம் போன்றது) தரவுகள் மற்றொரு பகுதிக்கும் பொதுமைப்படுகிறதா என்பதை நாம் சரிபார்க்கலாம்.[121] குழு தரவுகள் போல, தரவுகளுக்குள் ஒட்டுறவுகள் இருந்தால் குறுக்கு சரிபார்ப்பு பொதுவாக பொருத்தமற்றது.[122] எனவே சில நேரங்களில் சரிபார்ப்புக்கான பிற முறைகளைப் பயன்படுத்த வேண்டி நேரும். இந்த தலைப்பைப் பற்றி மேலும் அறிய , காண்க, புள்ளியியல் படிமச் சரிபார்ப்பு.[123]
  • உணர்திறன் பகுப்பாய்வு. உலகளாவிய அளவுருக்கள் முறைப்படி மாறுபடும் போது ஒரு அமைப்பு அல்லது படிமத்தின் நடத்தையைப் படிப்பதற்கான ஒரு நடைமுறை. இதைச் செய்வதற்கான ஒரு வழி , பூட்ஸ்ட்ராப்பிங் வழிமுறையாகும்.[124]

தரவு பகுப்பாய்விற்கான இலவச மென்பொருள்கள்[தொகு]

தரவு பகுப்பாய்விற்கான குறிப்பிடத்தக்க இலவச மென்பொருள்கள் பின்வருமாறு:

  • DevInfo-மனித வளர்ச்சியைக் கண்காணிக்கவும் பகுப்பாய்வு செய்யவும் ஐக்கிய நாடுகள் மேம்பாட்டுக் குழு பரிந்துரைக்கும் தரவுத்தள அமைப்பு.[125]
  • ELKI - ஜாவாவில் தரவு மீட்பு அடிப்படையிலான காட்சிப்படுத்தல் செயல்பாடுகளுடன் தரவுச் சுரங்கச் சட்டகம்.
  • KNIME - கான்சுட்டான்சு தகவல் சுரங்கத் தொழிலகம் பயனர் நட்பு மற்றும் விரிவான தரவு பகுப்பாய்வு கட்டமைப்பை வழங்குகிறது.
  • ஆரஞ்சுச்Orangeவ் - ஊடாடும் தரவு காட்சிப்படுத்தல், புள்ளியியல் தரவுப் பகுப்பாய்வு முறைகள் , தரவு சுரங்கம், இயந்திர கற்றல் ஆகிய முறைகளைக் கொண்ட ஒரு காட்சி நிரலாக்க கருவி.
  • பாண்டாஸ் - தரவு பகுப்பாய்விற்கான பைத்தான் நூலகம்.
  • PAW - CERN இல் உருவாக்கப்பட்ட FORTRAN / C தரவு பகுப்பாய்வுக் கட்டமைப்பு
  • R - புள்ளியியல் கணிப்புக்கும் கணிப்புசார் வரைவியலுக்குமான நிரலாக்க மொழியும் மென்பொருள் சூழலும்.[126]
  • CERN இல் உருவாக்கப்பட்ட RoOT - C++ தரவு பகுப்பாய்வுக் கட்டமைப்பு.
  • SciPy - தரவு பகுப்பாய்விற்கான பைத்தான் நூலகம்.
  • ஜூலியா - எண் பகுப்பாய்வுக்கும் கணக்கீட்டு அறிவியலுக்கும் மிகவும் பொருத்தமான ஒரு நிரலாக்க மொழி.

பன்னாட்டுத் தரவு பகுப்பாய்வு போட்டிகள்[தொகு]

பல்வேறு குழுமங்கள் அல்லது நிறுவனங்கள் ஆராய்ச்சியாளர்கள் தங்கள் தரவைப் பயன்படுத்தவும் ஊக்குவிக்கவும் அல்லது தரவு பகுத்தறிவைப் பயன்படுத்தி ஒரு குறிப்பிட்ட கேள்வியைத் தீர்க்கவும் தரவு பகுப்பாய்வு போட்டிகளை நடத்துகின்றன , .[127] நன்கு அறியப்பட்ட பன்னாட்டுத் தரவு பகுப்பாய்வு போட்டிகளின் சில எடுத்துக்காட்டுகள் பின்வருமாறு:[128]

  • காக்கிள் நடத்தும் காக்கிள் போட்டி.[129]
  • எல்டிபிபி தரவு பகுப்பாய்வு போட்டி FHWA, ASCE. ஆகிய அமைப்புகளால் நடத்தப்பட்டது.[130][131]

மேலும் காண்க[தொகு]

 

மேற்கோள்கள்[தொகு]

சான்றுகள்[தொகு]

  1. 1.0 1.1 "Transforming Unstructured Data into Useful Information", Big Data, Mining, and Analytics, Auerbach Publications, pp. 227–246, 2014-03-12, doi:10.1201/b16666-14, ISBN 978-0-429-09529-0, பார்க்கப்பட்ட நாள் 2021-05-29
  2. "The Multiple Facets of Correlation Functions", Data Analysis Techniques for Physical Scientists, Cambridge University Press, pp. 526–576, 2017, doi:10.1017/9781108241922.013, ISBN 978-1-108-41678-8, பார்க்கப்பட்ட நாள் 2021-05-29
  3. Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. எஆசு:10.1108/BIJ-08-2012-0050
  4. Exploring Data Analysis
  5. "Data Coding and Exploratory Analysis (EDA) Rules for Data Coding Exploratory Data Analysis (EDA) Statistical Assumptions", SPSS for Intermediate Statistics, Routledge, pp. 42–67, 2004-08-16, doi:10.4324/9781410611420-6, ISBN 978-1-4106-1142-0, பார்க்கப்பட்ட நாள் 2021-05-29
  6. Spie (2014-10-01). "New European ICT call focuses on PICs, lasers, data transfer". SPIE Professional. doi:10.1117/2.4201410.10. பன்னாட்டுத் தர தொடர் எண்:1994-4403. http://dx.doi.org/10.1117/2.4201410.10. 
  7. Goodnight, James (2011-01-13). "The forecast for predictive analytics: hot and getting hotter". Statistical Analysis and Data Mining: The ASA Data Science Journal 4 (1): 9–10. doi:10.1002/sam.10106. பன்னாட்டுத் தர தொடர் எண்:1932-1864. http://dx.doi.org/10.1002/sam.10106. 
  8. Sherman, Rick (4 November 2014). Business intelligence guidebook: from data integration to analytics. Amsterdam. பன்னாட்டுத் தரப்புத்தக எண்:978-0-12-411528-6. இணையக் கணினி நூலக மையம்:894555128. https://www.worldcat.org/oclc/894555128. 
  9. Field, John (2009), "Dividing listening into its components", Listening in the Language Classroom, Cambridge: Cambridge University Press, pp. 96–109, doi:10.1017/cbo9780511575945.008, ISBN 978-0-511-57594-5, பார்க்கப்பட்ட நாள் 2021-05-29
  10. 10.0 10.1 Judd, Charles. Data Analysis. பன்னாட்டுத் தரப்புத்தக எண்:0-15-516765-0. 
  11. Tukey, John W. (March 1962). "John Tukey-The Future of Data Analysis-July 1961". The Annals of Mathematical Statistics 33 (1): 1–67. doi:10.1214/aoms/1177704711. http://projecteuclid.org/download/pdf_1/euclid.aoms/1177704711. பார்த்த நாள்: 2015-01-01. 
  12. 12.0 12.1 12.2 12.3 Doing Data Science. O'Reilly Media. 2013. பன்னாட்டுத் தரப்புத்தக எண்:978-1-449-35865-5. https://archive.org/details/doingdatascience0000schu. 
  13. "USE OF THE DATA", Handbook of Petroleum Product Analysis, Hoboken, NJ: John Wiley & Sons, Inc, pp. 296–303, 2015-02-06, doi:10.1002/9781118986370.ch18, ISBN 978-1-118-98637-0, பார்க்கப்பட்ட நாள் 2021-05-29
  14. Ainsworth, Penne (20 May 2019). Introduction to accounting : an integrated approach. பன்னாட்டுத் தரப்புத்தக எண்:978-1-119-60014-5. இணையக் கணினி நூலக மையம்:1097366032. 
  15. Olusola, Johnson Adedeji; Shote, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. (7 May 2021). "Table 1: Data type and sources of data collected for this research.". PeerJ 9: e11387. doi:10.7717/peerj.11387/table-1. 
  16. MacPherson, Derek (2019-10-16), "Information Technology Analysts' Perspectives", Data Strategy in Colleges and Universities, Routledge, pp. 168–183, doi:10.4324/9780429437564-12, ISBN 978-0-429-43756-4, பார்க்கப்பட்ட நாள் 2021-05-29
  17. Figure 3—source data 1. Raw and processed values obtained through qPCR.. 30 August 2017. doi:10.7554/elife.28468.029. 
  18. 18.0 18.1 Bohannon, John (2016-02-24). "Many surveys, about one in five, may contain fraudulent data". Science. doi:10.1126/science.aaf4104. பன்னாட்டுத் தர தொடர் எண்:0036-8075. 
  19. Jeannie Scruggs, Garber (2010). Avoiding common nursing errors. பன்னாட்டுத் தரப்புத்தக எண்:978-1-60547-087-0. இணையக் கணினி நூலக மையம்:338288678. https://archive.org/details/avoidingcommonnu0000unse. 
  20. "Data Cleaning".
  21. Hancock, R.G.V.; Carter, Tristan (February 2010). "How reliable are our published archaeometric analyses? Effects of analytical techniques through time on the elemental analysis of obsidians". Journal of Archaeological Science 37 (2): 243–250. doi:10.1016/j.jas.2009.10.004. பன்னாட்டுத் தர தொடர் எண்:0305-4403. Bibcode: 2010JArSc..37..243H. http://dx.doi.org/10.1016/j.jas.2009.10.004. 
  22. 22.0 22.1 22.2 "Perceptual Edge-Jonathan Koomey-Best practices for understanding quantitative data-February 14, 2006" (PDF).
  23. Peleg, Roni; Avdalimov, Angelika; Freud, Tamar (2011-03-23). "Providing cell phone numbers and email addresses to Patients: the physician's perspective". BMC Research Notes 4 (1): 76. doi:10.1186/1756-0500-4-76. பன்னாட்டுத் தர தொடர் எண்:1756-0500. பப்மெட்:21426591. 
  24. Goodman, Lenn Evan (1998). Judaism, human rights, and human values. பன்னாட்டுத் தரப்புத்தக எண்:0-585-24568-1. இணையக் கணினி நூலக மையம்:45733915. 
  25. Hanzo, Lajos. Blind joint maximum likelihood channel estimation and data detection for single-input multiple-output systems. doi:10.1049/iet-tv.44.786. http://dx.doi.org/10.1049/iet-tv.44.786. பார்த்த நாள்: 2021-05-29. 
  26. Hellerstein, Joseph (27 February 2008). "Quantitative Data Cleaning for Large Databases". EECS Computer Science Division: 3. http://db.cs.berkeley.edu/jmh/papers/cleaning-unece.pdf. பார்த்த நாள்: 26 October 2013. 
  27. Davis, Steve; Pettengill, James B.; Luo, Yan; Payne, Justin; Shpuntoff, Al; Rand, Hugh; Strain, Errol (26 August 2015). "CFSAN SNP Pipeline: An automated method for constructing SNP matrices from next-generation sequence data". PeerJ Computer Science 1: e20. doi:10.7717/peerj-cs.20/supp-1. 
  28. "FTC requests additional data". Pump Industry Analyst 1999 (48): 12. December 1999. doi:10.1016/s1359-6128(99)90509-8. பன்னாட்டுத் தர தொடர் எண்:1359-6128. http://dx.doi.org/10.1016/s1359-6128(99)90509-8. 
  29. Exploring your Data with Data Visualization & Descriptive Statistics: Common Descriptive Statistics for Quantitative Data. 2017. doi:10.4135/9781529732795. http://dx.doi.org/10.4135/9781529732795. 
  30. Tableau your data! : fast and easy visual analysis with Tableau Software. J. Wiley & Sons. பன்னாட்டுத் தரப்புத்தக எண்:978-1-118-61204-0. 
  31. Ben-Ari, Mordechai (2012), "First-Order Logic: Formulas, Models, Tableaux", Mathematical Logic for Computer Science, London: Springer London, pp. 131–154, doi:10.1007/978-1-4471-4129-7_7, ISBN 978-1-4471-4128-0, பார்க்கப்பட்ட நாள் 2021-05-31
  32. Causation. Oxford Univ. Press. பன்னாட்டுத் தரப்புத்தக எண்:978-0-19-875094-9. 
  33. Evans, Michelle V.; Dallas, Tad A.; Han, Barbara A.; Murdock, Courtney C.; Drake, John M. (28 February 2017). "Figure 2. Variable importance by permutation, averaged over 25 models.". eLife 6: e22053. doi:10.7554/elife.22053.004. 
  34. Watson, Kevin; Halperin, Israel; Aguilera-Castells, Joan; Iacono, Antonio Dello (12 November 2020). "Table 3: Descriptive (mean ± SD), inferential (95% CI) and qualitative statistics (ES) of all variables between self-selected and predetermined conditions.". PeerJ 8: e10361. doi:10.7717/peerj.10361/table-3. 
  35. Cortés-Molino, Álvaro; Aulló-Maestro, Isabel; Fernandez-Luque, Ismael; Flores-Moya, Antonio; Carreira, José A.; Salvo, A. Enrique (22 October 2020). "Table 3: Best regression models between LIDAR data (independent variable) and field-based Forestereo data (dependent variable), used to map spatial distribution of the main forest structure variables.". PeerJ 8: e10158. doi:10.7717/peerj.10158/table-3. 
  36. International Sales Terms, Beck/Hart, 2014, doi:10.5040/9781472561671.ch-003, ISBN 978-1-4725-6167-1, பார்க்கப்பட்ட நாள் 2021-05-31
  37. Nwabueze, JC (2008-05-21). "Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal". Journal of the Nigerian Association of Mathematical Physics 9 (1). doi:10.4314/jonamp.v9i1.40071. பன்னாட்டுத் தர தொடர் எண்:1116-4336. http://dx.doi.org/10.4314/jonamp.v9i1.40071. 
  38. Conway, Steve (2012-07-04). "A Cautionary Note on Data Inputs and Visual Outputs in Social Network Analysis". British Journal of Management 25 (1): 102–117. doi:10.1111/j.1467-8551.2012.00835.x. பன்னாட்டுத் தர தொடர் எண்:1045-3172. http://dx.doi.org/10.1111/j.1467-8551.2012.00835.x. 
  39. "Customer Purchases and Other Repeated Events", Data Analysis Using SQL and Excel®, Indianapolis, Indiana: John Wiley & Sons, Inc., pp. 367–420, 2016-01-29, doi:10.1002/9781119183419.ch8, ISBN 978-1-119-18341-9, பார்க்கப்பட்ட நாள் 2021-05-31
  40. Grandjean, Martin (2014). "La connaissance est un réseau". Les Cahiers du Numérique 10 (3): 37–54. doi:10.3166/lcn.10.3.37-54. http://www.martingrandjean.ch/wp-content/uploads/2015/02/Grandjean-2014-Connaissance-reseau.pdf. பார்த்த நாள்: 2015-05-05. 
  41. Data requirements for semiconductor die. Exchange data formats and data dictionary, BSI British Standards, doi:10.3403/02271298, பார்க்கப்பட்ட நாள் 2021-05-31
  42. Yee, D. (1985-04-01). "How to Communicate Your Message to an Audience Effectively". The Gerontologist 25 (2): 209. doi:10.1093/geront/25.2.209. பன்னாட்டுத் தர தொடர் எண்:0016-9013. http://dx.doi.org/10.1093/geront/25.2.209. 
  43. Bemowska-Kałabun, Olga; Wąsowicz, Paweł; Napora-Rutkowski, Łukasz; Nowak-Życzyńska, Zuzanna; Wierzbicka, Małgorzata (11 June 2019). Supplemental Information 1: Raw data for charts and tables. doi:10.7287/peerj.preprints.27793v1/supp-1. 
  44. Tunqui Neira, José Manuel (2019-09-19). Thank you for your review. Please find in the attached pdf file a detailed response to the points you raised.. doi:10.5194/hess-2019-325-ac2. 
  45. Brackett, John W. (1989), "Performing Requirements Analysis Project Courses for External Customers", Issues in Software Engineering Education, New York, NY: Springer New York, pp. 276–285, doi:10.1007/978-1-4613-9614-7_20, ISBN 978-1-4613-9616-1, பார்க்கப்பட்ட நாள் 2021-06-03
  46. Wyckhuys, Kris A. G.; Wongtiem, Prapit; Rauf, Aunu; Thancharoen, Anchana; Heimpel, George E.; Le, Nhung T. T.; Fanani, Muhammad Zainal; Gurr, Geoff M. et al. (19 October 2018). "Figure 2: Bi-monthly mealybug population fluctuations in southern Vietnam, over a 2-year time period.". PeerJ 6: e5796. doi:10.7717/peerj.5796/fig-2. 
  47. Riehl, Emily (2014), "A sampling of 2-categorical aspects of quasi-category theory", Categorical Homotopy Theory, Cambridge: Cambridge University Press, pp. 318–336, doi:10.1017/cbo9781107261457.019, ISBN 978-1-107-26145-7, பார்க்கப்பட்ட நாள் 2021-06-03
  48. Chart C5.3. Percentage of 15-19 year-olds not in education, by labour market status (2012). doi:10.1787/888933119055. http://dx.doi.org/10.1787/888933119055. பார்த்த நாள்: 2021-06-03. 
  49. Chart 7: Households: final consumption expenditure versus actual individual consumption. doi:10.1787/665527077310. http://dx.doi.org/10.1787/665527077310. பார்த்த நாள்: 2021-06-03. 
  50. Chao, Luke H.; Jang, Jaebong; Johnson, Adam; Nguyen, Anthony; Gray, Nathanael S.; Yang, Priscilla L.; Harrison, Stephen C. (12 July 2018). "Figure 4. Frequency of hemifusion (measured as DiD fluorescence dequenching) as a function of number of bound Alexa-fluor-555/3-110-22 molecules.". eLife 7: e36461. doi:10.7554/elife.36461.006. 
  51. Garnier, Elodie M.; Fouret, Nastasia; Descoins, Médéric (3 February 2020). "Table 2: Graph comparison between Scatter plot, Violin + Scatter plot, Heatmap and ViSiElse graph.". PeerJ 8: e8341. doi:10.7717/peerj.8341/table-2. 
  52. Product comparison chart: Wearables. 2009. doi:10.1037/e539162010-006. http://dx.doi.org/10.1037/e539162010-006. பார்த்த நாள்: 2021-06-03. 
  53. "Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004" (PDF). பார்க்கப்பட்ட நாள் 2014-10-29.
  54. "Stephen Few-Perceptual Edge-Graph Selection Matrix" (PDF). பார்க்கப்பட்ட நாள் 2014-10-29.
  55. Recommended Best Practices. 2008-10-01. doi:10.14217/9781848590151-8-en. http://dx.doi.org/10.14217/9781848590151-8-en. பார்த்த நாள்: 2021-06-03. 
  56. Hobold, Edilson; Pires-Lopes, Vitor; Gómez-Campos, Rossana; Arruda, Miguel de; Andruske, Cynthia Lee; Pacheco-Carrillo, Jaime; Cossio-Bolaños, Marco Antonio (30 November 2017). "Table 1: Descriptive statistics (mean ± standard-deviation) for somatic variables and physical fitness ítems for males and females.". PeerJ 5: e4032. doi:10.7717/peerj.4032/table-1. 
  57. Ablin, Jacob N.; Zohar, Ada H.; Zaraya-Blum, Reut; Buskila, Dan (13 September 2016). "Table 2: Cluster analysis presenting mean values of psychological variables per cluster group.". PeerJ 4: e2421. doi:10.7717/peerj.2421/table-2. 
  58. "Consultants Employed by McKinsey & Company", Organizational Behavior 5, Routledge, pp. 77–82, 2008-07-30, doi:10.4324/9781315701974-15, ISBN 978-1-315-70197-4, பார்க்கப்பட்ட நாள் 2021-06-03
  59. Antiphanes (2007), Olson, S. Douglas (ed.), "H6 Antiphanes fr.172.1-4, from Women Who Looked Like Each Other or Men Who Looked Like Each Other", Broken Laughter: Select Fragments of Greek Comedy, Oxford University Press, doi:10.1093/oseo/instance.00232915, ISBN 978-0-19-928785-7, பார்க்கப்பட்ட நாள் 2021-06-03
  60. Carey, Malachy (November 1981). "On Mutually Exclusive and Collectively Exhaustive Properties of Demand Functions". Economica 48 (192): 407–415. doi:10.2307/2553697. பன்னாட்டுத் தர தொடர் எண்:0013-0427. http://dx.doi.org/10.2307/2553697. 
  61. Total tax revenue. doi:10.1787/352874835867. http://dx.doi.org/10.1787/352874835867. பார்த்த நாள்: 2021-06-03. 
  62. "Dual-use car may solve transportation problems". Chemical & Engineering News Archive 46 (24): 44. 1968-06-03. doi:10.1021/cen-v046n024.p044. பன்னாட்டுத் தர தொடர் எண்:0009-2347. http://dx.doi.org/10.1021/cen-v046n024.p044. 
  63. Heckman (1978). "Simple Statistical Models for Discrete Panel Data Developed and Applied to Test the Hypothesis of True State Dependence against the Hypothesis of Spurious State Dependence". Annales de l'inséé (30/31): 227–269. doi:10.2307/20075292. பன்னாட்டுத் தர தொடர் எண்:0019-0209. http://dx.doi.org/10.2307/20075292. 
  64. Munday, Stephen C. R. (1996), "Unemployment, Inflation and the Phillips Curve", Current Developments in Economics, London: Macmillan Education UK, pp. 186–218, doi:10.1007/978-1-349-24986-2_11, ISBN 978-0-333-64444-7, பார்க்கப்பட்ட நாள் 2021-06-03
  65. Louangrath, Paul I. (2013). "Alpha and Beta Tests for Type I and Type II Inferential Errors Determination in Hypothesis Testing". SSRN Electronic Journal. doi:10.2139/ssrn.2332756. பன்னாட்டுத் தர தொடர் எண்:1556-5068. http://dx.doi.org/10.2139/ssrn.2332756. 
  66. 66.0 66.1 Yanamandra, Venkataramana (September 2015). "Exchange rate changes and inflation in India: What is the extent of exchange rate pass-through to imports?". Economic Analysis and Policy 47: 57–68. doi:10.1016/j.eap.2015.07.004. பன்னாட்டுத் தர தொடர் எண்:0313-5926. http://dx.doi.org/10.1016/j.eap.2015.07.004. 
  67. Mudiyanselage, Nawarathna. Characterization of epigenetic changes and their connection to gene expression abnormalities in clear cell renal cell carcinoma. 
  68. Moreno Delgado, David; Møller, Thor C.; Ster, Jeanne; Giraldo, Jesús; Maurel, Damien; Rovira, Xavier; Scholler, Pauline; Zwier, Jurriaan M. et al. (29 June 2017). "Appendix 1—figure 5. Curve data included in Appendix 1—table 4 (solid points) and the theoretical curve by using the Hill equation parameters of Appendix 1—table 5 (curve line).". eLife 6: e25233. doi:10.7554/elife.25233.027. 
  69. Feinmann, Jane. How Can Engineers and Journalists Help Each Other?. doi:10.1049/iet-tv.48.859. http://dx.doi.org/10.1049/iet-tv.48.859. பார்த்த நாள்: 2021-06-03. 
  70. Dul, Jan (2015). "Necessary Condition Analysis (NCA): Logic and Methodology of 'Necessary But Not Sufficient' Causality". SSRN Electronic Journal. doi:10.2139/ssrn.2588480. பன்னாட்டுத் தர தொடர் எண்:1556-5068. http://dx.doi.org/10.2139/ssrn.2588480. 
  71. Robert Amar, James Eagan, and John Stasko (2005) "Low-Level Components of Analytic Activity in Information Visualization" பரணிடப்பட்டது 2015-02-13 at the வந்தவழி இயந்திரம்
  72. William Newman (1994) "A Preliminary Analysis of the Products of HCI Research, Using Pro Forma Abstracts" பரணிடப்பட்டது 2016-03-03 at the வந்தவழி இயந்திரம்
  73. Mary Shaw (2002) "What Makes Good Research in Software Engineering?" பரணிடப்பட்டது 2018-11-05 at the வந்தவழி இயந்திரம்
  74. 74.0 74.1 Yavari, Ali. ConTaaS: An Approach to Internet-Scale Contextualisation for Developing Efficient Internet of Things Applications. பன்னாட்டுத் தரப்புத்தக எண்:9780998133102. https://scholarspace.manoa.hawaii.edu/handle/10125/41879.  பிழை காட்டு: Invalid <ref> tag; name "ConTaaS" defined multiple times with different content
  75. "Connectivity tool transfers data among database and statistical products". Computational Statistics & Data Analysis 8 (2): 224. July 1989. doi:10.1016/0167-9473(89)90021-2. பன்னாட்டுத் தர தொடர் எண்:0167-9473. http://dx.doi.org/10.1016/0167-9473(89)90021-2. 
  76. "Information relevant to your job", Obtaining Information for Effective Management, Routledge, pp. 48–54, 2007-07-11, doi:10.4324/9780080544304-16, ISBN 978-0-08-054430-4, பார்க்கப்பட்ட நாள் 2021-06-03
  77. Testing statistical hypotheses. Springer. 1997. பன்னாட்டுத் தரப்புத்தக எண்:978-1-4419-3178-8. https://archive.org/details/testingstatistic0000lehm_a7b0. 
  78. Fielding, Henry (2008-08-14), "Consisting partly of facts, and partly of observations upon them", Tom Jones, Oxford University Press, doi:10.1093/owc/9780199536993.003.0193, ISBN 978-0-19-953699-3, பார்க்கப்பட்ட நாள் 2021-06-03
  79. "Congressional Budget Office-The Budget and Economic Outlook-August 2010-Table 1.7 on Page 24". {{cite web}}: Missing or empty |url= (help)
  80. "Students' sense of belonging, by immigrant background". PISA 2015 Results (Volume III). PISA. 2017-04-19. doi:10.1787/9789264273856-table125-en. பன்னாட்டுத் தரப்புத்தக எண்:9789264273818. பன்னாட்டுத் தர தொடர் எண்:1996-3777. http://dx.doi.org/10.1787/9789264273856-table125-en. 
  81. Gordon, Roger (March 1990). "Do Publicly Traded Corporations Act in the Public Interest?". National Bureau of Economic Research Working Papers (Cambridge, MA). doi:10.3386/w3303. http://dx.doi.org/10.3386/w3303. 
  82. Minardi, Margot (2010-09-24), "Facts and Opinion", Making Slavery History, Oxford University Press, pp. 13–42, doi:10.1093/acprof:oso/9780195379372.003.0003, ISBN 978-0-19-537937-2, பார்க்கப்பட்ட நாள் 2021-06-03
  83. Papineau, David (1988), "Does the Sociology of Science Discredit Science?", Relativism and Realism in Science, Dordrecht: Springer Netherlands, pp. 37–57, doi:10.1007/978-94-009-2877-0_2, ISBN 978-94-010-7795-8, பார்க்கப்பட்ட நாள் 2021-06-03
  84. "Introduction" (PDF). பார்க்கப்பட்ட நாள் 2021-10-25.
  85. Figure 6.7. Differences in literacy scores across OECD countries generally mirror those in numeracy. doi:10.1787/888934081549. http://dx.doi.org/10.1787/888934081549. பார்த்த நாள்: 2021-06-03. 
  86. "Bloomberg-Barry Ritholz-Bad Math that Passes for Insight-October 28, 2014". பார்க்கப்பட்ட நாள் 2014-10-29.
  87. Gusnaini, Nuriska; Andesto, Rony; Ermawati (2020-12-15). "The Effect of Regional Government Size, Legislative Size, Number of Population, and Intergovernmental Revenue on The Financial Statements Disclosure". European Journal of Business and Management Research 5 (6). doi:10.24018/ejbmr.2020.5.6.651. பன்னாட்டுத் தர தொடர் எண்:2507-1076. http://dx.doi.org/10.24018/ejbmr.2020.5.6.651. 
  88. Linsey, Julie S.; Becker, Blake (2011), "Effectiveness of Brainwriting Techniques: Comparing Nominal Groups to Real Teams", Design Creativity 2010, London: Springer London, pp. 165–171, doi:10.1007/978-0-85729-224-7_22, ISBN 978-0-85729-223-0, பார்க்கப்பட்ட நாள் 2021-06-03
  89. Lyon, J. (April 2006). Purported Responsible Address in E-Mail Messages. doi:10.17487/rfc4407. http://dx.doi.org/10.17487/rfc4407. 
  90. Stock, Eugene (10 June 2017). The History of the Church Missionary Society Its Environment, its Men and its Work. 
  91. Gross, William H. (July 1979). "Coupon Valuation and Interest Rate Cycles". Financial Analysts Journal 35 (4): 68–71. doi:10.2469/faj.v35.n4.68. பன்னாட்டுத் தர தொடர் எண்:0015-198X. http://dx.doi.org/10.2469/faj.v35.n4.68. 
  92. 25. General government total outlays. doi:10.1787/888932348795. http://dx.doi.org/10.1787/888932348795. பார்த்த நாள்: 2021-06-03. 
  93. González-Vidal, Aurora; Moreno-Cano, Victoria (2016). "Towards energy efficiency smart buildings models based on intelligent data analytics". Procedia Computer Science 83 (Elsevier): 994–999. doi:10.1016/j.procs.2016.04.213. 
  94. "Low-Energy Air Conditioning and Lighting Control", Building Energy Management Systems, Routledge, pp. 406–439, 2013-07-04, doi:10.4324/9780203477342-18, ISBN 978-0-203-47734-2, பார்க்கப்பட்ட நாள் 2021-06-03
  95. Competing on Analytics. O'Reilly. 2007. பன்னாட்டுத் தரப்புத்தக எண்:978-1-4221-0332-6. https://archive.org/details/competingonanaly00thom. 
  96. Aarons, D. (2009). Report finds states on course to build pupil-data systems. Education Week, 29(13), 6.
  97. Rankin, J. (2013, March 28). How data Systems & reports can either fight or propagate the data analysis error epidemic, and how educator leaders can help. பரணிடப்பட்டது 2019-03-26 at the வந்தவழி இயந்திரம் Presentation conducted from Technology Information Center for Administrative Leadership (TICAL) School Leadership Summit.
  98. Brödermann, Eckart J. (2018), "Article 2.2.1 (Scope of the Section)", Commercial Law, Nomos Verlagsgesellschaft mbH & Co. KG, p. 525, doi:10.5771/9783845276564-525, ISBN 978-3-8452-7656-4, பார்க்கப்பட்ட நாள் 2021-06-03
  99. Jaech, J.L. (1960-04-21). Analysis of dimensional distortion data from initial 24 quality certification tubes. doi:10.2172/10170345. http://dx.doi.org/10.2172/10170345. 
  100. Kjell, Oscar N. E.; Thompson, Sam (19 December 2013). "Descriptive statistics indicating the mean, standard deviation and frequency of missing values for each condition (N = number of participants), and for the dependent variables (DV)". PeerJ 1: e231. doi:10.7717/peerj.231/table-1. 
  101. Practice for Dealing With Outlying Observations, ASTM International, doi:10.1520/e0178-16a, பார்க்கப்பட்ட நாள் 2021-06-03
  102. "Alternative Coding Schemes for Dummy Variables", Regression with Dummy Variables, Newbury Park, CA: SAGE Publications, Inc., pp. 64–75, 1993, doi:10.4135/9781412985628.n5, ISBN 978-0-8039-5128-0, பார்க்கப்பட்ட நாள் 2021-06-03
  103. Danilyuk, P. M. (July 1960). "Computing the displacement of the initial contour of gears when they are checked by means of balls". Measurement Techniques 3 (7): 585–587. doi:10.1007/bf00977716. பன்னாட்டுத் தர தொடர் எண்:0543-1972. http://dx.doi.org/10.1007/bf00977716. 
  104. Terwilliger, James S.; Lele, Kaustubh (June 1979). "Some Relationships Among Internal Consistency, Reproducibility, and Homogeneity". Journal of Educational Measurement 16 (2): 101–108. doi:10.1111/j.1745-3984.1979.tb00091.x. பன்னாட்டுத் தர தொடர் எண்:0022-0655. http://dx.doi.org/10.1111/j.1745-3984.1979.tb00091.x. 
  105. Tabachnick & Fidell, 2007, p. 87-88.
  106. Tchakarova, Kalina (October 2020). "2020/31 Comparing job descriptions is insufficient for checking whether work is equally valuable (BG)". European Employment Law Cases 5 (3): 168–170. doi:10.5553/eelc/187791072020005003006. பன்னாட்டுத் தர தொடர் எண்:1877-9107. http://dx.doi.org/10.5553/eelc/187791072020005003006. 
  107. Random sampling and randomization procedures, BSI British Standards, doi:10.3403/30137438, பார்க்கப்பட்ட நாள் 2021-06-03
  108. Sandberg, Margareta (June 2006). "Acupuncture Procedures Must be Accurately Described". Acupuncture in Medicine 24 (2): 92–94. doi:10.1136/aim.24.2.92. பன்னாட்டுத் தர தொடர் எண்:0964-5284. பப்மெட்:16783285. http://dx.doi.org/10.1136/aim.24.2.92. 
  109. Jaarsma, C.F.. Verkeer in een landelijk gebied: waarnemingen en analyse van het verkeer in zuidwest Friesland en ontwikkeling van een verkeersmodel. இணையக் கணினி நூலக மையம்:1016575584. 
  110. Foth, Christian; Hedrick, Brandon P.; Ezcurra, Martin D. (18 January 2016). "Figure 4: Centroid size regression analyses for the main sample.". PeerJ 4: e1589. doi:10.7717/peerj.1589/fig-4. 
  111. "The Final Years (1975-84)", The Road Not Taken, Boydell & Brewer, pp. 853–922, 2018-06-18, doi:10.2307/j.ctv6cfncp.26, ISBN 978-1-57647-332-0, பார்க்கப்பட்ட நாள் 2021-06-03
  112. Supplementary file 4. Raw data and R-based analyses. 7 March 2017. doi:10.7554/elife.24102.023. 
  113. Billings S.A. "Nonlinear System Identification: NARMAX Methods in the Time, Frequency, and Spatio-Temporal Domains". Wiley, 2013
  114. "Exploratory Data Analysis", Python® for R Users, Hoboken, NJ, USA: John Wiley & Sons, Inc., pp. 119–138, 2017-10-13, doi:10.1002/9781119126805.ch4, ISBN 978-1-119-12680-5, பார்க்கப்பட்ட நாள் 2021-06-03
  115. "Engaging in Exploratory Data Analysis, Visualization, and Hypothesis Testing ............................................................................................. Exploratory Data Analysis, Geovisualization, and Data", Spatial Analysis, CRC Press, pp. 106–139, 2015-07-28, doi:10.1201/b18808-8, ISBN 978-0-429-06936-9, பார்க்கப்பட்ட நாள் 2021-06-03
  116. "Hypotheses About Categories", Starting Statistics: A Short, Clear Guide, London: SAGE Publications Ltd, pp. 138–151, 2010, doi:10.4135/9781446287873.n14, ISBN 978-1-84920-098-1, பார்க்கப்பட்ட நாள் 2021-06-03
  117. Sordo, Rachele Del; Sidoni, Angelo (December 2008). "MIB-1 Cell Membrane Reactivity: A Finding That Should be Interpreted Carefully". Applied Immunohistochemistry & Molecular Morphology 16 (6): 568. doi:10.1097/pai.0b013e31817af2cf. பன்னாட்டுத் தர தொடர் எண்:1541-2016. பப்மெட்:18800001. http://dx.doi.org/10.1097/pai.0b013e31817af2cf. 
  118. Liquet, Benoit; Riou, Jérémie (2013-06-08). "Correction of the significance level when attempting multiple transformations of an explanatory variable in generalized linear models". BMC Medical Research Methodology 13 (1): 75. doi:10.1186/1471-2288-13-75. பன்னாட்டுத் தர தொடர் எண்:1471-2288. பப்மெட்:23758852. 
  119. 119.0 119.1 119.2 Mcardle, John J. (2008). Some ethical issues in confirmatory versus exploratory analysis. doi:10.1037/e503312008-001. http://dx.doi.org/10.1037/e503312008-001. பார்த்த நாள்: 2021-06-03. 
  120. Truswell IV, William H., ed. (2009), "3 The Facelift: A Guide for Safe, Reliable, and Reproducible Results", Surgical Facial Rejuvenation, Stuttgart: Georg Thieme Verlag, doi:10.1055/b-0034-73436, ISBN 978-1-58890-491-1, பார்க்கப்பட்ட நாள் 2021-06-03
  121. Supplementary file 1. Cross-validation schema.. 6 December 2018. doi:10.7554/elife.40224.014. 
  122. Hsiao, Cheng (2014), "Cross-Sectionally Dependent Panel Data", Analysis of Panel Data, Cambridge: Cambridge University Press, pp. 327–368, doi:10.1017/cbo9781139839327.012, ISBN 978-1-139-83932-7, பார்க்கப்பட்ட நாள் 2021-06-03
  123. Hjorth, J.S. Urban (2017-10-19), "Cross validation", Computer Intensive Statistical Methods, Chapman and Hall/CRC, pp. 24–56, doi:10.1201/9781315140056-3, ISBN 978-1-315-14005-6, பார்க்கப்பட்ட நாள் 2021-06-03
  124. Sheikholeslami, Razi; Razavi, Saman; Haghnegahdar, Amin (2019-10-10). "What should we do when a model crashes? Recommendations for global sensitivity analysis of Earth and environmental systems models". Geoscientific Model Development 12 (10): 4275–4296. doi:10.5194/gmd-12-4275-2019. பன்னாட்டுத் தர தொடர் எண்:1991-9603. Bibcode: 2019GMD....12.4275S. 
  125. Human development composite indices. 2018-09-19. doi:10.18356/ce6f8e92-en. http://dx.doi.org/10.18356/ce6f8e92-en. பார்த்த நாள்: 2021-06-03. 
  126. Wiley, Matt; Wiley, Joshua F. (2019), "Multivariate Data Visualization", Advanced R Statistical Programming and Data Models, Berkeley, CA: Apress, pp. 33–59, doi:10.1007/978-1-4842-2872-2_2, ISBN 978-1-4842-2871-5, பார்க்கப்பட்ட நாள் 2021-06-03
  127. Orduna-Malea, Enrique; Alonso-Arroyo, Adolfo (2018), "A cybermetric analysis model to measure private companies", Cybermetric Techniques to Evaluate Organizations Using Web-Based Data, Elsevier, pp. 63–76, doi:10.1016/b978-0-08-101877-4.00003-x, ISBN 978-0-08-101877-4, பார்க்கப்பட்ட நாள் 2021-06-03
  128. "Examples of Survival Data Analysis", Statistical Methods for Survival Data Analysis, Wiley Series in Probability and Statistics, Hoboken, NJ, USA: John Wiley & Sons, Inc., 2003-06-30, pp. 19–63, doi:10.1002/0471458546.ch3, ISBN 978-0-471-45854-8, பார்க்கப்பட்ட நாள் 2021-06-03
  129. "The machine learning community takes on the Higgs". Symmetry Magazine. July 15, 2014. http://www.symmetrymagazine.org/article/july-2014/the-machine-learning-community-takes-on-the-higgs/. 
  130. "LTPP International Data Analysis Contest". September 29, 2016. பார்க்கப்பட்ட நாள் October 22, 2017.
  131. "Data.Gov:Long-Term Pavement Performance (LTPP)". May 26, 2016. பார்க்கப்பட்ட நாள் November 10, 2017.

நூல்தொகை[தொகு]

மேலும் படிக்க[தொகு]

"https://ta.wikipedia.org/w/index.php?title=தரவு_பகுப்பாய்வு&oldid=3849131" இலிருந்து மீள்விக்கப்பட்டது