எக்ஸ்எம்எல்

கட்டற்ற கலைக்களஞ்சியமான விக்கிப்பீடியாவில் இருந்து.
தாவிச் செல்லவும்: வழிசெலுத்தல், தேடல்
எக்ஸ்எம்எல்
XML.svg
Filename extension .xml
Internet media type application/xml, text/xml (deprecated)
Uniform Type Identifier public.xml
Developed by World Wide Web Consortium
Type of format Markup language
Extended from Standard Generalized Markup Language
Extended to XHTML, RSS, Atom
Standard(s) 1.0 (Fifth Edition) நவம்பர் 26 2008 (2008-11-26); 2095 தினங்களுக்கு முன்னதாக
1.1 (Second Edition) ஆகஸ்ட் 16 2006 (2006-08-16); 2928 தினங்களுக்கு முன்னதாக
Free file format? Yes

எக்ஸ்.எம்.எல் (XML, "எக்ஸ்டென்ஸிபிள் மார்க்அப் லாங்குவேஜ்") என்பது ஆவணங்களை மின்னணுரீதியில் என்கோடிங் செய்வதற்கான விதிகளின் தொகுப்பாகும். இது டபிள்யு3சி ஆல் உருவாக்கப்பட்ட எக்ஸ்எம்எல் 1.0 ஸ்பெசிஃபிகேஷன் மற்றும் வேறு சில ஸ்பெசிஃபிகேஷன்களிலும் வரையறுக்கப்பட்டுள்ளது; இவை அனைத்தும் கட்டணமில்லாத ஓபன் ஸ்டேண்டர்ட்கள் ஆகும்.[1]

எக்ஸ்எம்மல்லின் வடிவமைப்பு இலக்குகள் இணையத்தளத்தின் மீதான எளிமை, பொதுப்படைத்தன்மை மற்றும் பயன்பாட்டுத்திறனை வலியுறுத்துகின்றன.[2] உலக மொழிகளுக்கான யுனிகோட் வழியாக பெறும் வலுவான உதவியுடன் இது ஒரு உரையில் அமைந்த தரவு வடிவமாக இருக்கிறது. இருப்பினும் இது எக்ஸ்எம்எல்லின் வடிவமைப்பு ஆவணங்களின் மீது கவனம் செலுத்துகிறது என்றாலும் தடையற்ற தரவு கட்டமைப்புகளை பிரதிநிதித்துவம் செய்பனவாகவும் பரவலாக பயன்படுத்தப்படுகின்றன, உதாரணத்திற்கு வலைத்தள சேவைகள்.

எக்ஸ்எம்எல் தரவை அணுகுவதற்கு மென்பொருள் மேம்படுத்துநர்கள் பயன்படுத்தக்கூடிய பல வகையிலான நிரலாக்க இடைமுகங்கள் இருக்கின்றன என்பதோடு, சில ஸ்கீமா அமைப்புக்கள் எக்ஸ்எம்எல்-சார்ந்த மொழிகளின் வரையில் உதவுவதற்கென்று வரையறுக்கப்பட்டுள்ளன.

2009ஆர்எஸ்எஸ், ஆடம், எஸ்ஓஏபி மற்றும் எக்ஸ்ஹெச்டிஎம்எல் உள்ளிட்ட நூற்றுக்கணக்கான எக்ஸ்எம்எல்-சார்ந்த மொழிகள் உருவாக்கப்பட்டிருக்கின்றன.[3] மைக்ரோசாப்ட் ஆபீஸ் (ஆபீஸ் ஓபன் எக்ஸ்எம்எல்), OpenOffice.org (ஓபன் டாகுமெண்ட்) மற்றும் ஆப்பிளின் ஐஒர்க்[4] உள்ளிட்ட பெரும்பாலான ஆபீஸ் உபயோகக் கருவிகளுக்கென்று எக்ஸ்எம்எல் அடிப்படையிலான வடிவங்களை இயல்பானதாக வைத்திருக்கின்றன.

பொருளடக்கம்

முக்கிய சொற்களஞ்சியம்[தொகு]

இந்தப் பிரிவிலுள்ள மூலவிஷயம் எக்ஸ்எம்எல் ஸ்பெசிபிகேஷனின் அடிப்படையில் அமைந்துள்ளது. இது எக்ஸ்எம்எல்லில் தோன்றுகின்ற கட்டமைப்புகள் அனைத்தையும் உள்ளடக்கிய பட்டியல் அல்ல; தினசரிப் பயன்பாட்டில் மிகத் தொடர்ச்சியாக பெரும்பாலும் எதிர்கொள்ளப்படும் முக்கியமான கட்டமைப்புகளுக்கான அறிமுகத்தையும் இது வழங்குகிறது.

(யுனிகோட்) பண்புரு[தொகு]

வரையறையின் அடிப்படையில் எக்ஸ்எம்எல் ஆவணம் பண்புருக்களின் சரடாக இருக்கிறது. கிட்டத்தட்ட விதிகளினடிப்படையில் அமைந்த யுனிக்கோட் பண்புரு ஒவ்வொரு பண்புருவும் எக்ஸ்எம்எல் ஆவணத்தில் தோன்றுகிறது.

பிராசஸரும் பயன்பாடும்[தொகு]

எக்ஸ்எம்எல் ஆவணத்தை நிகழ்முறையாக்கும் மென்பொருள். ஒரு பயன்பாட்டின் சேவையில் ஒரு பிராசஸர் செயல்படும் என்று எதிர்பார்க்கப்படுகிறது. ஒரு எக்ஸ்எம்எல் பிராசஸர் எதைச் செய்யவேண்டும், எதைச் செய்யக்கூடாது என்பதற்கு குறிப்பிட்ட மிகவும் திட்டவட்டமான தேவைகள் இருக்கின்றன. இந்த பிராசஸர் என்பது (ஸ்பெசிபிகேஷன் அழைப்பதன்படி) சொல்வழக்காக 'எக்ஸ்எம்எல் பார்ஸர் என்று குறிப்பிடப்படுகிறது.

மார்க்அப்பும் உள்ளடக்கமும்[தொகு]

எக்ஸ்எம்எல் ஆவணத்தை உருவாக்கும் பண்புருக்கள் மார்க்அப் மற்றும் உள்ளடக்கம் என்று பிரிக்கப்பட்டுள்ளன. மார்க்அப்பும் உள்ளடக்கமும் எளிய சின்டாக்டிக் விதிகளின் பயன்பாட்டின் மூலமாக வேறுபடுத்தப்படுவதாக இருக்கலாம். மார்க்அப்பை உருவாக்கும் எல்லாச் சரடுகளும் "<" என்ற பண்புருவுடன் தொடங்கி ">" என்ற பண்புருவுடன் முடிகின்றன, அல்லது "&" இல் தொடங்கி ";" இல் முடிவுறுகின்றன. மார்க்அப்பாக இல்லாத பண்புருக்களின் சரடு உள்ளடக்கமாகும்.

டேக்[தொகு]

ஒரு மார்க்அப் கட்டமைப்பு "<" உடன் தொடங்கி ">" உடன் முடிவுறுகிறது. டேக்குகள் மூன்று தனித்திறன்களுடன் வருகின்றன: தொடக்க-டேக்குகள், உதாரணத்திற்கு , மற்றும் வெற்று-அடிப்படைக்கூறு டேக்குகள், உதாரணத்திற்கு <line-break/>.

அடிப்படைக் கூறு[தொகு]

தொடக்க-டேக் உடன் தொடங்குகின்ற மற்றும் அதற்குப் பொருத்தமான முடிவு-டேக்குடன் முடிகின்றதாகவோ அல்லது வெற்று-அடிப்படைக்கூறு டேக்கை மட்டும் கொண்டிருக்கும் ஆவணத்தின் தர்க்கபூர்வ பாகம். தொடக்க மற்றும் முடிவு டேக்குகளுக்கு இடையில் உள்ள பண்புருக்கள் எதுவாயினும் அடிப்படைக் கூறுகளின் உள்ளடக்கம் என்பதுடன் சிறு அடிப்படைக்கூறுகள் எனப்படும் மற்ற அடிப்படைக்கூறுகள் உள்ளிட்ட மார்க்அப்பைக் கொண்டிருக்கலாம். அடிப்படைக்கூறின் உதாரணம் <Greeting>Hello, world.</Greeting>. மற்றொன்று <line-break/>.

தனியியல்பு[தொகு]

ஒரு மார்க்அப் கட்டமைப்பு தொடக்க-டேக் அல்லது வெற்று-அடிப்படைக் கூறு டேக்கிற்குள்ளாக இருக்கும் பெயர்/மதிப்பு இணையை கொண்டிருப்பதாக இருக்கிறது. இந்த உதாரணத்தில், தனியியல்பின் பெயர் "number" மதிப்பு "3": <step number="3">Connect A to B.</step> இந்த அடிப்படைக்கூறு இரண்டு தனியியல்புகளைப் பெற்றிருக்கிறது, src மற்றும் alt : <img src="madonna.jpg" alt='by Raphael'/> ஒரு அடிப்படைக்கூறு ஒரே பெயரிக்குள்ளாக இரண்டு தனியியல்புகளைக் கொண்டிருப்பதாக இருக்கக்கூடாது.

எக்ஸ்எம்எல் பிரகடனம்[தொகு]

எக்ஸ்எம்எல் ஆவணங்கள் பின்வரும் உதாரணத்தில் இருப்பதுபோன்ற தங்களைக் குறித்த சில விவரங்களை பிரகடனம் செய்வதன் மூலம் தொடங்குகிறது

<?xml version="1.0" encoding="UTF-8" ?.>

எடுத்துக்காட்டு[தொகு]

இந்தக் கட்டமைப்புகள் மட்டும் கருத்தாக்கங்களைப் பயன்படுத்தும் சிறிய முழுமையான எக்ஸ்எம்எல் ஆவணம் இங்கே உள்ளது.

<?xml version="1.0" encoding='UTF-8'?>
<painting>
 <img src="madonna.jpg" alt='Foligno Madonna, by Raphael'/>
 <table><caption>This is Raphael's "Foligno" Madonna, painted in<td>
 <date>1511</date>-<date>1512</date>.</td></caption><td>
</painting>

இந்த உதாரண ஆவணத்தில் ஐந்து அடிப்படைக்கூறுகள் உள்ளன: painting, img, caption, இரண்டு dates. painting அடிப்படைக் கூறின் சிறு கூறாக உள்ள caption இன் சிறு கூறாக இந்த date கூறுகள் உள்ளன. img இரண்டு தனியியல்புகளைக் கொண்டிருக்கிறது, src மற்றும் alt.

பண்புருக்களும் நழுவுதலும்[தொகு]

எக்ஸ்எம்எல் ஆவணங்கள் முற்றிலும் யுனிகோட் தொகுதியிலிருந்து பெறும் பண்புருக்களையே சார்ந்திருக்கின்றன. குறிப்பிட்ட முறையில் சேர்த்துக்கொள்ளப்படாத கட்டுப்பாட்டு பண்புருக்கள் தவிர்த்து, யுனிகோடால் வரையறுக்கப்படும் எந்த பண்புருவும் ஒரு எக்ஸ்எம்எல் ஆவணத்தின் உள்ளடக்கத்திற்குள்ளாக தோன்றக்கூடியவையாகும். மார்க்அப்பிற்குள்ளாக தோன்றக்கூடிய பண்புருக்களின் தேர்வு ஒருவகையில் வரம்பிற்குட்பட்டும் பெரியதாகவும் இருக்கிறது.

ஆவணத்தை உருவாக்குகின்ற யுனிகோட் பண்புருக்களின் என்கோடிங்கை அடையாளம் காண்பதற்கான வசதிகளையும் எக்ஸ்எம்எல் பெற்றிருக்கிறது என்பதோடு, ஏதோ ஒரு காரணத்திற்காக பண்புருக்களை வெளிப்படுத்த நேரடியாகப் பயன்படுத்த இயலாது.

என்கோடிங் டிடெக்ஸன்[தொகு]

பல்வேறு வகையிலான முறைகளில் சேமிக்கப்படவோ மாற்றித்தரப்படவோ பைட்ஸ்களாக என்கோட் செய்யப்படக்கூடிய யுனிகோட் பண்புருக்கள் "என்கோடிங்" எனப்படுகிறது. யுனிகோடும்கூட முழு தொகுதியையும் உள்ளிடும் என்கோடிங்கை வரையறுக்கிறது; யுடிஎஃப்-8 மற்றும் யுடிஎஃப்-16 ஆகியவை நன்கறியப்பட்டவையாகும்.[5] 0}ஏஎஸ்சிஐஐ மற்றும் ஐஎஸ்ஓ/ஐஇசி 8859 போன்ற முன்காலத்தைச் சேர்ந்தவையாக பல என்கோடிங் உரைகளும் இருக்கின்றன; கிட்டத்தட்ட எல்லா நிகழ்விலுமான அவற்றின் பண்புரு தொகுதிகள் யுனிகோட் பண்புரு தொகுதியின் துணைத்தொகுதிகளாக இருக்கின்றன.

எக்ஸ்எம்எல் யுனிகோட்-வரையறுத்த எந்த ஒரு என்கோடிங்குகளையும், யுனிகோடில் தோன்றும் பண்புருக்களின் மற்ற எந்த என்கோடிங்குகளையும் பயன்படுத்த அனுமதிக்கிறது. எக்ஸ்எம்எல் பிராசஸர் நம்பகத்தன்மையோடு வேறு எந்த முன்னறிவும் இல்லாமல் எந்த என்கோடிங் பயன்படுத்தப்படுகிறவிடத்தில் எக்ஸ்எம்எல் ஒரு இயக்கவியலையும் வழங்குகிறது.[6] யுடிஎஃப்-8 மற்றும் யுடிஎஃப்-16 தவிர்த்த என்கோடிங்குகள் ஒவ்வொரு எக்ஸ்எம்எல் பர்சராலும் அவசியம் ஏற்றுக்கொள்ளக்கூடியவையாக இல்லை.

நழுவுதல்[தொகு]

எக்ஸ்எம்எல் ஆவணத்தில் சில பண்புருக்களை நேரடியாக சேர்ப்பது ஏன் சிக்கலானதாகவோ அல்லது சாத்தியமற்றதாகவோ இருக்கிறது என்பதற்கு சில காரணங்கள் இருக்கின்றன.

  • "<" மற்றும் "&" ஆகிய பண்புருக்கள் முக்கியமான வாக்கியக் குறிப்பான்கள் என்பதுடன் உள்ளடக்கத்தில் ஒருபோதும் தோன்றாமல் போகலாம்.[7]
  • சில பண்புரு என்கோடிங்குகள் யுனிகோடின் துணைத்தொகுதியை மட்டுமே ஏற்கின்றன: உதாரணத்திற்கு, ஏஎல்சிஐஐ இல் எக்ஸ்எம்எல் ஆவணத்தை என்கோட் செய்வது விதிகளுக்கு கட்டுப்பட்டதுதான், ஆனால் ஏஎஸ்சிஐஐ "é" போன்ற யுனிகோட் பண்புருக்களுக்கான கோட் பாய்ண்ட்கள் இல்லாதிருக்கிறது.
  • இது உடைமைதாரரின் மெஷினிலும் பண்புருவை தட்டச்சு செய்ய சாத்தியமற்றதாக்கலாம்.
  • சில பண்புருக்கள் மற்ற பண்புருக்களிலிருந்து காட்சிரீதியாக வேறுபடுத்திப் பார்க்க இயலாத கிளிஃப்களைக் கொண்டிருக்கின்றன: உடைக்கப்பட முடியாத வெற்றிடங்கள் (&#xa0;) மற்றும் சிரிலிக் கேப்பிடல் எழுத்தான A (&#x410;) இதற்கான உதாரணங்களாகும்.

இந்தக் காரணங்களுக்காக, பிரச்சினைகளுக்குரிய அல்லது கிடைத்தற்கரிய பண்புருக்களை பார்வைக் குறிப்பாக கொள்ள எக்ஸ்எம்எல் நழுவுதல் வசதிகளை வழங்குகிறது. ஐந்து முன்வரையறுக்கப்பட்ட தனியுறுப்புக்கள் இருக்கின்றன: &lt; "<"ஐ குறிக்கிறது, &gt; ">"ஐ குறிக்கிறது, &amp; "&"ஐ குறிக்கிறது, &apos; 'ஐ குறிக்கிறது, மற்றும் &quot; represents "ஐ குறிக்கிறது. அனுமதிக்கப்பட்ட யுனிகோட் பண்புருக்கள் அனைத்தும் எண்ணியலான பண்புரு குறிப்போடு குறிப்பிடப்படலாம். "中" என்ற சீன பண்புருவை எடுத்துக்கொள்வோம், யுனிகோடில் இதன் எண்ணியல் குறியீடு ஹெக்ஸாடெசிமல் 4E2D அல்லது டெசிமல் 20,013. இந்தப் பண்புருவை உள்ளிடுவதற்கு எந்த முறையையும் வழங்காத விசைப்பலகையை வைத்திருக்கும் பயனர் 0}&#20013; அல்லது &#x4e2d; ஐ கொண்டு எக்ஸ்எம்எல் ஆவணத்தில் என்கோட் செய்து உள்ளிடலாம். அதேபோன்று, "I <3 Jörg" என்ற சரடு "I &lt;3 J&#xF6;rg" ஆக எக்ஸ்எம்எல் ஆவணத்தில் உள்ளிடப்படுவதற்கான என்கோடாக இருக்கலாம்.

"&#0;" அனுமதிக்கப்படவில்லை, இருப்பினும் வெற்று பண்புருவாக எண்ணியல் பண்புரு பார்வைக்குறிப்பைப் பயன்படுத்தும்போதிலும் எக்ஸ்எம்எல்லில் இருந்து விலக்களிக்கப்பட்ட ஒரு கட்டுப்பாட்டு பண்புருக்களுள் ஒன்றாக இருக்கிறது.[8] Base64 போன்ற மாற்று என்கோடிங் இயக்கவியல் இதுபோன்ற பண்புருக்களைக் குறிக்க தேவைப்படலாம்.

கருத்துரைகள்[தொகு]

மார்க்அப்பிற்கு வெளியில் எங்குவேண்டுமானாலும் கருத்துரைகள் தோன்றலாம். எக்ஸ்எம்எல் பிராசஸர் பொருத்தப்பாட்டிற்காக எக்ஸ்எம்எல் பிரகடனத்திற்கும் மேல் முதல் வரிசையிலோ அல்லது வேறு எங்குமோ கருத்துரைகள் தோன்றக்கூடாது. " -- " (இரட்டை-இணைப்புக்கோடு) என்ற சரடு அனுமதிக்கப்படவில்லை என்பதோடு தனியுடைமைகள் கருத்துரைகளுக்குள்ளாக ஏற்கப்படக்கூடாது.

ஒரு செல்லுபடியாகும் கருத்துரையின் உதாரணம்: ""

நன்கு வடிவமைக்கப்பட்டிருத்தலும் பிழை கையாளுதலும்[தொகு]

எக்ஸ்எம்எல் ஆவணத்தை நன்கு வடிவமைக்கப்பட்ட உரையாக எக்ஸ்எம்எஸ் ஸ்பெசிபிகேஷன் வரையறுக்கிறது, அதாவது ஸ்பெசிபிகேஷனில் வழங்கப்பட்டுள்ள வாக்கிய அமைப்பு விதிகளின் பட்டியலை இது திருப்திப்படுத்துகிறது. இந்தப் பட்டியல் சற்றே நீளமானது; சில முக்கியமான கூற்றுக்களாவன:

  • இது முறையாக என்கோட் செய்யப்பட்ட விதிகளுக்குட்பட்ட யுனிகோட் பண்புருக்களை மட்டுமே கொண்டிருக்கிறது.
  • "<" மற்றும் "&" போன்ற சிறப்பு வாக்கிய அமைப்பு பண்புருக்கள் எதுவும் அவற்றின் மார்க்அப்-விரித்துரை பங்காற்றும் நேரம் தவிர்த்து தோன்றுகின்றன.
  • இந்த அடிப்படைக்கூறுகளை வரம்பற்றதாகச் செய்யும் தொடக்கம், முடிவு மற்றும் வெற்று-அடிப்படைக்கூறு ஆகியவை எதுவும் விடுபட்டுவிடாமலும், எதுவும் மேல்கவிந்துவிடாமலும் சரியாக அமைக்கப்பட்டிருக்கின்றன.
  • அடிப்படைக்கூறு டேக்குகள் வேற்றுமை-உணர்திறன் உள்ளவை; தொடக்கம் மற்றும் முடிவு டேக்குகள் துல்லியமாக பொருந்திப்போக வேண்டும்.
  • எல்லா அடிப்படைக் கூறுகளையும் கொண்டிருக்கும் ஒற்றை "அடிப்படை" கூறும் உள்ளது.

ஒரு எக்ஸ்எம்எல் ஆவண"த்தின் வரையறை நன்கு வடிவமைக்கப்பட்ட விதிகளின் மீறல்களைக் கொண்டிருக்கும் உரைகளை விலக்கிவிடுகிறது; அவை எக்ஸ்எம்எல் அல்ல. இதுபோன்ற விதிமீறல்களை எதிர்கொள்ளும் ஒரு எக்ஸ்எம்எல் பிராசஸர் இதுபோன்ற பிழைகளைத் தெரிவிக்க வேண்டும் என்பதுடன் வழக்கமான நிகழ்முறையாக்கத்தை நிறுத்திவைக்க வேண்டும். அவ்வப்போது டிரகோனியன் என்று குறிப்பிடப்படும் இந்தக் கொள்கை, கடுமையான மார்க்அப் பிழைகள் உள்ளபோதிலும் உரிய அளவிற்கான விஷயங்களைத் தயார்செய்துவிடக்கூடிய அளவிற்கு வடிவமைப்பட்டுள்ள ஹெச்டிஎம்எல்லை நிகழ்முறையாக்கும் புரோகிராம்களின் நடத்தையோடு குறிப்பிடத்தகுந்த அளவிற்கு முரண்படுகிறது. இந்தப் பகுதியிலான எக்ஸ்எம்எல்லின் கொள்கை பாஸ்டல் விதியின் மீறலாக விமர்சிக்கப்படுகிறது.[9]

ஸ்கீமாக்களும் மெய்ப்பிப்புகளும்[தொகு]

நன்கு வடிவமைக்கப்பட்டதாக இருப்பதற்கும் மேலாக, ஒரு எக்ஸ்எம்எல் ஆவணம் செல்லுபடியாகக்கூடியதாகவும் இருக்கலாம். இது டாகுமெண்ட் டைப் வரையறைக்கான பார்வைக்குறிப்பைக் கொண்டிருக்கிறது என்பதைக் குறிப்பதோடு, இதனுடைய ஆக்கக்கூறுகள் மற்றும் உள்ளீடுகள் ஆகியவை டீடிடீயில் தெரிவிக்கப்பட வேண்டும் என்பதுடன் டீடிடீக்கள் குறிப்பிட்டிருக்கும் இவற்றிற்கான இலக்கண விதிகளையும் பின்பற்ற வேண்டும்.

எக்ஸ்எம்எல் பிராசஸர்கள் அவை மெய்ப்பிப்பிற்காக எக்ஸ்எம்எல் ஆவணங்களைச் சரிபார்க்கின்றனவா இல்லையா என்பதைப் பொறுத்து மெய்ப்பிப்பு அல்லது மெய்ப்பிப்பு-அற்றது என்று வகைப்படுத்தப்படுகின்றன. மெய்பிப்புப் பிழைகளை கண்டுபிடிக்கும் ஒரு பிராசஸர் அதைத் தெரிவிக்கும் திறனுள்ளதாக இருக்க வேண்டும், ஆனால் வழக்கமான நிகழ்முறையாக்கத்தைத் தொடரலாம்.

ஒரு டீடிடீ என்பது ஒரு ஸ்கீமா அல்லது இலக்கணத்தின் உதாரணமாகும். எக்ஸ்எம்எல் 1.0 பதிப்பிக்கப்பட்டதிலிருந்து, எக்ஸ்எம்எல்லுக்கான ஸ்கீமா மொழிகள் பகுதியிலான குறிப்பிடத்தகுந்த ஆய்வுகள் செய்யப்பட்டிருக்கின்றன. இதுபோன்ற ஸ்கீமா மொழிகள் ஒரு ஆவணத்தில் பயன்படுத்தப்படக்கூடிய ஆக்கக்கூறுகள், அவற்றிற்குப் பயன்படுத்தப்படக்கூடிய உள்ளீடுகள், அவை தோன்றக்கூடிய ஒழுங்குமுறை மற்றும் அனுமதிக்கக்கூடிய பெற்றோர்/குழந்தை உறவுகள் ஆகியவற்றை வரம்பிற்குட்படுத்துகின்றன.

டீடிடீ[தொகு]

எக்ஸ்எம்எல்லுக்கான பழமையான ஸ்கீமா மொழிகள் எஸ்ஜிஎம்எல்லில் இருந்து பெறப்பட்ட டாகுமெண்ட் டைப் வரையறையாக இருக்கிறது.

டீடிடீக்கள் பின்வரும் பலன்களைக் கொண்டிருக்கின்றன:

  • டீடிடீ எக்ஸ்எம்எல் 1.0 தரநிலையில் உள்ளிடப்பட்டிருப்பதன் காரணமாக ஒரேநேரத்தில் எங்கும் தோன்றக்கூடியதாக இருக்கிறது.
  • டீடிடீக்கள் ஆக்கக்கூறு அடிப்படையிலான ஸ்கீமா மொழிகளோடு ஒப்பிடுகையில் பொருட்செறிவு மிக்கவையாக இருக்கின்றன என்பதோடு அதன் விளைவாக ஒரே திரையில் அதிகத் தகவல்களை வழங்குகின்றன.
  • டீடிடீக்கள் பதிப்பிப்பு பண்புருக்களான தரநிலை பொது தனியுடைமைத் தொகுதிகளின் அறிவிப்பை அனுமதிக்கின்றன.
  • நேம்ஸ்பேஸால் பயன்படுத்தப்படும் டைப்களைக் காட்டிலும் டாகுமெண்ட் டைப்பை டீடிடீக்கள் குறிப்பிடுகின்றன, அத்துடன் ஒரு ஆவணத்திற்கான எல்லாத் தடைகளையும் ஒரே தொகுதியில் குழுப்படுத்துகின்றன.

டீடிடீக்கள் பின்வரும் வரம்புகளுக்கு உட்பட்டவையாக இருக்கின்றன:

  • அவை புதிய எக்ஸ்எம்எல் அம்சங்களுக்கான வெளிப்படை உதவியை, மிக முக்கியமாக நேம்ஸ்பேஸ்களுக்கு கொண்டிருப்பதில்லை.
  • அவை வெளிப்படைத்தன்மையின்றி இருக்கின்றன. எக்ஸ்எம்எல் டீடிடீக்கள் எஸ்ஜிஎம்எல் டீடிடீக்களைக் காட்டிலும் எளிதானவை என்பதோடு வழக்கமான இலக்கணங்களைக் கொண்டு வெளிப்படுத்த இயலாத குறிப்பிட்ட கட்டமைப்புகளும் இருக்கின்றன. டீடிடீக்கள் அடிப்படையான டேட்டாடைப்களை மட்டுமே ஏற்கின்றன.
  • அவை படிக்கப்படக்கூடிய திறனின்றி இருக்கின்றன. டீடிடீ வடிவமைப்பாளர்கள், சிக்கலான இலக்கணங்களை சுலபமானதாக வரையறுக்க பாராமீட்டர் தனியுடைகளை (உரைசார்ந்த மேக்ரோக்களாக அத்தியாவசியமான முறையில் செயல்படுபவை) பெருமளவிற்குப் பயன்படுத்துகின்றனர், ஆனால் தெளிவுபடுத்தலின் செலவினத்தோடு.
  • அவர்கள் வாக்கிய அமைப்பை, ஸ்கீமாவை விவரிப்பதற்கு எஸ்ஜிஎம்எல் இல் இருந்து பெறப்பட்ட வழக்கமான வெளிப்பாட்டு வாக்கிய அமைப்பின் அடிப்படையில் பயன்படுத்துகின்றனர். எஸ்ஏஎக்ஸ் போன்ற வழக்கமான எக்ஸ்எம்எல் ஏபிஐகள் வாக்கிய அமைப்பின் கட்டமைக்கப்பட்ட வெளிப்பாட்டு பயன்பாடுகளை வழங்க முயற்சிப்பதில்லை, இதனால் இது ஆக்கக்கூறு அடிப்படையிலான வாக்கிய அமைப்பால் செய்யப்படக்கூடியவற்றைக் காட்டிலும் புரோகிராமர்கள் குறைவான அளவிற்கே அணுக முடிகிறது.

எக்ஸ்எம்எல் ஆவணங்களுக்குள்ளாக டீடிடீஐ இணைப்பதற்கான வாக்கிய உதவி மற்றும் தனியுடைமைகளை வரையறுப்பதற்கான உதவி ஆகிய இரண்டும் மற்ற ஸ்கீமா வகைகளிலிருந்து டீடிடீயை வேறுபடுத்திக்காட்டுகின்ற திட்டவட்டமான அம்சங்களாகும், இவை பண்புரு நழுவல்கள் போன்ற எக்ஸ்எம்எல் ஆவணத்தில் பார்வைக்குறி்ப்பாக தோன்றுகின்றவிடத்தில் டீடிடீக்குள்ளாகவே எக்ஸஎம்எல் புராசஸர் சேர்க்கச்செய்யும் உரை மற்றும்/அல்லது மார்க்அப்பின் நடுவான்மை துண்டுகளாக இருக்கின்றன.

டீடிடீ தொழில்நுட்பம் அதனுடைய எங்கும் பரவியிருக்கும் தன்மை காரணமாக பல பயன்பாடுகளிலும் இப்போதும் பயன்படுத்தப்படுகின்றன.

எக்ஸ்எம்எல் ஸ்கீமா[தொகு]

டீடிடீ இன் அடுத்த வடிவமாக டபிள்யூ3சி ஆல் குறிப்பிடப்பட்டிருக்கும் ஒரு புதிய ஸ்கீமா மொழி எக்ஸ்எம்எல் ஸ்கீமா ஆகும், இது தொடர்ந்து இனிஷியலிஸத்தால் எக்ஸ்எம்எல் ஸ்கீமா நிகழ்வுகள், எக்ஸ்எஸ்டிக்கு (எக்ஸ்எம்எல் ஸ்கீமா வரையறை) குறிப்பிடப்படுகின்றன. எக்ஸ்எம்எல் மொழிகளை விவரிப்பதில் டீடிடீக்களைக் காட்டிலும் எக்ஸ்எஸ்டிக்கள் மிகவும் சக்திவாய்ந்தவை. அவை செறிவான டேட்டாடைப்பிங் அமைப்பைப் பயன்படுத்துகின்றன என்பதோடு எக்ஸ்எம்எல் ஆவணத்தின் தர்க்கபூர்வ கட்டமைப்பில் உள்ள மிக அதிக விவரமான தடைகளையும் அனுமதிக்கின்றன. எக்ஸ்எஸ்டிக்கள் எக்ஸ்எம்எல் அடிப்படையில் அமைந்த வடிவத்தையும் பயன்படுத்துகின்றன, இது அவற்றை நிகழ்முறையாக்குவதற்கு வழக்கமான எக்ஸ்எம்எல் கருவிகளின் பயன்பாட்டையும் சாத்தியமாக்குகிறது.

ரிலாக்ஸ் என்ஜி[தொகு]

ரிலாக்ஸ் என்ஜி தொடக்கநிலையில் ஓயாஸிஸால் பரிந்துரைக்கப்பட்டது என்பதுடன் இப்போது ஐஎஸ்ஓ சர்வதேச தரவரிசைப் பெற்றதாகவும் இருக்கிறது (டிஎஸ்டிஎல் இன் ஒரு பகுதியாக). ரிலாக்ஸ் என்ஜி ஸ்கீமாக்கள் எக்ஸ்எம்எல் அடிப்படையிலான வாக்கியத்திலோ அல்லது மிகவும் கச்சிதமான எக்ஸ்எம்எல்-சாராத வாக்கிய அமைப்பிலோ எழுதப்படலாம்; இந்த இரண்டு வாக்கிய அமைப்புக்களையும் ஐஸோமார்பிக் மற்றும் ஜேம்ஸ் கிளார்க்கின் டிராங் கன்வர்ஸன் டூல் இவற்றிற்கிடையிலான தகவலை தவறவிட்டுவிடாமல் மாற்றித்தரும். ரிலாக்ஸ் என்ஜி எக்ஸ்எம்எல் ஸ்கீமாவைக் காட்டிலும் எளிய வரையறை மற்றும் மெய்ப்பிப்பு கட்டமைப்பைக் கொண்டிருப்பது, இதைப் பயன்படுத்தவும் அமல்படுத்தவும் சுலபமானதாக்குகிறது. இது டேட்டாடைப் பிளக்-இன்களைப் பயன்படுத்தும் திறனையும் பெற்றிருக்கிறது; உதாரணத்திற்கு ஒரு ரிலாக்ஸ் என்ஜி ஸ்கீமா உருவாக்குநருக்கு எக்ஸ்எம்எல் ஸ்கீமா டேட்டாடைப்களோடு இணங்கிப்போவதற்கு எக்ஸ்எம்எல் ஆவணத்தில் உள்ள மதிப்புக்கள் தேவைப்படலாம்.

ஸ்கீமட்ரான்[தொகு]

ஸ்கீமட்ரான் என்பது ஒரு எக்ஸ்எம்எல் ஆவணத்தில் உருவரை இருப்பது அல்லது இல்லாதிருப்பது குறித்த வலியுறுத்தல்களை உருவாக்குவதற்கான மொழியாகும். இது வகைமாதிரியாக எக்ஸ்பாத் வெளிப்படுத்தல்களைப் பயன்படுத்துகிறது.

ஐஎஸ்ஓ டிஎஸ்டிஎல் மற்றும் பிற ஸ்கீமா மொழிகள்.[தொகு]

ஐஎஸ்ஓ டிஎஸ்டிஎல் (ஆவண ஸ்கீமா விவரணை மொழி) தரநிலை சிறிய ஸ்கீமா மொழிகளின் ஒருங்கிணைந்த தொகுதியை ஒன்றாக வழங்குகிறது, ஒவ்வொன்றும் குறிப்பிட்ட பிரச்சனையை இலக்காகக் கொண்டவை. ரிலாக்ஸ் என்ஜி முழு மற்றும் கச்சித வாக்கிய அமைப்பு, ஸ்கீமட்ரான் வலியுறுத்தல் மொழி, வரையறு தரவுத்தளங்களுக்கான மொழிகள், பண்புரு தொகுதி தடைகள், மறுபெயரிடுதல் மற்றும் தனியுடமை வலியுறுத்தல், மற்றும் வேவ்வேறு மதிப்பிடுநர்களுக்கான ஆவணத் துண்டுகளின் நேம்ஸ்பேஸ்-சார்ந்த ரவுட்டிங் ஆகியவற்றை உள்ளிட்டிருக்கிறது. டிஎஸ்டிஎல் ஸ்கீமா மொழிகள் எக்ஸ்எம்எல் ஸ்கீமாவின் வழங்குநர் உதவியை இப்போதும் கொண்டிருக்கவில்லை என்பதோடு, பதிப்பிப்பதற்கான எக்ஸ்எம்எல் ஸ்கீமாக்களின் பயன்பாட்டுத்திறனின்மைக்கான தொழில்துறை பதிப்பாளர்களுடைய பொதுமக்கள் எதிர்வினைக்கு சில அளவுகள் வரையிலும் கொண்டிருப்பதில்லை.

சில ஸ்கீமா மொழிகள் குறிப்பிட்ட எக்ஸ்எம்எல் வடிவத்தின் கட்டமைப்பை மட்டும் விவரிப்பதில்லை, அவை இந்த வடிவத்திற்கு இணங்கிப்போகக்கூடிய தனிப்பட்ட எக்ஸ்எம்எல் கோப்புகளின் நிகழ்முறையில் தாக்கமேற்படுத்துவதற்கு வரம்பிற்குட்பட்ட வசதிகளையும் வழங்குகின்றன. டீடிடீக்கள் மற்றும் எக்ஸ்எஸ்டிக்கள் ஆகிய இரண்டும் இந்தத் திறனைப் பெற்றிருக்கின்றன; அவை உதாரணத்திற்கு இன்ஃபோசெட் பெரிதாக்குதல் வசதி மற்றும் உள்ளீட்டு இயல்பாக்கங்களையும் வழங்குகின்றன. ரிலாக்ஸ் என்ஜியும் ஸ்கீமட்ரானும் உள்நோக்கத்துடனே இவற்றை வழங்குவதில்லை.

தொடர்புடைய விவரமளிப்புகள்[தொகு]

எக்ஸ்எம்எல்லிற்கு நெருக்கமான தொடர்புடைய விவரமளிப்புகளின் ஒரு தொகுதி உருவாக்கப்பட்டிருக்கிறது, இது எக்ஸ்எம்எல் 1.0 தொடக்கப் பதிப்பிற்கும் வெகுவிரைவிலேயே தொடங்கியுள்ளது. எக்ஸ்எம்எல் கருவின் பகுதியாகப் பார்க்கப்படும் இந்த மற்ற தொழில்நுட்பங்களின் ஒன்று அல்லது அதற்கு மேற்பட்டவற்றோடு இணைந்துள்ள எக்ஸ்எம்எல்லைக் குறிப்பதற்கு "எக்ஸ்எம்எல்" என்பதைப் பயன்படுத்துவது ஒரு விவகாரமாகவே தொடர்ந்து இருந்துவருகிறது.

  • எக்ஸ்எம்எல் நேம்ஸ்பேஸ்கள் எந்தவிதமான பெயர்க் குலைவுகளும் ஏற்பட்டுவிடாமல் எக்ஸ்எம்எல் ஆக்கக் கூறுகளை ஒரே ஆவணத்திலும் பல்வேறு சொற்களஞ்சியங்களிலிருந்து எடுக்கப்பட்ட உள்ளீடுகளிலும் கொண்டிருக்கச் செய்கின்றன. அடிப்படையில் எக்ஸ்எம்எல்லை ஏற்பதாக விளம்பரப்படுத்தப்படும் எல்லா மென்பொருள்களும் எக்ஸ்எம்எல் நேம்ஸ்பேஸ்களை ஏற்கின்றன.
  • எக்ஸ்எம்எல் பேஸ் xml:base ஐ வரையறை செய்கிறது, இது ஒற்றை எக்ஸ்எம்எல் ஆக்ககக்கூறின் எல்லைக்குள்ளாக தொடர்புடைய யுஆர்ஐ பார்வைக்குறிப்பின் பகுப்பிற்கான அடித்தளத்தை அமைக்க பயன்படுத்தப்படுகிறது.
  • எக்ஸ்எம்எல் தகவல் தொகுதி அல்லது எக்ஸ்எம்எல் இன்ஃபோசெட் தகவல் அம்சங்கள் என்ற வகையில் எக்ஸ்எம்எல் ஆவணங்களுக்கான அரூப தரவு மாதிரியை விளக்குகின்றன. இந்த இன்ஃபோசெட் மொழிகள் அனுமதிக்கும் எக்ஸ்எம்எல் கட்டமைப்புகளில் உள்ள தடைகளை விளக்குவதில் உள்ள வசதிக்காக எக்ஸ்எம்எல் மொழிகளின் விவரமளிப்புகளில் பொதுவாகப் பயன்படுத்தப்படுகிறது.
  • டீடிடீஇல் பயன்படுத்தப்படும் பொருளில் "ஐடி உள்ளீடாக" செயல்படும் xml:id என்று பெயரிடப்பட்ட ஒரு உள்ளீட்டைக் காட்டிலும் xml:id ஐ வலியுறுத்துகிறது.
  • ஒன்று அல்லது அதற்கு மேற்ப்ட்ட எக்ஸ்எம்எல் ஆவணத்தில் சேர்க்கப்பட்டுள்ள உட்புற பாகங்களை (ஆக்கக்கூறுகள், உள்ளீடுகள் இன்னபிற) அடையாளம் காண்கின்ற எக்ஸ்பாத் எக்ஸ்பிரசன்ஸ் என்று வரையறுக்கப்பட்டுள்ள எக்ஸ்பாத்தை வரையறுக்கிறது. எக்ஸ்பாத் மற்ற மைய எக்ஸ்எம்எல் ஸ்பெசிபிகேஷன்களிலும், எக்ஸ்எம்எல் என்கோட் செய்யப்பட்ட டேட்டாவிற்கான நிரலாக்க நூலகங்களிலும் பரவலாகப் பயன்படுத்தப்படுகிறது.
  • எக்ஸ்எஸ்எல்டி என்பது எக்ஸ்எம்எல் ஆவணங்களை பிற எக்ஸ்எம்எல் ஆவணங்கள், ஹெச்டிஎம்எல் அல்லது மற்ற எளிய உரை அல்லது RTF (ஆர்டிஎஃப்) போன்ற கட்டமைப்பில்லாத வடிவங்களுக்கு மாற்ற பயன்படுத்தப்படும் எக்ஸ்எம்எல் வாக்கிய அமைப்பிற்குள்ளாக இருக்கும் மொழியாகும்.
  • எக்ஸ்எஸ்எல் ஃபார்மேட்டிங் ஆப்ஜெக்ட்ஸ் அல்லது எக்ஸ்எஸ்எல்-எஃப்ஓ, என்பது பிடிஎஃப்களை உருவாக்க மிகத் தொடர்ச்சியாக பயன்படுத்தப்படும் எக்ஸ்எம்எல் ஆவண ஃபார்மேட்டிங்கிற்கான மார்க்அப் மொழியாகும்.
  • எக்ஸ்குவரி என்பது எக்ஸ்பாத் மற்றும் எக்ஸ்எம்எல் ஸ்கீமாவில் வலுவாக வேரூன்றியுள்ள எக்ஸ்எம்எல்-சார்ந்த குவரி மொழியாகும். இது அணுகல், கையாளுதல் மற்றும் எக்ஸ்எம்எல்லிற்கு திரும்புதல் ஆகியவற்றிற்கான முறைகளை வழங்குகிறது.
  • எக்ஸ்எம்எல் சிக்னேச்சர் எக்ஸ்எம்எல் உள்ளடக்கத்தில் டிஜிட்டல் சிக்னேச்சர்களை உருவாக்குவதற்கான வாக்கிய அமைப்பு மற்றும் நிகழ்முறையாக்க விதிகளை வரையறை செய்கிறது.
  • எக்ஸ்எம்எல் என்கிரிப்ஷன் எக்ஸ்எம்எல் உள்ளடக்கத்தை என்கிரிப்டிங் செய்வதற்கான வாக்கிய அமைப்பு மற்றும் நிகழ்முறையாக்க விதிகளை வரையறை செய்கிறது.

"எக்ஸ்எம்எல் மையக்கருவாக" கருதப்பட்ட வேறு சில கருத்தாக்கங்கள் எக்ஸ்இன்க்லூட், எக்ஸ்லின்க்ஸ், மற்றும் எக்ஸ்பாய்ண்டர் உள்ளிட்ட பரந்த தழுவலை கண்டுபிடிப்பதில் தவறிவிட்டன.

இணையத்தளத்தில் பயன்பாடு[தொகு]

இணையத்தளம் வழியாக தரவு உள்மாற்றத்தில் எக்ஸ்எம்எல் பயன்படுத்தப்படுவது பொதுவானதாகும். ஆர்எஃப்சி 3023 எக்ஸ்எம்எல்லை அனுப்பும்போது பயன்படுத்துவதற்கான இணையத்தள மீடியா டைப்களின் கட்டமைப்பிற்கான விதிகளை வழங்குகிறது. இது மேலும் தரவு எக்ஸ்எம்எல்லில் இருக்கிறது, அதனுடைய மொழியம்சங்கள் குறித்து எதுவுமில்லை என்று கூறும் "பயன்பாடு/எக்ஸ்எம்எல்" மற்றும் "உரை/எக்ஸ்எம்எல்" வகைகளையும் வரையறுக்கிறது. "உரை/எக்ஸ்எம்எல்" என்கோடிங் பிரச்சினைகளுக்கான வாய்ப்பு மூலாதாரமாக இருப்பதாக விமர்ச்சிக்கப்பட்டுள்ளது என்பதுடன் இதைத் தவிர்க்கச் செய்யும் நிகழ்முறையில் இப்போது இருக்கிறது.[10] ஆர்எஃப்சி 3023ம்கூட "பயன்பாடு/" என்பதில் தொடங்கி "+எக்ஸ்எம்எல்லில்" முடிவுறும் எக்ஸ்எம்எல்-சார்ந்த மொழிகள் மீடியா டைப்களுக்கு வழங்குவதைப் பரிந்துரைக்கிறது; உதாரணத்திற்கு எஸ்விஜிக்கான "பயன்பாடு/எஸ்விஜி+எக்ஸ்எம்எல்".

நெட்வொர்க் செய்யப்பட்ட பின்னணியில் எக்ஸ்எம்எல் பயன்பாட்டிற்கான மேற்கொண்டு செய்யப்படும் வழிகாட்டுதல்கள் ஐஇடிஎஃப் 70 என்றும் அறியப்படுகின்ற ஆர்எஃப்சி 3470 இல் காணப்படலாம்; இந்த ஆவணம் மிகவும் பரந்த அளவிற்கு இருக்கிறது என்பதுடன் எக்ஸ்எம்எல் சார்ந்த மொழிகளின் வடிவமைப்பு மற்றும் நிறுவுதலின் பல நோக்கங்களையும் உள்ளிட்டிருக்கிறது.

புரோகிராமிங் இடைமுகங்கள்[தொகு]

எக்ஸ்எம்எல்லின் வடிவமைப்பு இலக்குகள் "எக்ஸ்எம்எல் ஆவணங்களை நிகழ்முறைப்படுத்தும் புரோகிராம்களை எழுதுவதற்கு இது சுலபமானதாக இருக்கும்" என்பதை உள்ளிட்டிருக்கிறது.[2] இந்த உண்மை இருப்பினும், எக்ஸ்எம்எல் விவரமளிப்பு இதுபோன்ற நிகழ்முறையை புரோகிராமர்கள் எப்படிச் செய்வார்கள் என்பது குறித்து கிட்டத்தட்ட எந்த தகவலையும் கொண்டிருப்பதில்லை. எக்ஸ்எம்எல் ஆவணத்திற்குள்ளான கட்டமைப்புகளைக் குறிப்பதற்கான சொற்களஞ்சியத்தை எக்ஸ்எம்எல் இன்ஃபோசெட் வழங்குகிறது, ஆனால் மீண்டும் இந்தத் தகவலை அணுகுவதற்கான எந்த வழிகாட்டுதலையும் வழங்குவதில்லை. எக்ஸ்எம்எல்லை அணுகுவதற்கான பல்வேறுவிதமான ஏபிஐகள் உருவாக்கப்பட்டு பயன்படுத்தப்பட்டு வருகின்றன என்பதோடு இவற்றில் சில தரநிலையாக்கப்பட்டுள்ளன.

எக்ஸ்எம்எல் நிகழ்முறைக்கென்று இருந்துவரும் ஏபிஐகள் பின்வரும் பிரிவுகளுக்குள்ளாக வருகின்றன:

  • புரோகிராமிங் மொழியிலிருந்து அணுகக்கூடியவையாக இருக்கும் ஓட்டப்போக்கு-சார்ந்த ஏபிஐகள், உதாரணத்திற்கு எஸ்ஏஎக்ஸ் மற்றும் எஸ்டிஏஎக்ஸ்.
  • புரோகிராமிங் மொழியிலிருந்து அணுகக்கூடியவையாக இருக்கும் ட்ரீ-டிராவர்ஸல் ஏபிஐகள், உதாரணம் டிஓஎம்.
  • எக்ஸ்எம்எல் டேட்டா பைண்டிங், இது எக்ஸ்எம்எல் ஆவணம் மற்று புரோகிராமிங்-மொழி ஆப்ஜெக்ட்களிடையே தானியக்க மொழிபெயர்ப்பை வழங்குகிறது.
  • எக்ஸ்எஸ்எல்டி மற்றும் எக்ஸ்குவரி போன்ற அறிவிப்பு மாற்றுதல் மொழிகள்.

ஓட்டபோக்கு-சார்ந்த வசதிகளுக்கும் ஒரு எக்ஸ்எம்எல் ஆவணத்தின் குறுகல் குறுக்கீட்டின் அடிப்படையில் அமைந்துள்ள குறிப்பிட்ட வேலைகளுக்கும் குறைவான நினைவுத்திறனே தேவைப்படுகிறது என்பதுடன் மற்ற மாற்றுக்களைக் காட்டிலும் வேகமானதாகவும் எளிதானதாகவும் இருக்கிறது. ட்ரீ-டிராவர்ஸல்களுக்கும் டேட்டா பைண்டிங் ஏபிஐகளுக்கும் மிக அதிகமான நினைவுத்திறன் பயன்பாடு தேவைப்படுகிறது, ஆனால் அவை தொடர்ந்து புரோகிராமர்களால் பயன்படுத்தப்படுவதற்கு வசதியானவைகளாக இருப்பதாக தெரிகின்றன; இவற்றில் சில எக்ஸ்பாத் வெளிப்படுத்தல்கள் வழியாக ஆவண பாகங்களின் அறிவிப்பு மீட்பை உள்ளிட்டிருக்கின்றன.

எக்ஸ்எஸ்எல்டி, எக்ஸ்எம்எல் ஆவண மாற்றித்தருதல்களின் அறிவிப்பு விளக்கத்திற்காக வரையறுக்கப்பட்டுள்ளன என்பதோடு சர்வர் சார்ந்த பேக்கேஜ்கள் மற்றும் வலைத்தள உலாவிகள் ஆகிய இரண்டிலும் பரவலாக அமல்படுத்தக்கூடியவையாக இருக்கின்றன. எக்ஸ்குவரி எக்ஸ்எஸ்எஸ்டிஐ அதனுடைய செயல்பாட்டில் மேற்கவியச் செய்கிறது, ஆனால் இது பெரிய எக்ஸ்எம்எல் தரவுத்தளங்களுக்கான தேடுதல்களுக்கென்றே பெரிதும் வடிவமைக்கப்படுகின்றன.

எக்ஸ்எம்எல்லுக்கான எளிய ஏபிஐ (எஸ்ஏஎக்ஸ்)[தொகு]

எஸ்ஏஎக்ஸ் என்பது தொடர்வரிசைப்படி படிக்கப்படுகின்ற ஒரு ஆவணத்திலுள்ள நிகழ்வு-இயக்கம் மற்றும் அதனுடைய உள்ளடக்கங்கள் பயனர் வடிவமைப்பினுடைய ஹேண்ட்லர் ஆப்ஜெக்டில் உள்ள பல்வேறு முறைகளுக்கான கால்பேக்குகளாக தெரிவிக்கப்படும் அகராதி ஆகும். எஸ்ஏஎக்ஸ் அமல்படுத்துவதற்கு வேகமானதும் பயன்மிக்கதுமாகும், ஆனால் ஆவணத்தின் எந்தப் பகுதி நிகழ்முறையாக்கப்படுகிறது என்பதை கண்டுகொள்வதுடன் பதிப்பாசிரியருக்கு சுமையை ஏற்படுத்தும் நோக்கமுள்ளது என்பதால் எக்ஸ்எம்எல்லில் இருந்து தற்போக்காக தகவலைப் பிரித்துப்பெறுவதற்கு பயன்படுத்த சி்க்கலானவை. சில வகையிலான தகவல்கள், அவை ஆவணத்தில் எங்கு தோன்றுகின்றன என்ற பொருட்டின்றி ஒரேவிதமான முறையில் கையாளப்படுகின்ற குறிப்பிட்ட விதத்திலான சூழ்நிலைகளுக்கு இவை நன்றாகப் பொருந்திப்போகின்றன.

புல் பார்ஸிங்[தொகு]

இண்டராக்டர் வடிவமைப்பு முறையைப் பயன்படுத்தி தொடர்வரிசைகளில் படிக்கப்படக்கூடிய தொடர் அம்சங்களாக ஆவணத்தை புல் பார்ஸிங்[11] கருதுகிறது. எக்ஸ்எம்எல் இலக்கணப்படுத்தப்படுவதன் கட்டமைப்பை இலக்கணபபடுத்தும் மிரர்களை செயல்படுத்தும் கோடின் கட்டமைப்போடும் ரிகர்ஸிவ்-டிஸண்ட் பர்சர்களை எழுதுவதற்கு இது உதவுகிறது என்பதுடன் இடைப்பட்ட இலக்கணப்படுத்தல் முடிவுகள் இந்த இலக்கணப்படுத்தலை செய்யும் முறைகளுக்குள்ளான உட்புற மாறுபாடுகளைப் பயன்படுத்தி அணுகக்கூடியவற்றிற்கு காரணமாகிறது அல்லது தாழ்நிலை முறைகளுக்குள்ளாக இலக்கணப்படுத்தப்படுகிறது (முறை பாராமீட்டர்களாக) அல்லது உயர்நிலை முறைகளுக்கு திரும்புகிறது (முறை திரும்பல் மதிப்புகளாக). ஜாவா நிரலாக்க மொழியில் எஸ்டிஏஎக்ஸ், பிஹெச்பி மற்றும் சிஸ்டத்தில் சிம்பிள் எக்ஸ்எம்எல் ஆகிய புல் பர்சர்கள் உதாரணங்களாகும் எக்ஸ்எம்எல். நெட் கட்டமைப்பில் இருக்கும் எக்ஸ்எம்எல் ரீடர்.

ஒரு புல் பர்சர் பல்வேறு ஆக்கக்கூறுகள், உள்ளீடுகள் மற்றும் எக்ஸ்எம்எல் ஆவணத்தில் உள்ள தரவு ஆகியவற்றை வரிசைகிரமமாக பார்க்கின்ற இடரேட்டரை உருவாக்குகிறது. இந்த 'இடரேட்டரைப்' பயன்படுத்தும் கோட் தற்போதைய அம்சத்தை (உதாரணத்திற்கு இது தொடக்க அல்லது முடிவு ஆக்கக்கூறா அல்லது உரையா என) பரிசோதிக்கிறது, அதனுடைய உள்ளீடுகளை (லோக்கல் நேம், நேம்ஸ்பேஸ், எக்ஸ்எம்எல் உள்ளீடுகளின் மதிப்புகள், உரையின் மதிப்பு, இன்னபிற) ஆய்வு செய்கிறது என்பதுடன் இடரேட்டரை அடுத்த அம்சத்திற்கும் கொண்டுசெல்கிறது. ஆவணத்திலிருந்து குறுக்கீடாய் இருக்கும் தகவலை கோட் இவ்வாறு பிரித்தெடுக்கிறது. இந்த ரிகர்ஸிவ்-டிஸண்ட் அணுகுமுறை பார்ஸிங் செய்யும் கோடில் உள்ள டைப் செய்யப்பட்ட லோகல் வேரியபிள்களை தனக்குள்ளாக வைத்துக்கொள்ளும் நோக்கம் கொண்டதாக இருக்கிறது, அதேசமயம் உதாரணத்திற்கு எஸ்ஏஎக்ஸ் பார்ஸிங் செய்யப்படும் ஆக்கக்கூறின் மூல ஆக்கக்கூறாக உள்ள ஆக்கக்கூறுகளின் குவிப்பிற்குள்ளாக இடைப்பட்ட தரவைத் கைமுறையாக தக்கவைக்க கோருகிறது. புல்-பார்ஸிங் கோட் எஸ்ஏஎக்ஸ் பர்ஸிங் கோடை புரிந்துகொண்டு தக்கவைப்பதைக் காட்டிலும் மிகவும் முன்னோக்கியதாக இருக்கிறது.

ஆவண ஆப்ஜெக்ட் மாதிரி (டிஓஎம்)[தொகு]

டிஓஎம் (ஆவண ஆப்ஜெக்ட் மாதிரி) என்பது ஆவணத்தின் உள்ளடக்கங்களை குறிப்பிடுகின்ற "நோட்" ஆப்ஜெக்ட்களின் மரத்தை பிரதிநிதித்துவம் செய்கின்ற மொத்த ஆவணத்தின் நகர்விற்கான அனுமதியை வழங்கும் இண்டர்ஃபேஸ் சார்ந்த அப்ளிகேஷன் புரோகிராமிங் இண்டர்ஃபேஸாக இருக்கிறது. ஒரு டிஓஎம் ஆவணம் பர்சரால் உருவாக்கப்படலாம் அல்லது பயனர்களால் (வரம்புகளுடன்) கைமுறையாக உருவாக்கப்படலாம். டிஓம் நோடுகளில் உள்ள டேட்டா டைப்கள் அரூபமானவை; அமலாக்கங்கள் அவற்றின் சொந்த நிரலாக்க மொழி-குறிக்கும் பைண்டிங்குகளை வழங்குகின்றன. டிஓஎம் அமலாக்கங்கள் நினைவக அடர்த்தியுள்ளவையாக இருக்கும் நோக்கமுள்ளவை, அவற்றிற்கு பொதுவாக முழு ஆவணமும் நினைவகத்திற்குள்ளாக ஏற்றப்பட வேண்டும் என்பதோடு அனுமதி வழங்கப்படும் முன்னர் ஆப்ஜெட்களின் மரமாக கட்டமைக்கப்படுகின்றன.

டேட்டா பைண்டிங்[தொகு]

ஏபிஐ ஐ எக்ஸ்எம்எல் நிகழ்முறையாக்கும் மற்றொரு வடிவம் எக்ஸ்எம்எல் டேட்டா பைண்டிங் ஆகும், ஆவண ஆப்ஜெக்ட் மாதிரி பர்சரால் உருவாக்கப்படும் ஜெனரிக் ஆப்ஜெக்ட்களுக்கு முரணாக மரபான படிநிலை, வலுவாக டைப் செய்யப்பட்ட பிரிவுகளாக எக்ஸ்எம்எல் டேட்டா கிடைக்கப்பெறுமிடத்தில் இவ்வாறு செய்யப்படுகிறது. இந்த அணுகுமுறை குறியீடு உருவாக்கத்தை எளிதாக்குகிறது என்பதுடன் பல நிகழ்வுகளிலும் செயல்நேரத்தைக் காட்டிலும் தொகுப்பு நேரத்திலேயே பிரச்சினைகளை அடையாளம் காண அனுமதிக்கிறது. எக்ஸ்எம்எல் பைண்டிங்கிற்கான ஜாவா கட்டுமானம் (ஜேஏஎக்ஸ்பி), .NET இல்[12] எக்ஸ்எம்எல் சீரியலைஸேஷன் மற்றும் C++க்கான CodeSynthesis XSD ஆகியவற்றை டேட்டா பைண்டிங் அமைப்புகளுக்கான உதாரணமாகக் கூறலாம்.[13][14]

டேட்டா டைப்பாக எக்ஸ்எம்எல்[தொகு]

எக்ஸ்எம்எல் மற்ற மொழிகளில் முதல் தர டேட்டா டைப்பாக தோன்றத் தொடங்கின. இசிஎம்ஏஸ்கிரிப்ட்/ஜாவாஸ்கிரிப்ட் மொழிக்கான எக்ஸ்எம்எல்லிற்கான இசிஎம்ஏஸ்கிரிப்ட் (இ4எக்ஸ்) நீட்டிப்பு ஜாவாஸ்கிரிப்டிற்கான இரண்டு முக்கிய ஆப்ஜெக்ட்களை (எக்ஸ்எம்எல் மற்றும் எக்ஸ்எம்எல்லிஸ்ட்) வெளிப்படையாக குறிப்பிடுகிறது, இது எக்ஸ்எம்எல் ஆவண நோடுகள் மற்றும் எக்ஸ்எம்எல் ஆவணப் பட்டியல்களை வேறுபட்ட ஆப்ஜெக்ட்களாக ஏற்கிறது என்பதுடன் டாட்-நோட்டேஷன் குறிப்பிடும் பெற்றோர்-குழந்தை உறவுகளைப் பயன்படுத்துகிறது. இ4எக்ஸ் மொஸில்லா 2.5+ உலாவிகள் மற்றும் அடோப் ஆக்சன்ஸ்கிரிப்ட் ஆகியவற்றால் ஏற்கப்படுகிறது, ஆனால் பொதுப்படையானதாக ஏற்றுக்கொள்ளப்படவில்லை. மைக்ரோசாப்ட் .நெட் 3.5 மற்றும் அதற்கு மேற்பட்ட வடிவங்களுக்கான அமலாக்கங்களுக்கு மைக்ரோசாப்டின் எல்ஐஎன்க்யு இல் இதேபோன்ற நொட்டேஷன் பயன்படுத்தப்படுகிறது, அதேசமயம் 2005 ஆம் ஆண்டில் உருவாக்கப்பட்ட எக்ஸ்ஜே ஜாவாவிற்கான எக்ஸ்எம்எல் டேட்டா ஆப்ஜெக்டின் ஐபிஎம் அமலாக்கமாகும். எக்ஸ்எம்எல் கையாளுதற்கான சிறப்பு அம்சங்களுடன் உள்ள லினக்ஸ் போன்ற வரைச்சட்டகத்தை வழங்கும் ஓபன்-சோர்ஸான எக்ஸ்எம்எல்எஸ்ஹெச் பயன்பாடு இதேபோன்று எக்ஸ்எம்எல்லை <[ ]> நொட்டேஷனைப் பயன்படுத்தும் டேட்டா டைப்பாக நடத்துகிறது.[15]

வரலாறு[தொகு]

எக்ஸ்எம்எல் என்பது மிகப்பெரிய ஐஎஸ்ஓ தரநிலையான எஸ்ஜிஎம்எல் இன் சுயவிவரம் அல்லது மறுதிருத்தமாகும்.

திறன்மிக்க தகவல் காட்சிப்படுத்தலுக்கான எஸ்ஜிஎம்எல் இன் பலதிறன்கொண்ட செயல்பாடு இணையத்தளத்தின் வளர்ச்சிக்கு முந்தைய, 1980 ஆம் ஆண்டுகளின் முந்தைய டிஜிட்டல் மீடியா பப்ளிஷர்களால் புரிந்துகொள்ளப்பட்டிருந்தது.[16][17] 1990 ஆம் ஆண்டுகளின் மத்தியில் எஸ்ஜிஎம்எல் கையாளுநர்களுள் சிலர் அதன்பின்னர் புதியதாகிவிட்ட உலகளாவிய வலைத்தளத்துடனான அனுபவத்தைப் பெற்றனர் என்பதோடு வலைத்தளம் வளர்ச்சியடைகையில் அது எதிர்கொள்ளும் சில பிரச்சினைகளுக்கான தீர்வுகளையும் எஸ்ஜிஎம்எல் வழங்கும் என்றும் நம்பினர். டான் கான்னலி 1995 ஆம் ஆண்டில் டபிள்யு3சியில் சேர்ந்தபோது அதனுடைய நடவடிக்கைகளின் பட்டியலோடு எஸ்ஜிஎம்எல்லை சேர்த்தார்; மைக்ரோசிஸ்டம்ஸின் என்ஜினியரான ஜோன் போஸக் தனியுரிமை ஒன்றை உருவாக்கி உடனுழைப்பாளர்களை வேலைக்கமர்த்தியபோது இதற்கான பணிகள் 1996 ஆம் ஆண்டின் மத்தியப் பகுதியில் தொடங்கின. எஸ்ஜிஎம்எல் மற்றும் வலைத்தளம் ஆகிய இரண்டிலும் அனுபவம் பெற்ற சிறிய குழுவினருடன் போஸக் நல்லமுறையில் தொடர்புகொண்டிருந்தார்.[18]

எக்ஸ்எம்எல் ஏழு உறுப்பினர்கள்[19] கொண்ட வேலைக் குழுவால் தொகுக்கப்பட்டு ஆர்வமுள்ள 150 உறுப்பினர்களால் உதவியளிக்கப்பட்டது. ஆர்வம்கொண்ட குழுவினரின் அஞ்சல் பட்டியலில் தொழில்நுட்ப விவாதம் நடத்தப்பட்டது, பிரச்சனைகள் ஒருமனதான கருத்தின் மூலம் தீர்க்கப்பட்டன, அவை செயல்படாதபோது வேலைக் குழுவின் பெரும்பான்மை வாக்குகளின் அடிப்படையில் தீர்க்கப்பட்டன. வடிவமைப்பு முடிவுகளின் பதிவு மற்றும் அவற்றின் பகுப்புக்கள் 1997 ஆம் ஆண்டு டிசம்பர் 4 இல் மைக்கேல் ஸ்பெர்பர்க்-மெக்குயினால் தொகுக்கப்பட்டன.[20] ஜேம்ஸ் கிளார்க் வேலைக்குழுவின் தொழில்நுட்ப தலைவராக செயல்பட்டார், வெற்று-ஆக்கக்கூறான "<empty/>" வாக்கிய அமைப்பு மற்றும் "எக்ஸ்எம்எல்" என்ற பெயரிற்கு குறிப்பிடத்தகுந்த அளவிற்கு பங்களித்துள்ளார். பரிசீலனைக்கு உள்ளிடப்பட்ட மற்ற பெயர்கள் "எம்ஏஜிஎம்ஏ" (மினிமல் ஆர்க்கிடெக்சர் ஃபார் ஜெனரலைஸ்டு மார்க்அப் அப்ளிகேஷன்ஸ்), "எஸ்எல்ஐஎம்" (ஸ்ட்ரக்சர்டு லாங்குவேஜ் ஃபார் இண்டர்நெட் மார்க்அப்) மற்றும் "எம்ஜிஎம்எல்" (மினிமல் ஜெனரலைஸ்டு மார்க்அப் லாங்குவேஜ்) ஆகியவற்றை உள்ளிட்டிருந்தன. வரையறையின் இணை-ஆசிரியர்கள் உண்மையில் டிம் பிரே மற்றும் மைக்கேல் ஸ்பெர்பர்க்-மெக்குயின் ஆகியோராவர். இந்தத் திட்டப்பணி பாதியில் இருக்கும்போது மைக்ரோசாப்டின் பெரும் ஆர்ப்பாட்டத்தையும் தாண்டி நெட்ஸ்கேப் உடன் ஆலோசனையில் ஈடுபடுதற்கு பிரே ஒப்புதல் அளித்தார். பிரே தற்காலிகமாக எடிட்டோரியல்ஷிப்பிலிருந்து விலகிக்கொள்ள கேட்டுக்கொள்ளப்பட்டார். இது வேலைக் குழுவினரிடையே தீவிர விவாதத்திற்கு வழிவகுத்தது, மைக்ரோசாப்டின் ஜேன் பாவ்லி மூன்றாவது இணையாசிராக சேர்க்கப்பட்டதன் மூலம் ஏறத்தாழ இந்தப் பிரச்சனை தீர்க்கப்பட்டது.

எக்ஸ்எம்எல் வேலைக்குழு நேருக்கு நேராக சந்தித்துக்கொண்டதே இல்லை; இந்த வடிவமைப்பு மின்னஞ்சல் மற்றும் வாராந்திர தொலைபேசி கூட்டங்களைப் பயன்படுத்தி செய்துமுடிக்கப்பட்டது. முக்கியமான வடிவமைப்பு முடிவுகள் 1996 ஆம் ஆண்டில் ஜூலை மற்றும் நவம்பருக்கு இடையே செய்யப்பட்ட கடுமையான இருபது வார முடிவில், எக்ஸ்எம்எல் ஸ்பெசிபிகேஷனின் முதல் வேலை வரையறை பதிப்பிக்கப்பட்டபோது எட்டப்பட்டன.[21] மேற்கொண்டு வடிவமைப்பு வேலைகள் 1997 ஆம் ஆண்டு முழுவதும் செய்யப்பட்டன என்பதோடு, 1998 ஆம் ஆண்டு பிப்ரவரி 10 இல் எக்ஸ்எம்எல் 1.0 டபிள்யு3சியின் பரிந்துரையானது.

எக்ஸ்எம்எல் 1.0 இணையத்தள பயன்பாடு, பொது நோக்க பயன்பாடு, எஸ்ஜிஎம்எல் ஒத்திசைவு, நிகழ்முறையாக்க மென்பொருளின் சுலபமான உருவாக்கத்தின் வசதியேற்படுத்தல், தேர்வுநிலை அம்சங்களின் குறைவுபடுத்தல், தெளிவு, சம்பிரதாயம், ஒருமனதான போக்கு மற்றும் ஆசிரியத்துவத்தின் சுலபத்தன்மை ஆகியவற்றிற்கான வேலைக்குழுவின் இலக்குகளை எட்டியது.

இதனுடைய முன்னோடியான எஸ்ஜிஎம்எல்லைப் போன்று சில தேவைக்கு அதிகமான சின்டக்டிக் கட்டமைப்புகளை அனுமதிக்கிறது என்பதுடன் ஆக்கக்கூறு அடையாளம் காண்பவற்றின் மறுநிகழ்வையும் சேர்த்துக்கொண்டுள்ளது. இந்த முறைகளில், சுருக்கமாக தெளிவுபடக் கூறுதல் இதனுடைய கட்டமைப்பி்ல் அத்தியாவசியமானதாக கருதப்படுவதில்லை.

ஆதாரங்கள்[தொகு]

எக்ஸ்எம்எல் என்பது ஐஎஸ்ஓ தரநிலையுள்ள எஸ்ஜிஎம்எல் இன் சுருக்க ஆக்கமாகும், என்பதோடு பெரும்பாலான எக்ஸ்எம்எல்கள் மாற்றமடையாத எஸ்ஜிஎம்எல் இல் இருந்து வந்துள்ளன. எஸ்ஜிஎம்எல் இல் இருந்து தர்க்கரீதியான மற்றும் பௌதீக கட்டமைப்புகளின் பிரிவு (ஆக்கக்கூறுகள் மற்றும் தனியுடைமைகள்), இலக்கணம் அடிப்படையிலானவற்றின் இருப்பு (டீடிடீக்கள்), டேட்டா மற்றும் மெட்டாடேட்டாவின் பிரிவு (ஆக்கக்கூறுகளும் உள்ளீடுகளும்), கலப்பு உள்ளடக்கம், பிரதிநிதித்துவத்திலிருந்து நிகழ்முறையாக்கத்தின் பிரிப்பு (நிகழ்முறையாக்க அறிவுறுத்தல்கள்), மற்றும் இயல்பாக்க ஆங்கிள்-பிராக்கெட் வாக்கிய அமைப்பு ஆகியவை வருகின்றன. எஸ்ஜிஎம்எல் அறிவிப்பு நீக்கப்பட்டிருக்கிறது (எக்ஸ்எம்எல்) நிலையான டெலிமீட்டர் தொகுதியைக் கொண்டிருக்கிறது என்பதுடன் ஆவண பண்புரு தொகுதியாக யுனிகோடை ஏற்றுக்கொண்டுள்ளது).

எக்ஸ்எம்எல்லுக்கான மற்ற தொழில்நுட்ப மூலாதாரங்கள் 'மாற்றித்தருதல் வாக்கிய அமைப்பாக' பயன்படுத்துவதற்கான எஸ்ஜிஎம்எல்லின் சுயவிவரத்தை விளக்கும் டெக்ஸ்ட் என்கோடிங் இனிஷியேட்டிவ் (டிஇஐ); ஆக்கக்கூறுகள் தங்களுடைய மூலாதாரங்களுடன் ஒத்திசைவாக்கம் செய்துகொள்ளும் ஹெச்டிஎம்எல், ரிசோர்ஸ் என்கோடிங்கில் இருந்து ஆவண பண்புரு தொகுப்பின் பிரிப்பு, எக்ஸ்எம்எல்:லாங் பிரிப்பு, இணைப்பின் அறிவிப்பில் தேவைப்படுவதைக் காட்டிலும் மூலாதாரங்களை சேர்த்துக்கொள்ளும் மெட்டாடேட்டாவான ஹெச்டிடிபி கருத்தாக்கம். சீனா/ஜப்பான்/கொரியா ஆவண நிகழ்முறையாக்க நிபுணத்துவ குழுவோடு தொடர்புடைய ஐஎஸ்ஓ-சார்ந்த எஸ்பிஆர்இஏடி (ஸ்டாண்டர்டைசேஷன் புராஜக்ட் ரிகார்டிங் ஈஸ்ட் ஏசியன் டாகுமெண்ட்) திட்டப்பணியின் எக்ஸ்டண்டட் ரெஃப்ரண்ஸ் கான்க்ரீட் சின்டக்ஸ் (இஆர்சிஎஸ்) திட்டம் எக்ஸ்எம்எல் 1.0 இன் பெயரிடும் விதிகளின் அடிப்படையில் அமைந்துள்ளது; எஸ்பிஆர்இஏடி ஹெக்ஸாடெசிமல் எண்ணியல் பண்புரு குறிப்புகள் மற்றும் யுனிகோட் பண்புருக்கள் அனைத்தையும் கிடைக்கச்செய்வதற்கான பார்வைக்குறிப்பு கருத்தாக்கம் ஆகியவற்றையும் உருவாக்கியிருக்கிறது. இஆர்சிஎஸ், எக்ஸ்எம்எல் மற்றும் ஹெச்டிஎம்எல் ஆகியவற்றிற்கு நல்ல முறையில் உதவுவதற்காக, எஸ்ஜிஎம்எல் தரநிலையான ஐஎஸ் 8879 வெப்எஸ்ஜிஎம்எஸ் தழுவல்களுடன் 1996 மற்றும் 1998 ஆம் ஆண்டுகளில் திருத்தப்பட்டிருக்கின்றன. எக்ஸ்எம்எல்லின் ஹெடர் ஐஎஸ்ஓவின் ஹைடைமை பின்பற்றுகிறது.

விவாதங்களின்போது எக்ஸ்எம்எல்லில் உருவாக்கப்பட்ட நவீனத்துவமான கருத்தாக்கங்கள் என்கோடிங் டிடெக்சன் மற்றும் என்கோடிங் ஹெடருக்கான அல்கோரிதம், நிகழ்முறையாக்க அறிவுறுத்தல் இலக்கு, எக்ஸ்எம்எல்:ஸ்பேஸ் உள்ளீடு மற்றும் வெற்று-ஆக்கக்கூறு டேக்கிற்கான புதிய டெலிமீட்டர் ஆகியவற்றை உள்ளி்ட்டிருக்கிறது. மதிப்பிடுதலுக்கு (ஸ்கீமா இல்லாமல் பார்ஸிங்கை செயல்பட அனுமதிப்பது) எதிரான நன்கு-வடிவமைத்திருத்தல் என்ற கருத்தாக்கம் முதலில் எக்ஸ்எம்எல்லில்தான் உருவாக்கப்பட்டது, இருப்பினும் இது மின்னணு புத்தகத் தொழில்நுட்பமான "டைனாடெக்ஸ்டில்"[22] வெற்றிகரமாக அமலாக்கம் செய்யப்பட்டது; இந்த மென்பொருள் வாட்டர்லூ பல்கலைக்கழக நியூ ஆக்ஸ்போர்டு ஆங்கில அகராதி திட்டம்; டோக்கியோ, யுனிஸ்கோப்பில் உள்ள ஆர்ஐஎஸ்பி எல்ஐஎஸ்பி எஸ்ஜிஎம்எல் டெக்ஸ்ட் பிராசஸர்; அமெரிக்க ராணுவ ஆயுத கட்டளைமைய ஐஏடிஎஸ் ஹைபர்டெக்ஸ்ட் சிஸ்டம்; மென்டர் கிராபிக்ஸ் கான்டெக்ஸ்ட்; இண்டர்லீஃப் மற்றும் ஜெராக்ஸ் பப்ளிஷிங் சிஸ்டம் ஆகியவற்றிலிருந்து வந்திருக்கிறது.

பதிப்புகள்[தொகு]

தற்போது இரண்டு எக்ஸ்எம்எல் பதிப்புக்கள் உள்ளன. முதலாவது 1998 ஆம் ஆண்டில் தொடக்கநிலையில் வரையறுக்கப்பட்ட எக்ஸ்எம்எல் 1.0 . அதுமுதல் புதிய பதிப்பு எண் வழங்கப்படாமலேயே இது சிறிய திருத்தங்களுக்கு உட்பட்டு வந்திருக்கிறது என்பதுடன் 2008 ஆம் ஆண்டு நவம்பர் 26 இல் புதுபிக்கப்பட்டது, இது தற்போது ஐந்தாவது பதிப்பாக இருக்கிறது. இது பரவலாக அமல்படுத்தப்பட்டு பொதுப்பயன்பாட்டிற்காக இப்போதும் பரிந்துரைக்கப்படுகிறது.

எக்ஸ்எம்எல் 1.1 என்ற இரண்டாவது பதிப்பு, தொடக்கமாக 2004 ஆம் ஆண்டு பிப்ரவரி 4 இல் பதிப்பிக்கப்பட்டது, அதேநாளில் எக்ஸ்எம்எல்லின் மூன்றாவது பதிப்பும்[23] தற்போதும் அதனுடைய இரண்டாவது பதிப்பில் இருப்பதுமான எக்ஸ்எம்எல் 1.0 2006 ஆம் ஆண்டு ஆகஸ்ட் 16 இல் பதிப்பிக்கப்பட்டது. குறிப்பிட்ட நிலைகளில் எக்ஸ்எம்எல்லை சுலபமாகப் பயன்படுத்தும் நோக்கத்தோடு இது சிறப்பம்சங்களை உள்ளிட்டிருக்கிறது[24] - முக்கியமாக இபிசிடிஐசி பிளாட்ஃபார்ம்களில் பயன்படுத்துவதற்கான லைன்-கோடிங் பண்புருக்களை பயன்படுத்த முடிகிறது என்பதோடு யுனிகோட் 3.2 இல் இல்லாத பண்புருக்களின் எழுத்துவடிவங்களையும் பயன்படுத்தி்க்கொள்ள முடிகிறது. எக்ஸ்எம்எல் 1.1 மிகப்பரவலாக அமல்படுத்தப்படவில்லை என்பதோடு இதனுடைய பிரத்யேகமான அம்சங்கள் தேவைப்படுபவர்கள் மட்டும் பயன்படுத்துவதற்கென்று பரிந்துரைக்கப்படுகிறது.[25]

இதனுடைய ஐந்தாவது பதிப்பு வெளியீட்டிற்கு முன்னர், ஆக்கக்கூறுகள் மற்றும் உள்ளீட்டுப் பெயர்கள் மற்றும் பிரத்யேக அடையாளம் காண்பவைகள் ஆகியவற்றிற்கான பண்புருக்களை கிடைக்கச் செய்வதற்கான கடுமையான விதிகளோடு எக்ஸ்எம்எல் 1.1 இல் இருந்து எக்ஸ்எம்எல் 1.0 மாறுபடுகிறது: எக்ஸ்எம்எல் 1.0 இன் முதல் நான்கு பதிப்புக்களில் இந்தப் பண்புருக்கள் யுனிகோட் ஸ்டாண்டர்டின் (யுனிகோட் 2.0 முதல் யுனிகோட் 3.2 வரை) குறிப்பிட்ட வடிவத்தைப் பயன்படுத்தி நேரடியாக கணக்கிடப்பட்டிருக்கின்றன. முதல் பதிப்பு ஃயூச்சர்-புரூஃபாக இருக்கும் எக்ஸ்எம்எல் 1.1 இன் இயக்கவியலுக்கு மாற்றாக அமைந்தது ஆனால் தேவைக்கு அதிகமானவற்றைக் குறைத்தது. எக்ஸ்எம்எல் 1.0 ஐந்தாவது பதிப்பு மற்றும் எக்ஸ்எம்எல் 1.1 இன் எல்லாப் பதிப்புக்களிலும் பெயர்களில் கைவிடப்படும் குறிப்பிட்ட பண்புருக்கள் என்ற அணுகுமுறை மேற்கொள்ளப்பட்டது, அத்துடன் எதிர்கால யுனிகோட் பதிப்புக்களில் பொருத்தமான பெயர் பண்புருக்களின் பயன்பாட்டிற்கு வசதியேற்படுத்தித் தரும் விதத்தில் எல்லாமும் அனுமதிக்கப்பட்டன. ஐந்தாவது பதிப்பில் எக்ஸ்எம்எல் பெயர்கள் யுனிகோட் 3.2 இல் இருந்து யுனிகோடில் சேர்க்கப்பட்டுள்ள மற்றவற்றோடு பாலினெஸ், சாம் அல்லது ஃபொனீசியன் எழுத்து வடிவங்கள் உள்ளிடப்பட்டிருக்கின்றன.

கிட்டத்தட்ட எந்த யுனிகோட் விஷயத்தையும் பண்புருத் தரவு மற்றும் எக்ஸ்எம்எல் 1.0 அல்லது 1.1 ஆவணத்தின் உள்ளீட்டு மதிப்போடு பயன்படுத்த முடியும் என்பதோடு பண்புருவானது கோட் பாய்ண்டுடன் தொடர்புடையதாக இருந்தாலும்கூட அது தற்போதைய யுனிகோட் பதிப்பில் வரையறுக்கப்படவில்லை. பண்புருத் தரவு மற்றும் உள்ளீட்டு மதிப்புக்களில், எக்ஸ்எம்எல் 1.1 எக்ஸ்எம்எல் 1.0 ஐக் காட்டிலும் அதிக கட்டுப்பாட்டு பண்புருக்களை அனுமதிக்கிறது, ஆனால் "வலிமைத்திறனுக்கு" எக்ஸ்எம்எல் 1.1 இல் அறிமுகப்படுத்தப்பட்டுள்ள பெரும்பாலான கட்டுப்பாட்டு பண்புருக்கள், குறிப்பாக எண்ணியல் பண்புரு குறிப்பிடப்பட வேண்டும். எக்ஸ்எம்எல் 1.1 இல் உள்ள உதவியளிக்கும் கட்டுப்பாட்டு பண்புருக்களுக்கிடையே ஒயிட்ஸ்பேஸாக கருதப்பட வேண்டிய இரண்டு லைன் பிரேக் கோட்கள் இருக்கின்றன. ஒயிட்ஸ்பேஸ் பண்புருக்கள் மட்டுமே நேரடியாக எழுதப்படக்கூடிய ஒரே கட்டுப்பாட்டு குறியீடுகளாகும்.

எக்ஸ்எம்எல் 2.0 குறித்து விவாதங்கள் நடைபெற்று வருகின்றன, இருப்பினும் எந்த நிறுவனமும் இதுபோன்ற திட்டப்பணிக்கான திட்டங்களை வைத்திருப்பதாக அறிவிக்கவில்லை. எக்ஸ்எம்எல்-எஸ்டபிள்யு (எஸ்டபிள்யு-ஸ்கன்க் ஒர்க்ஸ்), எக்ஸ்எம்எல்லின் அசல் உருவாக்குநர்களுள் ஒருவரால் எழுதப்பட்ட இது எக்ஸ்எம்எல் 2.0 எவ்வாறு இருக்கும் என்பது குறித்த சில முன்மொழிவுகளை உள்ளிட்டிருக்கிறது: வாக்கிய அமைப்பிலிருந்து டீடிடீக்களின் நீக்கம், நேம்ஸ்பேஸ்களின் ஒருங்கிணைப்பு, பேஸ் ஸ்டாண்டர்டிற்குள்ளான எக்ஸ்எம்எல் பேஸ் மற்றும் எக்ஸ்எம்எல் இன்ஃபர்மேஷன் தொகுதி (இன்ஃபோசெட்).

உலகளாவிய வலைத்தள கூட்டமைப்பு, எக்ஸ்எம்எல் இன்ஃபோசெட்டின் பைனரி என்கோடிங்கிற்கான நிகழ்வுகள் மற்றும் உடைமைப்பொருள்களுக்குள்ளான தொடக்கநிலை ஆராய்ச்சிகளை மேற்கொண்டுவரும் எக்ஸ்எம்எல் பைனரி கேரக்டரைசேஷன் ஒர்க்கிங் குரூப்பையும் கொண்டிருக்கிறது. இந்த வேலைக்குழு அதிகாரப்பூர்வமான தரநிலைகள் எதையும் உருவாக்குவதற்கென்று அமைக்கப்படவில்லை. எக்ஸ்எம்எல் வரையறையின் அடிப்படையில் உரை அடிப்படையில் அமைந்திருப்பதால், ஐடியு-டி மற்றும் ஐஎஸ்ஓ ஆகியவை குழப்பத்தைத் தவிர்ப்பதற்கு தங்களுடைய சொந்த பைனரிக்கான ஃபாஸ்ட் இன்ஃபோசெட் பெயரைப் பயன்படுத்துகின்றன (பார்க்க ஐடியு-டி ஆர்இசி. எக்ஸ்.891 | ஐஎஸ்ஓ/ஐஇசி 24824-1).

பார்வைக் குறிப்புகள்[தொகு]

  1. "W3C® DOCUMENT LICENSE".
  2. 2.0 2.1 "XML 1.0 Origin and Goals". பார்த்த நாள் July 2009.
  3. "XML Applications and Initiatives".
  4. "Introduction to iWork Programming Guide. Mac OS X Reference Library". Apple.
  5. "Characters vs. Bytes".
  6. "Autodetection of Character Encodings".
  7. இது அனுமதிக்கப்பட்டிருக்கிறது, ஆனால் எக்ஸ்எம்எல் தனியுடைமை மதிப்புக்களில் "<" ஐப் பயன்படுத்துவதற்கு பரிந்துரைக்கப்படவில்லை: எக்ஸ்டென்சிபிள் மார்க்அப் லாங்குவேஜ் (எக்ஸ்எம்எல்) 1.0 (ஐந்தாவது பதிப்பு): தனியுடைமை மதிப்பு வரையறை
  8. "W3C I18N FAQ: HTML, XHTML, XML and Control Codes".
  9. "Articles tagged with “draconian”".
  10. "xml-dev — Fw: An I-D for text/xml, application/xml, etc". Lists.xml.org (2004-07-25). பார்த்த நாள் 2009-07-31.
  11. புஷ், புல், நெக்ஸ்ட்! XML.com இல் பாப் டுசார்ம்
  12. "XML Serialization in the .NET Framework". Msdn.microsoft.com. பார்த்த நாள் 2009-07-31.
  13. "An Introduction to XML Data Binding in C". Artima.com (2007-05-04). பார்த்த நாள் 2009-07-31.
  14. "CodeSynthesis XSD — XML Data Binding for C". Codesynthesis.com. பார்த்த நாள் 2009-07-31.
  15. http://www.xmlsh.org/CoreSyntax
  16. Bray, Tim (February 2005). "A conversation with Tim Bray: Searching for ways to tame the world’s vast stores of information". Association for Computing Machinery's "Queue site". பார்த்த நாள் April 16 2006.
  17. edited by Sueann Ambron and Kristina Hooper ; foreword by John Sculley. (1988). "Publishers, multimedia, and interactivity". Interactive multimedia. Cobb Group. ISBN 1-55615-124-1. 
  18. Eliot Kimber (2006). "XML is 10".
  19. வேலைக்குழு உண்மையில் "எடிட்டோரியல் ரிவ்யூ போர்ட்" என்றே அழைக்கப்பட்டது. அசலான உறுப்பினர்கள் மற்றும் முதல் பதிப்பு நிறைவுபெறும் முன்னர் சேர்க்கப்பட்ட ஏழுபேர் ஆகியோர் at http://www.w3.org/TR/1998/REC-xml-19980210 இல், எக்ஸ்எம்எல்லின் முதல் பதிப்பு முடிவுறும் நேரத்தில் சேர்த்துக்கொள்ளப்பட்டனர்.
  20. "Reports From the W3C SGML ERB to the SGML WG And from the W3C XML ERB to the XML SIG". W3.org. பார்த்த நாள் 2009-07-31.
  21. "Extensible Markup Language (XML)". W3.org (1996-11-14). பார்த்த நாள் 2009-07-31.
  22. Jon Bosak, Sun Microsystems (2006-12-07). "Closing Keynote, XML 2006". 2006.xmlconference.org. பார்த்த நாள் 2009-07-31.
  23. எக்ஸ்டென்சிபிள் மார்க்அப் லாங்குவேஜ் (எக்ஸ்எம்எல்) 1.0 (மூன்றாவது பதிப்பு)
  24. "Extensible Markup Language (XML) 1.1 (Second Edition) – Rationale and list of changes for XML 1.1". W3C. பார்த்த நாள் 2006-12-21.
  25. Harold, Elliotte Rusty (2004). Effective XML. Addison-Wesley. பக். 10–19. ISBN 0321150406. http://www.cafeconleche.org/books/effectivexml/. 

வெளி இணைப்புகள்[தொகு]

"http://ta.wikipedia.org/w/index.php?title=எக்ஸ்எம்எல்&oldid=1354572" இருந்து மீள்விக்கப்பட்டது