இயந்திர மொழிபெயர்ப்பு: திருத்தங்களுக்கு இடையிலான வேறுபாடு

உள்ளடக்கம் நீக்கப்பட்டது உள்ளடக்கம் சேர்க்கப்பட்டது

வரியுள்

01:02, 20 அக்டோபர் 2011 இல் நிலவும் திருத்தம்

இயந்திர மொழிபெயர்ப்பு அல்லது பொறிவழி மொழிபெயர்ப்பு என்பது கணினி அல்லது ஓர் இயந்திரத்தால் (பொறியால்) மாந்தர்களின் இயல்மொழி ஒன்றில் இருந்து மற்றொரு இயல்மொழிக்குத் தானியங்கியாய் மொழிபெயர்ப்பது.

இன்று பெரும்பாலும் கணினிவழியாகத் தக்க மென்கலத்தைப் ( மென்பொருளைப்) பயன்படுத்தி எழுத்துவடிவில் உள்ள உரையையோ, பேச்சையோ ஒருமொழியில் இருந்து மற்றொரு மொழிக்கு மொழிபெயர்ப்பது ஆகும்.

இது தொன்பழங்காலத்தில் இருந்து வரும் பொதுவான மொழிபெயர்ப்புக் கலையின் ஒரு கூறாகவும், தற்கால கணிப்பீட்டு மொழியியலில் (computational linguistics) ஒரு முக்கிய உள்துறையாகவும் இருக்கும் ஒரு துறை. கணினியின் துணையால் மாந்தர்களும் சேர்ந்து உருவாக்கும் கூட்டு மொழிபெயர்ப்பு ஆகிய இயந்திரத்துணையோடு செய்யும் மாந்த மொழிபெயர்ப்பு (machine-aided human translation, MAHT) என்பது போன்ற துறைகளில் இருந்து சற்று வேறுபட்ட துறை.

ஒரு மொழியில் கூறப்படும் ஒவ்வொரு சொல்லுக்கும், இன்னொரு மொழியில் அதே பொருள் சுட்டும் சொற்களை ஈடாக இடுவதால் மட்டும் மொழிபெயர்ப்பு நிறைவு தருவதாக அமைவதில்லை. ஒரு மொழியிலே பல சொற்கள் சேர்ந்து அதில் முழுப்பொருள் தரும் ஒரு சொற்றொடராகும் முறையானது மற்றொரு மொழியில் வேறு அடுக்கில் அல்லது வரன்முறையில் வந்து ஈடான சொற்றொடராகும். எளிய எடுத்துக்காட்டாக, ஆங்கிலத்தில் "She saw Murugan in the shop." என்னும் சொற்றொடர், தமிழில் "அவள் முருகனைக் கடையில் கண்டாள்" என்று மொழிபெயர்க்கப்படும் போது, தமிழில் வினைச்சொலாகிய (வினைமுற்று) "கண்டாள்" என்பது கடைசியாக வருவதும், ஆங்கிலத்தில் saw என்னும் வினைச்சொல் இரண்டாவதாக வருவதையும் பார்க்கலாம். தமிழில் "முருகனை" என்று இரண்டாம் வேற்றுமையாகிய ஐ என்பதைச் சேர்த்தும், "in the shop" என்பது தமிழில் மாற்றப்பெறும்பொழுது, "கடையில்" என்று தமிழின் ஏழாம் வேற்றுமையாகிய "இல்" என்பதைக் "கடை" என்பதோடு சேர்த்தும் மொழி பெயர்க்க வேண்டும். இவ்வாறான மாற்றங்களைத் தானியங்கியாய் இடத்திற்கு ஏற்றவாறு பொருள் மாறுபடாமல் ஓர் இயந்திரத்தால் அல்லது கணினியால் செய்வது இயந்திர மொழிபெயர்ப்பாகும்.

வரலாறு

ஓர் இயந்திரத்தைப் பயன்படுத்தி மொழிப்யர்ப்புச் செய்யலாம் என்னும் கருத்து, முதன் முதல் 17 ஆம் நூற்றாண்டைச் சேர்ந்த பிரானிசிய அறிவியலாளர் ரெனே டேக்கார்ட் அவர்களால் 1629 இல் முன் வைக்கப்பட்டது. நவம்பர் 20, 1629 இல் டேக்கார்ட் பியர் மெர்சென் (Pierre Mersenne) என்பாருக்கு எழுதிய மடலில் பொதுமொழி (univeral language) என்னும் கருத்தை முன் வைத்தார்; அதன்படி எல்லா மொழிகளிலும் ஒரு சொற்கருத்தைக் கூறும் சொற்களைப் பொதுமொழியில் ஒரு குறியீடு (தனியான எண் போன்ற ஒன்றைத்) தந்து, அதனையே எல்லா மொழிகளிலும் இட்டு, இயந்திரத்தைக் கொண்டு சொல்லுக்குச் சொல் மொழி பெயர்க்கலாம் என்னும் கருத்து நிலவியது. இதனைப் பயன்படுத்தி 1661 இல் பெக்கர் (Becher) என்பார் 10,000 இலத்தீன் சொற்கள், சொற்கூறுகளுக்குக் குறியீடுகள் தந்து அகராதியையே உருவாக்கினார். ஆனால் கிரேக்கம் , எபிரேயம், இடாய்ச்சு போன்ற மொழிகளுக்கும் தரவில்லை. சொற்றொடர் சிக்கல்கள் பற்றியவற்றையும் எதிர்கொள்ளவில்லை. இது போல சசன் வில்க்கின்சு (John Wilkins)(1668) மற்றும் பலர் இந்தப் பொதுமொழிக் கருத்து பற்றி கருத்துகள் முன்வைத்துள்ளனர். சூலை 22, 1933 இல் அருமேனியப் பின்புலம் உள்ள பிராசிய பொறியியலாளர் சியார்ச்செசு ஆர்ட்ஃசுரூனி (Georges Artsrouni) என்பாருக்கு மொழிபெயர்ப்பி இயந்திரம் ஒன்றிற்கு புத்தாக்க உரிமம் (patent) வழங்கப்பட்டது. The idea of machine translation may be traced back to the 17th century. In 1629, René Descartes proposed a universal language, with equivalent ideas in different tongues sharing one symbol. In the 1950s, The Georgetown experiment (1954) involved fully automatic translation of over sixty Russian sentences into English. The experiment was a great success and ushered in an era of substantial funding for machine-translation research. The authors claimed that within three to five years, machine translation would be a solved problem.

Real progress was much slower, however, and after the ALPAC report (1966), which found that the ten-year-long research had failed to fulfill expectations, funding was greatly reduced. Beginning in the late 1980s, as computational power increased and became less expensive, more interest was shown in statistical models for machine translation.

The idea of using digital computers for translation of natural languages was proposed as early as 1946 by A. D. Booth and possibly others. Warren Weaver wrote an important memorandum "Translation" in 1949. The Georgetown experiment was by no means the first such application, and a demonstration was made in 1954 on the APEXC machine at Birkbeck College (University of London) of a rudimentary translation of English into French. Several papers on the topic were published at the time, and even articles in popular journals (see for example Wireless World, Sept. 1955, Cleave and Zacharov). A similar application, also pioneered at Birkbeck College at the time, was reading and composing Braille texts by computer.

@@ வரிசை 6: / வரிசை 6: @@
 ஒரு மொழியில் கூறப்படும் ஒவ்வொரு சொல்லுக்கும், இன்னொரு மொழியில் அதே பொருள் சுட்டும் சொற்களை ஈடாக இடுவதால் மட்டும் மொழிபெயர்ப்பு நிறைவு தருவதாக அமைவதில்லை. ஒரு மொழியிலே பல சொற்கள் சேர்ந்து அதில் முழுப்பொருள் தரும் ஒரு சொற்றொடராகும் முறையானது மற்றொரு மொழியில் வேறு அடுக்கில் அல்லது வரன்முறையில் வந்து ஈடான சொற்றொடராகும். எளிய எடுத்துக்காட்டாக, [[ஆங்கிலம்|ஆங்கிலத்தில்]] "She saw Murugan in the shop."  என்னும் சொற்றொடர், தமிழில் "அவள் முருகனைக் கடையில் கண்டாள்" என்று மொழிபெயர்க்கப்படும் போது, தமிழில் வினைச்சொலாகிய (வினைமுற்று) "''கண்டாள்''"  என்பது ''கடைசியாக'' வருவதும், ஆங்கிலத்தில் ''saw'' என்னும் வினைச்சொல் இரண்டாவதாக வருவதையும் பார்க்கலாம். தமிழில் "''முருகனை''" என்று இரண்டாம் வேற்றுமையாகிய ''ஐ'' என்பதைச் சேர்த்தும், "in the shop" என்பது தமிழில் மாற்றப்பெறும்பொழுது, "''கடையில்''" என்று தமிழின் ஏழாம் வேற்றுமையாகிய "இல்" என்பதைக் "கடை" என்பதோடு சேர்த்தும் மொழி பெயர்க்க வேண்டும். இவ்வாறான மாற்றங்களைத் தானியங்கியாய் இடத்திற்கு ஏற்றவாறு பொருள் மாறுபடாமல் ஓர் இயந்திரத்தால் அல்லது கணினியால் செய்வது இயந்திர மொழிபெயர்ப்பாகும்.
+==வரலாறு==
+ஓர் இயந்திரத்தைப் பயன்படுத்தி மொழிப்யர்ப்புச்  செய்யலாம் என்னும் கருத்து, முதன் முதல் 17 ஆம் நூற்றாண்டைச் சேர்ந்த பிரானிசிய அறிவியலாளர் ரெனே டேக்கார்ட் அவர்களால் 1629 இல் முன் வைக்கப்பட்டது. நவம்பர் 20, 1629 இல் டேக்கார்ட் பியர் மெர்சென் (Pierre Mersenne) என்பாருக்கு எழுதிய மடலில் ''பொதுமொழி'' (univeral language) என்னும் கருத்தை முன் வைத்தார்; அதன்படி எல்லா மொழிகளிலும் ஒரு சொற்கருத்தைக் கூறும் சொற்களைப் பொதுமொழியில் ஒரு குறியீடு (தனியான எண் போன்ற ஒன்றைத்) தந்து, அதனையே எல்லா மொழிகளிலும் இட்டு, இயந்திரத்தைக் கொண்டு சொல்லுக்குச் சொல் மொழி பெயர்க்கலாம் என்னும் கருத்து நிலவியது. இதனைப் பயன்படுத்தி 1661 இல் பெக்கர் (Becher) என்பார் 10,000 இலத்தீன் சொற்கள், சொற்கூறுகளுக்குக் குறியீடுகள் தந்து அகராதியையே உருவாக்கினார். ஆனால் கிரேக்கம் , எபிரேயம், இடாய்ச்சு போன்ற மொழிகளுக்கும் தரவில்லை.  சொற்றொடர் சிக்கல்கள் பற்றியவற்றையும் எதிர்கொள்ளவில்லை. இது போல சசன் வில்க்கின்சு (John Wilkins)(1668) மற்றும் பலர் இந்தப் பொதுமொழிக் கருத்து பற்றி கருத்துகள் முன்வைத்துள்ளனர். சூலை 22, 1933 இல் அருமேனியப் பின்புலம் உள்ள பிராசிய பொறியியலாளர் சியார்ச்செசு ஆர்ட்ஃசுரூனி (Georges Artsrouni) என்பாருக்கு மொழிபெயர்ப்பி இயந்திரம் ஒன்றிற்கு புத்தாக்க உரிமம் (patent) வழங்கப்பட்டது.
+The idea of machine translation may be traced back to the 17th century. In 1629, René Descartes proposed a universal language, with equivalent ideas in different tongues sharing one symbol. In the 1950s, The Georgetown experiment (1954) involved fully automatic translation of over sixty Russian sentences into English. The experiment was a great success and ushered in an era of substantial funding for machine-translation research. The authors claimed that within three to five years, machine translation would be a solved problem.
+Real progress was much slower, however, and after the ALPAC report (1966), which found that the ten-year-long research had failed to fulfill expectations, funding was greatly reduced. Beginning in the late 1980s, as computational power increased and became less expensive, more interest was shown in statistical models for machine translation.
+The idea of using digital computers for translation of natural languages was proposed as early as 1946 by A. D. Booth and possibly others. Warren Weaver wrote an important memorandum "Translation" in 1949. The Georgetown experiment was by no means the first such application, and a demonstration was made in 1954 on the APEXC machine at Birkbeck College (University of London) of a rudimentary translation of English into French. Several papers on the topic were published at the time, and even articles in popular journals (see for example Wireless World, Sept. 1955, Cleave and Zacharov). A similar application, also pioneered at Birkbeck College at the time, was reading and composing Braille texts by computer.