தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 28. மொழித் தொழில்நுட்பத்தில் வளங்கள் மிகுந்த மொழியாகத் தமிழை உயர்த்துவோம்

இயல் மொழியியலில் அண்மைய தொழில்நுட்பக் கலை பற்றிய ஆய்வு, தொகுதி 13-14 இலிருந்து கீழ்க்கண்ட மேற்கோள் எடுக்கப்பட்டது.

“மொழித் தொழில்நுட்பத்தை பயன்படுத்துவதன் மூலம் பெறக்கூடிய நன்மைகள் இவை. கணினிகளின் பயன்மை (usability) அதிகரிக்கிறது. மேலும் கணினி பயன்பாட்டில் பாமர மக்கள் தன்மேம்பாடு பெறவும் (empowering) வழிவகுக்கிறது.”

தமிழின் கடந்த முதன்மைத்துவத்தை மீண்டும் பெற முயல்வோம்

1805 இல் ராஜெட் ஆங்கிலத்தில் முதல் தெஸாரஸ் (Roget’s Thesaurus) உருவாக்கினார். இதன் மூலப் பதிப்பில் 15,000 சொற்கள் இருந்தன. அச்சிடல் ஐரோப்பாவில் 15 ஆம் நூற்றாண்டிலேயே பரவலாக வந்துவிட்டது. திவாகர நிகண்டு என்னும் நூல் 8 ஆம் நூற்றாண்டில் திவாகர முனிவரால் இயற்றப்பட்டது. பிங்கள நிகண்டு 10 ஆம் நூற்றாண்டில் இயற்றப்பட்டது. இதில் 14700 சொற்பொருள் விளக்கங்கள் உள்ளன. நிகண்டு என்பது ஒத்த கருத்துடைய சொற்களை ஓரிடத்தில் சேர்த்துக் கொடுக்கும் தெஸாரஸ் போன்ற நூல் ஆகும். அக்காலத்தில் ஓலைச்சுவடியும் பரவலாக வரவில்லையென்று தெரிகிறது. இந்நூற்களை அனேகமாக மனப்பாடமாகவே பல தலைமுறைகளுக்குப் பேணிக்காத்தனர். கணினி மற்றும் தகவல் யுகத்தில் நம் தாய்மொழியைத் தழைக்கச் செய்யத் தேவையான வேலைகளை நாம் செய்யாவிட்டால் என்ன சாக்கு சொல்லமுடியும்? நமக்கு என்ன வசதி இல்லை? நம் முன்னோர்களிடமிருந்த மொழிப்பற்றையும் சமூக மனநிலையையும் அடைய முயல்வோம்.

இயல்மொழி ஆய்வில் தமிழுக்கு பலவீனமான ஆதரவுதான் உள்ளது

உலகத்தில் சுமார் 7000 மொழிகள் உள்ளன. இவற்றை இயல்மொழி ஆய்வின் ஆதரவு மற்றும் வளங்கள்படி ஆறு படிகளாகப் பிரித்தார்கள். கருவிகளும் வளங்களும் மிகுந்து முதல் படியில் உன்னதமான ஆதரவுடன் ஆங்கிலம் தனியிடத்தில் உள்ளது. இரண்டாம் இடத்தில் நல்ல ஆதரவுடன் ஜெர்மன், பிரெஞ்சு, ஸ்பானிஷ், இத்தாலிய, போர்த்துகீய மொழிகள் போன்ற 10 உள்ளன. மூன்றாவது இடத்தில் மிதமான ஆதரவுடன் இந்தி, வியட்நாமிய, தாய்லாந்து போன்ற 70 மொழிகள் உள்ளன. தமிழ் நான்காவது இடத்தில் பலவீனமான ஆதரவுடன் 300 மொழிகளில் ஒன்றாகத்தான் இன்று இருக்கிறது. 330 ஆயிரம் பேருக்கு மட்டுமே தாய்மொழியான ஐஸ்லாண்டு மொழிக்கு நம்மைவிட நல்ல கருவிகளும் வளங்களும் உள்ளன!

மொழிக்கான அடிப்படை வளங்கள் கருவிப் பெட்டி

ஐரோப்பிய மொழிகளுக்கு, மிகச்சிறு மக்கள்தொகை மட்டுமே பேசும் மொழிகளுக்குக் கூட, தொழில்நுட்பமும் வளங்களும் இன்று பெருகியிருக்கக் காரணம் தெரியவேண்டுமென்றால், அவர்கள் பல பத்தாண்டுகளாக திட்டமிட்டு எடுக்கும் முயற்சிகளைப் பார்க்க வேண்டும். இவற்றில் முக்கியமான ஒன்று மொழிக்கான அடிப்படை வளங்கள் கருவிப் பெட்டி  (Basic Language Resource Kit – BLARK) தயார் செய்தல்.

ஐரோப்பாவில் 11 அதிகாரப்பூர்வமான மொழிகளும் 200 க்கும் மேற்பட்ட மற்ற மொழிகளும் உள்ளன. அடிப்படை வளங்கள் கருவிப் பெட்டி என்ற கட்டமைப்பு  ஸ்டீவன் கிரௌவர் (Steven Krauwer) என்பவரால் ஐரோப்பிய மொழிகளுக்காக முன்வைக்கப்பட்டது. இதன் குறிக்கோள் ஒரு மொழியைக் கணினிக்கு கிடைக்க வைப்பது (making a language computationally available) என்று சொல்கிறார்கள். அதாவது இயல்மொழியை ஆய்வு செய்ய கருவிகள், தரவுகள், செயல்முறைகள் போன்றவை தேவையான அளவு இருந்தால்தான் கணினி உதவி ஆய்வுகள் செய்ய இயலும்.

கல்வி மற்றும் வணிகத்துறை ஆராய்ச்சியாளர்கள், மற்றும் கல்வியாளர்கள் இந்த கருவிப் பெட்டியின் இலக்கு பயனர்கள். இது மாணவர்களுக்குப் பயிற்சியளிக்கவும், ஆராய்ச்சி சோதனைகளுக்கும், செயலி வெள்ளோட்டங்களுக்கும் பயன்படுத்தப்படும். இந்தக் கருவிப் பெட்டியை வணிக நிறுவனங்கள் பயன்படுத்தலாம், ஆனால் பொதுவாக வணிக வேலைகளுக்கு மாற்றமின்றி அப்படியே பயன்படுத்துவது அனேகமாக சாத்தியமில்லை.

எனவே இந்தக் கருவிப் பெட்டி திறந்த மூலமாகவும் இதற்கான வளங்கள் திறந்த அனுமதியிலும் கிடைப்பது இன்றியமையாத முக்கியத்துவம் வாய்ந்தது. அப்படிக் கிடைத்தால்தான் தொழில்துறை உருவாக்குநர்கள் தயக்கமின்றித் தங்கள் தேவைகளுக்கு ஏற்ப இவற்றை மாற்றிக்கொண்டு பயன்படுத்த முடியும்.

நடைமுறைக்கேற்ற, அடையக்கூடிய குறிக்கோள்

ஆக இயல்மொழி ஆய்வுகளில் தமிழ் இன்று வளங்கள் வறண்ட மொழியாக இருக்கிறது. இதை ஆங்கிலத்துக்குச் சமமாக ஆக்குவது அடையக்கூடிய குறிக்கோள் அல்ல. வளங்கள் மிகுந்த மொழியாக ஆக்கக்கூடும். ஆனால் இப்போது அதை நினைத்துப் பார்க்கக் கூடிய இடத்தில் நாம் இல்லை. இடைக்காலத்தில், அதாவது மூன்று முதல் ஐந்து ஆண்டுகளுக்குள், மிதமான வளங்கள் கொண்ட மொழியாக ஆக்குவதுதான் நடைமுறைக்கேற்ற, அடையக்கூடிய ஆனால் சவாலான குறிக்கோள். இதற்கு முதல் படியாக நமக்கு நல்ல தரமான மொழித் தொகுப்புகள் படைப்பாக்கப் பொதுமங்கள் அனுமதியில் தேவை. அடுத்து திறந்த மூலமாக ஒரு இயல்மொழி ஆய்வு கருவித்தொடரி தேவை. மேலும், பிழைகளற்ற உரைத்தொகுப்புகள்  தயாரிக்க பிழைத்திருத்தியும் திறந்த மூலமாக அவசியம். இவற்றைக் குறுகிய காலத்தில், ஒராண்டுக்குள், தயாரிக்க வேண்டும்.

இயல்மொழி ஆய்வுக் கட்டுரைகள் தமிழில்

முரண்நகையாக தமிழ் மொழி பற்றிய இயல்மொழி ஆய்வுக் கட்டுரைகள் ஆங்கிலத்தில் மட்டுமே வெளியிடப்படுகின்றன! தமிழில் மதிப்புமிக்க ஆய்விதழ்கள் (reputed research journals) இல்லை, மேற்கோள் (citation) காட்ட ஆங்கிலத்தில் வெளியிட்டால்தான் வசதியாக இருக்கும் என்பது எனக்குப் புரிகிறது. ஆனால் தமிழிலும் வெளியிடக்கூடாதா என்பதுதான் என்னுடைய கேள்வி. தமிழில் வெளியிட நீங்கள் முன்வந்தால் கணியம் இதழ் வெளியிடத் தயாராக உள்ளது. மொழிபெயர்ப்பையும் நாங்களே செய்துகொள்கிறோம். ஆங்கிலக் கட்டுரையை மட்டும் அனுப்புங்கள்.

பண்பாட்டுக்குத் தமிழ்; பணிவாய்ப்புக்கு ஆங்கிலம்

ஒரு உலகளாவிய தகவல்தொடர்பு சூழலில், வணிக மற்றும் பணிவாய்ப்புகளை விரிவாக்க நாம் பரவலாக யாவருடனும் தொடர்பு கொள்ள வழிவகை தேவை. அதே வேளையில் நமது தாய்மொழியையும், அத்துடன் சேர்ந்த நமது கலாச்சார அடையாளத்தையும் பாதுகாத்துக் கொள்வதற்கான வழிகளையும் நாம் கண்டறிய வேண்டும். “பண்பாட்டுக்குத் தமிழ்; வணிக மற்றும் பணிவாய்ப்புக்கு ஆங்கிலம்” இதுதான் தமிழர்களின் இன்றைய மொழி பற்றிய அணுகுமுறையாக இருக்க முடியும். வணிக மற்றும் பணிவாய்ப்புக்காக ஆங்கிலக் கல்விக்கு முன்னுரிமை கொடுக்கும் நாம், நம் பிள்ளைகளுக்குத் தாய் மொழியான தமிழில் ஆர்வம் வளர்க்கவில்லையென்றால் அவர்கள் கலாச்சாரமும் பண்பாடுமற்ற இயந்திர மனிதர்களாகவே வளர்வார்கள்.

நீங்களும் பங்களிக்க முடியும்

நீங்களும் பங்களிக்க முடியும்

ஊர் கூடித்தான் தேரிழுக்க முடியும்

இந்த திட்டம் நம் தாய் மொழியைப் பிழைக்க வைப்பது பற்றியது மட்டுமல்ல, செழிக்க வைப்பது பற்றியதும்தான். நாம் யாவரும் ஒரு கை கொடுத்தால் சாதிக்க முடியாதது எதுவுமில்லை. உங்களுக்கு நிரல் எழுதத் தெரியாதா? சோதனை செய்வது, ஆவணங்கள் எழுதுவது, உரைகளைத் தொகுப்பது, வலைப்பதிவு எழுதுவது, தமிழாக்கம் செய்வது போன்ற பல வேலைகள் உள்ளன. நீங்களும் தமிழை செழிக்க வைக்கப் பங்களிக்க முடியும்.

முற்றும்

ashokramach@gmail.com

%d bloggers like this: