கணினியில் தமிழ்

தமிழ் 99 விசைப்பலகை

Figure 1: தமிழ் 99 விசைப்பலகை

கணினிக்கலையில் தமிழ் பயன்பாட்டை அதிகரிக்க நான் தமிழ்க் கணினிக் குழுவை நிறுவினேன். அதன் முதன்மையான பணி Translation Project என்னும் கட்டற்ற மென்பொருள் மொழிபெயர்ப்புத் தளத்தில் தமிழ்க் குழுவை நடத்துவதே. Translation Project யில் பல GNU கட்டளை நிரல்கள் மொழிபெயர்ப்பிற்காக வழங்கப்பட்டிருக்கின்றன. பெரும்பாலும் தமிழாக்க முயற்சிகள் வலை, கைபேசி மென்பொருள் என அதிகமாகப் பயன்படுத்தப்படும் மென்பொருட்களுக்குப் பெரியுதி அளிக்கின்றன. தமிழ் நிரலாக்கரும் கணினி வல்லுநரும் ஆங்கிலத்தையே பயன்படுத்துகின்றனர். இந்நிலையை மாற்ற நிரலாக்கர் அதிகம் பயன்படுத்தும் கட்டளை நிரல்களைத் தமிழாக்க வேண்டும். இதற்குத் தமிழ்க் கணினி சொல்வளத்தைத் தரப்படுத்த வேண்டும். இவ்விரண்டையும் நடைமுறைபடுத்துவதே தமிழ்க் கணினிக் குழுவின் நோக்கம்.

தமிழ்க் கணினிக்குள் புகுவதற்கு இடையூறாகயிருக்கும் சிலவற்றைப் பற்றியும் அவ்விடையூறுகளைக் கடக்கும் முயற்சிகள் பற்றியும் கீழ் காணலாம்.

கலைச்சொற்கள் நுண்பொருள் தர வேண்டும்

கலைச்சொற்கள் பொதுச் சொற்கள் போன்றில்லாமல் துல்லியமான நுண்பொருள் தருவனவாயிருக்க வேண்டும். ஆங்கில கலைச்சொற்கள் இத்தகையவை. தமிழில் கலைச்சொற்கள் பல உருவாக்கப்பட்டுள்ளனவாயினும் அவைப் போதிய அளவு புழக்கத்தில் இல்லாததால், நுண்பொருள் எய்தாமல் பேரளவு அங்கீகாரம் பெறாமல் இருக்கின்றன. எடுத்துக்காட்டிற்கு ஆங்கிலத்தில் library, module, package என்னும் சொற்களைக் கருதுக. இச்சொற்கள் ஏறக்குறைய ஒரே பொருள் தந்தாலும், அவை இடம்பெற்றுள்ள இடத்திற்கேற்ப அவற்றின் பொருள்களில் நுண்மையான வேறுபாடு உண்டு. இச்சொற்கள் பலக் காலம் புழக்கத்தில் இருந்துள்ளதால் அவற்றின் பொருளில் கருத்தொற்றுமை உள்ளது. இச்சொற்களை எவரும் தவறாகப் புரிந்துக் கொள்ளமாட்டார். இச்சொற்களை நிரலகம், நிரல்கூறு, நிரல்தொகுப்பு என்று நாம் தமிழாக்கலாம். ஆனால் இத்தமிழாக்கங்கள் புழக்கத்திற்குள் புகாததால் அவற்றின் பொருள் மனத்திற்கு உடனே வெளிப்படுவதில்லை; மேலும் இத்தமிழாக்கங்களைப் பார்க்கிற ஒவ்வொருவரும் ஒவ்வொரு பொருள் காணும் வாய்ப்புள்ளது — அவற்றின் பொருளில் போதிய கருத்தொற்றுமை இல்லை.

ஆங்கிலத்தில் ஒரேச் சொல் கலைப்பொருளிலும் பொதுப்பொருளிலும் இடம்பெற்று குழம்பாமலிருக்க பல முறை கிரேக்க மொழிச் சொற்களையும் இலத்தீன் மொழிச் சொற்களையும் கடன் வாங்குகிறார்கள். இவ்வேற்றுமொழிச் சொற்களுக்கு ஆங்கிலத்தில் பிறப் பொதுப் பொருள் இல்லாததால் அவைத் தனித்து நின்று நுண்பொருள் தர முடிகிறது. இவ்வாறு கடன்சொற்கள் தேவையா என்பது ஐயப்பாட்டுக்குரியதாயினும் அவ்வாறே சொற்கள் வேண்டுமாயின் நாம் கடன் வாங்குவதற்குப் பதிலாகப் புழக்கத்திலிருந்து விலகிய பழந்தமிழ்ச் சொற்களை மீட்டெடுத்துப் புதிய நுண்பொருளுடன் பயன்படுத்தலாம்1.

ஓரகல எழுத்துருக்கள்

ஒர் எழுத்துருவில் அனைத்து எழுத்துகளும் ஒரே அகலமுடையதாய் அமைந்தால் அவ்வெழுத்துரு ஓரகல எழுத்துரு (monospace font) எனப்படும். எடுத்துக்காட்டாக ஆங்கிலத்தில் i என்னும் எழுத்து மிக மெலிந்தது; m என்னும் எழுத்து மிக அகலமானது; ஆயினும் ஓரகல எழுத்துருக்களில் அவை ஒரே அகலத்துடன் இருக்குமாறு கொஞ்சம் திரித்து எழுதப்பட்டிருக்கும். அனைத்து எழுத்துக்களும் ஒரே அகலமுடையதாய் இருந்தால் தான் கட்டளை நிரல்களின் வெளியீடு வரிக்கு வரி ஒருசீராக ஒன்றின் கீழ் ஒன்றாக நேர்படுத்தப்பட்டுத் தோன்றும். எனவே இவ்வெழுத்துருகள் கணினி முனையங்களில் பரவலாகப் பயன்படுத்தப்படுகின்றன. எனக்குத் தெரிந்தவரை தமிழ் ஓரகல எழுத்துருக்கள் இல்லை. தமிழ் எழுத்துகள் மிகுந்த அகல வேறுபாடு உடையவை. எடுத்துக்காட்டிற்கு, “க” போன்ற அகர எழுத்துகள் மிக மெலிந்தவை; “கோ” போன்ற ஓகார எழுத்துகள் மிக அகலமானவை. இத்தகைய அகல வேறுபாடுகளுடைய தமிழ் எழுத்துகளுக்கு ஓரகல எழுத்துரு உருவாக்குவதெப்படி? இதைப் பற்றி உங்களுக்கு எண்ணம் இருந்தால் கூறுங்கள்.

Proportional எழுத்துருவும் Monospace எழுத்துருவும்

Figure 2: Proportional எழுத்துருவும் Monospace எழுத்துருவும்

cal என்னும் நாட்காட்டி நிரலின் வெளியீட்டை ஆங்கிலத்திலும் தமிழிலும் கீழ் காண்க. ஆங்கில வெளியீடு ஓரகல எழுத்துருகளைப் பயன்படுத்துவதால் பத்திகள் நேர்படுத்தப்பட்டுத் தோன்றுகின்றன. தழிழிலோ ஓரகல எழுத்துருகள் இல்லாததால் கிழமைப் பெயர்கள் சற்று பெயர்ந்திருப்பதைக் காண்க.

    February 2019   
Su Mo Tu We Th Fr Sa
                1  2
 3  4  5  6  7  8  9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28      
       பிப்ரவரி      
        2019        
ஞா தி செ பு வி வெ  ச
                1  2
 3  4  5  6  7  8  9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28      

மென்பொருள் கையேடுகள்

கணினி நிரல்களைத் தமிழாக்குவதோடு தமிழாக்கப் பணி முடிந்துவிடாது. அதை விடக் கடினமான, ஆனால் அவசியமான, வேலை அந்நிரல்களின் பயன்பாட்டு ஆவணங்களைத் தமிழாக்குவது. தற்போதைய நிலையில் அதற்குத் தேவையான ஆள்வலி இல்லாததால் முழு தொழில்நுட்பக் கையேடுகளைத் தமிழாக்குவது மிகக் கடினம். அக்கையேடுகளின் சுருக்கங்களான man பக்கங்களைத் தமிழாக்கலாம். ஆனால் man பக்கங்களை விடச் சுருக்கமாக tldr பக்கங்கள்2 என உள்ளன. அவை ஒவ்வொரு கட்டளை பற்றியும் 4-5 எடுத்துக்காட்டுகள் காட்டி அதன் அடிப்படை பயன்பாட்டை விளக்குவன. இவற்றைத் தமிழாக்கினால் குறைந்த உழைப்பில் நிறைய கட்டளைகளை ஓரளவாது ஆவணப்படுத்திவிடலாம். tldr-pages தற்போது ஆங்கிலப் பக்கங்களை மட்டுமே கொண்டுள்ளது. அதில் தமிழ் உட்பட பிற மொழி பக்கங்களை ஏற்றும் முயற்சி நடந்துக்கொண்டிருக்கிறது3.

முடிவுரை

தமிழ் பாமரனுக்கு மட்டும் தான் என்ற எண்ணம் மாற வேண்டும். ஆங்கிலம் அறிந்தவர்-அறியாதவர், நிரலாக்கர்-பயனர் என்ற பிரிவினைகள் மறைய வேண்டும். இக்குறியோடு நம்மால் இயன்ற அனைத்தையும் செய்து தமிழ்த்தொண்டு புரிவோம்.

Image Credits

Tamil 99 keyboard — by Thamizhpparithi Maari, released under the Creative Commons Attribution-ShareAlike 4.0 International license

A side by side comparison of proportional and monospace font — by Garethlwalt, released under the Creative Commons Attribution 3.0 Unported license

Footnotes:

1

புழக்கதில் இல்லாதச் சொற்களை மீட்டெடுப்பது பற்றி அறிய பழைய ஆங்கிலத்தை மீட்டெடுக்க முயலும் Anglish Moot திட்டத்தைக் காண்க.

2

tldr பக்கங்கள் வலைத்தளம்: tldr.sh/

3

GitHub tldr-pages களஞ்சியத்தில் உரையாடலைக் காண்க: Support for multiple human languages

 

கட்டுரை மூலம் – ta.systemreboot.net/post/%E0%AE%95%E0%AE%A3%E0%AE%BF%E0%AE%A9%E0%AE%BF%E0%AE%AF%E0%AE%BF%E0%AE%B2%E0%AF%8D-%E0%AE%A4%E0%AE%AE%E0%AE%BF%E0%AE%B4%E0%AF%8D

உரிமை – Creative Commons Attribution-ShareAlike 4.0 International

எழுதியவர் – அருண் ஐசக்.  தற்போது இந்திய அறிவியல் நிறுவனம், பெங்களூரில் முனைவர் பட்டம் பெற கணிப்பிய அறிவியல் துறையில் ஆய்வு செய்துக்கொண்டிருக்கிறார். அவர் கட்டற்ற மென்பொருள், lisp/scheme நிரலாக்க மொழிகள், மின்னணுவியல், தொழில்சாரா வானொலி ஆகியவற்றில் ஆர்வம் கொண்டவர்.

மின்னஞ்சல்/XMPP – arunisaac@systemreboot.net

%d bloggers like this: