கணித்தமிழ் வளர்ச்சியில் கட்டற்ற மென்பொருட்கள்

கணித்தமிழ் வளர்ச்சியில் கட்டற்ற மென்பொருட்கள்

த.சீனிவாசன்

tshrinivasan@gmail.com

ஆங்கிலேயர் உருவாக்கிய கணிணியின் திரைகளில் 1990 களில் தமிழ் எழுத்துக்களைக் காட்டுவதற்கே பலரும் பல வகைகளில் பெரிதும் முயற்சி செய்தனர். பின் எழுத்துருக்கள், குறிமுறைகள், விசைப்பலகைகள் எனப்பல முயற்சிகள் மேற்கொள்ளப்பட்டன.

ஒருங்குறியின் வருகை தமிழை அனைத்து கணிணிகளிலும் கருவிகளிலும் காட்டுவதற்கு உதவியது. இது கணித்தமிழ் வளர்ச்சியின் முதல் நிலையே. இதுவே எழுத்துணரி (OCR), பேச்சு உணரி (Speech to Text), எழுத்து ஒலி மாற்றம் (Text to Speech), இயந்திர மொழிமாற்றம் என பல்வேறு கனவுகளுக்கு வித்திட்டது.

ஆங்காங்கே தனிநபர்களும் கல்வி நிறுவனங்களும், மத்திய, மாநில அரசு நிறுவனங்களும் இந்தக் கனவுகளை நனவாக்கும் முயற்சியில் ஈடுபட்டு வருகின்றன. பலரும் ஓரளவு வெற்றியும் கண்டு வருகின்றனர்.

பல்வேறு காரணல்களால் இந்த முயற்சிகள் ஒருங்கிணைக்கப்படவில்லை. மென்பொருட்களும், மூல நிரல்களும், ஆய்வுகளும் யாவருக்கும் பகிரப்படாமல் கல்வி, தனியார், அரசு நிறுவனங்களின் கிடங்குகளில், உறங்குகின்றன.

இந்த நிலை மாற, பல்வேறு தனி நபர்களும், அமைப்புகளும் தமிழ்க்கணிமைக்கான கட்டற்ற மென்பொருட்களை உருவாக்கி வருகின்றன. இந்த கட்டற்ற மென்பொருட்கள் மூல நிரலுடன் பகிரப்படுவதால், யாவரும் அவற்றின் தொடர்ந்த வளர்ச்சியில் எளிதில் பங்களிக்கலாம்.

தமிழ்க்கணிமையின் கனவுகளை கட்டற்ற வகையில் நனவாக்கி வரும் சில முயற்சிகளை இங்கு காணலாம்.

எழுத்துணரி

Tesseract என்ற மென்பொருள், ஒரு படத்தில் உள்ள எழுத்து வடிவங்களை உரை ஆவணமாக மாற்றுகிறது. ஆங்கிலத்தில் நன்கு செயல்படும் இதற்கு தமிழைக் கற்பிக்கும் முயற்சியில் பலரும் ஈடுபட்டு வருகின்றனர்.

ஒரே எழுத்துருவில் உள்ள படங்களில் இருந்து உரையை எளிதாகப் பிரிக்கும் நிலை வரை தற்போதைய வளர்ச்சி உள்ளது. பல்வேறு எழுத்துருக்களை இதற்கு பயிற்சி அளிக்க முயற்சிகள் நடைபெறுகின்றன.

இணைப்புகள்

மூலநிரல் – code.google.com/p/tesseract-ocr/

printalert.wordpress.com/2014/04/28/training-tesseract-ocr-for-tamil/

printalert.wordpress.com/2014/10/28/tesseract-training-more-fonts/

தொடர்பு – kbalavignesh@gmail.com

மொழி – C

==================

சொல்திருத்தி

தமிழா எனும் குழு, இ கலப்பை என்ற தமிழ் தட்டச்சு மென்பொருளை பின் hunspell என்ற மென்மொருளை அடிப்படையாக கொண்டு ஒரு சொல்திருத்தி உருவாக்கி வருகிறது. Firefox plugin ஆகவும் ஒரு பதிப்பு வெளியிடப்பட்டுள்ளது.

தொடர்பு

இளஞ்செழியன் – tamiliam@gmail.com

இளந்தமிழ் – elantamil@gmail.com

இணைப்புகள்

thamizha.org/

www.kaniyam.com/spellchecker-and-grammar-checker-for-tamil/

மூலநிரல் – github.com/thamizha/thamizha-solthiruthi

 

==================

 

இலக்கணப்பிழைத் திருத்தி

தமிழா குழுவினர் languagetool என்ற மென்பொருள் மூலம் தமிழுக்கு சந்திப்பிழை, இலக்கணப் பிழைத் திருத்தி உருவாக்கி, libreoffice ல் இயங்கும் ஒரு plugin ஆக வெளியிட்டுள்ளனர்.

தொடர்பு

இளஞ்செழியன் – tamiliam@gmail.com

இணைப்புகள்

languagetool.org/

மூலநிரல் – github.com/thamizha/thamizha-ilakkanam

www.youtube.com/watch?v=r9qqrHfnbjA

==================

அகராதி

விக்கிபீடியாவின் துணைத்திட்டமான விக்கிசனரி, ஒரு கட்டற்ற அகராதி ஆகும். இதில் வார்த்தைகளுக்கு பொருள் அறிவதோடு, நாமும் பல புது வார்த்தைகளையும் அவற்றின் பொருட்களையும் சேர்க்கலாம்.

இணைப்பு

ta.wiktionary.org/

==================

உரை ஒலி மாற்றி – Text to Speech

ஆவணங்களில் உள்ள உரையை ஒலியாக மாற்றும் மென்பொருள் இது.

1. dhvani

இது பெரும்பாலான இந்திய மொழிகளில் உள்ள உரையை ஒலியாக மாற்றுகிறது.

மொழி – C

இணைப்புகள்

மூலநிரல் – dhvani.sourceforge.net/

www.slideshare.net/tshrinivasan/dhvani-indianlangaugetexttospeechsystemdemoaddinglanguagesupportusage370-24165395

தொடர்பு

lists.sourceforge.net/mailman/listinfo/dhvani-devel

2. tamil-tts

Php மொழியில் உருவாக்கப்பட்ட மென்பொருள் இது.

தொடர்பு

பேராசிரியர் வாசு ரங்கநாதன் – vasurenganathan@gmail.com

இணைப்புகள்

மூலநிரல் – github.com/vasurenganathan/tamil-tts

செய்து பார்க்க – www.thetamillanguage.com/tamilnlp/speak/

==================

நிரலாக்கம்

முழுவதும் தமிழிலேயே கணிணி நிரல் எழுதும் வகையில் எழில் என்ற மொழி உருவாக்கப் பட்டுள்ளது. இது பைதான் மொழி போன்ற அமைப்பைக் கொண்டுள்ளது.

இணைப்புகள்

மூலநிரல் – github.com/arcturusannamalai/Ezhil-Lang/

செய்து பார்க்க – ezhillang.org

ezhillang.wordpress.com/

தொடர்பு

முத்து – ezhillang@gmail.com

 

==================

உதவி நிரல்கள்

வார்த்தைகளை எழுத்துகளாகப் பிரித்தல், எண்ணுதல், திருப்புதல், குறிமாற்றம் செய்தல் போன்ற உரை கையாளும் text processing உதவி நிரல்கள் பல உள்ளன.

இவற்றைப் பயன்படுத்தி பல்வேறு மொழியியல் செயல்களை எளிதாகச் செய்து விடலாம்.

Python – Open-Tamil

மூலநிரல் – github.com/arcturusannamalai/open-tamil

www.slideshare.net/tshrinivasan/open-tamilpresentationta

தொடர்பு

முத்து – ezhillang@gmail.com

 

 

C – Project Silpa

மூலநிரல் – silpa.org.in/

 

Java

javas2-jcscdc.java.us2.oraclecloudapps.com/tamil/index.html

மூலநிரல் – github.com/velsubra/Tamil

தொடர்பு வேல்முருகன் – henavel@gmail.com

 

Clojure – clj-thamil

மூலநிரல் – github.com/echeran/clj-thamil

தொடர்பு இளங்கோ சேரன் – elango.cheran@gmail.com

==================

அரட்டை

கணிணியுடன் நாம் அரட்டை அடிக்க ஒரு மென்பொருள் உருவாக்கப் பட்டுள்ளது. இதற்கு பல்வேறு துறைசார் அறிவைப் புகுத்தினால், நல்ல கணிணி உதவியாளர் போல மாற்றலாம்.

செய்து பார்க்க – www.thetamillanguage.com/tamilnlp/avini/

ஆக்கம் – பேரா. வாசு. ரங்கநாதன் – vasurenganathan@gmail.com

நுட்பம் – ஜாவாஸ்கிரிப்டு

==================

வேர்ச்சொல் பகுப்பான்

ஒரு சொல் தந்தால், அதன் வேர்ச்சொல் தரும் மென்பொருள் இது.

Stemmer

C – Snowball with Tamil

மூலநிரல் – github.com/rdamodharan/tamil-stemmer

Python

மூலநிரல் – github.com/krishna143raj/Tamil_Morphological_Analyzer

தொடர்பு கிருஷ்ணராஜ் – krishna143raj@gmail.com

Java

செய்து பார்க்க – javas2-jcscdc.java.us2.oraclecloudapps.com/tamil/index.html

மூலநிரல் – github.com/velsubra/Tamil

தொடர்பு வேல்முருகன் – henavel@gmail.com

==================

இலக்கியத் தேடல்

பல்வேறு இலக்கியங்களில் ஒரு குறிப்பிட்ட வார்த்தை எந்த இடங்களில் எல்லாம் வருகிறது என்று தேடித்தரும் ஒரு தேடுபொறி இது.

செய்து பார்க்க – immense-hollows-2145.herokuapp.com/

மூலநிரல் – github.com/sathia27/ilakiyam

தொடர்பு சத்யா – sathia2704@gmail.com

 

==================

அவலோகிதம்

ஒரு தமிழ் யாப்பு மென்பொருள் ஆகும். உள்ளிடப்பட்ட உரையினை தமிழ் யாப்பு விதிகளின் படி ஆராய்ந்து – எழுத்து, அசை, சீர், தளை, அடி, தொடை ஆகிய யாப்பு உறுப்புக்களை வெளியிடும். இவற்றைக்கொண்டு உள்ளீட்டின் பாவகையினையும் கண்டுகொள்ளும்.

மூலநிரல் – github.com/virtualvinodh/avalokitam

செய்து பார்க்க – www.avalokitam.com/

தொடர்பு வினோத் ராஜன் – vinodh@virtualvinodh.com

 

==================

மின்னூலாக்கம்

Pressbooks.com, sigil, calibre ஆகிய மென்பொருட்கள் மூலம் அனைத்து கருவிகளிலும் படிக்கக்கூடிய வகையில் epub, mobi வகைகளில் மின்னூல்கள் உருவாக்கலாம்.

www.projectmadurai.org/pmworks.html

http://Tamilvu.org

http://FreeTamilEbooks.com

 

==================

தமிழாக்கம்

GNU/Linux இயக்குதளத்தில் உள்ள பெரும்பாலான கட்டற்ற மென்பொருட்கள் யாவும் பல்வேறு மொழிகளில் மொழிமாற்றம் செய்ய வசதி தருகின்றன. Mozilla firefox, GNOME, KDE, LibreOffice போன்ற பல மென்பொருட்கள் தமிழில் கிடைக்கின்றன. இவ்வாறு மொழியாக்கம் செய்வதை முறைப்படுத்த fuel என்ற திட்டமும் உள்ளது.

இணைப்புகள்

fedorahosted.org/fuel/

 

==================

கைபேசி

Firefox os தமிழ் இடைமுகப்புடன் வருகிறது. LG G3 போன்ற ஆன்டிராய்டு கருவிகளிலும் தமிழ் இடைமுகப்பு கிடைக்கிறது. தமிழ் தட்டச்சு செய்ய indic-keyboard என்ற செயலி கிடைக்கிறது. மேலும் பல தமிழ் கற்பிக்கும் செயலிகளும், தமிழ் விளையாட்டுகளும் கிடைக்கின்றன.

 

==================

 

ஆவணமாக்கல், அறிவுப்பகிர்வு

தமிழரின் அறிவை்க் கட்டற்ற வகையில் ஆவணமாக்கும் மாபெரும் பணியை தமிழ் விக்கிபீடியா பங்களிப்பாளர்கள் செய்து வருகின்றனர். கணியம், கற்போம், TamilDroid போன்ற பல இணைய இதழ்களும், பல தனி வலைப்பதிவுகளும் இன்று அதிக அளவில் நுட்பம் பேசுகின்றன.

kaniyam.com

karpom.com

tamildroid.com

==================

கணித்தமிழ் இணைய இதழ்

இவ்வாறு பல்வேறு மொழிகளிலும் உருவாகும் கணித்தமிழ் மென்பொருள் முயற்சிகளை ஒரே இடத்தில் அறிய, கணித்தமிழ் என்ற இணைய இதழ் உருவாக்கப் பட்டுள்ளது.

kaninitamil.wordpress.com/

==================

ஆய்வுகள்

இயந்திர மொழிமாற்றம், ஒலி-உரை மாற்றி, கையெழுத்து உணரி போன்ற பல கனவுகள் இன்னும் ஆய்வு நிலையிலேயே உள்ளன.

இதுவரை நாம் பார்த்தவை ஒரு சில மென்பொருட்களே. இன்னும் உள்ளவை ஏராளம்.

இந்த கட்டற்ற மென்பொருட்களை பதிவிறக்கம் செய்து பயன்படுத்திப் பாருங்கள்.

நீங்களும் அவற்றின் வளர்ச்சிக்கு உதவுங்கள்.

==================

தேவைகள்

  • கணித்தமிழுக்குத் தேவையான கட்டற்ற மென்பொருட்கள் வளர்ச்சியில் பங்களிக்க மாணவர்களையும், கணிணி அறிஞர்களையும் ஊக்குவிக்க வேண்டும்.
  • தமிழா, உத்தமம் பொன்ற அமைப்புகளும், பிற கல்வி, அரசு அமைப்புகளும் இணைந்து செயல்பட வேண்டும்.
  • தமிழ் அறிஞர்கள் இலக்கணம், மொழியியல் ஆய்வுகளை பொது வெளியில், இணையத்தில் வெளியிட வேண்டும்.
  • Google Summer of Code போன்ற மென்பொருள் போட்டிகள் நடத்த வேண்டும்.
  • கல்வி நிறுவனங்கள், மாணவர்கள், அரசு அமைப்புகள் நாம் செய்யும் ஆய்வுகள், மென்பொருட்களை மூல நிரலுடன் கட்டற்ற மென்பொருட்களாக வெளியிட வேண்டும்.
  • அரசு மானியம் பெறும் அனைத்து மென்பொருட்களையும் மூலநிரலுடன் வெளியிட உரிமைக்குரல் எழுப்ப வேண்டும்.
  • மென்பொருட்களையும் ஆவணங்களையும் தமிழாக்கம் செய்ய கலைச்சொற்கள், உதவி ஆவணங்கள் உருவாக்க வேண்டும்.
%d bloggers like this: