கேள்விச் செல்வம்

நான் நான்காம் வகுப்பு படிக்கும்போது என் தாத்தா எங்கள் ஊர் அரசு நூலகத்தை அறிமுகப்படுத்தினார் (என் ஊர் ஆற்காடு, வேலூர் மாவட்டம்).  மிகுந்த ஆர்வத்தோடு சிறார் நூல்களை படிக்கத் தொடங்கினேன். புத்தகங்கள் என்னை வெவ்வேறு உலகத்திற்குள் அழைத்து செல்வது எனக்கு வியப்பாகவும் மிக ஆர்வமாகவும் இருந்தது.  தொடர்ந்து பல புத்தகங்களை வாசித்தேன். வயது வளர்ந்தது, புத்தக வாசிப்பும் வகைகளும் அடுத்தடுத்த தளங்களை நோக்கிச் சென்றன.

சரியாக நான் கல்லூரியில் மூன்றாம் ஆண்டு படித்துக் கொண்டிருக்கும்போது, இணையத்தில் இருந்து ஒரு ஒலிப் பதிவை தரவிறக்கம் செய்தேன்.  அது ஒரு ஒலி புத்தகம். பொறுமையாக கேட்டுப் பார்த்தேன். மிக சுவாரஸ்யமாக இருந்தது. அருமையான வேறு ஒரு உணர்வை உணர்ந்தேன். சிறு வயதில் ரேடியோவில் அய்யா தென்கச்சி கோ. சுவாமிநாதன் அவர்களின் இன்று ஒரு தகவல் கேட்கும் பொது ஏற்பட்ட உணர்வை போன்ற ஒரு அருமையான வித்தியாசமான உணர்வு.  ஒருவேளை இதைத்தான் கேள்விச் சுவை என்று வள்ளுவர் குறிப்பிட்டிருப்பாரோ?

கேள்வி தாகம் தீரவில்லை.  பொன்னியின் செல்வன், ஹாரி பாட்டர் போன்ற பல ஒலி புத்தகங்களை விரும்பிக்  கேட்டேன். மேற்கொண்டு பல ஒலி புத்தகங்களை இணையத்தில் தேடினேன். மிகப் பெரிய ஏமாற்றம்.  ஆங்கிலத்தில் இருப்பது போன்று தமிழில் நிறைய ஒலி புத்தகங்கள் இல்லை. மிக சொற்பமான ஒலி புத்தகமே இருந்தது. இந்த வேளையில்தான் “எழுத்திலிருந்து ஒலி” (Text to Speech) என்ற முறையை பற்றி அறிந்தேன்.  மிகவும் சுவாரஸ்யமான முறை. கணினியே எழுத்துக்களை ஒலியாக மாற்றிக் கொடுக்கும். இது குறித்து தேடும்போது ஆங்கிலத்தில் நிறைய செயலிகள், நல்ல தரத்தில் இருந்தது. மறுபடியும் உற்சாகம் பிறந்தது காரணம் இதுபோன்று தமிழில் இருந்தால் அனைத்து புத்தகங்களையும் ஒலியாகவே கேட்கலாம் அல்லவா?  மிகுந்த உற்சாகத்துடன் இணையத்தில் தேட ஆரம்பித்தேன். மறுபடி ஏமாற்றம், காரணம் ஒன்று கூட எனக்கு கிடைக்கவில்லை. பின்னர் சிலநாட்கள் கழித்தது இந்த சுட்டி mile.ee.iisc.ernet.in:8080/tts_demo/ கிடைத்தது. இதில் இருந்த ஒலி ஓரளவு நன்றாக இருந்தது. அனால் திருப்த்திகரமாக இல்லை.

மேலும் பல தேடல்களுக்கு பிறகு, நாமே ஒரு செயலியை செய்தால் என்ன? என்று தோன்றியது.  இதற்காக நிறைய படிக்க ஆரம்பித்தேன் (நான் ஒரு மென்பொருள் பொறியாளன்). ஒரு கட்டத்தில் இது நம்மால் முடியாது என்று ஓரம்கட்டிவிட்டேன்.  நான் வாழை (www.vazhai.org/) என்ற அரசு சாரா அமைப்பில் ஆறு வருடம் பணியாற்றி இருந்தேன். மிகவும் அருமையான அமைப்பு. கிராமபுற மாணவர்களுக்கு அடிப்படை கல்வியை கொண்டு சேர்க்கும் பணியை செய்து வருகிறது.  இந்த அமைப்பில் நான் சிறார்களுக்கு ஆங்கிலம் கற்றுக்கொடுத்தேன். காரணம், நான் தமிழ் வழி கல்வி கற்றவன். ஆங்கிலம் கற்பதில் உள்ள சிரமங்கள் நன்றாக தெரியும். அவ்வாறு கற்பிக்கும் போது, பல நாட்கள் எனக்கு தெரிந்த ஒரு விஷயத்தை அங்கு மனத்தால் உணர்ந்தேன்.

தமிழ், அற்புத மொழி.  தமிழ் எழுத்துக்களின் ஒலி, ஆங்கிலத்தை போல வார்த்தைக்கு வார்த்தை மாறாது.  ‘அ’ என்ற எழுத்தின் ஒலி, அனைத்து இடங்களிலும் ஒரே மாதிரிதான் ஒலிக்கும். இந்த அடிப்படை புரிதல் என்னை வேறு தளத்திற்கு எடுத்து சென்றது.  உடனடியாக ஒரு சிறு பரிசோதனை செய்து பார்த்தேன். ‘அம்மா’ என்ற வார்த்தையை ‘அம்’ என்றும் ‘மா’ என்றும் ஒலிப்பதிவு செய்து, கணிணி மூலமாக ஒன்றாக இணைத்து கேட்டால் அது ‘அம்மா’ என்று முழுமையாக ஒலித்தது.  முதல் வெற்றி..! பெரும் மகிழ்ச்சி.. மேலும் ஆர்வம்..

உடனே இதை முழுமையாக செயல்படுத்த எண்ணி தமிழ் எழுத்துக்களின் உச்சரிப்புகளை ஒலிப்பதிவு செய்தேன்.  அவற்றை கணிணியில் வார்த்தைக்கு ஏற்ப இணைத்து ஒலியை உருவாக்கினேன். மிகவும் நன்றாக வேலை செய்தது. அனால் ஒலி சிறப்பாக இல்லை.

drive.google.com/file/d/1cMIhalO4BjdqV9QN5espfOgm_iwq08mc/view?usp=sharing

மீண்டும் இது வேலைக்கு ஆகாது என்று ஓரம் கட்டிவிட்டேன். இருந்தாலும் ஆழ் மனதில் இதுகுறித்து அவ்வப்போது எண்ணங்கள் வந்துகொண்டே இருந்தன.  ஒருமுறை ஒரு யோசனை உண்டாயிற்று. எழுத்துக்களாக உச்சரிப்புகளை ஒலிப்பதிவு செய்வதற்கு பதிலாக. வாக்கியங்களாக ஒலிப்பதிவு செய்து அதிலிருந்து தேவையான ஒலியை எடுத்து இணைத்தால் என்ன? என்று தோன்றியது.  இந்த யோசனை அடுத்த தளத்திற்கு எடுத்து சென்றது.

இந்த யோசனையை எளிதாக செயல்படுத்த முடியாது காரணம்,  ஒவ்வொரு வார்த்தைக்கும் அதன் உச்சரிப்பு மற்றும் மணி நேரத்திற்கான ஒரு அட்டவணை இருக்கவேண்டும். அப்படி இருந்தால்தான் நாம் நமக்கு தேவையான ஒலியை பிரித்து எடுக்க முடியும்.  உதாரணத்திற்கு கீழே பாருங்கள்.

இது தவறு என நீங்கள் கருதினால் இங்கே தெரிவியுங்கள் அல்லது எனக்கு மின்னஞ்சல் செய்யுங்கள்

இ,425,550

து,550,650

த,650,815

வ,815,910

று,910,950

எ,950,1155

ன,1155,1290

நீ,1290,1470

ங்,1470,1560

க,1560,1680

ள்,1680,1705

க,1705,1880

ரு,1880,1955

தி,1955,2070

னா,2070,2250

ல்,2250,2360

இ,2690,2810

ங்,2810,2900

கே,2900,3055

தெ,3055,3225

ரி,3225,3320

வி,3320,3400

யு,3400,3515

ங்,3515,3600

க,3600,3755

ள்,3755,3815

அ,4160,4265

ல்,4265,4340

ல,4340,4415

து,4415,4735

எ,4990,5150

ன,5150,5240

க்,5240,5270

கு,5270,5425

மி,5425,5580

ன்,5580,5595

ன,5595,5725

ஞ்,5725,5800

ச,5800,5905

ல்,5905,5985

செ,5985,6140

ய்,6140,6210

யு,6210,6330

ங்,6330,6400

க,6400,6505

ள்,6505,6540

மேலே உள்ள அட்டவணையில் ஒவ்வொரு எழுத்துக்கும் அதன் உச்சரிப்பு வரும் மணி நேரம் தெளிவாக குறிப்பிடப்பட்டிருக்கும்.  இதனால் நமக்கு தேவையான ஒலியை கோர்வையாக பிரித்து எடுக்கலாம். இவ்வாறு செய்வதால் நமக்கு ஓரளவு இயற்கையான ஒலியை பெறலாம்.  கீழே உள்ள ஒலியை கேளுங்கள்.

drive.google.com/file/d/1vzudYKvgawPZhstOtZwT_zOYNYUMkLdl/view?usp=sharing

இதை செய்து முடிக்க எனக்கு ஒன்றரை வருடம் ஆனது.  இது இதோடு நின்றுவிடக்கூடாது என்று Android செயலி ஒன்றை செய்து பதிவேற்றம் செய்து உள்ளேன். அதன் சுட்டியை கீழே கொடுத்துள்ளேன்.

play.google.com/store/apps/details?id=com.blogspot.vayalumvazhvum.thamizhpesi

சமீபத்தில் ஒரு சிறப்பான தமிழ் பேசும் செயலி ஒன்று அறிமுகமானது.  அதை இந்த தளத்தில் காணலாம்.

github.com/mohan43u/tamil-tts-install

www.iitm.ac.in/donlab/tts/

இதை எடுத்து எனது அனுபவத்தால் மேலும் மேம்படுத்தி தமிழ் ஒலி புத்தகம் உருவாக்கும் ஒரு ஒருங்கிணைந்த செயல்பாட்டை உருவாக்கினேன்.  இதை பயன்படுத்தி பல புத்தகங்களை ஒலி புத்தகங்களாக மாற்றி பதிவேற்றம் செய்து வருகிறேன். கீழே உள்ள சுட்டியில் அதை காணலாம்.

www.youtube.com/channel/UCPr6IvpBLzOUlbGJ2zJFKPQ?view_as=subscriber

முடிவில் எனது அனைத்து முயற்சிகளையும் கீழே உள்ள சுட்டியில் பதிவேற்றம் செய்துள்ளேன்.  யார் வேண்டுமானாலும் எடுத்து உபயோகிக்கலாம்.

github.com/sunnyglow/

இதை மேலும் பலர் மேம்படுத்தி இன்னும் சிறப்பாக தமிழ் ஒலி புத்தகங்கள் உருவாக்கப்பட்டால் நம் நோக்கம் நிறைவேறும்.

நன்றி..

 

சுரேஷ் குமார்
அமெரிக்கா

freetamilaudiobook@gmail.com

 

 

%d bloggers like this: