கணியம்

Hadoop – spark – பகுதி 5

Spark என்பது hadoop-ன் துணைத்திட்டமாக 2009-ம் ஆண்டு உருவாக்கப்பட்டது. பின்னர் 2010-ல் திறந்த மூல மென்பொருள் கருவியாக BSD உரிமத்தின் கீழ் வெளியிடப்பட்டது. 2013-ம் ஆண்டு இது அறக்கட்டளையுடன் இணைந்தது முதல் சிறப்பாக செயல்பட்டு வருகிறது. இதிலும் தரவுகளை சேமிக்க hdfs-தான் பயன்படுகிறது. ஆனால் சேமிக்கப்பட்டுள்ள தரவுகளை அணுகுவதற்கு வெறும் mapreduce-யோடு நின்று விடாமல் spark…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 10. கணினிக்குத் தமிழ் கற்றுக் கொடுப்போம் வாருங்கள்

பண்டைய காலத் தமிழர் இலக்கியப் படைப்புகளை மனப்பாடம் செய்து காத்தனர் இறையனார் களவியல் அல்லது அகப்பொருள் உரையை உருவாக்கியவர் நக்கீரர். இவரது காலம் கி.பி. 7-ம் நூற்றாண்டு வாக்கில். இவர் தாம் செய்த களவியல் உரையை வாய்மொழியாகத் தம் மகனார் கீரங்கொற்றனாருக்கு உரைத்தார். கீரம் கொற்றனார் தேனூர் கிழாருக்கு உரைத்தார். இவ்வாறாக இந்த உரை அடுத்தடுத்து…
Read more

Hadoop – hive – பகுதி 4

Facebook நிறுவனம் hadoop-ஐ பயன்படுத்தத் துவங்கிய காலங்கள் முதல், அதனிடம் வந்து சேரும் தரவுகளின் அளவு 1GB, 1TB, 15TB என உயர்ந்து கொண்டே சென்றது. அப்போது அவற்றினை அலசி தரவுச் சுருக்கங்களைத் தேர்ந்தெடுப்பதற்கு oracle database-ஐயும் பைதான் மொழியையும் பயன்படுத்தியது. ஆனால் வருகின்ற மூலத் தரவுகளின் அளவும், வடிவங்களும் அதிகரிக்க அதிகரிக்க data analysis…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 9. உங்கள் பிள்ளைகளை இயந்திர மனிதர்களாக வளர்க்கிறீர்களா?

தாய்மொழியை இழந்தால் தாயை இழந்ததுபோல் பரிதவிப்போம் என்பது மிகையாகாது “பல புலம்பெயர்ந்த தமிழ்ப் பிள்ளைகளைப் போலவே வளரும் காலத்தில் நான் தமிழ் பேசவில்லை. என் கல்லூரிப் பருவத்திலும் வயதுவந்த பின்னும் என் பெற்றோரைத் திட்டிக் கொண்டிருந்தேன், ஏன் எனக்குக் குழந்தைப் பருவத்திலேயே தமிழ் சொல்லிக் கொடுக்கவில்லை என்று. வயது வந்தபின் ஒரு மொழியைக் கற்றுக்கொள்வது மிகவும்…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 8. புதிய தலைமுறையின் மரபணுவே எண்ணிமத்தால் ஆனது போலுள்ளது

நுகர்பொருள் ஆய்வக அறிக்கையின்படி இந்தியாவில் 18 வயதிற்கு உட்பட்ட இளையவர்கள் சுமார் 200 மில்லியன் உள்ளனர், அவர்களில் 69 மில்லியன் பேர் நகர்ப்புறங்களில் வாழ்கின்றனர். 1981 முதல் 1995 வரை பிறந்த தலைமுறையை ஆங்கிலத்தில் மில்லேனியல் என்று சொல்கிறார்கள். இவர்களுக்கு தகவல்தொடர்பு, ஊடகம், எண்ணிம தொழில்நுட்பங்கள் ஆகியவற்றுடன் நல்ல பரிச்சயம் உண்டு. இவர்களுக்கு அடுத்து வந்த…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 7. “ஆளும் மொழியே வாழும்; மற்றவை மாளும்” இதுதான் நியதியா?

ஆக்ஸ்போர்ட் மொழியியல் பேராசிரியர் ஜீன் அட்சிசன் சொல்கிறார், “ஒரு மொழியின் பரவல் அதைப் பயன்படுத்துபவர்களுடைய சக்தியைச் சார்ந்தது, அம்மொழியின் உள் அம்சங்களைப் பொருத்தது அல்ல.” தமிழின் பயன்பாட்டைக் கட்டாயமாக்கும் ஒரு நாட்டைத் தமிழர்கள் அமைத்தால் மட்டுமே தமிழ் வளரவும் செழிக்கவும் முடியும் என்று சிலர் உறுதியாக நம்புகின்றனர். எடுத்துக்காட்டாக இதோ ஒரு கட்டுரை. இராஜேஸ்வரி பாலசுப்பிரமணியம்…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 6. தடை செய்யப்பட்ட கட்டலான் மொழி புத்துயிர் பெற்றது எப்படி?

ஸ்பெயின் நாட்டில் பார்சிலோனாவைச் சுற்றியுள்ள பகுதிகளில் கட்டலான் மொழி சிறுபான்மை மக்களால் பேசப்படுகிறது. வெற்றிபெற்ற ஆட்சியாளர்களால் பல நூற்றாண்டுகளாக ஒடுக்கப்பட்ட கட்டலான் மொழி இப்பொழுது 9 மில்லியன் மக்களால் பேசப்படுகிறது. உலகில் 150 க்கும் மேற்பட்ட பல்கலைக்கழகங்கள் இந்த மொழியை கற்றுத் தருகின்றன. 400 க்கும் மேற்பட்ட பத்திரிகைகள் இம்மொழியில் பிரசுரிக்கப்படுன்றன. பேரிடர்களை சந்தித்துப் பிழைத்து…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 5. பரவும் இந்த ஆங்கில மொழி ஆதிக்கம் தணிய வாய்ப்பு உள்ளதா?

ஆங்கிலம் மற்ற மொழிகளையும் கலாச்சாரங்களையும் அழிக்கிறதா? உலகமயமாக்கல், அமெரிக்க கலாச்சாரம் மற்றும் தொழில்நுட்பப் பேரலைகளின் மேல் ஏறி உலகில் இதுவரை எந்த மொழிக்கும் இல்லாத அளவுக்கு ஆங்கிலம் ஆதிக்கம் செலுத்துகிறது. சீன அல்லது ஸ்பானிஷ் மொழியைத் தாய்மொழியாகக் கொண்டவர்கள் ஆங்கிலத்தைத் தாய்மொழியாகக் கொண்டவர்களை விட அதிகமாக இருக்கலாம், ஆனால் வேற்று மொழியாளர்களுடன் பேசும் போது அவர்களும்…
Read more

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 4. அமெரிக்க கலாச்சார ஆதிக்கமும் தகவல் தொழில்நுட்பமும்

முதலில் ஹாலிவுட் திரைப்படங்களும் தொலைக்காட்சி நாடகத் தொடர்களும் 1920 களில் தொடங்கி அமெரிக்க திரைப்படம் மற்றும் தொலைக்காட்சித் தொழில் மையமான ஹாலிவுட், உலகின் பெரும்பாலான ஊடகச் சந்தைகளில் ஆதிக்கம் செலுத்தி வருகிறது. உலகெங்கிலும் உள்ள மக்கள் அமெரிக்க பாணி, பழக்கவழக்கம் மற்றும் வாழ்க்கை முறை ஆகியவற்றைப் பற்றித் தெரிந்து கொள்ளவும் அவற்றைப் பின்பற்ற முயற்சி செய்யவும்…
Read more

Hadoop – pig – பகுதி 3

2006-ஆம் ஆண்டு Yahoo நிறுவனத்தின் ஒரு ஆய்வுத் திட்டமாக Pig என்பது உருவாக்கப்பட்டது. இது குறிப்பாக mapreduce வேலைகளைச் செய்வதற்காகப் பயன்படுத்தப்பட்டது. பின்னர் Apache நிறுவனம் 2008-ல் இதனை திறந்த மூல மென்பொருள் கருவியாக அறிவித்து வெளியிட்டது. Pig என்பது java, python போன்ற நிரலாக்க மொழிகளின் துணையில்லாமல், வெறும் SQL-ஐ வைத்து hadoop-ல் உள்ள…
Read more