கணியம்

Machine Learning – 15 – Multivariate (Explanatory Data Analysis)

இரண்டுக்கும் மேற்பட்ட மதிப்புகளைப் பொறுத்து ஒரு taraget variable எவ்வாறு அமைகிறது எனக் காண்பதே multi-variate analysis ஆகும். Parallel coordinates என்பது இத்தகைய multi dimensional data-வைக் காண்பதற்கு உதவும் வரைபட வகை ஆகும். இங்கு plotly மற்றும் matplotlib மூலம் இத்தகைய வரைபடங்கள் வரைந்து கட்டப்பட்டுள்ளது. ‘SalePrice’ எனும் categorical variable-க்கு தரவுகள்…
Read more

திறந்த மூல கயெக பாவனையாக்கிகள் (CNC Simulators)

ஏன் பாவனையாக்கிகளைப் பயன்படுத்த வேண்டும்? கயெக நிரலாக்கம் (CNC Programming) பற்றிய அடிப்படைகளை முந்தைய கட்டுரையில் காணலாம். புதிதாக நிரல் பயில்வோர் தங்கள் நிரலை ஓட்டிப் பார்க்க ஒரு எளிதான வழி தேவை.  கயெக எந்திரங்கள் விலை உயர்ந்தவை. மேலும் உற்பத்திக்குப் பயன்படும் எந்திரங்களின் நேரத்தை வீணடிக்க வேண்டியதில்லை. அனுபவமுள்ள நிரலாளர்கள்கூட கயெக நிரலாக்கத்தில் மிகப்…
Read more

Machine Learning – 14 – Bivariate (Explanatory Data Analysis)

இரண்டு variables எவ்வாறு தொடர்பு கொண்டுள்ளன என வரைபடம் வரைந்து பார்ப்பது bi-variate analysis ஆகும். இதன் X-அச்சில் ஒன்றும் Y-அச்சில் மற்றொன்றும் வைத்து வரைபடம் வரையப்படும். இங்கு ஒவ்வொரு வீட்டினுடைய sqft அளவைப் பொறுத்து அதன் விற்பனை விலை எவ்வாறு மாறுபடுகிறது என்பது scatter plot, heatmap ஆகியவை மூலம் காட்டப்பட்டுள்ளன. HeatMap-ல் இரண்டு…
Read more

Machine Learning – 13 – Univariate (Explanatory Data Analysis)

நமது தரவுகள் எவ்வாறு அமைந்துள்ளன என விரிவாக ஆராய்ந்து பார்ப்பதே Explanatory Data Analysis ஆகும். ஒரே ஒரு column-ல் உள்ள தரவுகளை மட்டும் எடுத்து ஆராய்வது univariate எனவும், இரண்டு column-ல் உள்ளவை எவ்விதத்தில் ஒன்றோடொன்று தொடர்பினை ஏற்படுத்துகின்றன என ஆராய்வது bivariate எனவும், பல்வேறு columns இணைந்து எவ்வாறு ஒரு target column-ன் மீது தாக்கத்தை ஏற்படுத்துகிறது…
Read more

Machine Learning – 12 – Outliers, Removal ஐக் கண்டறிதல்

Outlier என்பது மற்ற தரவுகளிலிருந்து வேறுபட்டு சற்று தள்ளி இருக்கும் தரவு ஆகும். 5,10,15,20…75 எனும் மதிப்பினைக் கொண்டிருக்கும் தரவு வரிசைகளில் ஒன்றே ஒன்று மட்டும் 15676 எனும் எண்ணைக் கொண்டிருப்பின், அதுவே outlier ஆகும். இதைத் தான் நாம் கண்டறிந்து களைய வேண்டும். கீழ்க்கண்ட உதாரணத்தில், உள்ளீடாக உள்ள கோப்பிற்குள் இருக்கும் outliers ஒவ்வொரு column-லும் கண்டறியப்பட்டு …
Read more

Machine Learning – 11 – Trend, Parity & Data distribution plots

நாம் உருவாக்கிய model-ன் score-ஆனது மிகவும் குறைவாக இருக்கிறது எனில், அது எந்த இடத்தில் அதிகம் வேறுபடுகிறது எனக் கண்டறிய trend / parity போன்ற வரைபடங்களைப் போட்டுப் பார்க்க வேண்டும். கீழ்க்கண்ட உதாரணத்தில் ஒரு வீட்டின் விலையை நிர்ணயிப்பதற்கான பல்வேறு அம்சங்களும், அதனடிப்படையில் நிர்ணயிக்கப்பட்ட விற்பனை விலைகளும் பயிற்சிக்குக் கொடுக்கப்பட்டுள்ளன. இதை வைத்து நாம் உருவாக்கிய model-ன்…
Read more

விக்கிப்பீடியா:ஆசிய மாதம்

மூலம் – ta.wikipedia.org/s/4r3v விக்கிப்பீடியாவின் ஆசிய மாதம் ஆசிய விக்கிப்பீடியக் குமுகங்களுக்கிடையில் புரிந்துணர்வை மேம்படுத்துவதை இலக்காகக் கொண்டு ஆசிய மாதம் (Asian Month) என்னும் தொடர்தொகுப்பு நிகழ்வு நடத்தப்படவுள்ளது. இந்நிகழ்வை 2018 நவம்பர் மாதத்தில் நடத்துவதாகத் திட்டமிடப்பட்டுள்ளது. இந்நிகழ்வு பல்வேறு மொழிகளில் அமைந்த விக்கிப்பீடியாக்களிலும் நடத்தப்படவுள்ளது. இந்நிகழ்வில் பங்குகொள்ளும் விக்கிப்பீடியர்கள் ஆசியா தொடர்பான தமிழ் விக்கிப்பீடியா…
Read more

Machine Learning – 10 – Feature Selection

ஒரு கோப்பினுள் பல்வேறு columns இருக்கிறதெனில், அவற்றுள் எந்தெந்த column மதிப்புகளைப் பொறுத்து நாம் கணிக்கின்ற விஷயம் அமைகிறது எனக் கண்டுபிடிப்பதே feature selection ஆகும். உதாரணத்துக்கு 400, 500 columns-ஐக் கொண்டுள்ள கோப்பிலிருந்து, prediction-க்கு உதவும் ஒருசில முக்கிய columns-ஐத் தேர்வு செய்வது feature selection ஆகும். இதற்கு முதலில் நம்மிடமுள்ள columns-ஐ process variables,…
Read more

பொறியியல் வரைபடம் – திறந்த மூல லிபர்கேட் (LibreCAD)

திறந்த மூல லிபர்கேட் மென்பொருளை உபுண்டு 16.04 இல் எப்படி நிறுவுவது என்று இங்கே பார்க்கலாம். இவர்கள் சொன்ன மூன்று கட்டளைகளையும் கொடுத்தவுடன் லிபர்கேட் 2.2.0 வை நிறுவியது. முதன்முதலாக ஓட்டும்போது மெட்ரிக் அளவை முறையில் மிமீ என்று தேர்ந்தெடுக்கவும். மொழித் தேர்வில் ஆங்கிலத்தை அப்படியே விட்டுவிடலாம். பின்னால் மாற்றவேண்டுமென்றால் தேர்வுப் பட்டியலில் Options (தேர்வுகள்)…
Read more

Machine Learning – 9 – Model comparison

நமது model உருவாக்கத்திற்கு வெறும் linear regression-ஐ மட்டும் பயன்படுத்தாமல், வேறு சில algorithm-வுடனும் ஒப்பிட்டு எது சிறந்ததோ அதை பயன்படுத்த வேண்டும். இதற்கான நிரல் பின்வருமாறு. இது நமது தரவுகளை பல்வேறு algorithm-ல் பொருத்தி, ஒவ்வொன்றினுடைய Score மற்றும் RMSE மதிப்புகளை வெளிப்படுத்துகிறது. இவற்றில் சிறந்ததை நாம் தேர்வு செய்து கொள்ளலாம். நிரலுக்கான வெளியீடு….
Read more