பிக் டேட்டா

12. கத்தரிக்காய் வாங்கிய கோயிஞ்சாமி!

ஜெ.ராம்கி

பெங்களூரு ஒயிட்பீல்டில் பணியாற்றும் ஹாரீஸ், ஒரு தகவல் தொழில்நுட்ப வல்லுநர். ஔரங்காபாத்தில் உள்ள டாக்டர் அம்பேத்கர் மராத்வாடா பல்கலைக் கழகத்தில் டிகிரி படித்துவிட்டு மும்பைக்கு வந்துவிட்டார். மும்பையில் ஒரு சிறு நிறுவனத்தில் ஜாவா மென்பொருள் வல்லுநராக வாழ்க்கையைத் தொடங்கிய ஹாரீஸ், இப்போது வசிப்பது பெங்களூரில். பத்தாண்டுகளுக்கும் மேலாக மென்பொருள் வல்லுநராக இருந்தவர், தற்போது இருப்பது டேட்டா அனாலிடிக்ஸ் துறையில். கடந்த 3 ஆண்டுகளாக பெங்களூரைச் சேர்ந்த ஒரு பன்னாட்டு நிறுவனத்துக்கும், இரண்டு சிறிய தகவல் தொழில்நுட்ப நிறுவனங்களுக்கும் டேட்டா சயின்ஸ் ஆலோசகராக இருக்கிறார்.

ஹாரீஸுடன் படித்தவர்களும், பணிபுரிந்தவர்களும் இன்று ப்ராஜெக்ட்  மேனேஜராகவோ சிறுதொழில் முனைவர்களாகவோ மாறிவிட்டார்கள். ஜாவா மென்பொருள் வல்லுநராகவே இருந்திருந்தால் இந்நேரம் ஹாரீஸ்கூட அப்படித்தான் வாழ்க்கையைத் தொடர்ந்திருப்பார். ஜாவா போரடித்த நேரத்தில், டேட்டா பேஸ் உலகம் அவரை சுண்டியிழுந்தது. உலகம் முழுவதும் 3 லட்சம் வாடிக்கையாளர்களைக் கொண்டிருக்கும் ஆரக்கிள் நிறுவனத்தில் பணிபுரிவதை வாழ்க்கை லட்சியமாக்கிக்கொண்டார். டேட்டா பேஸ் டிசைனர், டேட்டா பேஸ் டெவலப்பர் என படிப்படியாக நகர்ந்து டேட்டா பேஸ் அட்மினிஸ்ட்ரார் ஆனார். ஆரக்கிளில் பணிபுரியும் ஆசை நிறைவேறவில்லை.  ஆனாலும், டி.பி.ஏ. வேலை அவரை பெங்களூரு வரவழைத்தது. அவரது வாழ்க்கையையும் மாற்றியமைத்தது.

‘ஸ்டாடிஸ்டிக்ஸ் படித்துவிட்டு, எம்.சி.ஏ. படித்தேன். பின்னாளில் ஸ்டாடிஸ்டிக்ஸை சுத்தமாக மறந்துபோயிருந்தேன். ஜாவா டெவலெப்மெண்ட் பிடிக்காமல், டேட்டா பேஸ் பக்கம் வந்தபோது, எப்போதோ படித்த ஸ்டாடிஸ்டிக்ஸ்தான் கைகொடுத்தது’ என்கிறார் ஹாரீஸ்.  புள்ளியியலில் பட்டம் பெற்று, தகவல் தொழில்நுட்பத்தின் கவர்ச்சியால் உந்தப்பட்டு, ஹாரீஸ் போல் வேறு வாழ்க்கையைத் தேர்ந்தெடுத்துக் கொண்டவர்கள் ஏராளம் உண்டு. அதே நேரத்தில், ஹாரீஸ் போன்றவர்களின் தேவை, நாளுக்கு நாள் அதிகமாகி வருவதும் உண்மைதான்.

டேட்டா சயின்ஸ் வல்லுநர்கள் அடங்கிய குழுவை புதிதாக உருவாக்குவது என்பது எந்தவொரு நிறுவனத்துக்கும் சவாலான விஷயம். காரணம், அனுபவம் வேண்டும். தொழில்நுட்பமும் கைப்பெற வேண்டும். நிறுவனத்தின் தலைமைக்கு என்ன தேவையோ, அதைப் புரிந்துகொண்டு, தகவல்களைத் துரிதமாகப் பெறுமளவுக்கு ஆக்கப்பூர்வமாக செயல்படுபவராக இருக்க வேண்டும். முதல் இரண்டில் ஜெயிப்பவர்கள், மூன்றாவதில் சறுக்கும்போது ஏமாற்றம்தான் மிஞ்சும்.  பிக் டேட்டா உலகம் வேறு. தொழில்நுட்ப சங்கதிகள்கூட தெரியாமல் ப்ரொஜக்ட் மேனேஜராக இருந்துவிட முடியும். ஆனால், பிக் டேட்டா வல்லுநரால் முடியாது.

பிக் டேட்டா பற்றி உலகம் முழுவதும் பரவலாகத் தெரிய ஆரம்பமாகியிருக்கும் நிலையில், அதற்கான தேவைகளும் நாளுக்கு நாள் மாறிக்கொண்டே இருக்கின்றன. இயந்திரங்களின் மூலமாக கற்றல் (Machine Learning) என்பது புதுப்புது விஷயங்களை அறிமுகப்படுத்துகிறது. டேட்டா சயின்ஸ் குழுவின் செயல்பாடுகளின் எல்லை நாளுக்கு நாள் விரிவடைந்துகொண்டே செல்கிறது. எதிர்பார்ப்புகளும் அதிகமாகின்றன. ஹாரீஸ் போன்றவர்கள் எதிர்கொள்ளும் சவால் இதுதான். சவாலை சமாளிக்க, தொடர்ந்து இயங்கியாக வேண்டும். 

பிக் டேட்டா என்பது பெரிய அளவிலான டேட்டாவை கையாளுவது மட்டுமே என்கிற புரிதல் உள்ளது. அதையும் தாண்டி சில விஷயங்களை பிக் டேட்டா மட்டுமே சாத்தியப்படுத்துகிறது. பொதுவாக, பிக் டேட்டா தரும் தீர்வுகள் (big data solutions) மூலம் நமக்கு என்னவெல்லாம் கிடைக்கின்றன என்பதைப் பார்த்துவிடலாம்.

நடைமுறைகளை மேம்படுத்துவது (Operational optimization). இன்றைய நிலையில் கார்பரேட் உலகில் பிரதானமாக விவாதிக்கப்படும் விஷயம் இதுதான். எதைச் செய்தாலும் விரைவாகச் செய்து முடிக்க வேண்டும். கூடுதல் நேரம் தரப்படுவதால், தரம் உயர்வதாகச் சொல்லமுடியாது. மாறாக, நிச்சயமாக செலவுகள் கூடுகின்றன. அதனால்தான், எல்லோரும் டெட் லைனை விடாப்பிடியாக பிடித்துக்கொள்கிறார்கள்.

இரண்டு வாரம் ஜாவா கோட் எழுதி, ஒரு வாரம் டெஸ்ட் செய்வதற்கெல்லாம் இப்போது நேரமில்லை. சாயங்காலம் கோட் எழுதி, மறுநாள் காலை டெலிவரி செய்தாக வேண்டும். ஆனால், எத்தனை பேரால் இதை வெற்றிகரமாகச் செய்ய முடிகிறது? எந்த வேலையாக இருந்தாலும், தாமதம் என்பது தவிர்க்க முடியாது. ஒரு குழுவாக இணைந்து பணியாற்றும்போது ஏராளமான நடைமுறைச் சிக்கல்கள் எழும். அவையெல்லாமே தாமதத்தில்தான் முடியும். டேட்டாவை சேமிப்பதிலும், அதை வெளியே எடுப்பதிலும் துரித சேவை இருந்தால், நிச்சயம் கொடுத்த வாக்கை காப்பாற்றலாம்.  துரித சேவைக்கு, டேட்டா முக்கியம். அதற்கு பிக் டேட்டா பெரிய அளவில் கைகொடுக்கிறது.

சமயோசிதமாகச் செயல்பட வேண்டும் (Actionable intelligence) - அதே நேரத்தில் உருப்படியான ரிசல்ட் வர வேண்டும். உதாரணத்துக்கு, 230 எண்களை கூட்டிச் சொல்ல வேண்டும். கால்குலேட்டர் இருந்தாலே போதுமானது. ஆனால், ஏதாவது ஒரு எண்ணை தவறவிட்டால்…  அவ்ளோதான்! திரும்பவும் தட்டியாக வேண்டும். பத்து நம்பரை கால்குலேட்டரில் கூட்டலாம். 230 என்பதெல்லாம் நேர விரயம். மொத்தத்தையும் எக்ஸெல் ஷீட்டில் அடித்து, AutoSum ஐகானை தட்டினால் ரிசல்ட் ரெடி. கால்குலேட்டருடன் ஒப்பிடும்போது, இதில் தவறு வருவதற்கு வாய்ப்பில்லை.

துல்லியமான கணிப்புகள் (Accurate predictions) - என்ன நடக்கும் என்பதை எண்ணிப் பார்க்காதவர்கள் யாராவது இருக்க முடியுமா? ஜாதகக் கணிப்புகளில் ஆரம்பித்து ஓலைச் சுவடி ஜோதிடம் வரை நம்மூரில் ஏராளமான விஷயங்கள் உண்டு. உலகளாவிய கணிப்புகளைப் பற்றி பேசலாம். டைட்டானிக் என்றொரு கப்பல் 1912-ல் கடலில் மூழ்கும் என்று 1886-ல் எழுதி வைத்திருந்தார்களாம்.  கப்பல் மூழ்கும் வரை இதைப்பற்றி யாரும் பேசியிருக்கமாட்டார்கள். மூழ்கிய பின்னர், இவையெல்லாம் ஆச்சரியமான செய்திகளாக மாறிவிட்டன. கணிப்புகள் சரியாக இருக்கும்போது, மறுமுறை நம்பிக்கையுடன் செயலை செய்ய முடியும். சரியாக கணிப்பதற்கு ஏராளமான சாம்பிள் டேட்டா அவசியம். லட்சத்தில் அல்ல, கோடிக்கணக்கில் சாம்பிள் கிடைக்கும்போது துல்லியத்தை நம்மால் தொடமுடியும் 

அடுத்து, Fault and fraud detection. இதுவொரு பெரிய ஏரியா. முக்கியமானதும் கூட. கோடிக்கணக்கான பதிவு கோப்புகளை (log file) மேய்ந்து, அதன் மாறுபடு தன்மையை ஆராய்வது. இது சாதாரண விஷயமல்ல. தேவையில்லை என்று நாம் நினைப்பதையெல்லாம் தூர எறிந்துவிடாமல் சேமித்தாக வேண்டும். அனைத்து பதிவு கோப்புகளையும் சேமித்து வைக்க வேண்டும். பின்னர், அவற்றை வகைப்படுத்த வேண்டும். பதிவு கோப்புகள் (log file) பொறுத்தவரை பலவிதம் உண்டு.

* பரிவர்த்தனை பதிவு கோப்பு (transaction log)

* உடனடி செய்தி பதிவு கோப்பு ( message log)

* சிஸ்டம் & சர்வர் பதிவு கோப்பு (sys & server log)

* தணிக்கை பதிவு கோப்பு (audit log)

* டேமன் பதிவு கோப்பு (daemon log)

இவை தவிர ஸ்விப்ட், போட், அமேஸான் கிளவுட் வாட்ச் லாக் என ஏராளமான வகைகள் உண்டு.

நம்முடைய ஒவ்வொரு செயல்பாடும் சேமிக்கப்படுகிறது, பதிவு கோப்புகளாக. இது சாதாரண விஷயமல்ல. நொடிக்கு நொடி ஆயிரம் பதிவு கோப்புகள் வரும். வருவதையெல்லாம் தவறவிடாமல் சேமித்து வைக்க வேண்டும். பிக் டேட்டாவின் முக்கியத்துவத்தை இங்குதான் நம்மால் முழுமையாகப் புரிந்துகொள்ள முடியும்.

மிஸ்டர் கோயிஞ்சாமி காய்கறிகள் வாங்கிவரச் செல்கிறார். பர்ஸை திறந்து பார்த்தபோது போதுமான பணம் இல்லை என்பது தெரிய வருகிறது. வழக்கமாக அவர் எப்போதும் செல்லும் ஏடிஎம் அன்று இயங்கவில்லை. அருகில் வேறு ஏதாவது ஏடிஎம் இருக்கிறதா என்பதை கூகுளில் தேடிப்பார்க்கிறார். ஒருவழியாகக் கண்டுபிடித்து, உள்ளே நுழைகிறார். இரண்டாயிரம் ரூபாய்க்கு பதிலாக தவறுதலாக ஒரு ஜீரோவை சேர்த்து தட்டுகிறார். ஏடிஎம் மெஷின், 20 ஆயிரம் ரூபாயை வெளியே தள்ளுகிறது.

அதிர்ச்சியான கோயிஞ்சாமி, 18 ஆயிரம் ரூபாயை எடுத்து பேண்ட் பாக்கெட்டில் வைத்துக்கொள்கிறார். இரண்டாயிரம் ரூபாயை மட்டும் பர்ஸில் வைக்கிறார். பதற்றத்தில் என்னென்ன காய்கறிகள் வாங்க வேண்டும் என்பதும் மறந்துபோகிறது. வாட்ஸ் அப்பில் தங்கமணிக்கு செய்தி அனுப்புகிறார். தங்கமணி தந்த தகவல்படி, ஒன்றரை கிலோ உருளைக்கிழங்கு, ஒரு கிலோ வெங்காயம், அரை கிலோ அவரைக்காய், அரை கிலோ தக்காளி வாங்கிவிட்டு பத்திரமாக வீடு வந்து சேர்கிறார்.

நடந்ததெல்லாம் தங்கமணிக்கு தெரியாது என்கிற நினைப்பில் விசில் அடித்தபடி, பிக் பாஸ் பார்க்க ஆரம்பிக்கிறார். சற்று நேரங்களில் தங்கமணியின் கச்சேரி ஆரம்பமாகிறது. ‘பர்ஸில் பணம் இருக்கிறதா இல்லையா என்பதுகூட தெரியாமலா வெளியே கிளம்பிப்போவீங்க?’ முதல் அர்ச்சனை ஆரம்பமாகிறது. அவரைக்காய்க்குப் பதிலாக கத்தரிக்காய் வாங்கியதும் தெரிய வருகிறது.

எந்த ஏடிஎம், எடுத்த தொகை எவ்வளவு என்று எதையும் கோயிஞ்சாமி சொல்லி, தங்கமணிக்குத் தெரிய வேண்டிய அவசியமில்லை. ஜிமெயில் அக்கௌண்ட் முதல் பேங்க் அக்கௌண்ட் வரை கோயிஞ்சாமிக்கு சொந்தமான சகல விஷயங்களும் தங்கமணிக்கும் தெரியும். வீட்டை விட்டு வெளியே காலடி வைத்த நிமிடம் தொடங்கி, சொத்தை கத்தரிக்காயோடு கோயிஞ்சாமி வீடு திரும்பியது வரையிலான மொத்த தரவுகளும் ஜிமெயில் வசம் உண்டு. கோயிஞ்சாமியால் ஓடவும் முடியாது, ஒளியவும் முடியாது!

(தொடரும்)

தினமணி'யை வாட்ஸ்ஆப் சேனலில் பின்தொடர... WhatsApp

தினமணியைத் தொடர: Facebook, Twitter, Instagram, Youtube, Telegram, Threads, Koo

உடனுக்குடன் செய்திகளை தெரிந்து கொள்ள தினமணி செயலியை பதிவிறக்கம் செய்யவும் 

வேட்புமனுவுக்கு நாளையே கடைசி: அமேதி, ரே பரேலி வேட்பாளர்கள் யார்?

வாக்கு எண்ணிக்கை மையப் பணி: தலைமைக் காவலர் விபத்தில் பலி

கல்குவாரி வெடி விபத்து: மேலும் ஒருவர் கைது

ஒடிஸாவில் ஹேமந்த் சோரனின் சகோதரி போட்டி!

சூப்பா்சோனிக் ஏவுகணை உதவியுடன் தாக்கும் டாா்பிடோ ஆயுதம் வெற்றிகரமாக பரிசோதனை

SCROLL FOR NEXT