Enable Javscript for better performance
25. பிக் டேட்டா: இறுதியாக..- Dinamani

சுடச்சுட

  
  7

   

  எந்தவொரு சொல்லும் திரும்பத் திரும்ப உச்சரிக்கப்படும்போது, அதன் வீரியத்தை இழக்கும் என்பார்கள். நம்மூர் அரசியலுக்கு சர்வ நிச்சயமாக இது பொருந்தும். பிக் டேட்டாவுக்கும் இது பொருந்தும் என்பதையும் இங்கே குறிப்பிட்டாக வேண்டும். தகவல் தொழில்நுட்ப உலகைப் பொறுத்தவரை பிக் டேட்டா என்பது பெரிதும் புழக்கத்தில் உள்ள சொல்லாடல். அதே நேரத்தில், இந்தியாவில் இன்னும் பிரபலமடையவில்லை என்பதையும் குறிப்பிடவேண்டி இருக்கிறது. இன்னும் சில சொல்லாடல்களான டெவ்ஆப்ஸ், பிளாக்செயின், கிளவுட் என அனைத்துக்கும் அடிப்படையான விஷயமாக பிக் டேட்டா உருவெடுத்திருக்கிறது என்பதை முந்தைய அத்தியாயங்களில் பார்த்தோம்.

  டேட்டா என்பது இன்றைய நிலையில் விலைமதிக்கமுடியாத பொருள். உண்மையில், இத்தனை ஆண்டுகள் கழித்துதான் அதை நாம் உணர்ந்துகொண்டிருக்கிறோம். கையில் வெண்ணெய்யை வைத்துக்கொண்டு நெய்யைத் தேடி நாம் அலைந்திருக்கிறோம். பெரிய நிறுவனங்கள் தங்கள் வசம் வைத்திருக்கும் டேட்டாதான் அவர்களது ஆகச்சிறந்த சொத்து. உழைப்பையும், பணத்தையும் கொட்டி அதை உருவாக்கி வைத்திருக்கிறார்கள். அது தரும் பாடம், செய்தியை அடிப்படையாகவே வைத்து அவர்களது எதிர்காலம் அமைகிறது. அந்த அடிப்படையில் பார்க்கும்போது, பிக் டேட்டா என்பது நம்மிடம் உள்ள தகவல்களை ஒன்றுபடுத்தி, சீராக்கி, அதன்மூலம் புதிய செய்திகளைப் பெறுவது என்னும் ஒரு பெரிய இயக்கமாகத்தான் அதைப் பார்க்கவேண்டி இருக்கிறது. பிக் டேட்டாவின் அடிப்படை புரிதல் இதுதான். இதைப் புரிந்துகொள்ளாவிட்டால், மேற்கொண்டு நம்மால் நகர முடியாது.

  பிக் டேட்டாவை அடிப்படையாக வைத்ததுதான் பல பிஸினெஸ் முடிவுகள் எடுக்கப்படுகின்றன என்பதை நாம் ஏற்கெனவே பார்த்தோம். ஒரு முடிவை இன்னொரு முடிவு மறுதலிக்கவும் காரணமாக இருக்கின்றன. உதாரணத்துக்கு, சென்னையில் ஞாயிறு மாலைகளில் ஆட்டோ, வாடகைக்கார்கள் சுலபமாகக் கிடைப்பதில்லை. மூன்று மணி நேரங்களுக்கு முன்னதாக முன்பதிவு செய்யவேண்டி இருக்கும். நாம் கேட்ட காரும் கிடைக்காது. அதற்குக் காரணம், சென்னை போன்ற மாநகரங்களில் ஞாயிறு மாலையை தன்னுடைய குடும்பத்தினருடன் செலவிடுவதை எல்லோரும் விரும்புவார்கள். ஆட்டோ, வாடகைக்கார் மட்டுமல்ல ஹோட்டல், தியேட்டர் எங்கே சென்றாலும் கூட்டம் வழிந்தோடும். வரிசையில் நின்று காத்திருந்து, எதையும் பெற்றாக வேண்டும். இதற்கெல்லாம் காரணம், எல்லோருக்கும் தெரிந்த எளிய உண்மைதான். டிமாண்ட் அதிகம், சப்ளை குறைவு!

  சென்னையில் ஒரு ஞாயிறு என்னும் தலைப்பில் சென்னை மாநகரத்தின் வாழ்க்கை முறையை ஆய்வு செய்யும்போது இவையெல்லாம் நடைமுறையில் உள்ளவை என்பதால், பெரிய அளவில் ஆய்வு செய்து கண்டுபிடிக்க வேண்டிய தேவை இருக்காது. இதேபோன்று, சென்னையில் மழைக்காலங்களிலும் ஆட்டோ, காருக்கு டிமாண்ட் அதிகம். எல்லோரும் மழையில் நனையாமல் வீடு போய் சேரவே விரும்புவார்கள். ஆட்டோ, கார்களும் கிடைக்காது. சிங்கப்பூரிலும் இதே நிலைமைதான். மழை பெய்தால் வாடகைக்கார்கள் கிடைக்காது. அதை முன்வைத்து சிங்கப்பூரும், சென்னையும் ஒன்றுதான் என்கிற முடிவுக்கு வந்துவிடமுடியாது.

  விளைவுகள் ஒன்றுதான் என்றாலும் காரணங்கள் வேறு. சிங்கப்பூரில் போதுமான ஆட்டோ, கார் உண்டு. ஆனால், மழைக்காலங்களில் விபத்து நேரிட்டால், இன்ஷூரன்ஸ் கவரேஜ் கிடைக்காது. அதிகமான தண்டத்தொகை கட்டவேண்டி இருக்கும். இதைத் தவிர்ப்பதற்காகவே, மழைக்காலங்களில் வாடக்கைக்கார்களை வெளியே எடுக்க ஓட்டுநர்கள் விரும்புவதில்லை. கார்களில் ஜிபிஎஸ் வைத்திருப்பது கட்டாயம் என்பதால் அவற்றின் நடமாட்டத்தையும், உள்ளூர் தட்வெட்ப நிலையையும் உத்தேசித்து, மழைப் பொழிவின்போது கார்களின் நடமாட்டம் கட்டுப்படுத்தப்படுகிறது. ஆக, சென்னைக்கும் சிங்கப்பூருக்கும் உள்ள வித்தியாசத்தைப் புரிந்துகொள்ள பிக் டேட்டா தகவல்களோடு கூடுதலாகச் சில விவரங்களும் தேவை. உள்நாட்டு சட்ட திட்டங்கள், இன்ஷூரன்ஸ் விதிகள் போன்றவை குறித்த புரிதல்கள் வேண்டும். அப்போதுதான், பிக் டேட்டாவை அடிப்படையாக வைத்துச் செய்யப்படும் ஆய்வுகள், முழுமை அடையும்.

  டேட்டா எக்ஸாஸ்ட் (Data Exhaust), அதாவது ‘நழுவ விடப்படும் டேட்டா’ - இதுதான் தகவல் தொழில்நுட்ப உலகில் பொற்குவியலாக வர்ணிக்கப்படுகிறது. இணையத்தளங்களில் கசியும் டேட்டா, யாராலும் கண்டுகொள்ளப்படாமல் விடப்படும் டேட்டா, குறிப்பாக ஒருவர் ஒரு குறிப்பிட்ட பொருளை வாங்க நினைத்து, பின்னர் வேண்டாம் என்று முடிவு செய்தது போன்ற தேவையில்லாத டேட்டா என்று முடிவு செய்யப்பட்டவைதான் பொற்குயிலாகப் பார்க்கப்படுகிறது. இவற்றையெல்லாம் சேகரித்து, எப்படி ஆய்வு செய்வது என்பதில்தான் வெற்றி அடங்கியிருக்கிறது. ஆகவே, இனி வரும் நாள்களில், டேட்டாபேஸ் வல்லுநர்களைவிட புள்ளி விவர நிபுணர்களின் தேவையே அதிகமாக இருக்கும்.

  இன்றைய டிஜிட்டல் உலகின் பிக் பாஸ் என்றால் அது பிக் டேட்டாதான். தண்ணீரைவிட அதிகளவில் பகிரப்படும் ஒரு வஸ்து உண்டென்றால் அது டேட்டாதான். தகவல் என்று மொழிபெயர்க்க வேண்டிய அவசியமில்லாதபடி, டேட்டா என்னும் சொல் தமிழ்ச் சமூகத்தின் பிரபலமான வார்த்தையாகிவிட்டது. பேஸ்புக், தனிமனிதனின் அடையாளமாக மாறிவிட்டது. ஒவ்வொரு 3 விநாடிகளுக்கும் ஒரு புதிய கணக்கு துவங்கப்படுகிறது. பேஸ்புக்கில் ஒரு மணிநேரத்தில் கையாளப்படும் டேட்டாவின் அளவு 100 டெராபைட்டை தாண்டிவிட்டது. ஒரு சாதாரண நாளில் 3.5 பில்லியன் பதிவுகள் பேஸ்புக்கில் பதிவிடப்படுகின்றன. லைக்குபவர்களின் எண்ணிக்கையோ 155 மில்லியன்! ஷேர் செய்யாத தமிழர்கள் இன்று இல்லை. (மில்லியன், பில்லியன் எல்லாம் மேற்கத்திய சொற்கள். இந்திய கணக்கீட்டில் சொல்வதென்றால் ஒரு மில்லியன் என்பது 10 லட்சம்; ஒரு பில்லியன் என்பது 100 கோடி).

  இன்னொரு பக்கம் டிவிட்டர். 400 மில்லியன் டிவிட்டுகள் தட்டப்படுகின்றன. பெரும்பாலான இந்திய அரசியல்வாதிகள் டிவிட்டரில்தான் குரல் கொடுக்கிறார்கள். டிவிட்டர் அரசியல் என்றொரு தனி அரசியல் பாணியே வந்துவிட்டது. பேஸ்புக், டிவிட்டரில் நீங்கள் பகிரப்படும் செய்திகளை வைத்து உங்களது அரசியல் நிலைப்பாடு, பொழுதுபோக்கு, உங்களுக்குப் பிடித்தது, பிடிக்காதது, உங்களது நட்பு வட்டாரம், அவர்களது பின்னணி என எல்லாவற்றையும் பிழிந்து எடுத்துவிடுகிறார்கள். இணையம், மொபைல் மட்டுமல்ல எல்லா இடங்களில் இருந்தும் டேட்டா பெறப்படுகிறது. உதாரணத்துக்கு, ஸ்மார்ட் பேண்ட்.

  ‘ஸ்மார்ட் பேண்ட்’ - சமீப காலமாகப் பிரபலமாகிவரும் சாதனம். கைக்கடிகாரத்துக்குப் பதிலாக இதையே பலரும் விரும்புகிறார்கள். நடப்பது, ஓடுவது, சாப்பிடுவது, தூங்குவது என அனைத்து நடவடிக்கைகளையும் இக் கருவி பதிவு செய்துகொள்கிறது. உங்களது எடை, சாப்பிடும் பழக்கம் அனைத்தும் பகிரப்படுகிறது. எத்தனை மணி நேரம், எப்போது தூங்குகிறீர்கள் என்பதும் பகிரப்படுகிறது. இவற்றை ஆராய்வதற்காக பிரத்யேக செயலிகளும் கிடைக்கின்றன. நல்ல விஷயம்தான். ஆனால், டேட்டா எங்கே, எப்படி, யாரால் கையாளப்படுகிறது என்பது தெரியாது. இப்படி பல்வேறு வழிகளில் டேட்டா பெறப்படுகிறது. எப்படியெல்லாம் டேட்டாவைப் பெறலாம் என்பதும் முக்கியமான ஆய்வாக மேற்கொள்ளப்படுகிறது. டேட்டா டிஸ்கவரி (Data Discovery) என்பது இன்று பிக் டேட்டாவின் முக்கியமான துறையாக மாறியிருக்கிறது. இவற்றை முன்வைத்து செய்யப்படும் ஆய்வுகள், சூழல் பகுப்பாய்வு (contextual analytics) என்று அழைக்கப்படுகிறது.

  ஏராளமான டேட்டா ஸ்டோரேஜ் வகைகளை எப்படி திறன்பட நிர்வகிப்பது என்பது அடுத்து ஒரு சவாலான விஷயமாகப் பார்க்கப்படுகிறது. நெக்ஸ்ட் ஜெனரேஷன் டேட்டா பிளாட்பாரம் ஆர்கிடெக்சர் (Next Generation Data Platform Architecure) வடிவமைப்பதற்குப் பரந்துபட்ட அளவில் பல்வேறு டேட்டா ஸ்டோரேஜ் பற்றிய அறிவும், அனுபவமும் தேவைப்படுகிறது. பாலிகாட் (Ployglot) என்னும் பன்மொழியாளர்கள் தேவைப்படுகிறார்கள். சிக்கலான டேட்டா லேயர் பிரச்னைகளைத் தீர்ப்பதற்கு இவையெல்லாம் அவசியம். SQL, NoSQL பற்றியெல்லாம் ஏற்கெனவே பார்த்தோம். இப்போது இவையெல்லாம் இணைந்த புதிய டேட்டாபேஸ் பாணி தேவைப்படுகிறது. அதற்கு NewSQL என்றுகூட பெயரிடலாம்!

  சரி, பிக் டேட்டாவுக்கு சவால் விடுக்கும் விஷயங்கள் சிலவற்றை பார்க்கலாம். அவற்றில் மூன்று முக்கியமான விஷயங்களைக் குறிப்பிடமுடியும். Agility, Cost & Depth of insight.

  ஏஜிலிட்டி (Agility) பற்றி ஏற்கெனவே பார்த்தோம். மாற்றம் ஒன்றுதான் மாறாதது. மற்றவையெல்லாம் மாறிக்கொண்டே இருக்கும். எதையும் கட்டுப்படுத்த முடியாது. புதிய மாற்றங்கள் வரும்போதெல்லாம் அவற்றை உடனுக்குடன் ஏற்றுக்கொள்ள தயாராக இருக்க வேண்டும். எழுத்தில் வேண்டுமானால் எளிதாகச் சொல்லிவிடலாம். நடைமுறையில் மிகவும் சிக்கலான விஷயம். அதற்கேற்ற தொழில்நுட்ப அறிவு, உழைப்பு, மனித ஆற்றல் உள்ளிட்டவை குறித்து வேறு தளங்களில் விவாதிக்கப்பட வேண்டிய விஷயம்.

  அடுத்து, முதலீடு (Cost). இப்போதைக்கு, பிக் டேட்டாவில் எல்லாமே காஸ்ட்லியான விஷயங்கள்தான். ஹார்ட்வேர், சாப்ட்வேர் என அனைத்துக்கும் முதலீடு செய்ய ஏராளமான நிதி தேவைப்படுகிறது. இதுவொரு தற்காலிக நிலைதான். நாளை நிலைமை மாறும். குறைவான முதலீடே தேவைப்படும் நிலைமை ஏற்படும்.

  மூன்றாவது விஷயம்தான், முக்கியமானது. எந்த அளவுக்கு ஆழமான ஆய்வுகள் தேவை (Depth of insight) என்பதை நிர்ணயிப்பது. ஒரு பொருளின் தரத்தை (Quality) நிர்ணயிப்பதுபோல் இதுவும் விவாதித்து முடிவு செய்யப்பட வேண்டிய விஷயம். இதற்கு அனுபவமும், புதிய முறைகள் பற்றிய அறிவும் தேவைப்படுகிறது. ஏற்கனவே ஒரு உதாரணத்தை பார்த்தோம். சென்னையின் ஒரு மழைக்காலத்தையும், சிங்கப்பூரின் ஒரு மழைக்காலத்தையும் ஒரே தளத்தில் வைத்து ஆய்வு செய்ய முடியாது. உலக அளவில் நிறுவனங்களுக்குப் பெரிய அளவில் சவாலாகத் தென்படும் விஷயம் இதுதான். பழைய முறைகள் (historical approach) பெரிய அளவில் கைகொடுக்காது. தலைமையில் முடிவெடுப்பவர்களின் ஐகியூ (IQ) தரத்தை உயர்த்துவது குறித்து நிஜமான கவலைகளைப் பார்க்கமுடிகிறது.

  Data Stream Management என்பது நாளைய தினம் முக்கியமான துறையாகப் பார்க்கப்படும். டேட்டாவை பெறும்போதே, சரியான டேட்டாவை பெறுவது, தேவையானதை உடனடியாக அடுத்த கட்டத்துக்கு எடுத்துச்செல்வது போன்ற விஷயங்களில் ஏராளமான முன்னேற்றங்கள் வர இருக்கின்றன. மேகக்கணிமை சேவை (Cloud Service) தரும் நிறுவனங்களும், டேட்டா சேவைகளுக்காக தனிப் பெரும் சேவைகளைத் தரவேண்டி இருக்கும். இதற்கான வேலைகளில், அமேஸான் (AWS), மைக்ரோசாப்டின் அஷ்யூர் (Azure) இறங்கியிருக்கின்றன. ஏராளமான டேட்டா பரிமாற்றங்கள் நிகழும்போது, அதற்கேற்றபடி Bandwidth அளவையும் உயர்த்தவேண்டி இருக்கிறது. டேட்டாவின் வடிவமும் மாறிக்கொண்டே வருகிறது. Text, speech, image, video என்பதைத் தாண்டி புதிய வடிவங்கள் வரக்கூடும்.

  உலகெங்கும் 500 கோடி பேர் கையில் மொபைல் வைத்திருக்கிறார்கள். அதில் குறைந்தபட்சம் 200 கோடி பேர் இணையத்தில் இணைந்திருக்கிறார்கள். சினிமா தியேட்டருக்கு அடுத்தபடியாக இங்குதான் ஜாதி, மத, மொழி, இனம் பேதமில்லை. யாரை, எப்போது வேண்டுமானாலும் தொடர்புகொள்ள முடியும்; 200 கோடி பேரால், உலகின் எந்தவொரு மூலையையும் நிமிடங்களில் அல்ல விநாடிகளிலேயே தொடர்புகொள்ள முடியும் என்பதே நமக்கு ஆச்சரியமான விஷயம்.

  100 ஆண்டுகளுக்கு முன் நிலைமை இப்படியா இருந்தது? உலகப்போர்களில் சிக்கி, லட்சக்கணக்கான மக்கள் அழிந்ததுகூட அண்டை நாடுகளுக்கு தெரியாத அளவுக்குத் தகவல் தொடர்பு மோசமாக இருந்தது. இன்று, இணையம்தான் எல்லாவற்றையும் சாத்தியப்படுத்தியது. நாளை, இத்தகைய நிலை நீடிக்க வேண்டும் என்றால், அதற்கு பிக் டேட்டா வேண்டும். பிக் டேட்டா துறையில் விண்ணைத் தொடும் வளர்ச்சிகள் வேண்டும்.

  2020. வாட்ஸ்அப், பேஸ்புக் உலகம் முடிவுக்கு வந்து, அதைவிட பெரிய இன்னொரு ஆச்சரியமான உலகம் நமக்காகக் காத்திருக்கும் என்கிறார்கள். ஆச்சரியத்தோடு கூடவே இலவச இணைப்பாக ஆபத்துகளும் வரக்கூடும். இன்று தகவல் பரிவர்த்தனையின் உச்சத்தில் இருக்கிறோம். நல்லதோ, கெட்டதோ எதுவாக இருந்தாலும் விஷம் போல் பரவுகிறது. 2020 ஆண்டின் முடிவில் 5000 கோடி சாதனங்கள் இணையத்தில் இணைந்துகொள்ளும் என்கிறார்கள். நம்முடைய மொபைல், டெஸ்க்டாப், லேப்டாப் மட்டுமன்றி டிவி, பிரிட்ஜ் ஏன் காலிங் பெல்கூட இணையத்தோடு இணைக்கப்பட்டிருக்கும். உலகத்தின் எந்தவொரு மூலையிலிருந்து உங்களது வீட்டு காலிங்பெல்லை அழுத்தி, ஒலிக்கவிடலாம்.

  ஆச்சரியம்தான். அதே நேரத்தில் ஆபத்தும் காத்திருக்கிறது. உங்களது தனியறை, பொது இடமாகிவிடும். உங்களை யார் யாரோ கண்காணிக்கப்போகிறார்கள். உங்களைக் கட்டுப்படுத்தி இயக்கவும் போகிறார்கள். எதுவும் நடக்கலாம்! நம் கையில் எதுவும் இல்லை. சவால்களை எதிர்கொண்டால்தான் சாதனை படைக்கமுடியும். தொழில்நுட்பத்தின் வசதிகளை அனுபவிக்கும் அதே நேரத்தில், அவை முன்வைக்கும் சவால்களையும் எதிர்கொள்ள வேண்டியது காலத்தின் கட்டாயம். வேறு வழியில்லை!

  (முற்றும்)

  • அதிகம்
   படிக்கப்பட்டவை
  • அதிகம் இ-மெயில் செய்யப்பட்டவை
  google_play app_store
  kattana sevai