வெள்ளிக்கிழமை 22 மார்ச் 2019

3. டேட்டா சயின்ஸ்

By ஜெ. ராம்கி| Published: 24th April 2018 12:00 AM

 

டேட்டா சயின்ஸ் என்பது தொழில்நுட்பத்தின் புது மந்திரம். இணைய சமூகத்தில் ஒவ்வொரு மனிதனும் ஒரு நிறுவனம்போல செயல்பட ஆரம்பித்திருக்கிறான். மடை திறந்த வெள்ளம்போல், அவனைச் சுற்றி கொட்டிக்கிடக்கும் டேட்டா, ஒரு முக்கியமான மூலப்பொருள். அதை சீராக்கி, திறம்பட பயன்படுத்திக்கொண்டு, சம்பந்தப்பட்டவர்களை, அவர்களது விருப்பு, வெறுப்புகளை சரியாகப் புரிந்துகொள்வதில்தான் வெற்றி அடங்கியிருக்கிறது.

நம்மைச் சுற்றி நிறைந்திருக்கும் டேட்டாவை நாம் எப்படி பயன்படுத்திக்கொள்ளப்போகிறோம்? முதலில் அதை எப்படி புரிந்துகொள்வது, எப்படி கையாள்வது, அதை அடிப்படையாக வைத்து, எத்தகைய முடிவுகளை மேற்கொள்ள முடியும்?

இணைய உலகத்தில் இன்று முக்கியமாக முன்வைக்கப்படும் கேள்விகள் இவை. 80-களிலும் 90-களிலும் கம்ப்யூட்டரை எவ்வாறு கையாளப்போகிறோம் என்பது சவாலாக இருந்தது. கம்ப்யூட்டரின் அறிமுகம் பலரது வேலை வாய்ப்புகளைப் பறித்துவிடும் என்று பயமுறுத்தினார்கள். பின்னர் கம்ப்யூட்டர் மூலமாகப் புதிய வேலை வாய்ப்புகள் குவிந்தன. டேட்டா விஷயத்திலும் அப்படித்தான் என்பதை எளிதாகக் கணித்துவிடலாம்.

டேட்டா சயின்ஸ் என்பது புதிதல்ல. ஏற்கெனவே பல்வேறு துறைகளில் நெடுங்காலமாகப் புழக்கத்தில் உள்ளதுதான். உதாரணத்துக்கு, இந்திய வானிலை ஆய்வுத் துறை. மாறிவரும் தட்பவெப்பச் சூழல், மழை மற்றும் புயல் நிலவரங்களைக் கணிப்பதற்கு, வானிலை ஆய்வுத் துறை ஏற்கெனவே பதிவு செய்து வைக்கப்பட்டுள்ள டேட்டாவை பெரிதும் நம்பியிருக்கிறது. சரியான டேட்டாவை மீட்டெடுத்து, தற்போதைய சூழ்நிலையோடு ஒப்பிட்டு அலசப்படுகிறது. இதன்மூலமாக, ஓரளவு சரியாகக் கணிக்கமுடியும். ஆனால், நிறைய சாம்பிள் தேவைப்படுகிறது. சாம்பிள் அதிகமாகும்போது, கணிப்புகள் தவறுவதில்லை.

டேட்டா எவ்வாறு திரட்டப்பட்டு, சேமிக்கப்படுகிறது? எப்படியெல்லாம் அவற்றை பாதுகாத்து வைத்திருந்தார்கள் என்பதையும் நாம் பார்க்க வேண்டும். ஐம்பதுகளில் மேக்னடிக் டேப் அறிமுகப்படுத்தப்பட்ட காலத்திலிருந்து, டேட்டாவை சேமிப்பது என்பது சவாலான விஷயமாகவே இருந்துவருகிறது. இன்று 1 TB என்பது அனைவருக்கும் சாத்தியமான விஷயமாகத் தெரியலாம். ஆனால், அன்றைய காலகட்டத்தில், ஒரே ஒரு எம்பி டேட்டாவை சேமித்துவைக்க, ஒரு அறை முழுக்க மேக்னடிக் டேப் தேவைப்பட்டது.

1951 தொடங்கி 1971 வரை டேட்டா ஸ்டோரேஜ் விஷயத்தில் பெரிய அளவில் முன்னேற்றங்கள் இல்லை என்றே சொல்லமுடியும். அதிகமான இடவசதி, மேக்னடிக் டேப் இருந்தால், அதிக அளவில் டேட்டா சேகரித்து, பாதுகாப்பாக வைக்கமுடியும் என்கிற நிலை இருந்தது. அமெரிக்க, ரஷ்யா மற்றும் ஐரோப்பிய நாடுகளில் மட்டும் சாத்தியமான விஷயமாக இருந்தது.

டேட்டாபேஸ் உலகில் முதல் புரட்சி, 1970-ல் அறிமுகப்படுத்தப்பட்டது. ரிலேஷனல் மாடல் டேட்டாபேஸ். அதாவது, டேட்டாவை ஒன்றுக்கொன்று தொடர்புபடுத்தி சேமித்து வைப்பது. ஓரிடத்தில் உள்ள டேட்டாவை நெட்வொர்க் மூலமாக இணைத்து, பல்வேறு இடங்களில் பயன்படுத்திக்கொள்வது. உண்மையில் இணையத்துக்கான தொடக்கம் இங்கிருந்துதான் ஆரம்பமானது.

1972-க்குப் பின்னரே, டேட்டாபேஸ் என்கிற சொல்லாடல் புழக்கத்துக்கு வந்தது. அதுவரை டேட்டா மட்டுமே. டேட்டாபேஸ் சிஸ்டம் என்பது ஒட்டுமொத்த சட்டகமாகச் சொல்லலாம். மேலாடை என்பது மெல்ல, மெல்ல பல்வேறு வடிவங்களைப் பெற்றதுபோல், டேட்டவும் பல்வேறு பரிணாமங்களை அடைந்தது.

டேட்டாபேஸ் வளர்ச்சி, ஒட்டுமொத்த தொழில்நுட்ப வளர்ச்சி மீது ஏற்படுத்திய தாக்கத்தைப் புரிந்துகொள்ள வேண்டுமானால், கடந்த 20 ஆண்டுகால வரலாற்றைப் புரட்டியாக வேண்டும். 1998-ல் செல்பேசி இல்லை. பத்து ஆண்டுகளுக்கு முன்னர்கூட, பணம் சம்பந்தமான பரிவர்த்தனைகளை எளிதாகச் செய்துவிடமுடியாது. இன்று, ஓரிரு நிமிடங்களில் மொபைல் மூலமாக பணம் அனுப்பமுடிகிறது. அதை சாத்தியப்படுத்தியிருப்பது, டேட்டாபேஸ்.

ஏன் டேட்டாபேஸ் அவசியமாகிறது? டேட்டாபேஸ் இல்லாவிட்டால் பணப் பரிவர்த்தனைகள் சாத்தியமில்லையா? இல்லை. நிச்சயமாக இல்லை. பணப் பரிவர்த்தனைகள் மட்டுமல்ல, இணையத்தில் எந்தவொரு பரிவர்த்தனையும் சாத்தியமில்லை. ஏனென்றால், ஒவ்வொரு பரிவர்த்தனை, அதாவது ஒவ்வொரு தகவல் பரிமாற்றமும் பத்திரமாக சேகரித்து வைத்தாக வேண்டும். வங்கித் துறை போன்ற இடங்களில் வரவு, செலவு கணக்குகளில் நிகழும் சிறு பிழைகள்கூட பெருத்த நஷ்டத்தைக் கொண்டுவந்துவிடும். மொபைல் டிரான்ஸ்ஃபர், ஆன்லைன் டிரான்ஸ்ஃபரெல்லாம் பரவலாகிவிட்ட சூழலில், வலுவான டேட்டாபேஸ் இருப்பது அவசியமாகிறது.

டேட்டாபேஸ் என்பது தகவல்களை ஒழுங்குபடுத்தி, ஒரு சட்டகத்துக்குள் அடைத்துத் தருபவை. இதனால், தகவல்களைத் தேடுவது துரிதமாகிறது. தகவல் சேகரிப்பு என்பதெல்லாம் காலம் காலமாக இருந்து வருவதுதான். மனிதகுல மேம்பாட்டுக்கும், தொழில்நுட்ப வளர்ச்சிக்கும் தகவல்களைத் திரட்டுவதும், ஒப்புநோக்குவதும், அதன்மூலம் பல முடிவுகள் எடுப்பதும், உலகளாவிய அளவில் இருந்து வருகிறது. அதையெல்லாம் எந்த அளவுக்கு டேட்டாபேஸ் மேம்படுத்துகிறது என்பதைத்தான் நாம் புரிந்துகொள்ள வேண்டும்.

ஒவ்வொரு டேட்டாவும், டேட்டாபேஸ் என்னும் ஒரு பொதுவான கட்டமைப்புக்குள் கொண்டுவரப்பட்டன. எந்தவொரு டேட்டாவாக இருந்தாலும், ஏதாவது ஒரு கட்டமைப்பின் கீழ் வந்தாக வேண்டும். டேட்டாபேஸின் அடிப்படை டேட்டாதான். டேட்டா இன்றி டேட்டாபேஸ் இல்லை. ஆனால், டேட்டாபேஸ் இன்றி டேட்டா உண்டு. ஆனால், அதனால் எந்தவொரு உபயோகமும் இல்லை.

நூலகங்களைப் பற்றி தெரியாதவர்கள் இருக்க முடியாது. அங்கே புத்தகங்கள் எவ்வாறு அடுக்கிவைக்கப்பட்டிருக்கின்றன என்பதை நினைவில் கொண்டால், டேட்டாபேஸை புரிந்துகொள்வது எளிது. ஒவ்வொரு நூலகங்களும் ஏராளமான அலமாரிகளைக் கொண்டிருக்கும். ஒவ்வொரு அலமாரியிலும் புத்தகங்கள் வரிசைக்கிரமமாக அடுக்கிவைக்கப்பட்டிருக்கும். ஒவ்வொரு புத்தகத்துக்கும் ஒரு வரிசை எண் கொடுக்கப்பட்டிருக்கும். வரிசை எண்ணின் அடிப்படையில் புத்தகங்கள் அடுக்கிவைக்கப்பட்டிருக்கும். அலமாரியின் முகப்பில், அனைத்து வரிசை எண்களும் குறிப்பிடப்பட்டிருக்கும்.

ஒரு புத்தத்தைத் தேட வேண்டுமென்றால், அது எந்த அலமாரியில் இருக்கக்கூடும் என்பதை முதலில் கண்டுபிடித்தாக வேண்டும். பின்னர் வரிசை எண்ணை வைத்து, புத்தகங்கள் அடுக்கிவைக்கப்பட்டிருக்கும் இடத்தைக் கண்டுபிடித்து, அங்கேயுள்ள சரியான புத்தகத்தை அடையாளம் காண வேண்டும்.

1890-ல், அமெரிக்காவில் மக்கள் தொகைக் கணக்கெடுப்பு நடைபெற்றபோது, பன்ச் கார்டு என்னும் டேப்ளட் இயந்திரத்தைப் பயன்படுத்தினார்கள். இரண்டாம் உலகப்போருக்குப் பின்னர் ஏராளமான மாற்றங்கள் கொண்டுவரப்பட்டன. ராணுவ ரகசியங்களைப் பரிமாறிக்கொள்ளவும், தாக்குதல் குறித்த திட்டங்களைக் கணிப்பதற்கும் கம்ப்யூட்டர்கள் வந்தன. டிஜிட்டல் கம்ப்யூட்டர், சிக்கலான கணக்குகளைக் கையாள்வதற்காக அறிமுகப்படுத்தப்பட்டன. அப்போது டேட்டாபேஸ் என்பது, பேப்பர் டேப் அல்லது மேக்னடிக் டேப் பயன்படுத்தி தகவல்களைப் பாதுகாப்பாக வைப்பது என்ற அளவில்தான் இருந்தது.

ஐம்பதுகளில், ISAM என்னும் இண்டெக்ஸ் முறை அறிமுகப்படுத்தப்பட்டது. இதன்மூலம், தேடுதல் என்பது துரிதமாக்கப்பட்டது. ஒவ்வொரு மேக்னடிக் டேப்பையும் படித்துப் பார்த்து, ஒப்பிட்டுப் பார்த்து முடிவுக்கு வருவதற்குப் பதிலாக, அதன் இண்டெக்ஸை முதலில் சரிபார்ப்பது. நூலகங்களில் அலமாரியின் வரிசை எண்ணை சரிபார்க்காமல், நேரடியாக புத்தகங்களைத் தேட ஆரம்பித்தால் நேரம்தான் விரயமாகும். அதுபோலத்தான் இங்கும்.

ஆரக்கிள், மைஎஸ்கியூல், ஸ்கியூல் சர்வர் என்றெல்லாம் சின்ன வட்டாரத்தில் இருந்த டேட்டாபேஸ் உலகம், 2008-க்குப் பின்னர் கிடுகிடுவென வளர்ச்சி அடைந்தது. ரிலேஷனல் டேட்டாபேஸ் பிதாமகனாக ஆரக்கிள் இருக்கும்போது, வேறு டேட்டாபேஸ் எதற்கு என்று கேள்வி எழுப்பியவர்கள் பலர். சகலவசதிகளும் ஆரக்கிள் தரும்போது, வேறு எதுவும் தேவையில்லை என்பது அன்றைய காலகட்டத்துக்குப் பொருத்தமாக இருந்தது. ஆனால், இன்று நிலைமை வேறு.

ரிலேஷனல் டேட்டாபேஸ் காலம் முடிவுக்கு வந்துகொண்டிருக்கிறது. இது, நோஎஸ்கியூல் காலம். எளிமையான, கட்டற்ற டேட்டாபேஸ் சந்தைக்கு நிறைய வந்துவிட்டன.

(தொடரும்)

Tags : ஜெ.ராம்கி டேட்டா பேஸ் கம்ப்யூட்டர் டிஜிட்டல் பிக் டேட்டா ramki digital database big data

More from the section

24. நாளை என்னும் நாள், நமதே!
23. ஒன்றைவிட இன்னொன்று.. எப்போதும் பெட்டர்!
22. டிஸ்கவரி இன்ஃபர்மேடிக்ஸ்
21. மறைந்து நின்று பார்க்கும் மர்மம்
20. கூகுளாண்டவர் என்னும் எட்டாவது வள்ளல்!