সম্ভাবনাময় পেশা : ডাটা অ্যানালিটিকস
- ড. মো. সোহেল রহমান
আমাদের দেশটি এখন অনেক অর্থনৈতিক সম্ভাবনার দেশ। আমরা প্রযুক্তিগত দিক থেকেও অনেক এগিয়ে যাচ্ছি।ডিজিটাল বাংলাদেশের যে স্বপ্ন এক সময় শুধুই স্বপ্ন মনে হয়েছিল, আজ সেদিক থেকেও আমরা অনেক দূর এগিয়ে গিয়েছি। কিন্তু আমার মনে হয়, আমাদের দেশের বিভিন্ন অঙ্গের মধ্যে সমন্বয়ের অভাব আমাদের সেই পর্যন্ত এগোতে দিচ্ছে না যতটুকু আমরা হয়তো এগোতে পারতাম। আজ সে রকম একটি বিষয় নিয়ে কথা বলব, যেদিকে যথাযথ নজর দিলে আমরা হয়তো অনেক অল্প সময়েই আরো কয়েক যুগ এগিয়ে যেতে পারব। বিষয়টি হচ্ছে ডাটা অ্যানালিটিকস; শুদ্ধ বাংলায় যা হলো তথ্য বিশ্লেষণ। কম্পিউটারবিজ্ঞান তথা তথ্য-প্রযুক্তির আলোকে ডাটা অ্যানালিটিকস এখন সারা বিশ্বেই একটি বহুল ব্যবহৃত প্রযুক্তি।
আমাদের আজকের আলোচনার পরিধি অত বড় নয়। আমরা মূলত আমাদের দেশের উন্নয়নে ডাটা অ্যানালিটিকসকে বিভিন্নভাবে যে ব্যবহার করা যেতে পারে, তা নিয়েই খুব সংক্ষিপ্ত আলোচনা করব।
আমাদের মোবাইল কম্পানিগুলো এবং মূলত তাদের ওপর ভিত্তি করে গড়ে ওঠা বিভিন্ন আর্থিক সেবাপ্রতিষ্ঠানগুলো যে বিশাল পরিমাণ উপাত্ত জমা করছে তার সুষ্ঠু ব্যবহার আমাদের আসলে অনেক এগিয়ে দিতে পারে। তাই এখানে ডাটা অ্যানালিটিকসের প্রয়োগের বিষয়টি অসম্ভব গুরুত্বপূর্ণ। কিছুদিন আগে আমার সুযোগ হয় আমাদের দেশের বহুল প্রচলিত একটি মোবাইলভিত্তিক আর্থিক সেবাপ্রতিষ্ঠান বিকাশের (bKash) করপোরেট অফিস পরিদর্শন করার। একপর্যায়ে সুযোগ পেলাম বিকাশের Real Time Monitoring কক্ষে প্রবেশ করার। দেশের প্রতিটি কোনায় প্রতি মুহূর্তের যে লেনদেনগুলো বিকাশের মাধ্যমে হচ্ছে, তা পর্যবেক্ষণ করা যাচ্ছে ওই কক্ষে বসে। অর্থাৎ এ-সংক্রান্ত উপাত্ত সেখানে সংরক্ষণও করা হচ্ছে। বিকাশের কর্মকর্তারা এই উপাত্তের ওপর ভিত্তি করে কিছু চমকজাগানিয়া তথ্য আমাদের সামনে উপস্থাপন করলেন। বাংলাদেশের ৬৪টি জেলার প্রতিটিতে গড়ে দৈনিক কত টাকা বিকাশের মাধ্যমে লেনদেন হচ্ছে তার একটা লেখচিত্র আমাদের সামনে তাঁরা উপস্থাপন করলেন। তা ছাড়া আরো একটা আপাতনিরীহ, কিন্তু খুবই গুরুত্বপূর্ণ তথ্য সেখানে ছিল। যেমন একটি জেলায় কত টাকা বিকাশের ওয়ালেটে ঢুকেছে আর কত টাকা ওয়ালেট থেকে বেরিয়ে গেছে অর্থাৎ ব্যবহারকারীরা কত টাকা এজেন্টদের সাহায্যে ক্যাশ আউট করেছে তার একটা চিত্রও সেখানে ছিল। যেমন একটি নতুন শিল্প শহর গড়ে তোলার জন্য কোন কোন জেলা ভালো হবে তার একটা প্রাথমিক ধারণা এখান থেকে আসতে পারে।
আমাদের শিক্ষা বোর্ডগুলোও তাদের কাছে রাখা উপাত্তগুলোতে ডাটা অ্যানালিটিকস ব্যবহার করে অনেক অগ্রগতি করতে পারে। যেমন তারা ছাত্রদের বিষয়ভিত্তিক নম্বর স্কুলগুলোকে ডিজিটাল পদ্ধতিতে সংরক্ষণ করতে বলতে পারে। পরে পাবলিক পরীক্ষাগুলোতে ওই ছাত্রদের ওই বিষয়গুলোতে নম্বর যদি স্কুলের অভ্যন্তরীণ পরীক্ষার নম্বরের সঙ্গে সাদৃশ্যপূর্ণ না হয়, তবে বোঝা যাবে যে কোথাও না কোথাও একটা গলদ রয়েছে। যেমন একটি স্কুলের ছাত্ররা যদি অভ্যন্তরীণ পরীক্ষায় আইসিটি বিষয়ে ভালো মার্ক পায় আর পাবলিক পরীক্ষায় এসে খুব খারাপ করে, তাহলে সহজেই বোঝা যাবে যে হয় তাদের পাবলিক পরীক্ষার খাতা মূল্যায়নে সমস্যা হয়েছে অথবা তাদের স্কুলের আইসিটি শিক্ষাদান ত্রুটিপূর্ণ। আবার ইদানীং আমরা আমাদের পাবলিক পরীক্ষার মান নিয়েও অনেক কথা বলছি। বিশেষত নামকরা বিশ্ববিদ্যালয়গুলোতে জিপিএ ৫ পাওয়া ছাত্রছাত্রীরা পাস মার্ক তুলতে ব্যর্থ হচ্ছে বলে আমরা শুনতে পাচ্ছি। আমরা এই ফলাফলগুলোরও চুলচেরা বিশ্লেষণ করতে পারি। যেমন আমরা জানি যে বুয়েটে গণিত, পদার্থবিদ্যা ও রসায়নের ওপর বিষয়প্রতি ২০০ নম্বর করে মোট ৬০০ নম্বরের ভর্তি পরীক্ষা হয়। উচ্চ মাধ্যমিক পরীক্ষায় গণিতে যে ভালো করল, সাধারণভাবে বুয়েটের ভর্তি পরীক্ষায়ও তার ভালো নম্বর পাওয়া উচিত। সবার ক্ষেত্রে এটি হয়তো সত্য হবে না। এমন হতে পারে যে হঠাৎ কারো পরীক্ষা খারাপ হয়েছে; কিন্তু গড়পড়তা এটি যদি না হয়, তাহলে নিশ্চয়ই কোথাও কোনো গলদ আছে।
সরকারের বিভিন্ন অধিদপ্তরেও ক্রয়প্রক্রিয়ার দুর্নীতি দমনের জন্য একটি মেশিন লার্নিংনির্ভর সফটওয়্যার তৈরি করা যেতে পারে। কোনো অধিদপ্তরের সাধারণ ক্রয়প্রক্রিয়ার উপাত্তের ওপর ভিত্তি করে সফটওয়্যারটি একবার প্রশিক্ষণ পাওয়ার পর যদি কোনো ক্রয়প্রক্রিয়া সাধারণ ধরনের বাইরে হয়, তাহলে সে স্বয়ংক্রিয়ভাবে দুর্নীতি দমন কমিশনের দৃষ্টি আকর্ষণ করবে। অতঃপর সংশ্লিষ্ট কর্মকর্তা এ বিষয়ে তদন্ত করে ব্যবস্থা গ্রহণ করতে পারেন। এ ধরনের মেশিন লার্নিংনির্ভর সফটওয়্যার অবশ্য অনেক সময় ভুল করবে। তাই চূড়ান্ত সিদ্ধান্ত অবশ্যই একজন কর্মকর্তাকে নিতে হবে। কিন্তু নিশ্চিতভাবেই এটি আমাদের অনেক সুবিধা দেবে। এ ধরনের মেশিন লার্নিংনির্ভর একটি সফটওয়্যার রয়েছে, এ কথাটাই দুর্নীতিবাজ কর্মকর্তাদের অনেক ক্ষেত্রে নিবৃত্ত করবে। সৎ ও সাহসী কর্মকর্তারাও তখন অনেক বলিষ্ঠ পদক্ষেপ নিতে পারবেন। একই ধারণা ব্যাংকের বিভিন্ন লেনদেনের ক্ষেত্রেও ব্যবহার করা যায় এবং পশ্চিমা দেশগুলোতে তা হরদম ব্যবহার করা হচ্ছে।
মূলকথা হলো, ডাটা অ্যানালিটিকসের মাধ্যমে Raw Data ব্যবহার করে তার থেকে প্রয়োজনীয় তথ্য বের করে সঠিক সিদ্ধান্ত নেওয়ার মাধ্যমে আমরা অনেক দূর এগিয়ে যেতে পারি। উন্নত দেশগুলো এ প্রযুক্তিগুলোর সুষ্ঠু ব্যবহার অনেক আগে থেকেই শুরু করেছে। অন্য অনেক দিকে এগিয়ে গেলেও এ বিষয়গুলোতে আমরা এখনো পিছিয়ে আছি। যেমন সেই ২০০৮ সালে, গুগল তাদের সার্চ ইঞ্জিনের মাধ্যমে করা ইনফ্লুয়েঞ্জা রোগসংক্রান্ত অনুসন্ধান ও এর ধরন বিশ্লেষণপূর্বক বিশ্বের প্রায় ২৫টি দেশে এ রোগের প্রাদুর্ভাব এবং বিস্তার সম্পর্কে ভবিষ্যদ্বাণী করার একটি প্রকল্প নিয়েছিল, যার নাম ছিল Google Flu Trend। পরে ডেঙ্গুর জন্য তারা একই রকম একটি কাজ করে। ডাটা অ্যানালিটিকস ব্যবহারের এ রকম আরো হাজারো উদাহরণ পাওয়া যাবে উন্নত বিশ্বে। সুখের কথা হলো, আমাদের সরকারের আইসিটি বিভাগ এরই মধ্যে এ বিষয়গুলো নিয়ে কাজ শুরু করেছে। আমাদের বিভাগেও আমরা ডাটা অ্যানালিটিকস নিয়ে তত্ত্বীয় এবং প্রায়োগিক অনেক গবেষণা/কাজ শুরু করেছি। এ নিয়ে বিশ্বে যে পরিমাণ কাজ চলছে এবং তা যেভাবে কাজে লাগছে, তাতে আমাদের আর হাত-পা গুটিয়ে থাকার কোনো উপায় নেই।
লেখক : অধ্যাপক, সিএসই বিভাগ, বুয়েট
সূত্র: কালের কণ্ঠ