বিগ ডেটা | Big Data


বিগ ডেটা কি ?
বিগ ডেটা জানার আগে আসুন জেনে নেই ডেটা কি?
ডেটা মানে তথ্য, অর্থাৎ আমারা কম্পিউটারে বা মোবাইলের মাধ্যমে ছবি, অডিও, ভিডিও ইত্যাদি বিভিন্ন ডেটা বা তথ্য আদান প্রদান বা সংরক্ষণ করে রাখি। 

এখন আমরা ইন্টারনেটের মাধ্যমে অডিও, ভিডিও, টেক্সট ইদ্যাদি বিভিন্ন রকম ডেটা নিয়মিত আদান প্রদান করছি, এবং এই সকল ডেটা বা তথ্য কোথাও না কোথাও সংরক্ষিত হচ্ছে। 
তো এসব ডেটা বা তথ্যের পরিমাণ বাড়তে বাড়তে বর্তমানে এমন পর্যায়ে চলে গেছে যে, এই বিশাল পরিমাণ এবং জটিল ডেটা সমূহকে পুরনো পদ্ধতিতে আর প্রক্রিয়াকরণ ( Processing ) করা যাচ্ছে না !
আরো অবাক করা বিষয় হল, গত দুই বছরে সারা বিশ্বে নতুন করে ৯০% ডেটা বা তথ্যের সৃষ্টি হয়েছে। 

এই বিশাল পরিমাণের জটিল ( Complex ) তথ্যসমূহকেই বলা হচ্ছে বিগ ডেটা ( Big Data ).
ডেটা সংরক্ষণেই শুধু “বিগ ডেটা” টার্মটি ব্যবহার হয়না, ডেটা আদান প্রদানেও এটি ব্যবহার করা হয়।

বিগ ডেটা | Big Data


বিগ ডেটা মূলত তিনটা ভি ( 3 V ) এর উপর নির্ভরশীলঃ
১। ভলিউম ( Volume )
২। ভেলুসিটি ( Velocity )
৩। ভেরাইটি ( Variety )
আসুন এগুলো নিয়ে একটু আলোচনা করি, 

১। ভলিউম ( Volume ) : ভলিউম কি ?
আমারা সবাই তো ফেসবুক, টুইটার, হোয়াটসঅ্যাপ, ইউটিউব ইত্যাদি ব্যবহার করি।
তো সেখানে আমরা কি করি? কাউকে টেক্সট ম্যাসেজ পাঠায়, বিভিন্ন সাইজের অডিও, ভিডিও এবং ছবি  আপলোড করি, এবং আপলোডকৃত এই ডেটাগুলো একটা নির্দিষ্ট পরিমাণ স্পেস বা জায়গা দখল করে।
আসুন একটা উদাহরণ দেখি যে আমরা কি পরিমাণ ডেটা ইউজ করি।
- ইউটিউবে আমরা প্রতি মিনিটে ১২ ঘণ্টা ইউটিউব ভিডিও ফুটেজ আপলোড করি,
চিন্তা করুণ টেরাইবাইটের চেয়ে বেশী ডেটা আমারা প্রতি সেকেন্ডে ব্যবহার করি।

এখন আসি ভেলিসিটিতে,
২। ভেলুসিটি ( Velocity ) : ভেলুসিটি কি ?
ভেলুসিটি হল কত দ্রুত আমরা ডেটার ব্যবহার করছি বা নতুন ডেটা তৈরি করছি।
আসুন কিছু উদাহরণ দেখি,
- ১৯৯২ সালে সারা বিশ্বে প্রতিদিন ১০০ জিবি ডেটার ব্যবহার হয়েছিল।
তার পরে ১৯৯৭ সালে সারা বিশ্বে প্রতিদিন ঘণ্টায় ১০০ জিবি ডেটা ব্যবহৃত হয়।
২০০২ সালে সারা বিশ্বে প্রতি সেকেন্ডে ১০০ জিবি নতুন ডেটা তৈরি হয়,
২০১৩ সালে প্রায় ২৯,০০০ জিবি নতুন ডেটা তৈরি হয়।
এবং ২০১৫-২০১৬ সালে এসে আমরা প্রতি সেকেন্ডে তৈরি করছি প্রায় ৪০,০০০ জিবি ডেটা !
প্রতিদিন আমারা রেপিড স্পিডে তৈরি করছি বিশাল পরিমাণ নিতুন ডেটা ।

৩। ভেরাইটি ( Variety ) :
শুরুর দিকে আমরা স্টাকচার্ড পদ্ধতিতে ডেটা ব্যবহার করতাম।
চিন্তা করুন আপনি আপনার চেবিল স্টাকচার্ডের কথা যেখানে আপনি এসকিউএল এর সাহায্যে যেকোন ডেটা নিয়ন্ত্রণ করতে পারতেন। কিন্তু সমস্যা হল এখন আমরা যে ডেটা তৈরি করি এগুলো স্টাকচার্ড ডেটা নয়। 
এখন আমরা ইমেজ, অডিও, ভিডিও ডেটা তৈরি করছি। 
আমারা যখন কোন পিকনিকে যায় বা কোথাও ঘুরতে যায় তখন আমরা বিশেষ মুহুর্তগুলো ক্যামেরায় ছবি তুলে রাখি। 
আর আমরা কিন্তু একটা ছবি তুলিনা, ইচ্ছামত ছবি তুলি। 
তো ধরুন একটা ছবির সাইজ যদি ৪ এমবি হয়, আর যেহেতু আমারা একাধিক ছবি তুলি 
সেই হিসেবে আমরা একটা পিকনিকে বা ঘুরতে গিয়ে প্রায় ১ জিবি বা তারও বেশী সাইজের ডেটা তৈরি করছি। 
তাছাড়া আমারা এখন কারণে বা অকারণে সেলফি তুলি, তো আমরা কিন্তু একটা সেলফি তুলি না, এক সাথে চার পাঁচটা সেলফি তুলি।
একটা সেলফির সাইজ যদি ৩ এমবি হয় তাহলে পাঁচটা সেলফিতে ১৫ এমবি এর ডেটা তৈরি হল। 
আর এই ছবিগুলো কিন্তু আমারা এক জায়গায় রাখি, বিভিন্ন জায়গায় শেয়ার করি। যেমনঃ ফেসবুক, টুইটার, ইন্সটগ্রাম সহ বিভিন্ন সোশ্যাল মিডিয়াতে আমরা আমাদের ডেটা গুলো শেয়ার করি। 
সারা বিশ্বে ৩ বিলিয়নের চেয়ে বেশী মানুষ ইন্টারনেট ইউজ করে। 
তো চিন্তা করুণ আমরা সবাই যখন একসাথে ইন্টারনেট ইউজ করি 
তখন কত বিশাল পরিমাণ নতুন ডেটার সৃষ্টি করি ! 
প্রতিদিন আমারা প্রায় ২.৫ কুইন্টিলিয়ন বাইট নতুন ডেটা সৃষ্টি করছি ! 
যারা কুইন্টিলিয়ন এর হিসাব জানেন না তাদের জন্য এর হিসাবটা দিলাম।  
কুইন্টিলিয়ন( Quintillion ) = ১ এর পর ১৮ টা শুন্য = ১০^১৮

বিগ ডেটার গুরুত্বঃ
এখন প্রশ্ন আসতে পারে যে কিভাবে আমার এত বিশাল পরিমাণ ডেটা প্রসেস করবো বা সক্রিয় বা চালু রাখবো ?
কিন্তু আপনি প্রশ্ন করতে পারেন কেন আমরা এই ডেটা গুলো সক্রিয় রাখবো? ডেটা গুলোর কাজ শেষে এগুলো আমরা কোথাও সেভ বা সংরক্ষণ করে রাখতে পারি।

কিন্তু গুগল, এপল, মাইক্রোসফট, জেরক্স, আইবিএম, অ্যামাজনের মত কোম্পানি গুলোর কাছে এই ডেটা গুলো  সক্রিয় রাখা খুবই গুরুত্বপুর্ন, এই ডেটা গুলো মূল্যবান রিসোর্স ।
তাছাড়া ব্যাংকেও বিশাল পরিমাণ ডেটার ব্যবহার হয় এবং তা সক্রিয় রাখা খুব জরুরী।
সর্বপরি ভবিষ্যৎ প্রয়োজনে এই বিশাল পরিমাণ ডেটা প্রসেস করা বা সক্রিয় রাখা খুব গুরুত্বপূর্ন।
আর বিগ ডেটা প্রসেস করার জন্য একটা বিশেষ টেকনোলোজি দরকার।
ধরুন আপনি বিগ ডেটা প্রসেস করবেন, কিন্তু তাঁর জন্য কিছু টুলস ব্যবহার করতে হবে আর সেটা হল হেডোপ
হেডোপের একটা বিশেষ সুবিধা হল এটা দিয়ে আপনি আপনার নিজস্ব সার্ভারে কাজ করতে পারবেন, আপনার নিজের ল্যাপটপ দিয়ে বিশাল পরিমাণ ডেটা প্রসেস করতে পারবেন।
আর এজন্যই বিগ ডেটা খুবই গুরুত্বপুর্ন।

......... ( 'বিগ ডেটা' নিয়ে বিস্তারিত আরো লেখা হবে )

./TheShahzada

~ First They Will Laugh, Then They Will Copy.

Alhamdulillah, I Can & I Will, Believe That.../

Share this

Related Posts

Previous
Next Post »