ইন্টারনেটেই হোক টাইম ট্রাভেল

বাস্তবিকতায় টাইম ট্রাভেল সম্ভব হোক আর না হোক, ইন্টারনেটে টাইম ট্রাভেল সম্ভব অনায়াসে । আপনি বলতে পারেন, “টাইম ট্রাভেল তো করছিই । ১০ দিন আগে ফেসবুকে আপলোড করা ছবি এখনো দেখতে পাচ্ছি ।”
কিন্তু আপনি যদি সেই ছবি ডিলেট করে দেন তাহলে? তখন কি ওই ছবিটা দেখতে পাবেন? এই অসুবিধা দূর করার জন্য হাজির আছে ইন্টারনেটের সত্যিকারের টাইম মেশিন । আর্কাইভ.অর্গ এর WAYBACK MACHINE ।
আক্ষরিক অর্থেই এর মাধ্যমে আপনি ৩৩২ মিলিয়নেরও বেশি পুরনো ওয়েব পেজ ভিসিট করতে পারবেন । চমৎকার এই সাইটটি আপনাকে সাহায্য করতে পারবে বিভিন্নভাবে ।

ইতিহাসের কিছুটা

Wayback Machine এর যাত্রা শুরু হয়েছিলো ১৯৯৬ সালে Brewster Kahle এবং Bruce Gilliat এর হাত ধরে । পাঁচ বছর ধরে তাদের দল বিভিন্ন ওয়েবপেইজ সংরক্ষণ করার পর জনসাধারণের জন্য Wayback Machine কে উন্মুক্ত করে দেয় ।

উদ্দেশ্য ছিলো ইন্টারনেটে উপস্থিত সকল পাবলিক ওয়েবপেইজকে সংরক্ষণ করা । যাতে গুরুত্বপূর্ণ তথ্য সংরক্ষিত থাকে এবং সেগুলোকে ব্যবহার করা যায়। সংরক্ষিত এই ওয়েব পেইজ গুলোকে বলা হয় Three Dimensional Index ।

Wayback Machine এর নামকরনের একটি ইতিহাস রয়েছে । ৬০ এর দশকে প্রচারিত একটি কার্টুন শো The Adventure of Rocky and Bull Winkle and Friends এর একটি পর্বে কার্টুনের চরিত্রগুলো একটি টাইম মেশিন ব্যবহার করতো যেটা দিয়ে পূর্বে ঘটিত কোনো ঘটনাস্থল ভ্রমন করতে পারতো, তবে ভবিষ্যতে যাওয়া যেত না । মেশিনটির নাম ছিলো Wabac Machine। উচ্চারণ করা হত Wayback Machine(ওয়েব্যাক মেশিন) হিসেবে ।  ওয়েব্যাক মেশিনেও ভবিষ্যতের ওয়েব পেইজ ব্রাউজ করা না গেলেও অতীতের ওয়েব পেইজ ব্রাউজ করা যায় । তাই সেখান থেকেই এর নামকরণ ।

টেকনিক্যাল ডিটেইলস

এই মেশিনের সফটওয়ার এমনভাবে ডেভেলপ করা হয়েছে যে, ইন্টারনেটে উন্মুক্ত ওয়েবপেইজগুলোকে কে এটি ‘ক্রল’ করে ডাউনলোড করতে পারবে । এছাড়াও এটি উন্মুক্ত সফটওয়্যার, বুলেটিন নিউজ, সার্ভারের ডাটা ডাউনলোড করে নিজের সার্ভারে রেখে দেয় । তবে শুধুমাত্র সেসকল ডাটাকেই এটি সংরক্ষণ করে যেগুলো সবার জন্য উন্মুক্ত এবং ক্রল করা সম্ভব ।

আবার এমন নয় যে আর্কাইভ নিয়মিত সকল সাইট ক্রল করবে । কোন সাইট কখন ক্রল করা হবে সেটা সাইটের বিভিন্ন বিষয়ের উপর নির্ভর করে । কোনো সাইট ক্রল করতে মাসখানেক বা বছরও লেগে যায় । তাই অটোমেটিক ক্রল এর হিসেবে চলমান সাইটগুলোর সংরক্ষিত পেজ সবসময় হালনাগাদ হয় না । তবে যদি কোনো সাইট নিজ থেকে নিয়মিত নিজের পেজ ওয়েব্যাক মেশিনে হালনাগাদ করে তাহলে সেটির সর্বশেষ রূপ আর্কাইভে জমা থাকবে ।

এই ফিচারটি আনা হয় ২০১৩ সালে । যা Save a page নামে পরিচিত । এই ফিচারটির মাধ্যমে যে কেউ ম্যানুয়ালি সাইট অন্তর্ভুক্ত করতে পারবে । জুলাই ২০১৬ এর তথ্য অনুসারে Wayback Machine এ ১৫ পেটাবাইট (১ পেটাবাইট = ১ মিলিয়ন গিগাবাইট) ডাটা সংরক্ষণ করা হয়েছে । প্রতি সপ্তাহে প্রায় ২০ টেরাবাইট করে ডাটা যুক্ত হচ্ছে । এই সকল ডাটা সংরক্ষণ করা হয় Petabox ও Sun open storage সার্ভারে ।

ব্যবহার

ওয়েব্যাক মেশিন মূলত ব্যবহার করেন জার্নালিস্টরা এবং সাধারণ মানুষরা । পুরনো কোনো সাইট বা পুরনো তথ্য খুঁজে বের করার জন্য এটি আদর্শ একটি টুল। যেমনটা পুরোনো কাগজের পত্রিকা ঘেটে কোনো তথ্য বের করা হয় ঠিক সেভাবেই । তাছাড়া ফেসবুক, গুগল শুরুতে কেমন দেখতে ছিলো? এরকম কিছু অতীতের মজার ব্যাপার ঘেটে দেখাও সম্ভব ।

আপনার বর্তমান কোনো সাইটকে ওয়েব্যাক মেশিনে স্টোর করলে ভবিষ্যতে আপনি পুরনো সেই ব্লগ বা সাইট ভিজিট করতে পারবেন । এটি আক্ষরিক অর্থেই ভার্চুয়াল দুনিয়ার অতীতে ভ্রমন । যদি সেই সাইটের বর্তমানে কোনো অস্তিত্ব না ও থাকে তবুও আপনি সেটা দেখতে পারবেন । কিন্তু এর জন্য আপনার কোনো খরচ প্রয়োজন হবে না । ডোমেইন বলুন হোস্টিং বলুন, কোনো কিছুরই ঝামেলা নেই ।

আন্তর্জাতিক, রাজনৈতিক ব্যাপারেও বেশ কিছু সমস্যা সমাধান করা সম্ভব হয়েছে Wayback Machine এর সাহায্যে । অনলাইনে কোনো তথ্য প্রচার করে পরে সেটি সরিয়ে ভিন্ন তথ্য দিয়ে বিভ্রান্ত করার চেষ্টা করতে গিয়ে আর্কাইভের কারনে ধরা পড়েছেন অনেকেই । ফলে বড় ধরনের দুর্নীতি ও অপরাধ দমন করা গেছে ।

ক্রলিং কি?

গুগলে কিছু সার্চ করলে গুগল আপনাকে ফলাফল দেখায়, কিন্তু সেজন্য গুগলকে নিজে আগে ফলাফল বের করতে হয় । এই কাজটি করার জন্য প্রত্যেক সার্চ ইঞ্জিনের বিশেষ সফটওয়্যার রোবট রয়েছে । পুরো ওয়েবে ঘুরে বেড়ানো আর সবকিছু লিপিবদ্ধ করাটাই তাদের কাজ ।

প্রতিটি সার্চ ইঞ্জিনের প্রযুক্তি ভিন্ন, ইনডেক্স তৈরির কৌশলও ভিন্ন সার্চ ইঞ্জিনের ভাষায় এদের “স্পাইডার” বলা হয়।

এরা  ইন্টারনেটে যত ওয়েবসাইট রয়েছে সেগুলির প্রত্যেকটি লিংক প্রতিনিয়ত ভিজিট করে । প্রতিবার একটি সাইট ভিজিট করার সময় সাইটটির নতুন লিংকগুলি সংগ্রহ করে এবং নষ্ট বা ডেড লিঙ্কগুলো সার্ভার থেকে মুছে দেয়। স্পাইডার একটা নির্দিষ্ট সময় পরপর সাইটগুলোতে ঢুকে দেখে নতুন কোন পরিবর্তন এসেছে কিনা ।

স্পাইডার এর এই কাজটিকে বলা হয় ‘ক্রলিং’ । ক্রল মানে হামাগুড়ি দেয়া, বটগুলো হামাগুড়ি দেয়ার মত করে প্রবেশযোগ্য সাইটগুলোতে হামাগুড়ি দেয় । ওয়েব্যাক মেশিনের ক্রল করায় সামান্য একটু পরিবর্তন রয়েছে ।

কিভাবে ব্যবহার করবেন?

ওয়েব্যাক মেশিন

১. web.archive.org তে প্রবেশ করুন

২. সার্চ বক্সে কাঙ্খিত সাইটের এড্রেস বা নাম লিখুন ।

৩. সার্চ রেজাল্টে থাকা গোল চিহ্নিত করা তারিখগুলোর মধ্যে যেকোনো একটি ক্লিক করুন ।

এভাবেই আপনি এভেলবল সাইটগুলো দেখতে পাবেন ।

ম্যানুয়ালি ওয়েব পেইজ যুক্ত করা

Wayback Machine

১. web.archive.com এ প্রথমে প্রবেশ করুন ।

২. প্রথম পেজেই নিচের দিকে Save page now লেখার নিচে একটি টেক্সট বক্স রয়েছে । আপনি যে সাইটটি আর্কাইভে যুক্ত করতে চান সেটি এখানে লিখুন । যদি সাইটটিতে ক্রল করার অনুমতি থাকে তাহলে সেটি আর্কাইভে অন্তর্ভুক্ত হয়ে যাবে ।

উৎস : টেন মিনিট স্কুল , উইকিপিডিয়া

 

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>