আপনি কি কম্পিউটার গেমস খেলতে পছন্দ করেন? আপনি কি আরো বেশী পছন্দ করেন যখন সেই গেমসটির প্রধান চরিত্রে আপনার মতই একজনকে দেখায়? আর সেই চরিত্রটির সময়ের সাথে সাথে আপনার নিজের মত পরিবর্তন কি আপনার খুব বেশী পছন্দের? এর সবগুলো প্রশ্নের উত্তর যদি হয় হ্যাঁ তাহলে একটি ছোট্ট গণিত আপনার বেশ কাজে দিবে। এবছরেই Cambridge Science Festival এ Cambridge Image Analysis Group এর গণিতজ্ঞরা এমন একটি সফটওয়্যার প্রদর্শন করেন যেটি ফেস ফিউশন(Face Fusion) ঘটাতে পারে। এতে যদি আপনি আপনার যদি আপলোড করুন এবং অন্য কারো আরেকটি ছবি আপলোড করুন তাহলে এটি অতি নিখুঁত ভাবে দুটি ছবির সংমিশ্রণ ঘটাবে। আর এই সংমিশ্রণের ফলে নতুন আরেকটি ছবি বেড়িয়ে আসবে যেটি দুয়ের মিশ্রনে তৈরী।
এই ফিউশন বা মিশ্রণের ধারনা জন্মে গানের মিউজিক গুলোকে একসাথে মিশ্রন করা থেকে। যখন গানে ট্র্যাক গুলোকে একত্রে মিশ্রণ করা হয় তখন equalizer ব্যবহার করে আলাদা আলাদা শব্দের ফ্রিকুয়েন্সি গুলোর সমন্বয় করা হয়। ছবির ক্ষেত্রে বিষয়টা কিছুটা ভিন্ন ধরনের কারণ এটির স্বতন্ত্র কোন ফিকুয়েন্সি নেই। তবে খুশির খবর হচ্ছে, ছবি গুলোর নিজস্ব একটি কাঠামো থাকে। একটু উদাহরন দিয়ে বলি সকল মানুষের মুখের গড়ন কিন্তু এক নয়, সেই সাথে বিভিন্ন জনের মুখে বিভিন্ন সূক্ষ্ম সূক্ষ্ম দাগ বা কুঞ্চন রয়েছে। আর সেটাই মিউজিকের বিট বা ফিকুয়েন্সির মত কাজ করে। এখন যদি আপনার কাছে দুটি আইসোলেটেড উপাদান থাকে তাহলে খুব সহজেই তাদের কুঞ্চন গুলো সরিয়ে বা মিশ্রন করে নতুন আরেকটি উপাদান তৈরী করতে পারবেন। অথবা একজন ব্যক্তির মুখের সামন্য অংশ এবং অন্যজনের সামন্য অংশ জুড়ে দিয়ে নতুন একজনকে পেতে পারেন। তবে এর সব কিছুই গাণিতিকভাবে করা সম্ভব কারণ প্রতিস্থাপন এবং সংমিশ্রণের ধারনা জন্ম নেয় এই গণিত থেকেই।
মুখচ্ছবি সংমিশ্রণ বা সংযোজনের মুলে যে সমীকরণটি কাজ করে তাহচ্ছে বিভক্তি সমীকরণ বা diffusion equation আর এই diffusion equation টি আসলে তাপের সমীকরণ হিসেবে বেশী জনপ্রিয়। এটি একটি উপাদান মাধ্যমে তাপ কিভাবে বিস্তৃত (diffuses) হয়। যেমন ধরুন একটি ধাতব রড যদি আপনি আগুনে ধরে রাখেন সেটি থেকে তাপ ধীরে ধীরে আপনার হাতে পৌছে যাবে।
এখনপ্রশ্ন আসতেই পারে তাহলে ছবির ক্ষেত্রে কিভাবে তাপ সমীকরণ কাজ করে?? উত্তর টাও খুব সহজ, ছবির বিশ্লেষণ এবং ছবির প্রক্রিয়াকরণের ক্ষেত্রে যখন আমরা তাপের সমীকরণ ব্যবহার করি তখন চারপাশে তাপ ছড়িয়ে যায় না, তবে ছবিটির বিভিন্ন পিক্সেল থেকে তথ্য ছড়িয়ে পরে। তবে ছবির ক্ষেত্রে ব্যবহৃত এই বিভেদ সমীকরণটি তাপের ক্ষেত্রে ব্যবহৃত সমীকরণের তুলনায় কিছুটা জটিল। কারণ ছবিটির বিশেষ বৈশিষ্ট্যগুলোও এখানে সংরক্ষিত হয়। বিশেষ করে মুখের সামগ্রিক আকৃতি। “তাই ছবি সংমিশ্রণেরর ক্ষেত্রে এই সমীকরণটি total variation (TV) সমীকরণ হিসেবে পরিচিতি পাবে। যা সেই বিভেদ সমীকরণেরর প্রতিনিধি হিসেবে কাজ করবে “বলে জানায় গবেষক দলটি।
উপরের চিত্রের ন্যায় TV সমীকরন প্রয়োগের সাথে সাথে ছবিটি দ্রুত ঝাপসা হতে শুরু করে ছবিগুলোর পিক্সেল বিবরণ সরানোর সাথে সাথে এটি আরো ঝাপসা হয়ে উঠে। একটা সময় পরে এটি বেশ ঝাপসা হয়ে যায়। এখন কথা হচ্ছে এখানে গণিত কোথায়? যেহেতু ছবি গুলো ঝাপসা করার ক্ষেত্রে আমরা টিভি সমীকরণ ব্যবহার করছি সেক্ষেত্রে আমরা সময়ের সাথে টিভি প্রবাহের পরিবর্তন আমরা নির্ণয় করতে পারি। এছাড়াও ছবি গুলোর সাথে টিভি প্রবাহের কাজ করা ধরন এবং এর বিস্তারিত কাঠামো ( সুক্ষ্ম বা মোটা) কিভাবে প্রবাহে সাড়া দেয় তা নির্ণয় সম্ভব। যা এই প্রবাহটিকে সনাক্ত এবং সংরক্ষণ করতে সহযোগীতা করে এতে করে প্রবাহটির যে কোন ছবি আপনি চাইলেই সংরক্ষণ করতে পারবেন। তাদের পৃথক করার জন্য একটি গাণিতিক টুলও ব্যবহার করা হয়েছে।
এই চিত্রটিতে দেখানো হয়ে একটি ক্রম থেকে আমরা কোন ছবিটিকে বেছে নিবো এখানে শেষের টি বেছে নেওয়া হয়েছে। চাইলে অন্যটিও নিতে পারেন আপনি। একবার এই উপাদানগুলোকে পৃথক করা হয়ে গেলে গানের equalizer এর মতই স্বতন্ত্র সুর তৈরীর মত করেই ছবি গুলোর স্বতন্ত্র সুক্ষ্ম ব্যবহার করতে পারবেন। টিভি ট্রান্সফারের পিছনের গণিতটি গাণিতিকভাবে প্রক্রিয়াকরণের পিছনে সুর প্রক্রিয়াকরণের ভুমিকা অনেক। কারণ সুর প্রক্রিয়াকরণ থেকে অনুপ্রাণিত হয়েছিল এবং এর ফলে একটি শক্তিশালী হাতিয়ার হিসেবে আবির্ভূত হয়েছে এই সমীকরণটি। তবে এখন সময় কিছু ফেস ফিউশন করার। আপনি প্রস্তুত তো?
ধরুন আপনি রোনাল্ড রিগানের এবং বারাক ওবামার মুখের একটা মিশ্রণ করবেন যেখানে দুজনের বৈশিষ্ট্যই প্রকাশিত হবে। তার জন্য আপনাকে গাণিতিক ভাবে ওবামার মুখের অনেক স্ট্রাকচার মুছে দিতে হবে বা তুলে ফেলতে হবে। যার ফলে আপনি ওবামার একটা ব্যাকগ্রাউন্ড ফেস পাবেন। আপনি কি ধরনের ইফেক্ট প্রদান করবেন তার উপর নির্ভর করে আপনি ওবামার কিছু কিছু জিনিস যেমন, চোখ, মুখ এবং চুল, অপরিবর্তিত রেখে বাকি অংশ গুলো মুছে ফেলতে পারেন। এতে করে এটা নিশ্চিত করবে এটি ওবামারই মুখ। এখন TV সমীকরণ ব্যবহার করে আপনি রিগানের মুখ থেকে সূক্ষ্ম এবং মাঝারি স্তরের কাঠামোকে আলাদা করে দিন, যেমন তার কুঞ্চন এবং ফোলা গালের অংশ। এখন দুটো ছবিকে গাণিতিক ভাবে একত্রে জুড়ে দিলেই পেয়ে যাবেন নতুন ওবামা কে।
একইভাবে, আপনি একটি ব্যাকগ্রাউন্ড রিগান দিয়ে শুরু করতে পারেন এবং ওবামার মাঝারি মাত্রার বৈশিষ্ট্যগুলিকে আরোপ করতে পারেন। এখন দুইটির মধ্যে কোনটিকে ভাল দেখাচ্ছে?? রোনাল্ড ওবামা নাকি বারাক রিগান সিদ্ধান্তটা নিতে হবে আপনাকেই। এখন ধারনা করা হচ্ছে গাণিতিক ভাবে ফেস ফিউশন প্রযুক্তিটি ভবিষতে বেশ বিস্তৃতি লাভ করবে। এটি ব্যবহৃত হতে পারে কম্পিউটা গেইমিং এমনকি সিনেমা শিল্পেও। পরবর্তী কয়েক বছরে হয়ত কম্পিউটারের অনেক গ্রাফিক্স দেখেই আপনি চমকে যেতে পারেন। তবে মনে না হলেও সত্যটি হচ্ছে এটা গণিতেরই দান। গণিতের প্রতি আপনার শ্রদ্ধাটা আরো কয়েক গুন বেড়ে যেতে পারে যদি আপনি ক্যামব্রিজ সাইন্স ফেস্টিভ্যালের Maths Public Open day তে Centre for Mathematical Sciences এর Face Fusion এর সফটওয়্যার নিয়ে ভিডিও গুলো দেখেন।