কলম্বিয়া ইঞ্জিনিয়ারিংয়ের গবেষকরা ইমো নামক একটি মানুষের মতো রোবটকে অনলাইন ভিডিও অধ্যয়ন করে ঠোঁটের সাথে কথা বলার এবং গানের সমন্বয় করার প্রশিক্ষণ দিয়েছেন, যা দেখিয়েছে যে মেশিনগুলি এখন কেবল পর্যবেক্ষণের মাধ্যমে জটিল মানুষের আচরণ শিখতে পারে।
ইমো সম্পূর্ণ মানবিক দেহ নয় বরং একটি অত্যন্ত বাস্তবসম্মত রোবোটিক মুখ যা মানুষের যোগাযোগ কীভাবে হয় তা অন্বেষণ করার জন্য তৈরি করা হয়েছে। মুখটি সিলিকন ত্বক দিয়ে আবৃত এবং 26টি স্বাধীনভাবে নিয়ন্ত্রিত ফেসিয়াল মোটর দ্বারা চালিত হয় যা ঠোঁট, চোয়াল এবং গালকে নাড়া দেয়।
এই মোটরগুলি ইমোকে ২৪টি ব্যঞ্জনবর্ণ এবং ১৬টি স্বরবর্ণকে আবৃত করে এমন বিশদ মুখের আকৃতি তৈরি করতে সাহায্য করে, যা স্বাভাবিক বক্তৃতা এবং গান গাওয়ার জন্য অত্যন্ত গুরুত্বপূর্ণ। লক্ষ্য ছিল অদ্ভুত উপত্যকার প্রভাব কমানো, যেখানে রোবটগুলি প্রায় মানুষের মতো দেখায় কিন্তু তবুও অস্থির বোধ করে কারণ তাদের মুখের নড়াচড়া তাদের কণ্ঠস্বরের সাথে মেলে না।
ইমো কীভাবে মানুষের মতো ঠোঁট মেলাতে শিখেছে
শেখার প্রক্রিয়াটি ধাপে ধাপে সম্পন্ন হয়েছিল। প্রথমে, ইমো আয়নায় নিজেকে দেখার সময় তার মোটরগুলি সরানোর মাধ্যমে নিজের মুখ অন্বেষণ করেছিল। এটি সিস্টেমকে বুঝতে সাহায্য করেছিল যে মোটর কমান্ডগুলি কীভাবে মুখের আকার পরিবর্তন করে।
এরপর গবেষকরা একটি শেখার পাইপলাইন চালু করেন যা শব্দকে নড়াচড়ার সাথে সংযুক্ত করে। ইমো ঘন্টার পর ঘন্টা ইউটিউবে মানুষের কথা বলা এবং গান গাওয়ার ভিডিও দেখে, যখন একটি AI মডেল অডিও এবং দৃশ্যমান ঠোঁটের নড়াচড়ার মধ্যে সম্পর্ক বিশ্লেষণ করে।
ভাষা বা অর্থের উপর মনোযোগ দেওয়ার পরিবর্তে, সিস্টেমটি কথার কাঁচা শব্দগুলি অধ্যয়ন করেছিল। একটি ফেসিয়াল অ্যাকশন ট্রান্সফরমার সেই শেখা প্যাটার্নগুলিকে রিয়েল-টাইম মোটর কমান্ডে রূপান্তরিত করেছিল।
এই পদ্ধতির ফলে ইমো কেবল ইংরেজিতেই নয়, ফরাসি, আরবি এবং চীনা ভাষাগুলিতেও ঠোঁটের সমন্বয় করতে সক্ষম হয়েছিল, যেগুলি এটি কখনও শেখা হয়নি। একই পদ্ধতি গান গাওয়ার ক্ষেত্রেও কাজ করেছিল, যা প্রসারিত স্বরবর্ণ এবং ছন্দের পরিবর্তনের কারণে আরও কঠিন।
গবেষকরা বলছেন যে এটি গুরুত্বপূর্ণ কারণ ভবিষ্যতের রোবটদের যদি মানুষের সাথে কাজ করতে হয় তবে তাদের স্বাভাবিকভাবে যোগাযোগ করতে হবে। এই অগ্রগতি এমন সময় এসেছে যখন বাড়ি এবং কর্মক্ষেত্রে রোবটের প্রতি আগ্রহ দ্রুত বৃদ্ধি পাচ্ছে।
CES 2026- তে, সেই গতি পূর্ণরূপে প্রদর্শিত হয়েছিল, যেখানে কর্মক্ষেত্রে প্রবেশের জন্য প্রস্তুত বোস্টন ডায়নামিক্সের অ্যাটলাস হিউম্যানয়েড থেকে শুরু করে সুইচবটের গৃহ-কেন্দ্রিক রোবট যা খাবার রান্না করতে এবং আপনার কাপড় ধোয়ার কাজ করতে পারে এবং দৈনন্দিন জীবনকে সহজ করার জন্য ডিজাইন করা LG-এর আসন্ন হোম অ্যাসিস্ট্যান্ট রোবট পর্যন্ত ডেমো দেখানো হয়েছিল।
কৃত্রিম ত্বকের মতো অগ্রগতি যা রোবটদের মানুষের মতো সংবেদনশীলতা দেয় এবং বাস্তবসম্মত ঠোঁটের সমন্বয়ের সাথে যুক্ত করে, এটি সহজেই বোঝা যায় যে রোবটগুলি কীভাবে মেশিনের মতো কম এবং সামাজিক সঙ্গীর মতো বেশি অনুভব করতে শুরু করেছে। ইমো এখনও একটি গবেষণা প্রকল্প, তবে এটি দেখায় যে কীভাবে রোবটরা একদিন মানুষের দক্ষতা শিখতে পারে যেমন আমরা দেখি এবং শুনে।
"এই রোবটটি ইউটিউব দেখে মানুষের মতো ঠোঁট মেলাতে শিখেছে" পোস্টটি প্রথম ডিজিটাল ট্রেন্ডসে প্রকাশিত হয়েছিল।
