হাঁটতে হাঁটতে ঘরের কাজ করতে পারে এমন একটি রোবটের আবির্ভাব ঘটেছে এবং বসার ঘর পরিষ্কার করার তার এক শটের ভিডিওটি বিদেশে ভাইরাল হয়েছে।

বসন্ত উৎসবের অনুষ্ঠানে রোবটটি তার নানান সংগীত প্রতিভা প্রদর্শন করার পর, এর পরের ঘটনা কল্পনা না করে পারা যায় না: তাড়াতাড়ি করো, এই কিংবদন্তী গৃহকর্মের রোবটটি কি আরও দ্রুত কাজ করতে পারবে?

এই মার্চে, হিউম্যানয়েড রোবট কোম্পানি ফিগার একটি নতুন ভিডিও প্রকাশ করেছে, যেটিতে নাচ বা ডিগবাজি ছিল না; এতে কেবল তাদের গৃহকর্মের দক্ষতা প্রদর্শন করা হয়েছে।

একটি ফিগার ০৩ রোবট একটি অগোছালো বসার ঘরে প্রবেশ করে, চারদিকে তাকায় এবং তারপর কাজ শুরু করে: মেঝে থেকে খেলনা তুলে একটি স্টোরেজ বাক্সে রাখে, কফি টেবিলে স্প্রে করে তোয়ালে দিয়ে তা মুছে পরিষ্কার করে, সোফার কুশনগুলো ফুলিয়ে যথাস্থানে ফিরিয়ে রাখে, এমনকি রিমোট তুলে নিয়ে টিভি বন্ধ করার জন্য পাওয়ার বাটনও টিপে দেয়। পুরো প্রক্রিয়াটি কোনো মানুষের নির্দেশ বা রিমোট কন্ট্রোলের ব্যবহার ছাড়াই সম্পন্ন হয় এবং এটি একটি অবিচ্ছিন্ন শটে ধারণ করা হয়েছে।

ভিডিওটি দ্রুত সোশ্যাল মিডিয়ায় ভাইরাল হয়ে যায়। বিভিন্ন ‘কুল’ রোবট ডেমোর তুলনায় এটি খুবই সাধারণ কিছু কাজ করে—এমন সব কাজ যা আপনি প্রতিদিন বাড়ি ফিরে করতে চান না, কিন্তু তবুও করতে বাধ্য হন।

ফিগার ঠিক এই বার্তাটাই দিতে চায়।

এটা নতুন হার্ডওয়্যার নয়, এটা একটি নতুন 'মস্তিষ্ক'।

উল্লেখ্য যে, ফিগার কোনো নতুন রোবট বাজারে আনছে না; এর হার্ডওয়্যার হিসেবে গত অক্টোবরে প্রকাশিত ফিগার ০৩-ই থাকছে। এই আপগ্রেডটি এসেছে হেলিক্স নামক একটি সম্পূর্ণ নতুন এআই কন্ট্রোল সিস্টেম থেকে।

হেলিক্স ০২-এর মূল যুগান্তকারী উদ্ভাবনটি একটি ধারণার মধ্যে নিহিত: সম্পূর্ণ শারীরিক স্বায়ত্তশাসন। ফিগারের নিজস্ব পূর্ববর্তী প্রজন্মের সিস্টেম হেলিক্স সহ আগের হিউম্যানয়েড রোবটগুলো মূলত কেবল শরীরের উপরের অংশ নিয়ন্ত্রণ করতে পারত; স্থিরভাবে দাঁড়াতে পারা এবং কোনো কিছুর জন্য হাত বাড়াতে পারাকেই যথেষ্ট বলে মনে করা হতো। নড়াচড়া করার সময়, সিস্টেমটিকে প্রথমে তার হাতের নড়াচড়া বন্ধ করতে, শরীরকে স্থির করতে, এক পা ফেলতে, আবার থামতে এবং তারপরে পুনরায় হাত বাড়াতে হতো।

এই "হাঁটা-থামা-করা-থামা-হাঁটা" ধরনের অর্থ হলো, একটি রোবট যদি কোনো কাজ করে, তবে আপনার নিজের করার চেয়ে দশগুণ বেশি সময় লাগতে পারে, যা পুরোপুরি উল্টো কাজ করার শামিল।

হেলিক্স ০২ এই প্রক্রিয়াটিকে সম্পূর্ণরূপে সুবিন্যস্ত করেছে। এটি একই সাথে হাঁটা, ভারসাম্য রক্ষা এবং বিভিন্ন জিনিস নাড়াচাড়া নিয়ন্ত্রণ করতে একটিমাত্র নিউরাল নেটওয়ার্ক ব্যবহার করে। রোবটটি বাটি বহন করার সময় হাঁটতে পারে, হাতে কিছু ধরে রেখে কোমর দিয়ে দরজা বন্ধ করতে পারে, এমনকি হাত ব্যস্ত থাকা অবস্থায় পা দিয়ে লাথি মেরে ডিশওয়াশারের দরজাও খুলতে পারে।

গৃহকর্ম করার সময় একজন মানুষ যে সবচেয়ে স্বাভাবিক কাজটি করে, এটি তার মতোই শোনায়, কিন্তু রোবটদের জন্য এটি এমন একটি সমস্যা যা কয়েক দশক ধরে শিক্ষাজগৎ এবং শিল্পজগতকে জর্জরিত করে আসছে: লোকো-ম্যানিপুলেশন, যা হলো নড়াচড়া এবং চালনার সমন্বিত নিয়ন্ত্রণ।

এমনকি মাস্কও জিজ্ঞাসা না করে পারলেন না: এটা কি সত্যিই স্বয়ংক্রিয়?

পরিবারের জন্য ডিজাইন করা হার্ডওয়্যার

হেলিক্স ০২-এর স্থাপত্য তিনটি স্তরে বিভক্ত, যেটিকে মানুষের চিন্তাভাবনার পদ্ধতির সাথে তুলনা করা যেতে পারে:

সিস্টেম ২ (ধীর চিন্তন) শব্দার্থগত উপলব্ধির জন্য দায়ী: বসার ঘরের দিকে তাকানো, কী অগোছালো তা বিচার করা, জিনিসগুলো কোথায় রাখা উচিত এবং কোনটি আগে ও কোনটি পরে করতে হবে। এই স্তরটি 'বোঝা' এবং 'পরিকল্পনা' নিয়ে কাজ করে।

সিস্টেম ১ (দ্রুত চিন্তাভাবনা) উপলব্ধিকে কাজে পরিণত করার জন্য দায়ী: এটি দৃষ্টি, স্পর্শ এবং প্রোপ্রিওসেপশন সহ সমস্ত সেন্সর থেকে প্রাপ্ত ডেটাকে প্রতি সেকেন্ডে ২০০ বার ফ্রিকোয়েন্সিতে শরীরের সমস্ত জয়েন্টের জন্য লক্ষ্য অবস্থানে রূপান্তরিত করে। এই স্তরটি 'সিদ্ধান্ত গ্রহণ' পরিচালনা করে।

সিস্টেম ০ (স্বজ্ঞামূলক স্তর) হলো এবারের সবচেয়ে বড় সংযোজন। এটি প্রতি সেকেন্ডে ১,০০০ বার কাজ করে এবং ভারসাম্য, স্পর্শ ও সম্পূর্ণ শারীরিক সমন্বয়ের জন্য দায়ী। ফিগার এই অন্তর্নিহিত কন্ট্রোলারটিকে ১,০০০ ঘণ্টারও বেশি মানুষের গতিবিধির ডেটা এবং সিমুলেটেড পরিবেশে রিইনফোর্সমেন্ট লার্নিং ব্যবহার করে প্রশিক্ষণ দিয়েছে। ফিগারের ভাষায়, এই ১০ মিলিয়ন-প্যারামিটারের নিউরাল নেটওয়ার্কটি হাতে লেখা মূল ১,০৯,৫০৪ লাইনের C++ কোডকে প্রতিস্থাপন করেছে।

এই ত্রি-স্তরীয় কাঠামোর ফলস্বরূপ, রোবটটিকে আর পূর্ব-প্রোগ্রাম করা নির্দেশাবলী পালনকারী একটি যন্ত্রের মতো দেখায় না, বরং "গৃহস্থালীর কাজ করা" একজন মানুষের মতো মনে হয়—এর নড়াচড়া সুসংহত ও ছন্দময়, এবং এটি মাঝে মাঝে কিছু আপাতদৃষ্টিতে "বুদ্ধিদীপ্ত" তাৎক্ষণিক সিদ্ধান্তও নেয় (যেমন দাগ আছে কিনা তা পরীক্ষা করার জন্য একটি কাপ সরিয়ে রাখা)।

হেলিক্স ০২-এর কার্যক্ষমতা ফিগার ০৩ হার্ডওয়্যার প্ল্যাটফর্মের সমর্থন থেকেও অবিচ্ছেদ্যভাবে জড়িত। এই রোবটটি ৫ ফুট ৮ ইঞ্চি লম্বা (প্রায় ১৬৮ সেমি), এর ওজন ৬১ কেজি এবং এটি একবার চার্জে ৫ ঘণ্টা পর্যন্ত চলতে পারে। এর পূর্বসূরি ফিগার ০২-এর তুলনায় এতে বেশ কিছু গুরুত্বপূর্ণ পরিবর্তন আনা হয়েছে:

হাতের তালুতে লাগানো ক্যামেরা এবং স্পর্শ সংবেদী সেন্সর। প্রতিটি তালুতে একটি অন্তর্নির্মিত ওয়াইড-অ্যাঙ্গেল ক্যামেরা রয়েছে, যা মূল ক্যামেরাটি বাধাগ্রস্ত হলে (যেমন, কোনো কিছু স্পর্শ করার জন্য ক্যাবিনেটের ভেতরে হাত ঢোকানোর সময়) নিকটবর্তী দৃশ্যমান প্রতিক্রিয়া প্রদান করে। প্রতিটি আঙুলের ডগায় একটি স্পর্শ সংবেদী সেন্সর রয়েছে যা ৩ গ্রামের মতো সামান্য বলও শনাক্ত করতে সক্ষম। এর ফলে রোবটটি ছড়িয়ে ছিটিয়ে থাকা ছোট ছোট বস্তুর স্তূপ থেকে নির্ভুলভাবে একটি নির্দিষ্ট লক্ষ্যবস্তু তুলে নিতে পারে এবং এমনকি সিরিঞ্জের সাহায্যে নিখুঁতভাবে ৫ মিলিলিটার তরলও বিতরণ করতে পারে।

পুরো শরীর নরম উপাদান দিয়ে আবৃত। এটি আর কোনো ঠান্ডা, ধাতব খোলস নয়, বরং এটি একটি অপসারণযোগ্য ও ধৌতযোগ্য নরম কাপড়, যাতে চিমটি লাগার আঘাত প্রতিরোধ করার জন্য কৌশলগতভাবে বিভিন্ন ঘনত্বের ফোম স্থাপন করা হয়েছে।

ওয়্যারলেস চার্জিং। এর পায়ের তলায় একটি ইন্ডাকশন কয়েল বসানো আছে; ২ কিলোওয়াট চার্জিংয়ের জন্য শুধু চার্জিং বেসের উপর দাঁড়ালেই হবে। প্লাগ লাগানোর জন্য কোনো মানুষের হস্তক্ষেপের প্রয়োজন নেই; রোবটটি নিজে থেকেই হেঁটে চার্জিং স্টেশনে যেতে পারে।

এই বিবরণগুলো পণ্যের একটি সুস্পষ্ট অবস্থান নির্দেশ করে: চিত্র ০৩ কোনো পরীক্ষাগারের প্রোটোটাইপ নয়, বরং এটি ঘরে ব্যবহারের জন্য ডিজাইন করা একটি ভোক্তা পণ্য।

বছরের শেষে যখন এটি মুক্তি পায়, তখন ফিগার প্রদর্শনের দৃশ্য হিসেবে একটি রান্নাঘর বেছে নিয়েছিল, যেখানে রোবটটি স্বয়ংক্রিয়ভাবে ৪ মিনিট ধরে চলা একটি সম্পূর্ণ কাজ সম্পন্ন করে।

এটি ডিশওয়াশারের দিকে হেঁটে যায়, দরজা খোলে, থালা-বাসন বের করে, সেগুলো রাখার জন্য ক্যাবিনেটের দিকে হেঁটে যায়, তারপর নোংরা থালা-বাসনগুলো রাখার জন্য ফিরে আসে, দরজা বন্ধ করে এবং মেশিনটি চালু করে। সম্পূর্ণ প্রক্রিয়াটি ৬১টি ধারাবাহিক, নিরবচ্ছিন্ন গতিবিধি নিয়ে গঠিত। চিত্রটিতে এটিকে "একটি হিউম্যানয়েড রোবট দ্বারা সম্পন্ন করা এখন পর্যন্ত দীর্ঘতম এবং সবচেয়ে জটিল স্বায়ত্তশাসিত কাজ" হিসাবে বর্ণনা করা হয়েছে।

মার্চ মাসের প্রদর্শনীটি এই জটিলতাকে আরও এক ধাপ এগিয়ে নিয়ে বসার ঘরে প্রবেশ করেছিল। রান্নাঘর জটিল হলেও, সেখানে জিনিসপত্রের বিন্যাস তুলনামূলকভাবে স্থির এবং চলাচলের পথও বেশ অনুমানযোগ্য। কিন্তু বসার ঘর এমন একটি জায়গা যা প্রতিদিন পরিবর্তিত হয়।

খেলনাগুলো বিভিন্ন জায়গায় ছড়ানো-ছিটানো, সোফার কুশনগুলো নানা অবস্থায় আছে এবং কফি টেবিলের ওপর কাপের সংখ্যাও বিভিন্ন রকম। নরম জিনিসপত্রের (তোয়ালে, কুশন) শারীরিক আচরণ অপ্রত্যাশিত। আসবাবপত্রের মাঝের পথগুলো সরু, যার মধ্যে দিয়ে পাশ কাটিয়ে গলে যেতে হয়। অনেক কাজের জন্য দুটি হাতই ব্যবহার করতে হয়, আবার অন্য কিছু কাজের জন্য কাজ চলাকালীন একটি হাত সাময়িকভাবে মুক্ত রাখার প্রয়োজন হয়।

এছাড়াও, এই প্রদর্শনীতে বিভিন্ন সরঞ্জামের ব্যবহারও অন্তর্ভুক্ত ছিল—যেমন একটি স্প্রে বোতল ও মোছা, এবং রিমোট কন্ট্রোলের বোতাম—যার জন্য রোবটটিকে শুধু জিনিসটি 'কী' তা-ই নয়, বরং 'কীভাবে' তা ব্যবহার করতে হয়, সেটাও বুঝতে হতো।

চিত্রটি একটি গুরুত্বপূর্ণ বিষয় তুলে ধরে: রান্নাঘর থেকে বসার ঘর পর্যন্ত, হেলিক্স ০২ কোনো অ্যালগরিদম পরিবর্তন করেনি বা কোনো নির্দিষ্ট ইঞ্জিনিয়ারিং অপ্টিমাইজেশনও করেনি; এটি কেবল প্রশিক্ষণের ডেটা বাড়িয়েছে। একই সাধারণ কাঠামো ব্যবহার করে, এটিকে আরও ডেটা সরবরাহ করার ফলে এটি নতুন দক্ষতা শিখতে পেরেছে।

এটি একটি চমৎকার সম্ভাবনার দ্বার উন্মোচন করে: যদি বসার ঘর গোছানোর জন্য শুধু 'প্রদর্শনীটি আরও কয়েকবার দেখা'ই যথেষ্ট হয়, তাহলে শোবার ঘর গোছানো, আলমারি গোছানো, গাছে জল দেওয়া এবং বিড়ালকে খাওয়ানোর ব্যাপারে কী হবে? করার মতো অনেক কাজ আছে!

‘বাড়ির রোবটের যুগ’ কি সত্যিই এসে গেছে?

প্রথমে এর ওপর এক বালতি ঠান্ডা জল ঢালুন।

ফিগার ০৩-এর আনুমানিক মূল্য বর্তমানে ৫০,০০০ থেকে ১০০,০০০ ডলারের মধ্যে। এমনকি ফিগারের প্রস্তাবিত ‘রোবট-অ্যাজ-এ-সার্ভিস’ ব্যবসায়িক মডেল অনুযায়ী, যা প্রতি বছর প্রতিটি রোবট থেকে প্রায় ৫,০০০ ডলার আয় করে, এই মূল্য এখনও সাধারণ পরিবারের নাগালের অনেক বাইরে। তাছাড়া, প্রদর্শনী ভিডিও এবং বাস্তব বাড়ির পরিবেশের মধ্যে সবসময়ই একটি ব্যবধান থাকবে।

তাছাড়া, ভিডিওতে বসার ঘরটি দেখতে খুব ‘সাধারণ’ মনে হলেও, এটি একটি নিয়ন্ত্রিত পরিবেশ। আসল পরিবারগুলোতে পোষা প্রাণী, সন্তান, ডেলিভারির বাক্সে ঠাসা কোণ এবং তিন সপ্তাহ ধরে না ধোয়া কাপড়ের স্তূপ থাকে।

তবে, অন্য দৃষ্টিকোণ থেকে, হেলিক্স ০২-এর তাৎপর্য এর তাৎক্ষণিক প্রয়োগে নয়, বরং একটি পথের সম্ভাব্যতা প্রমাণের মধ্যে নিহিত: একটি একক সাধারণ-উদ্দেশ্যমূলক এআই আর্কিটেকচার + আরও বেশি ডেটা = আরও বেশি পারিবারিক দক্ষতা।

এটি বৃহৎ ভাষা মডেলের স্কেলিং সূত্রের অনুরূপ। ChatGPT-কে বিশেষভাবে কবিতা বা কোড লেখার জন্য প্রোগ্রাম করা হয়নি—আরও বেশি টেক্সটের উপর প্রশিক্ষিত হওয়ার মাধ্যমেই এটি এই ক্ষমতাগুলো অর্জন করেছে।

হেলিক্স ০২ একই যুক্তিকে বাস্তব জগতের ক্ষেত্রে প্রয়োগ করে দেখায়: একটি নিউরাল নেটওয়ার্ক, যাকে প্রতিটি নতুন কাজের জন্য নতুন করে ডিজাইন করার প্রয়োজন হয় না, বরং এর জন্য কেবল আরও বেশি মোশন ডেটা প্রয়োজন।

যদি এই যুক্তি সত্যি হয়, তাহলে হিউম্যানয়েড রোবটদের বিবর্তনের গতি আর প্রকৌশলীরা কত লাইন কোড লিখছেন তার উপর নির্ভর করবে না, বরং তারা কতগুলো গৃহস্থালির কাজ 'দেখতে পায়' তার উপর নির্ভর করবে। আর গৃহস্থালির কাজ থেকে তথ্য সংগ্রহ করাটাই সবচেয়ে সহজে বাড়ানো যায়—কারণ, প্রত্যেকেই প্রতিদিন তাদের বাড়িতে এই তথ্য তৈরি করে।

বটকিউ (BotQ) উৎপাদন কেন্দ্রের বর্তমান বার্ষিক উৎপাদন ক্ষমতা ১২,০০০ ইউনিট এবং আগামী চার বছরের মধ্যে মোট ১,০০,০০০ ইউনিট উৎপাদনের লক্ষ্যমাত্রা রয়েছে। পাঠানো প্রতিটি রোবটই একটি ডেটা অ্যাকুইজিশন টার্মিনাল, এবং বিভিন্ন বাড়িতে তাদের সম্মুখীন হওয়া প্রতিটি নতুন পরিস্থিতি ১০ জিবিপিএস মিলিমিটার ওয়েভ ওয়্যারলেস ট্রান্সমিশনের মাধ্যমে ফেরত পাঠানো হবে, যা হেলিক্সের (Helix) পরবর্তী সংস্করণের জন্য প্রশিক্ষণ সামগ্রী হিসেবে ব্যবহৃত হবে।

ব্রেট অ্যাডককের ভাষায়, তাদের পণ্য বাজারে ছাড়তে বাধা চাহিদা নয়—তারা আজই এক বিলিয়ন ইউনিট বিক্রি করতে পারত—বরং আসল কারণ হলো এআই এখনও যথেষ্ট সার্বজনীন নয়। তবে, হেলিক্স ০২-এর লিভিং রুম প্রদর্শনীটি তাদেরকে সেই 'সার্বজনীনতা'র লক্ষ্যের আরও এক ধাপ কাছে নিয়ে এসেছে।

নাচ থেকে শুরু করে বসার ঘর গোছানো পর্যন্ত, হেলিক্স ০২-এর নেওয়া পদক্ষেপটি হয়তো যেকোনো ব্যাকফ্লিপের চেয়েও ভবিষ্যতের বেশি কাছাকাছি। রোবটদের আর প্রমাণ করতে হবে না যে তারা কতটা দুর্দান্ত; তাদের প্রমাণ করতে হবে যে তারা কতটা উপকারী।

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।