এমবডিড ইন্টেলিজেন্স কোম্পানি ইন্ডিপেন্ডেন্ট ভ্যারিয়েবল তাদের রোবট মডেল ওয়াল-বি (WALL-B) বাজারে আনে, যেটি ৩৫ দিন পর একটি আসল বাড়িতে প্রবেশ করে।

গত সপ্তাহান্তে বেইজিংয়ের ইঝুয়াং-এ অনুষ্ঠিত রোবট ম্যারাথন একটি বিষয় প্রমাণ করেছে: দ্রুততম হিউম্যানয়েড রোবট এখন এমনকি শীর্ষ মানব ম্যারাথন দৌড়বিদদেরও পেছনে ফেলতে পারে। তবে, এই ঘটনাটি তেমন আলোড়ন সৃষ্টি না করার কারণ হলো, রোবট বা মূর্ত বুদ্ধিমত্তা শিল্প নিয়ে মানুষের প্রত্যাশা অনেক বেশি।

অনারের হিউম্যানয়েড রোবট মাত্র ৫০ মিনিটে একটি হাফ ম্যারাথন সম্পন্ন করেছে, এবং ইউশুর রোবট বসন্ত উৎসবের মঞ্চে এমন সব মার্শাল আর্টের কৌশল প্রদর্শন করতে পারে যা মানুষের পক্ষে করা অত্যন্ত কঠিন। তাদের কাছ থেকে এমনটাই প্রত্যাশিত বলে মনে হয়। তাছাড়া, মানুষের মনে এখনও প্রশ্ন রয়েছে: দেহধারী বুদ্ধিমান রোবটদের কি এই ধরনের কাজ করা বন্ধ করে থালাবাসন ধোয়া, কাপড় গুছিয়ে ভাঁজ করা এবং মেঝে ঝাড়ু দেওয়ার মতো কিছু আসল কাজ করা উচিত নয়?

কিন্তু সাধারণ মানুষের পক্ষে করা সম্ভব এমন এই গৃহস্থালির কাজগুলো ম্যারাথন দৌড়ানো বা মার্শাল আর্টের কৌশল প্রদর্শনের চেয়ে অনেক বেশি কঠিন, এবং কারখানার অ্যাসেম্বলি লাইনে কাজ করার চেয়েও অনেক বেশি কঠিন।

রোবট কবে সত্যি সত্যি মানুষকে তাদের বাড়ির অগোছালো অবস্থা পরিষ্কার করতে সাহায্য করবে? ২১শে এপ্রিল, ইন্ডিপেন্ডেন্ট ভ্যারিয়েবল রোবটস একটি সংবাদ সম্মেলনের মাধ্যমে আনুষ্ঠানিকভাবে তাদের নতুন প্রজন্মের এমবডিড ইন্টেলিজেন্স বেসিক মডেল, WALL-B, উন্মোচন করেছে এবং ঘোষণা করেছে যে আগামী ৩৫ দিনের মধ্যে এই মডেল দ্বারা সজ্জিত নতুন প্রজন্মের রোবটগুলো প্রথম ব্যাচে বাস্তব বাড়িগুলোতে প্রবেশ করবে।

এই সংস্থাটি বিশ্বাস করে যে রোবটিক্স শিল্পের আসল ক্ষেত্র মঞ্চে বা গবেষণাগারে নয়, বরং বাড়িতেই। বাড়ির পরিবেশ কারখানার পরিবেশের চেয়ে অনেক বেশি জটিল ও অপ্রত্যাশিত, এমনকি কোনো প্রকাশ্য প্রদর্শনীর চেয়েও বেশি: চপ্পল সোফার নিচে লাথি মেরে ফেলে দেওয়া হতে পারে, একটি শিশু তার ব্যাগ মেঝেতে ছুঁড়ে ফেলতে পারে, একটি বিড়াল খাবার টেবিলে লাফিয়ে উঠতে পারে, এবং সদ্য মোছা মেঝেতে এক গ্লাস জল পড়ে যেতে পারে। আপাতদৃষ্টিতে এই তুচ্ছ বিষয়গুলোই হলো সবচেয়ে কঠিন সমস্যা যা রোবটদের এখনও সমাধান করতে হবে।

কেন আমাদের রোবট মডেলটি WALL-A থেকে WALL-B তে পুনরায় লিখতে হবে?

সংবাদ সম্মেলনে, ইন্ডিপেন্ডেন্ট ভ্যারিয়েবল-এর প্রতিষ্ঠাতা ও সিইও ওয়াং কিয়ান একটি সাধারণ সকালের ঘটনা দিয়ে শুরু করেন: "সকাল সাতটায় অ্যালার্ম ঘড়িটা বেজে উঠল। আপনি বসার ঘরে ঢুকে দেখলেন যে আপনার চপ্পলগুলো নেই, রান্নাঘরের থালাবাসন ধোয়া হয়নি, আপনার সন্তানের স্কুলব্যাগটি মেঝেতে পড়ে আছে এবং বিড়ালটি এক গ্লাস জল ফেলে দিয়েছে।"

এই বর্ণনার মূল ধারণাটি হলো, পরিবার একটি এলোমেলো, খণ্ডিত এবং ক্রমাগত পরিবর্তনশীল পরিবেশ।

অতীতে, রোবটের সক্ষমতার বেশিরভাগ প্রদর্শনী এমন পরিস্থিতিতে অনুষ্ঠিত হতো না। ব্যাকফ্লিপ, ক্যালিগ্রাফি এবং মঞ্চে নাচ মূলত পূর্বনির্ধারিত গতিপথ এবং নির্দিষ্ট গতি পদ্ধতির উপর নির্ভর করে; অন্যদিকে কারখানার শিল্প রোবটগুলো উচ্চ পুনরাবৃত্তি এবং কম পরিবর্তনশীলতা সহ একটি প্রমিত পরিবেশে তৈরি করা হয়।

কিন্তু পরিবার ব্যাপারটা ঠিক উল্টো। প্রতিটি কাজই ভিন্ন হতে পারে, যেকোনো বাধা অপ্রত্যাশিতভাবে এসে পড়তে পারে, এবং প্রতি মুহূর্তে নতুন নতুন পরিস্থিতি এসে যোগ হতে পারে।

স্বাধীন চলকটি এই যুক্তি দেয় যে, রোবটিক্স শিল্পের বর্তমান প্রতিবন্ধকতা আর হার্ডওয়্যার নিজে নয়, বরং এর "মস্তিষ্ক"। দ্বিপদ গমন, নিপুণ হাত এবং বল-নিয়ন্ত্রিত সন্ধি—এই সবই দ্রুত উন্নত হচ্ছে, কিন্তু পরিবেশ বোঝা, ঝুঁকি মূল্যায়ন করা, দুর্ঘটনা সামলানো এবং ক্রমাগত শেখাই রোবটদের ঘরে প্রবেশের আগে সবচেয়ে বড় বাধা হয়ে রয়েছে।

ইন্ডিপেন্ডেন্ট ভ্যারিয়েবল পূর্বে প্রথম প্রজন্মের এমবডিড মডেল WALL-A চালু করেছিল, যা শিল্পে প্রচলিত VLA (ভিজ্যুয়াল-ল্যাঙ্গুয়েজ-মোশন) আর্কিটেকচার গ্রহণ করে।

এই ধরনের মডেলের মূল যুক্তিটি হলো:

ক্যামেরা কিছু একটা দেখে (V, দৃষ্টি)।
মডেলটি ভাষার নির্দেশাবলী (L) বোঝে।
কাজটি সম্পাদন করার জন্য কর্মের গতিপথ পুনরায় তৈরি করুন (A, Action)।

কথাটা যুক্তিসঙ্গত শোনালেও, সমস্যাটিও সুস্পষ্ট: এই সক্ষমতাগুলো প্রায়শই বিভিন্ন মডিউল থেকে আসে এবং তারপর সেগুলোকে একত্রিত করা হয়।

ইন্ডিপেন্ডেন্ট ভ্যারিয়েবল-এর সহ-প্রতিষ্ঠাতা এবং সিটিও ওয়াং হাও ব্যাখ্যা করেছেন:

দৃষ্টি মডিউল বস্তু শনাক্ত করার দায়িত্বে থাকে, ভাষা মডিউল নির্দেশনা বোঝে এবং কর্ম মডিউল গতিপথ তৈরি করে। মডিউলগুলোর মধ্যে ধাপে ধাপে তথ্য আদান-প্রদান হয় এবং প্রতিবার সীমানা অতিক্রম করার সময় তথ্যের ক্ষতি ও বিলম্ব ঘটে।

আরও গুরুত্বপূর্ণ বিষয় হলো, এই মডেলগুলো অনুকরণে পারদর্শী হলেও জগৎকে পুরোপুরি বোঝে না। একটি রোবট ‘কাপ তুলতে’ শিখতে পারে, কিন্তু কাপটি কেন পড়ে যায় তা হয়তো জানে না; সে টেবিলে প্লেট রাখতে জানে, কিন্তু প্লেটের অর্ধেক অংশ বাতাসে ঝুলে থাকার অর্থ যে সেটি ভেঙে যেতে চলেছে, তা হয়তো জানে না।

এই কারণেই WALL-B-এরও উদ্ভব হয়েছে। সহজ ভাষায় বলতে গেলে, এর লক্ষ্য হলো রোবটদেরকে খণ্ড খণ্ড চিন্তাভাবনার ঊর্ধ্বে নিয়ে গিয়ে একটি একীভূত সত্তা হিসেবে উপলব্ধি ও কাজ করতে সক্ষম করা। এর আনুষ্ঠানিক উপমা হলো অ্যাপল সিলিকনের ইউনিফাইড মেমোরি আর্কিটেকচার। পূর্বে সিপিইউ, জিপিইউ এবং মেমোরি ছিল স্বাধীন, এবং ডেটা স্থানান্তর নিজেই কর্মদক্ষতা কমিয়ে দিত; একটি ইউনিফাইড আর্কিটেকচারের মাধ্যমে সমস্ত ক্ষমতা একই রিসোর্স ব্যবহার করে, যার ফলে পারফরম্যান্সে উল্লেখযোগ্য উন্নতি ঘটে।

রোবটরাও একই ধরনের যুক্তিতে কাজ করে।

WUM (ওয়ার্ল্ড ইউনিফাইড মডেল আর্কিটেকচার) আর্কিটেকচারের অধীনে, দৃষ্টি, ভাষা, গতি, স্পর্শ এবং ভৌত পূর্বাভাসের মতো ক্ষমতাগুলোকে আলাদাভাবে প্রশিক্ষণ দিয়ে পরে একত্রিত করার পরিবর্তে একই নেটওয়ার্কে একসাথে প্রশিক্ষণ দেওয়া হয়। এটি কিছু গুরুত্বপূর্ণ পরিবর্তন নিয়ে আসে। প্রচলিত রোবটগুলো প্রায়শই "প্রথমে শনাক্ত করে, তারপর কাজ করে," যেখানে WALL-B-এর লক্ষ্য হলো উপলব্ধি এবং সিদ্ধান্ত গ্রহণ একই সাথে সম্পন্ন করা।

স্বাধীন চলকটিকে মডেল বলা হয়। প্রশিক্ষণের প্রথম দিন থেকেই ‘বহুমাত্রিক ইনপুট ও বহুমাত্রিক আউটপুট’ অর্জনের জন্য চাক্ষুষ, শ্রবণীয়, ভাষাগত, স্পর্শীয় এবং গতি সংক্রান্ত ডেটা একযোগে ব্যবহার করা হয়। সহজ কথায়: কাপটি দেখার মুহূর্তেই এটি হিসাব করতে শুরু করে যে কীভাবে তা ধরবে; যখন এটি ওজন অনুভব করে, তখন সেই অনুযায়ী নিজের শক্তি সমন্বয় করে।

ওয়াং হাও বলেছেন যে, মডেলটি মহাকর্ষ, জড়তা, ঘর্ষণ এবং বেগের মতো মৌলিক ভৌত নিয়মগুলো শিখতে শুরু করেছে। উদাহরণস্বরূপ, যদি একটি টেবিলের কিনারায় একটি আধা-ঝুলন্ত প্লেট থাকে, রোবটটি আগে কখনও এই নির্দিষ্ট পরিস্থিতি না দেখলেও, এটি অনুমান করতে পারে যে প্লেটটি পড়ে যেতে পারে এবং সেই অনুযায়ী সক্রিয়ভাবে এটিকে একটি নিরাপদ অবস্থানে ঠেলে দিতে পারে। এর মানে হলো, ভবিষ্যতে প্রতিটি বাড়ির জন্য রোবটকে নতুন করে প্রশিক্ষণ দেওয়ার প্রয়োজন হবে না, কারণ ঘরের বিন্যাস ভিন্ন হলেও ভৌত নিয়মগুলো একই থাকে।

অতীতে, অনেক রোবট কোনো কাজে ব্যর্থ হওয়ার পর তা সম্পাদন করা বন্ধ করে দিত এবং মানুষের হস্তক্ষেপের জন্য অপেক্ষা করত। WALL-B-এর ধারণাটি হলো, ব্যর্থতার পর পুনরায় চেষ্টা করা এবং সফল হলে সেই অভিজ্ঞতা সরাসরি মডেলের মধ্যে অন্তর্ভুক্ত করা। ওয়াং হাও এই প্রক্রিয়াটিকে মানুষের চপস্টিক ব্যবহার শেখার সাথে তুলনা করেছেন:

চপস্টিকগুলো অসংখ্যবার হাত থেকে পড়ে গিয়েছিল, কিন্তু প্রতিটি ব্যর্থতা আমাকে আমার নিয়ন্ত্রণ পদ্ধতি পরিমার্জন করতে সাহায্য করেছিল এবং অবশেষে আমি একটি স্থিতিশীল দক্ষতা অর্জন করি।

যদি এই কৌশলটি সত্যিই কাজ করে, তবে রোবটের পুনরাবৃত্তির গতি আর সম্পূর্ণরূপে পরীক্ষাগারের প্রশিক্ষণের উপর নির্ভর করবে না, বরং বাস্তব জগৎ থেকে প্রাপ্ত অবিচ্ছিন্ন প্রতিক্রিয়ার উপর নির্ভর করবে।

৩৫ দিনের মধ্যে রোবটটি সত্যিই ব্যবহারকারীর বাড়িতে বসবাস করবে।

প্রশিক্ষণ ডেটার ক্ষেত্রে, স্বাধীন চলকগুলোকে খুব সুস্পষ্টভাবে বর্ণনা করা হয়েছে: পরীক্ষাগারের ডেটা হলো 'চিনির পানির' মতো, আর বাস্তব পারিবারিক ডেটা হলো 'দুধের' মতো। প্রথমটি পরিষ্কার, স্থিতিশীল এবং প্রচুর পরিমাণে পাওয়া যায়, কিন্তু এর পুষ্টিগুণ সীমিত; দ্বিতীয়টি জটিল ও কোলাহলপূর্ণ, কিন্তু এটি বাস্তব জগতের বেশি কাছাকাছি।

ওয়াং হাও প্রকাশ করেছেন যে এই তথ্য সংগ্রহের জন্য, দলটি পরিবেশগত নমুনা সংগ্রহ করতে শত শত স্বেচ্ছাসেবকের বাড়িতে প্রবেশ করেছিল। তাছাড়া, প্রতিটি বাড়িই ছিল ভিন্ন: উষ্ণতা ও শীতলতার দিক থেকে আলোর ভিন্নতা ছিল, মেঝের উপাদান ছিল আলাদা, খেলনা ও চপ্পল যেখানে-সেখানে ছড়ানো-ছিটানো থাকত, বিড়ালরা হঠাৎ টেবিলের উপর লাফিয়ে উঠত, এবং শিশুরা নতুন করে বিশৃঙ্খলা সৃষ্টি করত…

এই পরিবর্তনশীল বিষয়গুলো পরীক্ষাগারে পুরোপুরি অনুকরণ করা কঠিন, কিন্তু এগুলো এমন বাস্তবতা যা ঘরে প্রবেশের পর রোবটদের প্রতিদিন মোকাবেলা করতে হবে।

মূর্ত বুদ্ধিমত্তা শিল্পে এটিও একটি নতুন ঐকমত্য হিসেবে উঠে আসছে: যার কাছে বাস্তব-জগতের পরিস্থিতি সম্পর্কিত ডেটা থাকবে, তার দীর্ঘমেয়াদী প্রতিযোগিতামূলক সুবিধা অর্জনের সম্ভাবনা বেশি। মডেল প্রকাশের চেয়েও বেশি সুনির্দিষ্ট হলো স্বাধীন চলকগুলো দ্বারা প্রদত্ত সময়সীমা। এই সংস্থাটি ঘোষণা করেছে যে ৩৫ দিনের মধ্যে, পরবর্তী প্রজন্মের রোবটটি প্রথম ব্যবহারকারীদের বাড়িতে প্রবেশ করবে। এর অর্থ হলো, এটি এখন আর শুধু একটি ডেমো ইউনিট বা একটি সীমাবদ্ধ পরীক্ষার যন্ত্র নয়, বরং সত্যিকার অর্থেই গ্রাহক-কেন্দ্রিক পরিবেশে এর ব্যবহার শুরু হচ্ছে।

অবশ্যই, স্বাধীন চলকটি পরিস্থিতিকে নিখুঁত হিসেবে তুলে ধরে না। ওয়াং ছিয়ান অকপটে স্বীকার করেন যে রোবটটি বর্তমানে এখনও তার "ইন্টার্নশিপ পর্যায়ে" রয়েছে। এটি ভুল করবে, হয়তো রান্নাঘরে চপ্পল রেখে দেবে, বা টেবিল মোছার মাঝপথে থেমে চিন্তা করবে, এবং এর এখনও দূরবর্তী সহায়তার প্রয়োজন হয়। কিন্তু অন্যদিকে, এটি দিনে ২৪ ঘণ্টা একটানা কাজ করতে পারে এবং দৈনন্দিন কার্যক্রমে নতুন অভিজ্ঞতা সঞ্চয় করতে পারে। "পরিপূর্ণতা লাভের পাশাপাশি সেবা প্রদান"-এর এই যুক্তিটি আজকের সফটওয়্যার পণ্যের পুনরাবৃত্তিমূলক পদ্ধতির সাথে অনেকটাই সাদৃশ্যপূর্ণ, শুধু পার্থক্য এই যে, এক্ষেত্রে বাহক হলো একটি রোবট।

সাম্প্রতিক বছরগুলোতে রোবটিক্স শিল্প চমকপ্রদ মুহূর্ত তৈরিতে পারদর্শিতা দেখিয়েছে। কিন্তু যে পণ্যগুলো সত্যিই জীবন বদলে দেয়, সেগুলো প্রায়শই সবচেয়ে চিত্তাকর্ষক পারফর্মার হয় না, বরং সেগুলোই হয় যা সাধারণ সমস্যাগুলোর সেরা সমাধান করে।

ইন্ডিপেন্ডেন্ট ভ্যারিয়েবল কর্তৃক WALL-B-এর উন্মোচন মূলত একটি আরও বাস্তবসম্মত প্রশ্নের উত্তর দিচ্ছে: ভবিষ্যৎ নিয়ে কথা বলার আগে রোবটরা কি প্রথমে গৃহস্থালীর কাজ করতে পারবে?

৩৫ দিনের মধ্যে প্রথম ব্যাচের ব্যবহারকারীদের ড্রয়িংরুমে উত্তরগুলো আসতে শুরু করবে।

লিউ জুয়েন

পরিস্থিতি স্থিতিশীল এবং উন্নত হচ্ছে।

ইমেইল সিনা ওয়েইবো ১

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।