অবিশ্বাস্য! রোবটটি অবশেষে থালা-বাসন ধোয়া শিখেছে এবং এমনকি তার নিতম্বের কব্জা ব্যবহার করে ড্রয়ারও বন্ধ করতে পারে।

কয়েক ঘন্টা আগে, ফিগার এআই হেলিক্স ০২ প্রকাশ করেছে – যাকে তারা "একটি সাধারণ দৃষ্টি-ভাষা-ক্রিয়া (VLA) মডেল" বলে।

সবচেয়ে স্বজ্ঞাত প্রদর্শন? চিত্র ০৩-এ দেখানো একটি রোবট আলমারির দিকে হেঁটে যায়, দরজা খুলে দেয়, স্তূপ থেকে একটি থালা বের করে, ঘুরে ডিশওয়াশারের দিকে হেঁটে যায়, কোণটি সামঞ্জস্য করে এবং স্থিরভাবে ভিতরে রাখে।

পুরো প্রক্রিয়াটি স্বয়ংক্রিয় ছিল, কোনও রিমোট কন্ট্রোল ছাড়াই, এবং একটিও থালা ক্ষতিগ্রস্ত হয়নি।

থালা-বাসন ধোয়া: মূর্ত বুদ্ধিমত্তার একটি "নরকীয়" পরীক্ষা

রান্নার প্রদর্শন কেন? কারণ এটি গৃহকর্মের "নরকীয় কষ্ট"।

মানুষের জন্য রান্নাঘরের বাসনপত্র সরানো সহজ, কিন্তু রোবটের জন্য, প্রতিটি জয়েন্টের নড়াচড়া একটি চ্যালেঞ্জ।

থালা-বাসন ধোয়ার ক্রিয়া শৃঙ্খল ভেঙে আমরা এটি বুঝতে পারি—

প্রথমত, এটি রোবটের পরিবেশগত স্বীকৃতি এবং স্থানিক গতিশীলতার ক্ষমতা কঠোরভাবে পরীক্ষা করে:

রোবটটিকে (এবং এটি যে মডেলটি ব্যবহার করে) তার নিজস্ব অবস্থান নির্ধারণ করতে হবে, আলমারি, সিঙ্ক এবং ডিশওয়াশারের আপেক্ষিক অবস্থান সনাক্ত করতে হবে এবং তারপরে সেখানে পৌঁছানোর জন্য একটি রুট পরিকল্পনা করতে হবে।

আলমারির কাছে পৌঁছানোর পর, তোমাকে সঠিক দূরত্বে থামতে হবে—খুব কাছে এবং দরজা খুলতে পারবে না, অনেক দূরে এবং বাটিগুলো পর্যন্ত পৌঁছাতে পারবে না।

টেবিলওয়্যার দেখার পর, আপনাকে এর ধরণও শনাক্ত করতে হবে: চীনামাটির বাসন প্লেট, কাচের কাপ এবং প্লাস্টিকের বাটি, প্রতিটির জন্য আলাদা ভঙ্গি এবং চাপ প্রয়োজন।

এটি তোলার পরে, আপনাকে এখনও ডিশওয়াশারে কোথায় রাখতে হবে তা নির্ধারণ করতে হবে: নীচের তাকে প্লেট, উপরের তাকে কাপ এবং পাশে অন্যান্য টেবিলওয়্যার।

দ্বিতীয়ত, জিয়া চু ফাং (下厨房)-এর জন্যও 3D ভিজ্যুয়াল এবং স্পর্শকাতর প্রতিক্রিয়া প্রয়োজন:

সিরামিক ভঙ্গুর, কাচ পিচ্ছিল, এবং প্লাস্টিক বিকৃত হতে পারে। বল নিয়ন্ত্রণের জন্য রোবটদের সুনির্দিষ্ট স্পর্শকাতর প্রতিক্রিয়া প্রয়োজন – খুব হালকা এবং এটি পিছলে যাবে, খুব ভারী এবং এটি ভেঙে যাবে।

হেলিক্স ০২ মডেলের সাফল্য এখানেই নিহিত।

দৃষ্টি, স্পর্শ, চাপ এবং আবেশের মতো একাধিক সেন্সর একত্রিত করে, এটিতে একটি বহুমাত্রিক স্টেরিওস্কোপিক দৃষ্টি ক্ষমতা রয়েছে যা একটি স্ট্যাকের মধ্যে বাটির অবস্থান এবং গভীরতা সঠিকভাবে নির্ধারণ করতে পারে।

চিত্র ০৩ রোবটের হাতে একটি বল প্রতিক্রিয়া প্রক্রিয়াও রয়েছে, যা এটি প্রয়োগ করা বল "চিনতে" পারে এবং কখন এটি চীনামাটির পৃষ্ঠের সংস্পর্শে আসে তা জানতে পারে।

একটি বাটি নাড়াচাড়া করার সময়, সিস্টেমটি রিয়েল টাইমে স্পর্শ বল টের পায়। বাটিটি কাত হয়ে আছে? কোণটি সামঞ্জস্য করুন। ক্যাবিনেটের দরজায় আঘাত করেছেন? একটু পিছিয়ে যান।

অবশেষে, ভিজ্যুয়াল মেমোরি আছে, যা হেলিক্স 02 মডেলের জন্য একটি প্রধান আপগ্রেড পয়েন্ট:

এর মানে হল যে রোবটটি যা দেখেছে তা মনে রাখতে পারে।

যখন আলমারিটি খোলা হয়, এমনকি যদি কোনও নির্দিষ্ট বাটি বর্তমান কোণ থেকে দৃশ্যমান না হয়, তবুও এটি কেবল এটি দেখার কথা মনে রাখে এবং সেই স্মৃতির উপর ভিত্তি করে তার নড়াচড়া সামঞ্জস্য করে।

যখন আপনি বারবার ডিশওয়াশারে থালা-বাসন রাখেন, তখন এটি মনে রাখে কোন স্লটগুলি পূর্ণ এবং কোথায় এখনও জায়গা আছে।

এটি প্রতিবার পুনরায় স্ক্যান করার প্রয়োজনীয়তা দূর করে , কর্ম সম্পাদনের দক্ষতা ব্যাপকভাবে উন্নত করে।

ফিগার এআই-এর প্রতিষ্ঠাতা এবং সিইও ব্রেট অ্যাডকক X-এর উপর জোর দিয়েছেন:

কোনও রিমোট কন্ট্রোল নেই; হেলিক্স রোবটটি পরিচালনা করে, হাঁটাচলা, ধরা থেকে শুরু করে পরিকল্পনা করা পর্যন্ত সবকিছু পরিচালনা করে।

ব্রেট অ্যাডকক আরও বলেন যে একই সাধারণ স্থাপত্য পূর্বে রোবটদের তোয়ালে ভাঁজ করতে এবং প্যাকেজগুলি সাজানোর শিক্ষা দিত, এবং এখন এটি তাদের থালা-বাসন ধোয়া শিখিয়েছে।

কোনও নতুন অ্যালগরিদম বা টাস্ক-নির্দিষ্ট ইঞ্জিনিয়ারিংয়ের প্রয়োজন নেই; কেবল নতুন ডেটা প্রয়োজন।

একমাত্র বর্তমান সীমাবদ্ধতা হল প্রাক-প্রশিক্ষণ ডেটা। আমরা হেলিক্সকে যত বেশি ডেটা সরবরাহ করব, রোবট তত বেশি কাজ পরিচালনা করতে পারবে। হার্ডওয়্যারের কোনও পরিবর্তনের প্রয়োজন নেই; এটি ইতিমধ্যেই মানুষের বেশিরভাগ কাজ সম্পাদন করতে পারে।

এই টুইটের নিচে, ব্যবহারকারী X মন্তব্য করেছেন: "একটি মানবিক রোবটকে প্রথমবারের মতো ঘরে বসে কাজ করতে দেখে আমি বুঝতে পারি যে আমরা এই ভবিষ্যতের কতটা কাছাকাছি।"

বিএমডব্লিউতে কাজ করার জন্য রোবট পাঠানো তারকা কোম্পানি

অন্যদিকে, ফিগার এআই কোনওভাবেই সেই ধরণের "সৃজনশীল কোম্পানি" নয় যারা ল্যাবে কেবল তত্ত্বের কথা বলে।

তিন বছরে, বেজোস ক্যাপিটাল, ওপেনএআই, মাইক্রোসফ্ট এবং এনভিডিয়া সহ বিনিয়োগকারীদের বিনিয়োগের জন্য ফিগার এআই-এর মূল্যায়ন $0 থেকে বেড়ে $39 বিলিয়ন হয়েছে।

২০২৪ সালের ফেব্রুয়ারিতে, ফিগার এআই ৬৭৫ মিলিয়ন ডলারের সিরিজ বি তহবিল রাউন্ড সম্পন্ন করে এবং ২০২৫ সালের সেপ্টেম্বরে, এটি ১ বিলিয়ন ডলারের সিরিজ সি রাউন্ড সম্পন্ন করে, যা অগ্রগতির একটি আশ্চর্যজনক দ্রুত গতি প্রদর্শন করে।

প্রতিষ্ঠাতা ব্রেট অ্যাডককও একজন সফল সিরিয়াল উদ্যোক্তা।

২০১৮ সালে, অ্যাডকক তার নিয়োগ প্ল্যাটফর্ম ভেটেরি ১০০ মিলিয়ন ডলারে বিক্রি করে এবং বৈদ্যুতিক বিমান কোম্পানি আর্চার এভিয়েশন প্রতিষ্ঠা করে, যা ২০২১ সালে SPAC এর মাধ্যমে প্রায় ৩.৮ বিলিয়ন ডলারের সম্মিলিত মূল্যায়নের সাথে জনসাধারণের কাছে পৌঁছে।

রোবোটিক্স ক্ষেত্রে প্রবেশের পর, অ্যাডকক বোস্টন ডায়নামিক্স, টেসলা এবং গুগল ডিপমাইন্ড থেকে বেশ কয়েকজন শীর্ষ প্রতিভা নিয়োগ করে এবং ফিগার এআই-এর প্রযুক্তিগত শক্তি দ্রুত বৃদ্ধি পায়।

▲ ব্রেট অ্যাডকক (ডানে)

এই প্রতিভা মডেলটি ফিগার এআই-কে তার সবচেয়ে স্বতন্ত্র বৈশিষ্ট্যও দেয়:

"মস্তিষ্ক" এবং "শরীর" একসাথে তৈরি, যা হার্ডওয়্যার এবং উৎপাদন ব্যবস্থা উভয়কেই নিয়ন্ত্রণ করে।

এখানে "মস্তিষ্ক" স্বাভাবিকভাবেই হেলিক্স এআইকে বোঝায়।

ওপেনএআই-এর সাথে প্রাথমিক সহযোগিতা থেকে শুরু করে বর্তমান সম্পূর্ণ স্ব-উন্নত মডেল পর্যন্ত, ফিগার এআই মডেলের বর্ণনার উপর সফলভাবে তার নিয়ন্ত্রণ সুরক্ষিত করেছে।

উদাহরণস্বরূপ, চিত্র ০৩-এর রোবটটি "সিস্টেম ০, সিস্টেম ১, সিস্টেম ২"-এর একটি বহু-স্তরযুক্ত নিয়ন্ত্রণ স্থাপত্য গ্রহণ করে—

▲ চিত্র ০৩

সিস্টেম ০ বিমানের গতি নিয়ন্ত্রণের জন্য দায়ী, বিমানের ভারসাম্য, আঙুলের স্পর্শ এবং পরিবেশগত ব্যাঘাতের মতো নিম্ন-স্তরের নিয়ন্ত্রণ সমস্যা সমাধান করে। এর কার্যকারিতা মানুষের সেরিবেলামের মতোই।

এর উপর ভিত্তি করে, সিস্টেম ১ চিত্র ০২-এর ভিজ্যুয়াল-মোটর নীতি পরিচালনা করে, যেখানে সিস্টেম ২ ভিজ্যুয়াল ভাষা মডেল পরিচালনা করে।

▲ চিত্র ০২, যা গত বছর প্রদর্শিত হয়েছিল, সিস্টেম ১+২ এর উপরের বডি মডেল ব্যবহার করেছে।

তিনটি স্তরের সহযোগিতার মাধ্যমে, চিত্র ০৩ স্বায়ত্তশাসিতভাবে নির্দেশাবলী বুঝতে, এর আশেপাশের পরিবেশ চিনতে এবং বিমানটি কীভাবে চলাচল করবে তা নির্ধারণ করতে সক্ষম হয়েছিল।

এবং "বডি" স্পষ্টতই ফিগার রোবট হার্ডওয়্যারকে বোঝায়—

চিত্র ০২-এর পূর্বে ছোট আকারের পরীক্ষামূলক উৎপাদনে ৬টি RGB ক্যামেরা, ডুয়াল GPU মডিউল, হাতে ১৬ ডিগ্রি স্বাধীনতা এবং সর্বোচ্চ ২৫ কেজি ওজন বহন করা সম্ভব।

চিত্র ০২ এর ব্যাটারি লাইফ প্রায় ৫ ঘন্টা, যা কেবল একটি কাজের শিফটের জন্য যথেষ্ট।

▲ চিত্র ০২

সর্বশেষ চিত্র ০৩-এ প্রতিটি হাতের তালুতে ক্যামেরা এবং স্পর্শকাতর সেন্সর রয়েছে, যা ৩ গ্রাম পর্যন্ত চাপ সনাক্তকরণ সক্ষম করে।

অন্য কথায়, চিত্র ০৩-এর তালু আরও সূক্ষ্ম এবং নমনীয়:

▲ চিত্র ০৩

আরও গুরুত্বপূর্ণ বিষয় হল, ফিগার এআই-এর রোবট "কেনজিন" দ্রুত একত্রিত করার এবং বাস্তব-বিশ্বের অ্যাপ্লিকেশনগুলিতে রোবট সরবরাহ করার ক্ষমতা রাখে।

২০২৪ সালের জানুয়ারিতে, ফিগার এআই দক্ষিণ ক্যারোলিনায় বিএমডব্লিউ-এর চূড়ান্ত অ্যাসেম্বলি লাইনে চিত্র ০২-এর একটি ব্যাচ সরবরাহ করার জন্য বিএমডব্লিউ-এর সাথে অংশীদারিত্ব করে।

সেখানে, চিত্র ০২ স্থির ডিভাইসে ধাতুর পাত অংশগুলিকে সুনির্দিষ্টভাবে স্থাপনের জন্য দায়ী – একটি সূক্ষ্ম কাজ যা বৃহৎ, স্থির রোবোটিক বাহুগুলি পরিচালনা করতে লড়াই করে।

এই চিত্র ০২ জন মোট ১১ মাস ধরে BMW-তে কাজ করেছেন, প্রায় ২০০ মাইল মোট দূরত্ব অতিক্রম করেছেন, ৯০,০০০-এরও বেশি যন্ত্রাংশ পরিবহন করেছেন এবং ৩০,০০০-এরও বেশি BMW X3 উৎপাদনে সহায়তা করেছেন।

অ্যাডকক রোবটটির আঁচড় এবং ক্ষতবিক্ষত ছবিও পোস্ট করেছে, যা ইঙ্গিত করে যে এটি একটি "বাস্তব" বাণিজ্যিক বৈধতা:

রোবটটি স্ক্রু শক্ত করতে দেখে, BMW-এর প্রযোজনা পরিচালক মিলান নেদেলজকোভিচ সংক্ষেপে বললেন:

প্রাথমিক পরীক্ষার মাধ্যমে, আমরা উৎপাদনে হিউম্যানয়েড রোবটের সম্ভাব্য প্রয়োগগুলি সনাক্ত করছি। ভবিষ্যতে, আমরা প্রযুক্তি উন্নয়ন পর্যায়ে (রোবটগুলির) জড়িত থাকার আশা করি।

ফিগার এআই এবং ওপেনএআই-এর মধ্যে সম্পর্কও অত্যন্ত গুরুত্বপূর্ণ।

উদাহরণস্বরূপ, ২০২৪ সালে, ওপেনএআই কেবল ফিগার এআই-তে বিনিয়োগ করেনি, বরং এমন একটি স্পিচ মডেল তৈরিতেও সহায়তা করেছে যা রোবটদের প্রাকৃতিক ভাষার কমান্ড গ্রহণ করতে সক্ষম করে।

যদিও পরবর্তীতে ফিগার নিজস্ব হেলিক্স তৈরিতে স্যুইচ করে, এই সহযোগিতা মূলত ভিএলএ মডেলের ভিত্তি স্থাপন করে।

কাকতালীয়ভাবে, এই বছরের CES-এ, আমরা একটি স্পষ্ট প্রবণতা দেখতে পেলাম:

গৃহস্থালী যন্ত্রপাতির জায়ান্টরা "হোম রোবট" বাজারকে চ্যালেঞ্জ জানাতে শুরু করেছে।

এলজি এবং হাইসেন্স উভয়ই প্রোটোটাইপ রোবট প্রদর্শন করেছে যা ঘরে স্বায়ত্তশাসিতভাবে ঘোরাফেরা করতে এবং গৃহস্থালির কাজে সহায়তা করতে সক্ষম, যা ইঙ্গিত দেয় যে ঐতিহ্যবাহী গৃহস্থালী যন্ত্রপাতি কোম্পানিগুলি বুঝতে শুরু করেছে:

পরবর্তী প্রজন্মের স্মার্ট হোম অ্যাপ্লায়েন্সগুলি রেফ্রিজারেটর বা ওয়াশিং মেশিন নয় যার কম্পিউটিং ক্ষমতা বেশি, বরং রোবট হবে যারা সরাসরি এই ডিভাইসগুলি পরিচালনা করতে পারে।

▲ LG CIOiD হোম রোবট

এই "মানব রূপান্তর" প্রতিযোগিতায়ও, দেশীয় নির্মাতারা আরও আক্রমণাত্মক পন্থা গ্রহণ করছে—

এইমাত্র, অ্যান্ট গ্রুপের একটি সহযোগী প্রতিষ্ঠান, লিংবো টেকনোলজি, বৃহৎ আকারের মডেল লিংবট-ভিএলএ-কে উন্মুক্তভাবে উৎসর্গ করেছে।

বাস্তব-বিশ্বের কর্মক্ষম পরিস্থিতির জন্য একটি "বুদ্ধিমান ভিত্তি" হিসেবে LingBot-VLA, রোবটদের বিভিন্ন সংস্থা এবং কার্যগুলিতে সাধারণীকরণ করতে সক্ষম করে।

লিংবো টেকনোলজির তথ্য অনুসারে, লিংবট-ভিএলএ জিএম-১০০-এর রিয়েল-ডিভাইস পরীক্ষায় সর্বোচ্চ সাফল্যের হারের রেকর্ড ভেঙেছে, যার মধ্যে ১০০টি রিয়েল-ওয়ার্ল্ড অপারেশনাল কাজ অন্তর্ভুক্ত ছিল।

▲ রব্বিয়ান্ট-আর১, লিংবো টেকনোলজির প্রথম রোবট

শুধু অ্যান্ট গ্রুপই নয়; JD.com, আলিবাবা, টেনসেন্ট, হুয়াওয়ে, বিওয়াইডি, শাওমি—প্রায় সকল প্রযুক্তি জায়ান্টই মূর্ত বুদ্ধিমত্তায় বিনিয়োগ করছে।

২০২৪ সালের বিশ্ব কৃত্রিম বুদ্ধিমত্তা সম্মেলনে প্রকাশিত "মানবীয় রোবট শিল্পের উপর গবেষণা প্রতিবেদন" উল্লেখ করে:

২০২৪ সালে চীনের হিউম্যানয়েড রোবটের বাজার ২.৭৬ বিলিয়ন আরএমবিতে পৌঁছেছে এবং ২০২৯ সালে এটি ৭৫ বিলিয়ন আরএমবিতে প্রসারিত হবে বলে আশা করা হচ্ছে এবং ২০৩৫ সালের মধ্যে এটি ৩০০ বিলিয়ন আরএমবিতে পৌঁছাতে পারে।

ভবিষ্যতের কথা তো বাদই দিলাম, এই বছরের বসন্ত উৎসব গালা "সর্বোচ্চ রোবট কন্টেন্ট" সহ একটি হয়ে উঠতে পারে।

বেশ কিছু স্মার্ট হোম কোম্পানি তাদের পণ্য মঞ্চে প্রদর্শন করবে বলে আশা করা হচ্ছে – কেবল প্রদর্শনের জন্য নয়, বরং এমন ধরণের কোম্পানি যারা আসলে গান, নাচ এবং র‍্যাপ পরিবেশন করতে পারে।

রোবটটি "মস্তিষ্ক" এবং "শরীর" উভয় দিয়ে সজ্জিত এবং প্রতিটি ঘরে প্রবেশের জন্য প্রস্তুত।

চিত্র এআই-এর হেলিক্স ০২ একটি "সাধারণ মূর্ত বুদ্ধিমত্তা মডেল"-এর সম্ভাব্যতা প্রদর্শন করে:

নির্মাতাদের আসলে প্রতিটি কাজ আলাদাভাবে প্রোগ্রাম করার বা বিপুল পরিমাণে সিমুলেশন ডেটা সংগ্রহ করার প্রয়োজন হয় না। যথেষ্ট শক্তিশালী VLA মডেলের সাহায্যে, রোবটটি নির্দেশাবলী বুঝতে পারে, পরিবেশের সাথে পরিচিত হতে পারে এবং নিজেই কৌশল তৈরি করতে পারে

▲ এটা এমনকি জানে কিভাবে প্রচেষ্টা বাঁচাতে হয়

যেমন জিপিটি হলো ভাষার জন্য এবং হেলিক্স হলো বুদ্ধিমত্তার জন্য, তেমনি আজ একটি রোবট থালা-বাসন ধুতে পারে এবং স্ক্রু শক্ত করতে পারে, কাল এটি আপনার দৈনন্দিন জীবনের যত্ন নিতে পারে।

বাড়িতে রোবট থাকাটা হয়তো আমাদের ধারণার চেয়েও বেশি দূরের কথা।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো