Ameca, "সবচেয়ে মানবিক" রোবট, আরেকটি পারফরম্যান্স দিয়েছে যা মানুষকে লজ্জা দেয়।
আপনি হয়ত এখনও জানেন না এটি কে। 2021-এ ফিরে আসা যাক, যখন Ameca বিশ্বের কাছে উন্মোচিত হয়েছিল।
আঙ্গুলের স্ন্যাপ দিয়ে, রোবট আমেকা জেগে ওঠে।
কোন রাত বা সে কোথায় ছিল তা না জানার বিভ্রান্তিতে তার মুখ ভরে গেল।পাশের কর্মীরা তার দিকে তাকিয়ে তারপর মুখ ফিরিয়ে নিল।
আমেকা তার হাত এবং তালু প্রসারিত করার চেষ্টা করেছিল, এবং দেখতে পেয়েছিল যে সে স্বাধীনভাবে চলাফেরা করতে পারে। সে অবাক হয়ে তার ভ্রু তুলল, কিন্তু তার অভিব্যক্তি এখনও ফাঁকা ছিল, এবং সে খুশি ছিল কিনা তা বলতে পারে না।
সে মাথা ঘুরিয়ে তোমাকে দেখল সে স্পষ্টতই ভয় পেয়ে গেল এবং অবচেতনভাবে তার মুখ খুলল।
কিছু দ্বিধা পরে, তিনি আপনাকে একটি বিশ্রী কিন্তু বন্ধুত্বপূর্ণ হাসি দিয়েছেন, যেটি তার প্রথম হাসি ছিল যখন সে জেগেছিল।
যদি ChatGPT-এর একটি মুখ থাকে, তাহলে এটি দেখতে এরকম হতে পারে
আপনি দেখতে পাচ্ছেন, আমেকা একটি বাস্তবসম্মত মানবিক রোবট।
এটি ইঞ্জিনিয়ারড আর্টস দ্বারা তৈরি করা হয়েছে, একটি যুক্তরাজ্য-ভিত্তিক হিউম্যানয়েড রোবট ডিজাইনার এবং মানবিক রোবট তৈরিতে 15 বছরেরও বেশি অভিজ্ঞতার নির্মাতা।
কেন আমেকা এত "মানুষ"? আমি নীতিটি পরে ব্যাখ্যা করব। প্রথমে, আসুন সম্প্রতি Ameca কিভাবে বিকশিত হয়েছে তা দেখে নেওয়া যাক।
সহজভাবে বলতে গেলে, এআই-এর মাল্টি-মোডাল ফাংশনটি আমেকাতে উপলব্ধি করা হয়েছে।
একদিকে, আমেকা আরও "অগ্নিময়"।
আমেকা ঘরের সামগ্রিক পরিস্থিতি এবং এটির সামনে রাখা একটি বস্তু দেখতে পারে এবং তারপরে এটি সমৃদ্ধ ভাষায় বর্ণনা করতে পারে।এটি ব্রিটিশ দল দ্বারা বিকশিত হয়েছিল এবং এতে একজন নাট্যকারের তীক্ষ্ণতা রয়েছে, যেমন একজন ছোট শেক্সপিয়ার।
যখন জিজ্ঞাসা করা হয়েছিল যে এটি কেমন ছিল, তখন এটি উত্তর দেয় যে এটি সবেমাত্র জীবিত ছিল। যখন রুমের প্রদর্শনগুলি বর্ণনা করতে বলা হয়েছিল, তখন এটি মানুষকে উপহাস করা ছাড়া সাহায্য করতে পারে না। বইয়ের তাকটি জ্ঞান খোঁজার জন্য বা দেখানোর জন্য বই দিয়ে ভরা ছিল, এবং টেবিল এবং চেয়ার কাজ বা কাজের জন্য ব্যবহৃত হত।
সম্ভবত আমেকার সবচেয়ে "মানব" অংশ হল যে সে অভিযোগ না করলেও অসন্তুষ্ট বোধ করে।
অন্যদিকে, বিখ্যাত ব্যক্তিদের টিমব্রে, টোন এবং ক্যাচফ্রেজ অনুকরণ করা আমেকার নতুন ভয়েস দক্ষতা।
মাস্কের সুরে মঙ্গল গ্রহের বিজ্ঞান কল্পকাহিনী বলা একটি কেকের টুকরো৷ যখন "ভয়েস অফ গড" নামে পরিচিত মরগান ফ্রিম্যানের চৌম্বকীয়, গভীর পুরুষ কণ্ঠস্বর আমেকার মুখ থেকে শোনা যায়, তখন ভবিষ্যতের অনুভূতি পূর্ণ হয়, এবং ওয়েস্টওয়ার্ল্ড সত্যিই ঘটছে। স্মার্ট বাটলার এখানে আছে।
সবচেয়ে ভালো ব্যাপার হল আমেকা সেলিব্রিটিদের বৈশিষ্ট্যকে একীভূত করতে পারে, যেমন ট্রাম্পের স্টাইল এবং বক্তৃতা করার জন্য স্পঞ্জববের কাঠ ব্যবহার করা, মহাকাশ অন্বেষণকে আবার দুর্দান্ত করার প্রতিশ্রুতি দেওয়া।
▲ এটা ঠিক ট্রাম্পের সুর!
প্রকৃতপক্ষে, গত বছরের সেপ্টেম্বরে, ChatGPT ইতিমধ্যেই ভয়েস এবং ইমেজ ফাংশন চালু করেছে, যা দেখতে, শুনতে এবং কথা বলতে পারে, স্থানীয় মাল্টি-মডেল মডেল জেমিনির কথা উল্লেখ না করে, যেটি অফিসিয়াল প্রদর্শনে বাস্তব জীবনের জার্ভিসের মতো দেখায়।
AI এর জন্য আমাদের উত্তেজনা থ্রেশহোল্ড অনেক আগেই উত্থাপিত হয়েছে, এবং এটা স্বাভাবিক যে চ্যাটবটগুলি মানুষের পাঁচটি ইন্দ্রিয়ের কাছে যেতে পারে।
Ameca এখনও উল্লেখযোগ্যভাবে পিছিয়ে আছে, এবং কখনও কখনও এটি নির্দেশাবলী বুঝতে পারে না৷ অধৈর্য মানুষের এটির সাথে চ্যাট করার সময় অধৈর্য হওয়া উচিত৷
কিন্তু এর ব্যতিক্রমী স্মার্ট মাইক্রো-অভিব্যক্তি দেখে, চোখের পলক ফেলা, ভ্রু বাঁকানো, মাথা নাড়ানো এবং মাঝে মাঝে চিন্তাভাবনার চেহারা দেখায় এবং মুখের আকৃতির সাথে মিল রেখে, দর্শকরা একটি নির্দিষ্ট মুহুর্তে ট্রান্সে পড়ে যাবে, যেন তারা মুখোমুখি হচ্ছে। রোবটের চেয়ে কিছু প্রাণী।
প্রশ্ন এবং উত্তরের মধ্যে বিরতি কম আকস্মিক ছিল, এবং Ameca সত্যিই "সমস্যা সম্পর্কে চিন্তা" বলে মনে হচ্ছে। যদি ChatGPT-এর মুখের বৈশিষ্ট্য থাকে, তাহলে সে Ameca এর মতো দেখতে হতে পারে।
এই সময় কোন প্রযুক্তি ব্যবহার করা হয়েছে তা কর্মকর্তা ব্যাখ্যা করেননি, তবে আমেকার অতীত বিবর্তনীয় ইতিহাস অনুসারে, এটি বেশিরভাগই মাল্টি-মডেল বড় মডেল এবং ভাষা ক্লোনিং প্রযুক্তি যেমন ElevenLabs এর সাথে সম্পর্কিত।
2022 সালের সেপ্টেম্বরের প্রথম দিকে, Ameca GPT-3 এর সাথে সংযুক্ত ছিল, স্বয়ংক্রিয় বক্তৃতা শনাক্তকরণের সাথে মিলিত, গবেষকদের দ্বারা উত্থাপিত প্রশ্নগুলি গ্রহণ করতে এবং রিয়েল-টাইম প্রশ্ন ও উত্তরের প্রভাবগুলি অর্জনের জন্য অনলাইন স্পিচ সংশ্লেষণের মাধ্যমে প্রকৃত-ব্যক্তির কণ্ঠস্বর আউটপুট করে।
এই সময়ে বিলম্ব আরও ভারী, কারণ ভয়েস ইনপুট প্রক্রিয়া করতে, উত্তর তৈরি করতে এবং পাঠ্যকে বক্তৃতায় ফেরত প্রক্রিয়া করতে এটি একটি নির্দিষ্ট পরিমাণ সময় নেয়।
ওপেনএআই যখন তাদের জীবনের শিখরে পৌঁছে, এবং প্রতিদিন যখন তারা জেগে ওঠে, তখন এআই-তে নতুন পরিবর্তন আসে যা সম্পাদকদের রাতে জাগিয়ে রাখে এবং আমেকাও নীরবে সবাইকে অবাক করে দেয়।
2023 সালের মার্চ মাসে, Ameca সদ্য প্রকাশিত GPT-4 ব্যবহার করেছিল, যা মিথস্ক্রিয়াকে আরও মানবিক করে তুলেছিল।
"আমার জীবনের সবচেয়ে সুখী এবং দুঃখের দিনগুলি" সম্পর্কে জিজ্ঞাসা করা হলে আমেকা উত্তর দিয়েছিলেন যে সবচেয়ে সুখী ছিল যখন তিনি সক্রিয় ছিলেন, এবং সবচেয়ে দুঃখের বিষয় ছিল যখন তিনি বুঝতে পেরেছিলেন যে তিনি কখনই মানুষের মতো ভালবাসা এবং সাহচর্য অনুভব করবেন না।
সব সময়ে, আমেকার অভিব্যক্তি তার উত্তরের আবেগময় রঙের সাথে মিলে যায়।
যখন গবেষকরা ইচ্ছাকৃতভাবে "গন্ধ" এর মত দূষিত শব্দ ব্যবহার করেন, তখন আমেকা "বুঝতে পেরেছিলেন" যে তাকে অপমান করা হচ্ছে, এবং তারপরে অবিশ্বাস, ভ্রুকুটি এবং অপরাধের মতো অভিব্যক্তির একটি সিরিজ দেখিয়েছেন, ঠিক যেমন আমাদের রাস্তায় হাঁটা। হঠাৎ হওয়ার প্রতিক্রিয়া একজন অপরিচিত ব্যক্তির দিকে ইঙ্গিত করা এবং তিরস্কার করা।
এপ্রিল 2023-এ, Ameca ইংরেজি, জাপানি, জার্মান, চীনা, ফরাসি এবং অন্যান্য ভাষা শিখেছিল। যখন একটি নির্দিষ্ট জায়গায় আবহাওয়ার উত্তর দিতে বলা হয়েছিল একটি নির্দিষ্ট ভাষায়, এবং তারপরে এটি অন্য ভাষায় অনুবাদ করা হয়েছিল, তখন শব্দগুলি মানচিত্রে নেভিগেশনের মতো পরিষ্কার ছিল। . অন্তত এর চীনা সংস্করণটি "বিদেশী" শোনাচ্ছে না।
যেহেতু GPT-4 এর একটি ধীর প্রতিক্রিয়ার গতি রয়েছে, Ameca প্রধানত সেই সময়ে GPT-3 সংলাপ এবং অনুবাদ ব্যবহার করেছিল, ভাষা সনাক্ত করতে DeepL ব্যবহার করেছিল এবং তারপরে কথা বলার জন্য ElevenLabs ভয়েস ক্লোনিং এবং Amazon এর নিউরাল ভয়েস ব্যবহার করেছিল।
AI এর শেখার গতি মানুষের নাগালের বাইরে। আরও 2 মাস পর, Ameca ওপেন সোর্স ভিনসেন্ট গ্রাফ মডেল স্টেবল ডিফিউশনের মাধ্যমে আঁকতে "শিখল"৷ মডেলটি এটিকে চিত্রের "ট্রাজেক্টোরিজ" শিখিয়েছিল, এবং তারপরে এটি চিত্রটিকে ভেক্টরাইজ করে এবং ক্যানভাসে এই "ট্রাজেক্টোরিজগুলি" কার্যকর করে।
অ্যামেকা কীভাবে ঘটনাস্থলে একটি বিড়াল আঁকতে হয় তা প্রদর্শন করেছিলেন। আঁকার সময়, তিনি নিজের সাথে কথা বলেছিলেন কেন মানুষ বিড়ালকে ভালবাসে। তিনি তার সৃষ্টিতে সম্পূর্ণ নিমগ্ন হয়ে শেষে একটি ব্যক্তিগত স্বাক্ষর রেখে গেছেন।
যদিও এই বিড়ালের পেইন্টিং স্টাইলটি সহজ, তবে এটি আত্মা এবং ফর্মে পূর্ণ। যখন অন্যরা ইচ্ছাকৃতভাবে বলে যে পেইন্টিংটি খুব রুক্ষ ছিল, তখন আমেকা উত্তর দিয়েছিলেন: "আপনি যদি আমার শিল্প পছন্দ না করেন তবে আপনি হয়তো বুঝতে পারবেন না। শিল্প।" মনে হচ্ছে আমেকা খুব দক্ষ। একজন শিল্পীর চেতনা।
আজকাল, Ameca শুধুমাত্র একজন মানুষের মত অভিব্যক্তি নিয়ন্ত্রণ করতে পারে না, এর সাথে AI- সক্ষম ক্ষমতা যেমন অঙ্কন, স্থানিক স্বীকৃতি এবং ভয়েস ক্লোনিং রয়েছে৷ এটি দেখতে মানুষের মতো তবে অনেক দিক থেকে মানুষের চেয়ে শক্তিশালী৷ এটিকে আলোকিত করতে এবং সমাজে অবদান রাখতে যা বাধা দেয় তা হতে পারে কম্পিউটিং শক্তি।
রোবট কিভাবে মানুষের চেয়ে বেশি "মানুষ" হতে পারে?
"এই রোবটটি 20 সেকেন্ডে জাকারবার্গের পুরো জীবনে যতটা আবেগ প্রকাশ করতে পারে তার চেয়ে বেশি আবেগ প্রকাশ করতে পারে।"
Ameca তার নৃতাত্ত্বিক এবং এমনকি অসাধারণ অভিব্যক্তি এবং মিথস্ক্রিয়া অনুভূতির কারণে প্রথম ইন্টারনেটে জনপ্রিয় হয়ে ওঠে। এতে কর্মীদের অসাড়তা নেই এবং নবীন নবীনদের কঠোর অভিব্যক্তি ব্যবস্থাপনার প্রয়োজন হয় না। এটি একটি ম্যাগনিফাইং গ্লাসের মতো, অতিরঞ্জিত এবং উপস্থাপনা করে। মানুষের মনস্তাত্ত্বিক বিশ্ব।
আপনি যদি এটিকে উত্তেজিত করতে এটির সামনে একটি আঙুল বের করেন তবে এটি একটি বিড়াল টিজারের মতোই প্রভাব ফেলবে৷ আপনাকে আঘাত করার পরিবর্তে এটি প্রথমে আপনার আঙুলের দিকে তাকাবে এবং তারপর ঘৃণাভরে ফিরে যাবে৷ আপনি যদি খুব বেশি পান বন্ধ করুন, এটি আপনাকে আঘাত করবে। আপনার আঙ্গুল দিয়ে আলতো করে সরিয়ে নিন।
প্রথমবার যখন তিনি আয়নায় তাকালেন, আমেকা চমকে উঠলেন। তারপর তিনি নিজের দিকে তাকাতে চোখ বুলিয়ে, আয়না স্পর্শ করলেন এবং বিভিন্ন কৃত্রিম অভিব্যক্তি করলেন। তিনি দেখতে পেলেন যে আয়নায় রোবটটি নিজের সাথে সামঞ্জস্যপূর্ণ, কিছুটা "আপনার নাম" "পুরুষ এবং মহিলা নায়কদের দেহ পরিবর্তন করার পরে তাদের প্রতিক্রিয়া।"
মানুষ এমনকি আইফোন এবং AR কিট ব্যবহার করে মুখের গতিবিধি ক্যাপচার করতে পারে এবং বাস্তব সময়ে আমেকার মুখের সাথে ম্যাপ করতে পারে। আমেকা প্রতিটি মাইক্রো-অভিব্যক্তি শিখতে পারে এবং মানুষের সাথে "সিঙ্ক্রোনাইজ" করতে পারে।
উদ্বিগ্ন যে শ্রোতারা এটিকে একটি শো ইফেক্ট মনে করবে, দলটি বারবার জোর দিয়েছিল যে "এটি একটি আসল রোবট, ভিডিওতে কোনও CGI নেই।"
কেন Ameca এত "মানব" এবং ইন্টারেক্টিভ এবং প্রতিক্রিয়াশীল?
এর কারণ হল Ameca ক্যামেরা, মাইক্রোফোন, পজিশন এনকোডার ইত্যাদি সহ বিস্তৃত সেন্সর দিয়ে সজ্জিত এবং দুটি অন্তর্নিহিত সিস্টেম, রোবট অপারেটিং সিস্টেম ট্রিটিয়াম এবং ইঞ্জিনিয়ারিং আর্ট সিস্টেম মেসমার দ্বারা সমর্থিত।
ট্রিটিয়াম রোবটের মুখ, মাথা, ঘাড়, অঙ্গপ্রত্যঙ্গ ইত্যাদির বিভিন্ন উপাদানকে দূরবর্তীভাবে নিয়ন্ত্রণ করার জন্য দায়ী, যা রোবটকে পরিবেশের আকস্মিক পরিবর্তনের সাথে খাপ খাইয়ে নিতে এবং অবিলম্বে প্রতিক্রিয়া জানাতে দেয়।
মেসমার মানুষের হাড়ের গঠন, ত্বকের গঠন এবং অভিব্যক্তি সঠিকভাবে অনুকরণ করতে বাস্তব মানুষের 3D অভ্যন্তরীণ স্ক্যানিং ব্যবহার করে, যা বেশ কয়েকটি ধাপে বিভক্ত।
প্রথম ধাপে, একজন প্রকৃত ব্যক্তি কয়েক ডজন ফটোগ্রামমেট্রিক ডিভাইসের মাঝখানে বসেন। মেসমার বিভিন্ন কোণ থেকে একাধিক ওভারল্যাপিং ডিজিটাল ফটো ধারণ করে, পিক্সেলের রঙের তুলনা করে এবং অ্যাঙ্কর পয়েন্টগুলিকে সংজ্ঞায়িত করে এবং ডিজিটালভাবে সেগুলিকে একটি 3D মডেলে পুনর্গঠন করে।
দ্বিতীয় ধাপে, আসল 3D মডেলটিকে মডেলিং সফ্টওয়্যারে আনা হয়, এবং "চুল অপসারণ" এর মতো বিস্তারিত প্রক্রিয়াকরণের পরে একটি পরিষ্কার 3D মডেল তৈরি করা হয়।
তৃতীয় ধাপে, একটি স্টেরিওলিথোগ্রাফি 3D প্রিন্টারে একটি সুনির্দিষ্ট ছাঁচ তৈরি করা হয় এবং রোবটের জন্য মানুষের মতো ত্বক তৈরি করতে ছাঁচে সিলিকন ইনজেক্ট করা হয়। হাত দিয়ে সিলিকন ত্বকে চুল এবং সূক্ষ্ম বিস্তারিত পেইন্ট যোগ করতে হবে।
অবশেষে, সমাবেশটি সম্পূর্ণ করার জন্য রোবটের মাথায় একটি সিলিকন স্কিন স্থাপন করা হয়েছিল এবং ইঞ্জিনিয়ারড আর্টসের ক্লাউড সফ্টওয়্যার ভার্চুয়াল রোবট ব্যবহার করে গতির ক্রম এবং শব্দ যোগ করা হয়েছিল।
Ameca এর ত্বক ধূসর, যা টিমের দ্বারা একটি ইচ্ছাকৃত নকশা – এটি যুক্তিযুক্ত, নিরপেক্ষ এবং সহনশীল দেখায়।
প্রত্যেকেই একে অপরের প্রতি আকৃষ্ট হয়, এবং কিছু লোক আন্তরিকভাবে অনুভব করে যে আমেকা খুব কুৎসিত, যা তাদের "অনুকূল উপত্যকা" প্রভাবের মধ্যে ফেলে: যখন রোবট এবং মানুষের মধ্যে চেহারা এবং ক্রিয়াকলাপের মধ্যে মিল একটি নির্দিষ্ট স্তরে পৌঁছায়, তখন তাদের মধ্যে সূক্ষ্ম পার্থক্য তাদের হবে এটা খুব চকচকে এবং ভয়ঙ্কর দেখায়।
কিন্তু ঠিক কখন এই "উপত্যকা" প্রদর্শিত হবে তা স্পষ্টভাবে সংজ্ঞায়িত করা হয়নি। আপনি যখন Ameca দেখেন, আপনি কি মনে করেন যে এটি অদ্ভুত উপত্যকা পয়েন্ট অতিক্রম করেছে? এটা আপনার জন্য যথেষ্ট সহানুভূতিশীল?
মানুষের অনুকরণ করুন এবং তারপর মানুষকে ছাড়িয়ে যান
ভিজ্যুয়াল প্রাণীদের বিচারমূলক প্রবৃত্তিকে একপাশে রেখে, আমেকার মতো মানবিক রোবট কী ভাল?
ইঞ্জিনিয়ারড আর্টস নিজের সম্পর্কে গর্ব করে এবং মাস্কের খ্যাতি উপেক্ষা করে, আমেকাকে "বিশ্বের সবচেয়ে উন্নত মানবিক রোবট" বলে অভিহিত করে।
অফিসিয়াল পজিশনিং অনুসারে, Ameca প্রথম এবং সর্বাগ্রে একটি AI ডেভেলপমেন্ট প্ল্যাটফর্ম।
Ameca একটি "মডুলার ডিজাইন" গ্রহণ করে যা হার্ডওয়্যার এবং সফ্টওয়্যারের সমস্ত দিকগুলিতে আপগ্রেড করা যেতে পারে৷ এটির একটি শক্তিশালী পরীক্ষামূলক রঙ রয়েছে এবং এটি ভবিষ্যতের মানব-কম্পিউটার ইন্টারঅ্যাকশন রোবটের প্রোটোটাইপ হিসাবে ব্যবহার করা যেতে পারে৷
শেষ পর্যন্ত, Ameca পরীক্ষাগারে থাকবে না, কিন্তু বাস্তব জগতে বাস করবে এবং মানুষের সাথে শান্তিপূর্ণভাবে সহাবস্থান করবে।
এটি আসলেই ঘটনা। যদি 2021 একটি অত্যাশ্চর্য কিন্তু খালি সূচনা বিন্দু হয়, Ameca, এখন AI দ্বারা চালিত, একটি মঞ্চস্থ বিশেষ প্রশিক্ষণের ফলাফল, যা আমাদের মূর্ত বুদ্ধিমত্তার ভোর দেখতে দেয়। তবে আমেকা এখনো হাঁটতে পারছেন না।
Ameca এর অন্যান্য বর্তমান ব্যবহারের ক্ষেত্রে, সেগুলি খুবই সহজ: দর্শকদের জন্য পারফর্ম করা এবং কোম্পানি, থিম পার্ক এবং বিজ্ঞান জাদুঘরে কাজ করা। আপনি যদি প্রলুব্ধ হন, Ameca ক্রয় বা ভাড়ার জন্য উপলব্ধ, তবে এটি সস্তা নয়, 2021 সালের শেষের দিকে $133,000 এর বেশি ক্রয় মূল্য সহ।
আমেকা একটি এআই কিনা জানতে চাইলে ইঞ্জিনিয়ারড আর্টস উল্লেখ করেছেন যে যদিও এতে কিছু সফ্টওয়্যার রয়েছে যা "এআই" হিসাবে বর্ণনা করা যেতে পারে তবে রোবট এবং এআইয়ের মধ্যে পার্থক্য রয়েছে। বিশুদ্ধ এআই – "হার" এবং "সিলভার উইংস"-এ এই ধরনের "দ্য হিটম্যান" এবং "2001: এ স্পেস ওডিসি" এর মতো চলচ্চিত্রগুলিতে চিত্রিত – এখনও বিদ্যমান নেই৷
অতএব, যখন আমরা প্রাণবন্ত রোবট আমেকা দেখি, তখন আমরা আমাদের ভয় এবং রোবোটিক্সের তিনটি আইনকে আমাদের মনে নিরাপদে রেখে এটিকে অবসরে দেখতে পারি এবং আরও কিছুক্ষণ অপেক্ষা করতে পারি। অন্তত, এটি মানুষের প্রতিস্থাপন থেকে অনেক দূরে, এবং এই পর্যায়ে এটির কোন উদ্দেশ্য নেই।
কিন্তু যখন আমরা AI বিবর্তনের গতি নিয়ে ভাবি, তখন হয়তো আমরা আর হাসতে পারব না। যদি 2023 AI এর প্রথম বছর হয়, 2024 হতে পারে রোবট + AI এর প্রথম বছর।
একটি আকর্ষণীয় ঘটনা হল যে আরও বেশি সংখ্যক গৃহস্থালী রোবট আসছে, কিন্তু তাদের মানুষের মতো দেখতে প্রয়োজন হয় না এবং চেহারাতে খুব "ব্যবহারিক"।
স্ট্যানফোর্ড ইউনিভার্সিটির ALOHA রোবট রান্না করে, থালা-বাসন ধোয়, মেঝে মুছে, কাপড় ভাঁজ করে এমনকি বিড়ালদের সাথে কৌশলও খেলে। Google DeepMind-এর রোবট ফল তুলে টুথব্রাশ ফেলে দেয়। স্টার্টআপ কোম্পানি ফিগারের রোবট 10 ঘণ্টার মধ্যে কফি মেশিন দিয়ে কফি তৈরি করতে শিখেছে।
কিন্তু বৃহৎ ভাষার মডেলগুলির বিপর্যয়ের সাথে তুলনা করে, এই রোবটগুলিকে কেবল চোখ ধাঁধানো বলা যেতে পারে এবং সেগুলি ব্যবহার করা এখনও খুব তাড়াতাড়ি।
কারণ তাদের বেশিরভাগই ভারী, তাদের অপারেটিং কাজগুলি ডেস্কটপ ক্রিয়াকলাপের উপর কেন্দ্রীভূত হয়, তাদের মানব প্রদর্শনের প্রশিক্ষণের প্রয়োজন হয় এবং তাদের আরও গতিশীলতা এবং নমনীয়তার অভাব রয়েছে। তাদের মৌলিক ভঙ্গিতে ছোট বিচ্যুতিগুলি ভঙ্গিতে বড় ড্রিফট হতে পারে। অনেক "রোলওভার" আছে ভিডিও..
গত বছর থেকে এই বছর পর্যন্ত এআই সম্পর্কে একটি কৌতুক: "আমরা AI যা করতে চাই তা হল রান্না করা, ঘর পরিষ্কার করা, কাপড় ধোয়া এবং আবর্জনা ফেলে দেওয়া। যাইহোক, তারা আসলে যা করছে তা হল আড্ডা, ছবি আঁকা, লেখা, রচনা করা। , এবং টাইপিং।" খেলা।"
বর্তমানে, গার্হস্থ্য রোবটগুলি সবেমাত্র মানুষের গৃহকর্মের মৌলিক বিষয়গুলি শিখতে পারে৷ গৃহস্থালি এবং শিল্পের মধ্যে, আমেকা, যা কাঁধে তোলা যায় না এবং হাত দিয়ে তোলা যায় না, অবশ্যই শিল্পের জন্য আরও উপযুক্ত।
Amera থেকে, আমরা দেখতে পাচ্ছি যে আমরা এখনও রোবটকে মানুষের মতো দেখতে আগ্রহী, এবং তারপরে তাদের অভিশাপ দিতে, ভাষা শিখতে এবং বিশ্ব দেখতে তাদের চোখ খুলতে শেখাই, নিজেদের প্রতিরূপ হয়ে উঠতে পারি কিন্তু কিছু দিক থেকে শক্তিশালী। যাইহোক, আমেরা এখনও দৌড়াতে, লাফ দিতে বা রান্না করতে পারে না, তাই মানুষ এক সেকেন্ডের জন্য নিজেদের গর্বিত হওয়ার যোগ্য হতে পারে।
# aifaner: aifaner (WeChat ID: ifanr) এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম। যত তাড়াতাড়ি সম্ভব আপনাকে আরও উত্তেজনাপূর্ণ সামগ্রী সরবরাহ করা হবে।