মিনিম্যাক্স ‘তিনটি প্রদেশ ও ছয়টি বিভাগ’ নিয়ে মেভিস নামে এক সত্যিকারের এজেন্ট চালু করেছে।

আমি একটি কাজ অর্পণ করার পর, এজেন্ট ৭টি ধাপের রূপরেখা দিয়ে প্ল্যান মোডটি সক্রিয় করে দেন।

আমি অনুমোদন দেওয়ার পর এটি চলতে শুরু করল। তিনটি ধাপ পর এটি থেমে গিয়ে জানাল: "আমি ধাপ ১, ২ এবং ৩ সম্পন্ন করেছি এবং ফলাফলগুলো নিম্নরূপ… আমরা কি ধাপ ৪, ৫, ৬ এবং ৭ নিয়ে এগিয়ে যাব?"

আমি বললাম চালিয়ে যাও। এটি আরও দুটি ধাপ এগিয়ে আবার থেমে গেল: "আমি ৪ এবং ৫ সম্পন্ন করেছি, এবং ফলাফলগুলো হলো এই এবং কোনটি… আমরা কি ৬ এবং ৭ দিয়ে চালিয়ে যাব?"

সারারাত পর, যখন আমি এজেন্টকে কিছু দীর্ঘমেয়াদী কাজ করতে বললাম, তখন তার কোনো দীর্ঘমেয়াদী প্রভাব দেখা গেল না; ডায়ালগ বক্সটিতে শুধু "চালিয়ে যান" লেখাটিই দেখাচ্ছিল।

দীর্ঘদিন ধরে বিভিন্ন এজেন্ট ব্যবহার করে কাজ করিয়ে নেওয়ার এটাই আমার অভিজ্ঞতা।

এই অভিজ্ঞতাটি অযৌক্তিক। যদিও এআই-এর সাথে কাজ করার সময় 'নিশ্চিত হওয়ার জন্য থামা' একটি ভালো অভ্যাস, কিন্তু অনেক কাজেই আমি এটিকে সক্রিয়ভাবে থামতে বলিনি, তবুও এটি থেমে যেত।

তাদের সর্বশেষ প্রযুক্তিগত ব্লগ পোস্টে, মিনিম্যাক্স তাদের এজেন্ট পণ্যগুলোর এই আচরণের কারণ হিসেবে 'প্রসঙ্গগত উদ্বেগ'-কে উল্লেখ করেছে। মূল সমস্যাটি হলো, একটি খুব দীর্ঘ কাজ কখন সম্পূর্ণ হয়েছে বলে ধরা হবে, সে বিষয়ে মডেলটি নিজেই অস্পষ্ট। সহজ কথায়, ব্যাপারটা এমন নয় যে তারা কাজটি করতে পারে না, বরং তারা করতে ভয় পায়। তারা প্রতিটি পদক্ষেপে ভুল করার ভয়ে থাকে, আর একারণেই তারা মাঝপথে থেমে গিয়ে প্রশ্ন করে।

আজ মিনিম্যাক্স এজেন্ট ডেস্কটপ ক্লায়েন্টে একটি বড় আপডেট এসেছে। ম্যাভিস নামে একটি নতুন মোড যোগ করা হয়েছে (আসলে, এটি "মিনিম্যাক্স অ্যাজ এ জার্ভিস"-এর সংক্ষিপ্ত রূপ)।

এটা সর্বজনবিদিত যে একজন এজেন্ট বস হিসেবে এবং একদল এজেন্ট কর্মচারী হিসেবে কাজ করে—এই প্রচলিত মাল্টি-এজেন্ট কাঠামোটি নতুন কিছু নয়। তবে, মিনিম্যাক্স উল্লেখ করেছে যে পূর্ববর্তী মূলধারার মাল্টি-এজেন্ট কাঠামোসমূহ মূলত মডেলকে একটি "ভূমিকা-পালনকারী" ভূমিকা পালনের সুযোগ দেওয়ার জন্য সংকেত শব্দের বিন্যাসের উপর নির্ভর করত। কিন্তু এই পদ্ধতি বেশিদিন টেকে না, কারণ এটি পূর্বে উল্লিখিত প্রেক্ষাপট-উদ্বেগ, দীর্ঘমেয়াদী কাজের অবনতি এবং আত্ম-যাচাই সংক্রান্ত সমস্যার মতো সমস্যার সম্মুখীন হয়।

মাল্টি-এজেন্ট সিস্টেমের জন্য এমন একটি নির্ভরযোগ্য পরিকাঠামো প্রয়োজন যা নিরবচ্ছিন্নভাবে চালু ও রক্ষণাবেক্ষণ করা হয় এবং যেখানে একাধিক এজেন্ট একে অপরের সাথে "ষড়যন্ত্র" করে না। মিনিম্যাক্স ঠিক এই কাজটিই করে।

বাস্তব-জগতের পরীক্ষার অভিজ্ঞতা: এজেন্টকে অপর পক্ষের খুঁত ধরতে দিন।

মিনিম্যাক্স তার এজেন্ট টিম পরিকাঠামোকে টিম ইঞ্জিন বলে, যার তিনটি মূল ভূমিকা রয়েছে: লিডার, ওয়ার্কার এবং ভেরিফায়ার। নামগুলো থেকে বোঝা যায়, একজন পরিচালনা করেন, একজন কাজটি সম্পাদন করেন এবং অন্যজন যাচাই করেন।

সবচেয়ে গুরুত্বপূর্ণ পার্থক্য হলো, কর্মী এবং যাচাইকারীর মধ্যে একটি "বৈরী" সম্পর্ক থাকে এবং কেউই এর থেকে রেহাই পেতে পারে না।

কিছুদিন আগে, APPSO একটি বিষয় নিয়ে গবেষণা করছিল: "কোডিং/এজেন্ট ক্ষেত্রে উচ্চাকাঙ্ক্ষী সকল মডেল বিক্রেতাদের নিজস্ব স্বাধীন কোডিং/এজেন্ট পণ্য তৈরি করা উচিত।"

হ্যাঁ, ঠিকই, মিনিম্যাক্স আগে একটি নেতিবাচক উদাহরণ ছিল, কিন্তু অপ্রত্যাশিতভাবে, প্রবন্ধটি প্রকাশিত হওয়ার আগেই এটি নিজেকে প্রমাণ করে ফেলল!

তাই আমরা মিনিম্যাক্সের এজেন্ট টিমের উপর এই সমস্যাটি আবার চালালাম।

এই কাজটি ৫ জন কর্মীর মধ্যে ভাগ করে দেওয়া হয়েছিল। প্রত্যেক কর্মী তার কাজ শেষ করার পর, ফলাফলগুলো গুছিয়ে নেতার কাছে জমা দেবে (স্ট্যাটাস হিসেবে 'ম্যাভিস জেনারেলের কাছে পাঠিয়েছে' বা 'জেনারেল ম্যাভিসের কাছে পাঠিয়েছে', ইত্যাদি প্রদর্শন করে)।

একটি ওয়ার্কার ১২ মিনিট ধরে কোনো ফলাফল না দিয়েই চলছিল। APPSO লক্ষ্য করল যে লিডারটি অধৈর্য হয়ে পড়ছে, তাই এটি তার অবস্থা পরীক্ষা করার জন্য একটি ব্যাশ কমান্ড পাঠাল:

সকল ৫ জন কর্মী তাদের কাজ সম্পন্ন করার পর, লিডার ৫ জন ভেরিফায়ার তৈরি করেন—যাদেরকে টাস্ক লিস্টে 'হলুদ টুপি' পরা এজেন্ট হিসেবে দেখানো হয়:

যাচাইকারী দ্রুত ত্রুটিটি খুঁজে পেলেন! যাচাইকারীদের মধ্যে একজন সংশ্লিষ্ট কর্মীর ডেলিভারেবলগুলিতে একটি সুস্পষ্ট ডেটা ত্রুটি খুঁজে পান এবং একটি 'ব্যর্থতা' শাস্তি জারি করেন। এর ঠিক পরেই, সংশ্লিষ্ট কর্মীটি পুনরায় চালু হন (যা একটি ছোট নীল বৃত্ত দ্বারা চলমান হিসাবে প্রদর্শিত হয়)।

তার চিন্তাভাবনা পর্যবেক্ষণ করতে সংশ্লিষ্ট কর্মীর কর্মক্ষেত্রে ক্লিক করুন: "যাচাইকারী নিম্নলিখিত তিনটি ত্রুটির ভিত্তিতে আমার পূর্ববর্তী ডেলিভারেবলগুলো প্রত্যাখ্যান করেছেন… আমাকে ফিরে গিয়ে মূল তথ্যগুলো পুনরায় যাচাই করতে হবে এবং নির্দিষ্ট সংখ্যাগত সমস্যাগুলো পরীক্ষা করে সংশোধন করতে হবে…"

আর আমাকে বলতেই হবে, এজেন্টরা সবাই একে অপরের প্রতি আপোসহীন, যা তাদেরকে তাদের কাজে সত্যিই নির্ভরযোগ্য করে তোলে।

পাঁচটি ১ বনাম ১ এজেন্ট লড়াইয়ে এই কথার লড়াই কয়েক ডজন বার ঘটেছিল। এই প্রক্রিয়া চলাকালীন, মেভিস আরও বলেন যে তিনি "নতুন কিছু শিখেছেন" এবং তার স্মৃতি ঝালিয়ে নিয়েছেন।

পূর্ববর্তী কাজটি চলমান থাকা অবস্থাতেই, আমরা নির্ভরযোগ্য তথ্যের ভিত্তিতে মে দিবসের ছুটির সময়কার পর্যটন বাজার বিশ্লেষণ করে একটি নতুন গভীরতর গবেষণা শুরু করব এবং একটি বহুমাত্রিক বিশ্লেষণ প্রতিবেদন প্রদান করব।

এই গবেষণাটি পূর্ববর্তী কাজের চেয়ে অনেক বেশি জটিল। অধিকন্তু, চলমান সংঘাতের কারণে, এজেন্ট দলটি একজন সাধারণ একক এজেন্টের তুলনায় গভীর গবেষণায় উল্লেখযোগ্যভাবে বেশি সময় ব্যয় করে।

তবে, অন্যান্য এআই বিষয়ক গভীর গবেষণালব্ধ ফলাফলের তুলনায় চূড়ান্ত প্রতিবেদনটি প্রকৃতপক্ষে অনেক বেশি নির্ভুল ও বিশ্বাসযোগ্য ছিল।

APPSO সম্প্রতি অনেকগুলো অফলাইন ইভেন্টের জন্য প্রস্তুতি নিচ্ছে, এবং এর পরিকল্পনা ও সমাধান উদ্ভাবন করা সবসময়ই একটি চ্যালেঞ্জ। কাজটি কেমন হয় তা দেখার জন্য আমরা এই দায়িত্বটিও ম্যাভিসের ওপর অর্পণ করেছি।

আমাকে গুয়াংঝোতে একটি অফলাইন এআই ডেভেলপার স্যালন আয়োজন করতে হবে। অনুগ্রহ করে শত শত বা হাজার হাজার অংশগ্রহণকারী সহ প্রযুক্তি ইভেন্টের জন্য উপযুক্ত যত বেশি সম্ভব ভেন্যুর তালিকা, আনুমানিক খরচের হিসাব এবং একই ধরনের ইভেন্টের তথ্য সরবরাহ করুন। তারপর, এই এআই ইভেন্টের থিম, প্রচার এবং পরিচালনার পরিকল্পনা করতে আমাকে সাহায্য করুন এবং এই সবকিছুকে একটি সুসংহত ব্যবসায়িক পরিকল্পনার কাঠামোতে সংকলন করুন। সেই সাথে থিমের সাথে সামঞ্জস্যপূর্ণ একটি সুন্দর ডিজাইন করা ওয়েবসাইটও তৈরি করে দিন।

শুধুমাত্র পরিকল্পনা প্রক্রিয়াতেই আগের গভীর গবেষণামূলক কাজগুলোর চেয়ে বেশি সময় লেগেছিল। মেভিস উত্তর দিল, "এই কাজটি বৃহৎ পরিসরের এবং এর জন্য একাধিক কর্মীকে সমান্তরালভাবে কাজ করতে হয়—স্থান গবেষণা, প্রতিযোগী বিশ্লেষণ, থিম পরিকল্পনা, ব্যবসায়িক পরিকল্পনা এবং ওয়েবসাইট তৈরি।"

মেভিসের শক্তি নিহিত রয়েছে ক্রমাগত নতুন নতুন প্রয়োজনীয়তা যোগ করার ক্ষমতায়:

দীর্ঘ প্রতিবেদনের পাশাপাশি, অনুষ্ঠানস্থলের সাথে সহযোগিতা, আমন্ত্রিত অতিথিদের সাথে সহযোগিতা এবং অন্যান্য সম্ভাব্য চুক্তিসহ একটি প্রাথমিক আনুষ্ঠানিক চুক্তির খসড়া এবং প্রাথমিক আর্থিক বিবরণী প্রস্তুত করতে পারলে সবচেয়ে ভালো হয়। এছাড়াও, এই পরিকল্পনাটি তুলে ধরার জন্য অনুগ্রহ করে একটি পাওয়ারপয়েন্ট প্রেজেন্টেশন প্রদান করুন, যা যত বিস্তারিত হবে তত ভালো।

নতুন প্রয়োজনীয়তা পাওয়ার পর, এজেন্ট টিম পরিকল্পনাটিকে আরও পরিমার্জন করে এবং আরও ওয়ার্কফ্লো চালু করে। অবশেষে, আমরা মোট নয়টি সমান্তরাল টাস্ক চালু করি।

যদি আমরা মেভিসের চিন্তাপ্রক্রিয়া উন্মোচন করি, তাহলে এজেন্টদের মধ্যে বিপুল সংখ্যক বার্তা আদান-প্রদান হতে দেখতে পাব। এই এজেন্টরা একটি বিশেষ টিম ইঞ্জিনের অধীনে কাজ করে এবং একে অপরের অবস্থা প্রেরণ করে; কেউ অপেক্ষা করছে, কেউ কাজ সম্পাদন করছে, এবং কেউ যাচাই করছে।

এই ভেরিফায়ারটিকে দেখুন, একে কি একজন খুঁতখুঁতে 'ক্লায়েন্ট'-এর মতো মনে হয় না?

সম্পূর্ণ কাজটি সম্পন্ন করে চূড়ান্তভাবে ১০ বা তারও বেশি ফাইল সরবরাহ করা হয়েছিল, যার মধ্যে xls, ppt, html ওয়েব পেজ এবং সেগুলোর সংশ্লিষ্ট .md সংস্করণ অন্তর্ভুক্ত ছিল।

▲ এজেন্ট টিম কর্তৃক তৈরি আর্থিক বাজেট স্প্রেডশিটে একটি প্রকল্প বাজেট সারাংশ, নগদ প্রবাহের পূর্বাভাস, টিকিটের মূল্য ও স্পনসরশিপ মূল্য নির্ধারণ মডেল এবং একটি বিস্তারিত ব্যয় খতিয়ান অন্তর্ভুক্ত থাকে।

এরপর, মেভিসের আরেকটি প্রধান বৈশিষ্ট্য নিয়ে কথা বলা যাক: এটি চ্যাট প্ল্যাটফর্মের সাথে সংযোগ করতে পারে এবং মাল্টিটাস্কিং সমর্থন করে।

মিনিম্যাক্স-এর ইতিমধ্যে সমর্থিত ওপেনক্ল এবং হার্মিস এজেন্টের মতোই, ম্যাভিসও দুটি ইনস্ট্যান্ট মেসেজিং প্ল্যাটফর্ম উইচ্যাট এবং লার্ক-এর মাধ্যমে কাজ বরাদ্দ করতে পারে। ইন্টিগ্রেশন প্রক্রিয়াটি অত্যন্ত সরলীকৃত; শুধু সেটিংস বোতামে ক্লিক করুন, কিউআর কোড স্ক্যান করুন এবং অ্যাপ্লিকেশনটির নাম দিন, তাহলেই আপনি উইচ্যাট/লার্ক-এর মধ্যে ম্যাভিস ব্যবহার করতে পারবেন।

যখন একটি সাধারণ এজেন্ট প্রোডাক্ট কোনো ইনস্ট্যান্ট মেসেজিং (IM)-এর সাথে সংযুক্ত হয় এবং আমরা এটিকে এমন কোনো কাজ দিই যা সম্পন্ন হতে অনেক সময় লাগে, তখন প্রায়শই এর মানে দাঁড়ায় যে বার্তাটি পাঠানোর পর আমরা অন্য কোনো বিষয়ে এর সাহায্য আর নিতে পারি না।

এর একটি কারণ হলো এই এজেন্টগুলো একই সাথে একাধিক ডায়ালগ উইন্ডো খুলতে পারে না; আরেকটি কারণ হলো এজেন্টের কার্যপ্রণালীর সীমাবদ্ধতা। একটি সেশনে একাধিক কাজ চালালে সহজেই প্রাসঙ্গিক বিভ্রান্তি এবং তথ্যের দূষণ ঘটতে পারে।

মিনিম্যাক্সের সমাধান হলো 'তাৎক্ষণিক প্রতিক্রিয়া' এবং 'কার্য সম্পাদন'-এর লজিককে বিচ্ছিন্ন করা।

আমি লার্ক-এ অ্যাপসোকে দিয়ে সাম্প্রতিক তেলের মূল্যবৃদ্ধি নিয়ে গবেষণা করিয়েছিলাম; কাজটি শুরু হওয়ার পর, আমি এটিকে দিয়ে গত মাসে সিলিকন ভ্যালির এআই জায়ান্টদের দ্বারা প্রকাশিত গুরুত্বপূর্ণ পণ্যগুলো নিয়েও গবেষণা করিয়েছিলাম।

মেভিস আগের কাজটি বন্ধ না করে আমাকে জানালো যে নতুন কাজটি ইতিমধ্যে সম্পন্ন হয়ে গেছে, অথচ তেলের দাম বৃদ্ধি সংক্রান্ত কাজটি তখনও প্রক্রিয়াধীন ছিল।

এটি মেভিসের আরেকটি মূল নকশা নীতি: প্রসঙ্গ বিচ্ছিন্নতার সুবিধা।

প্রতিটি এজেন্ট দল এবং দলের প্রত্যেক এজেন্ট শুধুমাত্র তাদের নিজস্ব মিশনের সাথে প্রাসঙ্গিক তথ্যের সারসংক্ষেপ দেখতে পায় এবং কেবল বিস্তারিত বিবরণের প্রয়োজন হলেই সম্পূর্ণ লেখাটি পড়ে।

এই পদ্ধতির দুটি সুবিধা রয়েছে: প্রথমত, এটি টোকেনের খরচ নিয়ন্ত্রণে রাখে, ফলে একটি বড় দল থাকা সত্ত্বেও কনটেক্সট সহজে উপচে পড়া রোধ করে; দ্বিতীয়ত, এটি কনটেক্সট দূষণ প্রতিরোধ করে, যা নিশ্চিত করে যে অনুসন্ধানের সময় এজেন্টের সম্মুখীন হওয়া ভুল তথ্য পুরো দলটিকে নিশ্চিহ্ন করে দেবে না।

সবচেয়ে চরম পরিস্থিতিতে, আমরা লার্ক ব্যবহার করে তাকে খুব অল্প সময়ের মধ্যে ৮টি কাজ দেওয়ার চেষ্টা করেছিলাম, এবং সেখানে প্রসঙ্গ বিভ্রান্তির কোনো ঘটনা ঘটেনি।

পুরো অভিজ্ঞতাটা অনেকটা এমন একজন সহকর্মীর সাথে কাজ করার মতো, যার জ্ঞানীয় ক্ষমতা অত্যন্ত বেশি: তিনি শুধু তাৎক্ষণিকভাবে বার্তার উত্তরই দিতে পারেন না, বরং কোনো বাধা ছাড়াই নেপথ্যেও কাজ করতে পারেন। কাজের অগ্রগতি জানতে চাইলে, তাঁর কাজের গভীর অবস্থা বা ‘ফ্লো স্টেট’-এ ব্যাঘাত ঘটার চিন্তা না করেই সরাসরি জিজ্ঞাসা করতে পারেন।

বিভিন্ন সেশন পরিচালনাকারী এজেন্টরা শুধুমাত্র তাদের নিজস্ব কাজের সাথে প্রাসঙ্গিক তথ্য দেখতে পায় এবং ক্রমাগত প্রসারিত হতে থাকা কথোপকথনের ইতিহাস তাদের সাথে শেয়ার করা হয় না।

সংক্ষেপে, ম্যাভিস আইএম চ্যানেল থেকে টাস্ক হাব এবং তারপর মলিকিউলার টাস্কের প্রতিটি মলিকিউলার এজেন্ট পর্যন্ত এন্ড-টু-এন্ড কনটেক্সট আইসোলেশন অর্জন করে।

অবশেষে, প্রধান প্রধান এআই কোম্পানিগুলোর এই মাসে প্রকাশিত নতুন এআই পণ্য এবং গুরুত্বপূর্ণ মূর্ত বুদ্ধিমত্তা পণ্যগুলো সম্পর্কে প্রশ্নের উত্তর দেওয়ার পাশাপাশি, এটি তেল মিশনের মূল ধারাটিও সফলভাবে সম্পন্ন করেছে এবং আমাদের একটি বিশদ প্রতিবেদন দিয়েছে, যেখানে এমনকি জাপানি আলুর চিপসের প্যাকেজিং সাদা-কালো হতে চলার সাম্প্রতিক খবরেরও উল্লেখ করা হয়েছে।

পরীক্ষা করার পর, আপনি কি লক্ষ্য করেছেন যে মেভিসের বিন্যাস কৌশলটি আসলে কিছুকাল ধরে জনপ্রিয় 'তিনটি প্রদেশ ও ছয়টি মন্ত্রণালয়' দক্ষতাটির সাথে কিছুটা সাদৃশ্যপূর্ণ?

প্রতিটি চরিত্র কী করবে, কখন শুরু করবে এবং কখন দায়িত্ব হস্তান্তর করবে, তা মডেলের নিজস্ব সিদ্ধান্ত গ্রহণকারী ব্ল্যাক বক্সের পরিবর্তে ইঞ্জিন স্তরের স্টেট মেশিন দ্বারা নির্ধারিত হবে।

সংক্ষেপে, এর অর্থ হলো মডেলের অনিয়ন্ত্রণযোগ্যতা এবং এলোমেলোভাবকে মৌলিকভাবে মোকাবেলা করার জন্য একাধিক এজেন্টের কার্যসম্পাদনে প্রকৌশল-স্তরের নিয়ন্ত্রণযোগ্যতা, কঠোরতা এবং নিয়তিবাদ ব্যবহার করা।

এই পদ্ধতিটি অতীতের এজেন্ট/মডেলগুলোর 'একই সাথে রেফারি ও খেলোয়াড় হিসেবে কাজ করার' চিরায়ত সমস্যাটির সম্পূর্ণ সমাধান করে।

অভিন্ন ক্রেডিট সীমা, এজেন্টের পর্যাপ্ত সহজলভ্যতা।

Mavis পরীক্ষা করার পর, চলুন MiniMax-এর করা আরেকটি সমান গুরুত্বপূর্ণ বিষয় নিয়ে কথা বলা যাক যা সকল অর্থ প্রদানকারী ব্যবহারকারীকে প্রভাবিত করে: এবার, টোকেন প্ল্যান এবং এজেন্ট প্ল্যানকে একীভূত করা হয়েছে।

একত্রীকরণের পর, সাধারণ ব্যবহারকারীদের দৈনন্দিন ব্যবহার—যেমন অফিসিয়াল ওয়েবসাইট ও অ্যাপে এজেন্টের সাথে যোগাযোগ ও ব্যবহার করা, কিংবা অন্যান্য টুল (যেমন কোডিং প্রোডাক্ট বা ওপেনক্ল/হার্মিস এজেন্ট) কল করার জন্য অফিসিয়াল এপিআই অ্যাক্সেস করা—সব ক্ষেত্রেই এখন একটি সমন্বিত প্ল্যান ব্যবহার করা যাবে। এছাড়াও, এম২.৭ ও এর পরবর্তী ফ্ল্যাগশিপ মডেলগুলো এবং সেইসাথে মিউজিক, ভিডিও ও ভয়েসের জন্য মাল্টিমোডাল মডেলগুলোও এই একক প্ল্যানের অন্তর্ভুক্ত।

সকল ক্রেডিট লিমিট শেয়ার করা হয়, এবং ব্যবহারকারীরা নিজেরাই সিদ্ধান্ত নিতে পারেন যে তারা কীভাবে তা খরচ করবেন। মিনিম্যাক্স একটি বোনাসও দিচ্ছে: যেসব ব্যবহারকারী আগে একসাথে দুটি প্ল্যান সাবস্ক্রাইব করেছিলেন, তারা অতিরিক্ত এক মাসের মেম্বারশিপ পাবেন।

এটা কেন করা হয়? ব্যবহারকারীর দৃষ্টিকোণ থেকে দেখলে, এটি আসলে বেশ যুক্তিসঙ্গত।

সহজ কথায় বলতে গেলে, এজেন্ট যুগে ব্যবহারকারীদের অর্থ প্রদানের প্রেরণা আসে "মডেল কম্পিউটিং পাওয়ার"-এর চাহিদা থেকে। মডেলগুলোর কোডিং, এজেন্ট এবং মাল্টিমোডাল সক্ষমতা যত উন্নত হবে, এই চাহিদাগুলোর ক্ষেত্র ততই বৈচিত্র্যময় হয়ে উঠবে এবং স্বাভাবিকভাবেই মডেল বিক্রেতাদের পণ্যে (অফিসিয়াল ওয়েবসাইট, স্বতন্ত্র পণ্য, সিএলআই) এবং পণ্যের বাইরেও (স্বতন্ত্রভাবে ডেপ্লয় করা এজেন্ট যা এক্সটার্নাল এপিআই অ্যাক্সেস করে) এর উদ্ভব ঘটবে।

এটি আসলে এমন একটি সমস্যা যা সব বড় বড় এআই কোম্পানিগুলোই মোকাবেলা করছে: ওপেনএআই এবং অ্যানথ্রোপিক বর্তমানে ব্যবহারকারীর সাবস্ক্রিপশন এবং এপিআই বিলিং আলাদা করে; অন্যদিকে ছোট এজেন্ট স্টার্টআপগুলো ব্যবহারকারীদের দিয়ে এপিআই ফি পরিশোধ করানোর পরিবর্তে, তাদের নিজস্ব সাবস্ক্রিপশন ফি ব্যবহার করেই সেই ফি পরিশোধ করে।

এবার মিনিম্যাক্স তার পণ্যের কাঠামোর অভ্যন্তরীণ দেয়ালগুলো ভেঙে ফেলার ক্ষেত্রে অগ্রণী ভূমিকা নিয়েছে। অ্যাপসো মনে করে যে, আজকের এই অত্যন্ত পণ্যভিত্তিক বাজারে, যেখানে ব্যবহারকারীরা সর্বদা নতুনতম এবং সবচেয়ে সস্তা মডেলের দিকে ঝুঁকে পড়ে, সেখানে এই একীভূত প্যাকেজ কৌশলটি মডেল প্রস্তুতকারকদের ব্যবহারকারীর আনুগত্য বজায় রাখতে প্রকৃতপক্ষে সাহায্য করে।

চলুন মূল পণ্যটিতে ফিরে যাই।

যেমনটা আগে উল্লেখ করা হয়েছে, APPSO একটি প্রবন্ধ লিখছে যেখানে বলা হয়েছে, "যেসব মডেল বিক্রেতা কোডিং/এজেন্ট বিষয়ে আন্তরিক, তাদের অবশ্যই নিজস্ব কোডিং/এজেন্ট পণ্য তৈরি করতে হবে।" বলা যেতে পারে মিনিম্যাক্স দেরিতে এসেছে, কিন্তু এটি খুব বেশি দূরে নয়।

বর্তমানে, মাল্টি-এজেন্ট আর্কিটেকচারের উপর বাজি ধরা প্রথম পণ্য মেভিস নয়। গত ছয় মাসে, চ্যাটজিপিটি, ম্যানাস এবং জেনস্পার্কের মতো কোম্পানিগুলো এই 'মাল্টি-এজেন্ট' যুদ্ধে যোগ দিয়েছে।

প্রকৃত পরীক্ষা সম্পন্ন করার পর APPSO-র ধারণা হয় যে, "পণ্যটি যখন নিজে থেকেই একটি অত্যন্ত জটিল/দীর্ঘমেয়াদী কাজ চালাতে পারে", সেই নিরিখে Mavis তার প্রতিযোগীদের চেয়ে ভালো কাজ করেছে এবং এর আর্কিটেকচারও অধিক স্থিতিশীল। যেখানে অন্যান্য পণ্যের মাল্টি-এজেন্ট পদ্ধতিগুলো প্রম্পট শব্দ বিন্যাস এবং কাজ বিভাজনের মধ্যেই সীমাবদ্ধ ছিল, সেখানে Mavis ইঞ্জিনিয়ারিং পর্যায়েই প্রতিপক্ষীয় কঠোর সীমাবদ্ধতা প্রয়োগ করেছিল—যার ফলে পার্থক্যটি ছিল বেশ তাৎপর্যপূর্ণ।

তবে, এই স্থাপত্যশৈলীটি সম্ভাবনাময় মনে হলেও একটি অনিবার্য বাস্তবতা রয়েছে: এটি ব্যয়বহুল।

মিনিম্যাক্স তার টেকনিক্যাল ব্লগে "কনসেনসাসের খরচ" (Cost of Consensus) ধারণাটি প্রবর্তন করেছে। সহজ ভাষায় বলতে গেলে, যদিও একাধিক এজেন্ট একে অপরকে "যাচাই ও ভারসাম্য" (check and balance) করে প্রক্রিয়া এবং ফলাফলকে আরও নির্ভরযোগ্য করে তোলে, ঐকমত্যে পৌঁছানোর এই প্রক্রিয়ার একটি খরচ আছে, যেখানে টোকেন খরচ একজন একক এজেন্টের তুলনায় কয়েকগুণ বেশি; তাছাড়া, তর্ক করার মতোই, উত্তপ্ত বিতর্কে জড়িয়ে পড়লে মূল বিষয় থেকে সরে যাওয়ার সম্ভাবনা থাকে এবং নির্ভুলতা বাড়ার পরিবর্তে কমেও যেতে পারে।

মিনিম্যাক্সের বিশ্লেষণ অনুযায়ী, এর এজেন্ট টিম আর্কিটেকচারের নির্দিষ্টভাবে তিন ধরনের খরচ রয়েছে:

প্রথমত, হস্তান্তরের খরচ রয়েছে। এজেন্টদের মধ্যে তথ্য স্থানান্তরের সময় সেটিকে পুনর্গঠন করতে হয়। প্রতিটি হস্তান্তরের জন্য তথ্যকে এমন একটি রূপে "অনুবাদ" করতে হয় যা পরবর্তী এজেন্ট ব্যবহার করতে পারে, এবং এর জন্য টোকেন খরচ হয়।

দ্বিতীয়ত, (প্রসঙ্গ-তথ্য) আদান-প্রদানের একটি খরচ রয়েছে। এই খরচ কিছুটা নিয়ন্ত্রণ করার জন্যই কনটেক্সট আইসোলেশন ডিজাইন করা হয়েছে। তবে, প্রতিটি এজেন্ট যদি শুধু অন্য এজেন্টদের কাছ থেকে পাঠানো 'সারাংশ' দেখেও, এজেন্ট দলের আকার বাড়ার সাথে সাথে সারাংশগুলো সংরক্ষণ ও বিতরণ করতেও খরচ হতে থাকবে।

তৃতীয়ত, রয়েছে একত্রীকরণের খরচ। APPSO সবসময় এই বিষয়টির ওপর জোর দিতে চেয়েছে: শত শত বা হাজার হাজার দক্ষতা এবং একটি অত্যন্ত জটিল 'তিনটি প্রদেশ ও ছয়টি বিভাগ' সিস্টেম সম্বলিত একটি ওয়ার্কফ্লোকেই চূড়ান্ত সমাধান বলে ধরে নেবেন না—এটি প্রায়শই তা হয় না। প্রকৃতপক্ষে, আপনি হয়তো টোকেন বিক্রেতাদের পাতা ফাঁদে পা দিচ্ছেন… আপনি হয়তো কাজটি আরও বিস্তারিত করেছেন, কিন্তু চূড়ান্ত ফলাফল একত্রিত ও সংগঠিত করার জন্য আপনাকে আরও বেশি টোকেন খরচ করতে হবে।

এই সম্মিলিত খরচগুলোর অর্থ হলো, একাধিক এজেন্ট রাখাটা কখনোই "যত বেশি এজেন্ট, তত ভালো"—এর মতো কোনো সহজ বিষয় নয়।

তবে, অন্য দৃষ্টিকোণ থেকে দেখলে: কোনো কাজে তথ্য আদান-প্রদান যত বেশি জটিল হয়, তার অন্তর্নিহিত মূল্যও প্রায়শই তত বেশি হয়। একাধিক যাচাই ও বারবার পরীক্ষা-নিরীক্ষার প্রয়োজন হয় এমন একটি পুঙ্খানুপুঙ্খ গবেষণা প্রতিবেদন এবং একটি সাধারণ প্রশ্নকে একই যুক্তিতে বিচার করা উচিত নয়। মেভিস তার সূক্ষ্মতার কারণেই ব্যয়বহুল, এবং সেই সূক্ষ্মভাবে সম্পন্ন করা কাজগুলো এই মূল্যের যোগ্য।

তারা নিম্নমানের কাজ করার চেয়ে সবকিছু নিখুঁতভাবে সম্পন্ন করতে বেশি অর্থ ব্যয় করতে বেশি পছন্দ করেন; জটিল কাজের সাথে জড়িত উচ্চ-মূল্যের ব্যবহারকারীরা এই বিষয়টিকেই গুরুত্ব দেন।

অবশ্যই, প্রোগ্রামের পুনরাবৃত্তির কারণে সৃষ্ট টোকেনের অপচয় এড়াতে মিনিম্যাক্স টিমও কিছু ইঞ্জিনিয়ারিং ডিজাইন করেছিল।

ব্যবহারকারীদের জন্য মিনিম্যাক্সের পরামর্শ হলো, এজেন্ট টিমগুলো "ব্যয়বহুল এবং জটিল" কাজের জন্য; এগুলো একটি কৌশলগত বিকল্প, ডিফল্ট ব্যবস্থা নয়। ব্যবহারকারীদের কাজের জটিলতা, ওয়ার্কফ্লোর দৈর্ঘ্য, ঝুঁকি এবং অভিজ্ঞতার পুনঃব্যবহারের গুরুত্ব মূল্যায়ন করা উচিত—এই বিষয়গুলো যত বেশি হবে, এজেন্ট টিম ব্যবহার করা তত বেশি লাভজনক হবে। এর বিপরীতে, একজন একক এজেন্ট বা এমনকি একটি সাধারণ চ্যাটও ব্যবহার করা যেতে পারে।

বেশি এজেন্ট থাকার অর্থ কি আবশ্যিকভাবেই বেশি বুদ্ধিমত্তা? মোটেই না। কিন্তু মেভিস-এর তাৎপর্য হলো, এটি মডেলকে নিজে থেকে সিদ্ধান্ত নিতে দেওয়ার পরিবর্তে, প্রতিপক্ষীয় কৌশল, যাচাইকরণ, দায়িত্বের সুস্পষ্ট বিভাজন এবং পুরস্কার/শাস্তি ব্যবস্থা সহ একটি প্রমাণিত ইঞ্জিনিয়ারিং সিস্টেমের মাধ্যমে সত্যিকারের জটিল ও জ্ঞান-নিবিড় কাজগুলো সম্পন্ন করার সুযোগ করে দেয়।

এটি অগত্যা এআই-কে আরও বুদ্ধিমান করে তুলবে না, তবে এটি অবশ্যই এআই-এর পক্ষে ফাঁকি দেওয়া কঠিন করে তুলবে—যা বড় মডেলগুলোর নিজেদের জন্যই একটি দীর্ঘস্থায়ী সমস্যা।

আসলে, বাস্তব আন্তঃব্যক্তিক কাজে আমাদের সহকর্মীদের খুব বুদ্ধিমান হওয়ার প্রয়োজন নেই… শুধু অলস হবেন না বা চালাক হওয়ার চেষ্টা করবেন না, সেটাই যথেষ্ট, তাই না?

ডু চেন এবং ঝাং জিহাও দ্বারা

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।