হার্মিস কি লবস্টারের জায়গা নিচ্ছে? ৪০,০০০ স্টার সমৃদ্ধ হার্মিস এজেন্ট, ওপেনক্ল-এর শুধু একটি বিকল্প নয়, তার চেয়েও বেশি কিছু।

হারনেস-এর অনুবাদ নিয়ে আলোচনা করা পূর্ববর্তী প্রবন্ধে একজন পাঠক মন্তব্য করেছিলেন যে এটিকে হার্মিস বলা যেতে পারে।

আমি প্রথমে ভেবেছিলাম এটা একটা শ্লেষ, কিন্তু পরে জানতে পারলাম যে হার্মিস নামে সত্যিই একটি এজেন্ট প্রোডাক্ট আছে, এবং এটি পুরো মাস ধরে গিটহাবের ট্রেন্ডিং তালিকায় এক নম্বরে রয়েছে, বর্তমানে যার স্টার সংখ্যা ৪৮,০০০।

সম্প্রতি ব্যাপক জনপ্রিয়তা পাওয়া এজেন্ট লবস্টারের মতো নয়, হার্মিস হলো একটি নিবেদিত ব্যক্তিগত এআই সহকারী যা সকল অপারেটিং সিস্টেম এবং প্ল্যাটফর্ম সমর্থন করে। হার্মিসের বিবরণে লেখা আছে, "সেই এজেন্ট যা আপনার সাথে সাথে বিকশিত হয়।"

এর শব্দটা খুবই অভিজাত, এবং এটাই হার্মিস এজেন্টকে অনন্য করে তুলেছে।

এতে একটি অন্তর্নির্মিত লার্নিং লুপ ফ্রেমওয়ার্ক রয়েছে। বিভিন্ন জটিল কাজ সামলানোর জন্য একাধিক এজেন্টকে একত্রিত করতে ওপেনক্ল (OpenClaw) কনফিগারেশন ফাইল পরিবর্তনের উপর নির্ভর করে। হার্মিস এজেন্ট (Hermes Agent) একটি একক এজেন্ট ফ্রেমওয়ার্ক, যার সক্ষমতা প্রকৃত ব্যবহারের সময় বাড়ার সাথে সাথে ক্রমাগত উন্নত হতে থাকবে।

এটি যে সমস্যার সমাধান করে তা হলো, যখন সবাই আলোচনা করে যে একটি এজেন্ট কী করতে পারে, তখন কেউ খেয়াল করে না যে ব্যবহারের পর এজেন্টটি কিছুই রেখে যায় না। অন্যদিকে, হার্মিস এজেন্ট এখন মনে রাখতে পারে 'কোন পদ্ধতিগুলো কাজ করেছিল'।

সোশ্যাল মিডিয়ায় হার্মিস এজেন্ট ব্যবহারের সুপারিশ করে অনেক পোস্টও রয়েছে, যেখানে কেউ কেউ বলছেন যে তাঁরা সম্প্রতি ওপেনক্ল থেকে হার্মিসে স্থানান্তরিত হয়েছেন এবং এটিই তাঁদের জীবনের সেরা সিদ্ধান্ত ছিল।

কিছু লোক 'হার্মিস অরেঞ্জ পেপার'-টিও শেয়ার করেছেন, যেখানে বলা হয়েছে যে হার্মিস এজেন্ট একটি মারাত্মকভাবে অবমূল্যায়িত পণ্য এবং বর্তমানে উপলব্ধ সবচেয়ে শক্তিশালী ওপেন-সোর্স এআই এজেন্ট ফ্রেমওয়ার্কগুলোর মধ্যে অন্যতম।

হার্মিস এজেন্ট তৈরি করেছে নুস রিসার্চ টিম। গিটহাবে এর রিলিজ হিস্ট্রি দেখলে বোঝা যায়, মার্চের মাঝামাঝি সময়ের V0.2.0 আপডেট থেকে শুরু করে গতকালের V0.8.0 রিলিজ পর্যন্ত প্রতিটি আপডেটে প্রচুর কোড কমিট ও মার্জ এবং সেই সাথে ব্যবহারিক ফিচারের আপডেটও রয়েছে, যা এটিকে একটি অত্যন্ত সক্রিয় ওপেন সোর্স প্রজেক্টে পরিণত করেছে।

▲এটি সর্বপ্রথম ২৫শে ফেব্রুয়ারি প্রকাশিত হয়েছিল, https://nousresearch.com/releases

কারপাথির পূর্বে শেয়ার করা এলএলএম উইকি নোট-নেওয়ার পদ্ধতিটি, যা নিজস্ব জ্ঞান ও গবেষণা ভান্ডার গড়ে তোলার জন্য বৃহৎ ল্যাঙ্গুয়েজ মডেল এবং অবসিডিয়ান নোট-নেওয়ার টুল ব্যবহার করে, তা অবিলম্বে হার্মিসের অন্তর্নির্মিত দক্ষতার তালিকায় যুক্ত করা হয়েছে।

হার্মিস এজেন্ট শুধু কম্পিউটারে নয়, টার্মাক্স টার্মিনাল এমুলেটরের মাধ্যমে অ্যান্ড্রয়েড ফোনেও ইনস্টল করা যায়। এই মডেল এবং গেটওয়ের কনফিগারেশন ওপেনক্ল-এর অনুরূপ।

উল্লেখ্য যে, ক্লদ এখনও এটিকে "ব্লক" করেনি; আমরা ক্লদ প্রো বা উচ্চতর সদস্য হিসেবে লগ ইন করে সরাসরি বড় মডেলগুলো কনফিগার করতে পারি। এছাড়াও, হার্মিস এজেন্ট তাদের নিজস্ব সাবস্ক্রিপশন-ভিত্তিক নু পোর্টাল লগইনও প্রদান করে।

▲নুস রিসার্চ টিমের হার্মিস ৪ মডেল

আজ শাওমির মিমিো প্ল্যাটফর্ম আনুষ্ঠানিকভাবে ঘোষণা করেছে যে, " শাওমি মিমিো বিশ্বের শীর্ষস্থানীয় এজেন্ট ফ্রেমওয়ার্ক, হার্মিস এজেন্টের সাথে সমন্বিত হয়েছে এবং এটি দুই সপ্তাহের জন্য বিনামূল্যে পাওয়া যাচ্ছে। "

 হার্মিস এজেন্ট অফিসিয়াল ওয়েবসাইট: https://hermes-agent.nousresearch.com

কেন ওপেনক্ল একটি প্রকৃত প্রতিদ্বন্দ্বী?

ওপেনক্ল-এর মূল উদ্দেশ্য হলো আমাদের এআই-কে চ্যাট উইন্ডো থেকে সম্পূর্ণরূপে বের করে এনে বাস্তব কাজ, পড়াশোনা এবং জীবনে একীভূত করা, যাতে এটি সত্যিকারের কাজ সম্পাদন করতে পারে। এটি উইচ্যাট, এন্টারপ্রাইজ উইচ্যাট এবং লার্ক-এর সাথে সংযোগ স্থাপন করতে পারে, টার্মিনাল কমান্ড চালাতে পারে, ব্রাউজার নিয়ন্ত্রণ করতে পারে এবং আমাদের ইমেল পাঠাতে, সময়সূচী পরিচালনা করতে ও আরও অনেক কিছুতে সাহায্য করতে পারে।

তবে, ওপেনক্ল-এর একটি অসুবিধা রয়েছে: এটি আমাদের দৈনন্দিন ব্যবহার থেকে স্বয়ংক্রিয়ভাবে শিখতে ও উন্নত হতে পারে না।

OpenClaw-এর মেমরি স্থির—আমরা কনফিগারেশন ফাইলে তথ্য লিখি, এটি তা পড়ে, সেশন শেষ হয়ে যায় এবং পরের বার আবার তা পড়ে। এটি এক্সিকিউশন প্রসেস থেকে সক্রিয়ভাবে কোনো কিছু গ্রহণ করে না, এবং আমরা একবার সংশোধন করেছি বলেই যে পরের বার স্বয়ংক্রিয়ভাবে সঠিক কাজটি করবে, তাও নয়।

সমস্ত ওয়ার্কফ্লো একবার ব্যবহার করার পরেও, আমাদের তাদের মনে করিয়ে দিতে হয়, সম্ভবত সেগুলোকে স্কিল বা নির্দিষ্ট প্রম্পটের মধ্যে প্যাকেজ করার মাধ্যমে।

যদিও বর্তমানে ওপেনক্ল-কে স্ব-শিক্ষণ ক্ষমতা দেওয়ার জন্য বিশেষায়িত দক্ষতা রয়েছে, হার্মিস এজেন্ট এর অন্তর্নিহিত আর্কিটেকচারের লার্নিং লুপ থেকে শুরু করে মেমরি সিস্টেম এবং এজেন্টের অভ্যন্তরীণ কার্য সম্পাদন পর্যন্ত, "আপনি যত বেশি এটি ব্যবহার করবেন, আপনাকে তত ভালোভাবে বোঝার" উপর মনোযোগ দেয়।

হার্মিস এজেন্টকে যা বিশেষ করে তোলে তা হলো এর আবদ্ধ শিক্ষণ চক্র।

প্রতিটি কাজ সম্পন্ন হওয়ার পর, হার্মিস যাচাই করে দেখে যে এর সম্পাদনের মান লিপিবদ্ধ করার যোগ্য কি না। এটি সক্রিয় হওয়ার শর্তগুলো নির্দিষ্ট: টুলটি ৫ বারের বেশি কল করা হলে, মাঝপথে কোনো ত্রুটি ঘটলে এবং তা স্বয়ংক্রিয়ভাবে ঠিক হয়ে গেলে, ব্যবহারকারী কোনো সংশোধন করলে, অথবা একটি সূক্ষ্ম কিন্তু কার্যকর পথ অনুসরণ করা হলে। এই শর্তগুলোর কোনোটি পূরণ হলে, এটি ~/.hermes/skills ডিরেক্টরিতে একটি Skill ফাইল তৈরি করবে।

স্কিলস মার্কেটে বহুল ব্যবহৃত অন্যান্য স্কিলের মতোই, এই স্বয়ংক্রিয়ভাবে তৈরি ডকুমেন্টটি একটি ওয়ার্কফ্লো প্রদান করে যা আপনি পরেরবার সরাসরি অনুসরণ করতে পারবেন। এর নাম, বিবরণ, ধাপসমূহ এবং সংশ্লিষ্ট টুল কলগুলো সবই স্পষ্টভাবে উল্লেখ করা থাকে। এর ফরম্যাটটি agentskills.io ওপেন স্ট্যান্ডার্ড অনুসরণ করে এবং তাত্ত্বিকভাবে এটি ক্রস-এজেন্ট কম্প্যাটিবল ও OpenClaw, Claude Code, এবং Cursor-এর মতো টুলগুলোতে ব্যবহারযোগ্য।

স্কিল ফাইলগুলো হার্ডকোড করা থাকে না। পরবর্তী এক্সিকিউশনের সময় হার্মিস এজেন্ট আরও ভালো কোনো পাথ খুঁজে পেলে সেগুলোকে পরিবর্তন করে দেবে। পুরো ফাইলটি নতুন করে লেখার পরিবর্তে, প্যাচ ব্যবহার করে পরিবর্তনগুলো করাই শ্রেয়, কারণ প্যাচ শুধু পুরোনো স্ট্রিং এবং প্রতিস্থাপিত কন্টেন্টটুকু পাস করে দেয়।

এই পছন্দের পিছনে দুটি বিষয় বিবেচনা করা হয়েছে: সম্পূর্ণ ওভাররাইট করলে মূল কার্যকরী অংশগুলো সহজেই নষ্ট হয়ে যেতে পারে, অপরদিকে প্যাচিং শুধুমাত্র সমস্যাযুক্ত অংশগুলোকে সমাধান করে, যা এটিকে আরও নিরাপদ করে এবং কম টোকেন খরচ করে।

এজেন্টদের জন্য স্মৃতিই হলো সবচেয়ে কঠিন সমস্যা।

OpenClaw থেকে আরেকটি পার্থক্য হলো এর মেমরি সিস্টেম।

কিছুদিন আগে, 'রেসিডেন্ট ইভিল'-এর প্রধান নারী চরিত্রে অভিনয় করা মিলা জোভোভিচ এবং প্রকৌশলী বেন সিগম্যান যৌথভাবে মেমপ্যালেস (MemPalace) নামক একটি ওপেন-সোর্স এআই মেমোরি টুল প্রকাশ করেছেন, যা দুই দিনে ২৩,০০০-এরও বেশি গিটহাব স্টার পেয়েছে।

এর নকশাটি প্রাচীন গ্রিক বক্তাদের স্মৃতি কৌশল থেকে অনুপ্রাণিত, যারা নিজেদের মনে রাখার মতো বিষয়গুলো একটি কাল্পনিক ভবনের বিভিন্ন কক্ষে রেখে দিতেন এবং প্রয়োজনমতো তা সংগ্রহ করতে সেখানে যেতেন।

সম্পূর্ণ সিস্টেমটি পাঁচটি স্তরে বিভক্ত: উইং (প্রকল্প বা ব্যক্তি), হল (মেমরি টাইপ), রুম (বিষয়), ক্লোজেট (সংকুচিত সারাংশ), এবং টানেল (বিভিন্ন বিষয়ের উদ্ধৃতি)। মেমপ্যালেস দাবি করে যে, শুধুমাত্র এই স্তরক্রমিক কাঠামোটিই অনুসন্ধানের নির্ভুলতা ৬০.৯% থেকে ৯৪.৮%-এ উন্নীত করেছে।

মেমপ্যালেসের মূল নীতি হলো: কী মনে রাখার মতো, তা নির্ধারণ করার দায়িত্ব এআই-কে দেওয়া উচিত নয়। এআই-এর বিচার নির্ভরযোগ্য নয়, তাই সবকিছু সংরক্ষণ করে রাখাই শ্রেয় এবং পুনরুদ্ধারের মাধ্যমেই নির্ধারণ করা উচিত কোনটি দরকারি।

এই মাসের শুরুতে ক্লড কোডের ৫ লক্ষ লাইনের কোড ফাঁসের ঘটনায়, মেমরি সমস্যার আরেকটি সমাধান কৃত্রিম বুদ্ধিমত্তার (এআই) উপর নির্ভর করেছিল। কিছু নেটিজেন আবিষ্কার করেছেন যে ক্লড একটি স্বপ্ন-সদৃশ পদ্ধতি ব্যবহার করে, যেখানে অটো ড্রিম আমাদের মেমরি ফাইলগুলোকে স্বয়ংক্রিয়ভাবে সাজিয়ে তোলে।

হার্মিসের স্মৃতি ব্যবস্থাও বিশেষভাবে নকশা করা ছিল, যা চারটি স্তর নিয়ে গঠিত ছিল; প্রতিটি স্তর ভিন্ন ভিন্ন কাজের জন্য দায়ী ছিল এবং ভিন্ন ভিন্ন সময়ে তা পুনরুদ্ধার করা হতো।

প্রথম স্তরটিকে পারসিস্টেন্ট কিউ মেমোরি বলা হয়। MEMORY.md এবং USER.md নামের দুটি ফাইল সেই কনটেক্সট সংরক্ষণ করে, যা প্রতিটি সেশনের শুরুতে স্বয়ংক্রিয়ভাবে লোড হওয়া প্রয়োজন। মোট অক্ষর সংখ্যা মাত্র ৩৫৭৫; হার্মিস এজেন্ট ইচ্ছাকৃতভাবে এই সংখ্যাটি কমিয়ে এনেছে, যাতে আমরা সবকিছু একসাথে না ঢুকিয়ে ফিল্টার করতে বাধ্য হই।

দ্বিতীয় স্তরটি হলো সেশন আর্কাইভ। প্রতিটি কথোপকথন একটি SQLite ডেটাবেসে লেখা হয় এবং একটি ফুল-টেক্সট ইনডেক্স ব্যবহার করে তা পুনরুদ্ধার করা হয়। যখন হার্মিস এজেন্টের ঐতিহাসিক প্রেক্ষাপটের প্রয়োজন হয়, তখন এটি সক্রিয়ভাবে একটি কোয়েরি শুরু করে, অনুসন্ধানের ফলাফলের উপর একটি LLM সামারি সম্পাদন করে এবং শুধুমাত্র বর্তমান কাজের সাথে প্রাসঙ্গিক অংশগুলো অন্তর্ভুক্ত করে।

▲ডকুমেন্টের লিঙ্ক: https://hermes-agent.nousresearch.com/docs/user-guide/features/memory

তৃতীয় স্তরটি হলো স্কিল ফাইল, যা উপরে উল্লিখিত শিখন চক্রের আউটপুট। ডিফল্টরূপে, সিস্টেমটি শুধুমাত্র স্কিলের নাম এবং সংক্ষিপ্ত বিবরণ লোড করার জন্য অনুরোধ করে, এবং সম্পূর্ণ লেখাটি চাহিদা অনুযায়ী লোড করা হয়। এই ডিজাইনের ফলে স্কিল লাইব্রেরিটি ৪০ থেকে ২০০টি স্কিল পর্যন্ত বৃদ্ধি পেতে পারে, অথচ কনটেক্সট কস্ট প্রায় অপরিবর্তিত থাকে।

চতুর্থ স্তরটি, যার নাম হনচো, একটি ঐচ্ছিক ইউজার মডেলিং স্তর যা বিভিন্ন কথোপকথনের মাধ্যমে পরোক্ষভাবে আপনার পছন্দ, যোগাযোগের ধরণ এবং বিষয়ভিত্তিক জ্ঞান সঞ্চয় করে। এটি এমন পরিস্থিতিতে উপযুক্ত যেখানে হার্মিস এজেন্টকে দীর্ঘমেয়াদী দৈনন্দিন ব্যক্তিগত সহকারী হিসেবে ব্যবহার করা হয়।

এই চারটি স্তরের মধ্যে কাজের বিভাজনও খুব স্পষ্ট: যদি কোনো কিছু প্রতিটি কথোপকথনে উপস্থিত থাকা প্রয়োজন হয়, তবে সেটিকে প্রথম স্তরে রাখুন; যদি এটি কেবল একটি নির্দিষ্ট বিষয়ে উপস্থিত হলেই কার্যকর হয়, তবে পুনরুদ্ধারের জন্য এটিকে দ্বিতীয় স্তরে রেখে দিন; যদি এটি একটি পুনঃব্যবহারযোগ্য কার্যপ্রণালী হয়, তবে তৃতীয় স্তরকে এর দায়িত্ব দিন; আর যদি এটি একটি দীর্ঘমেয়াদী ব্যবহারকারী প্রোফাইল হয়, তবে তা চতুর্থ স্তরের কাছে হস্তান্তর করুন।

যখন হার্মিস এজেন্টে কোনো বার্তা আসে, তা টেলিগ্রামের মতো কোনো থার্ড-পার্টি গেটওয়ে থেকে আসুক বা কমান্ড লাইন থেকে, এটি একই সিনক্রোনাস এক্সিকিউশন ইঞ্জিনে প্রবেশ করে: একটি টাস্ক আইডি তৈরি করা, মেমরি লেয়ার থেকে সিস্টেম প্রম্পট তৈরি করা, ডুপ্লিকেট কনস্ট্রাকশন এড়াতে ক্যাশ করা সংস্করণগুলির পুনঃব্যবহারকে অগ্রাধিকার দেওয়া, পাঠানোর আগে কনটেক্সটের দৈর্ঘ্য সীমার কাছাকাছি আছে কিনা তা পরীক্ষা করা এবং মডেলটিকে কল করা।

▲ছবির উৎস: https://mranand.substack.com/p/inside-hermes-agent-how-a-self-improving

টাস্ক সম্পাদনের সময় স্বয়ংক্রিয়ভাবে আপডেট করার জন্য লার্নিং লুপ ব্যবহার করার পাশাপাশি, হার্মিস প্রতিটি সেশনের মাঝখানে পিরিয়ডিক নাজ নামক একটি প্রক্রিয়াও সক্রিয় করে।

ব্যবহারকারীর কোনো হস্তক্ষেপ ছাড়াই, সিস্টেমটি পর্যায়ক্রমে এবং স্বয়ংক্রিয়ভাবে এজেন্টকে একটি অভ্যন্তরীণ নির্দেশ পাঠায়, যা তাকে সাম্প্রতিক কার্যক্রমগুলো পর্যালোচনা করতে এবং কোনগুলো মেমরিতে লেখার যোগ্য তা নির্ধারণ করতে অনুরোধ করে। এই প্রক্রিয়াটি সম্পূর্ণরূপে ব্যবহারকারী-প্রবর্তিত; কী সংরক্ষণ করা হবে, সেই সিদ্ধান্ত হার্মিস এজেন্টই নেয়।

হার্মিস এজেন্ট ব্যবহার শুরু করতে কত খরচ লাগে?

OpenClaw ইনস্টল করার মতোই, এটি Linux, macOS, এবং WSL2-তে একটিমাত্র কমান্ডের মাধ্যমে করা যায় এবং Termux ব্যবহার করে Android ডিভাইসেও এটি সমর্থিত।

হার্মিস উল্লেখ করেছে যে এটি নেটিভ উইন্ডোজ সমর্থন করে না, তাই আমাদের WSL2 (উইন্ডোজ সাবসিস্টেম ফর লিনাক্স), বা সংক্ষেপে WSL ইনস্টল করতে হবে, যা একটি কম্প্যাটিবিলিটি লেয়ার এবং এটি নেটিভ লিনাক্স বাইনারি এক্সিকিউটেবলগুলোকে উইন্ডোজে চালানোর সুযোগ করে দেয়।

ইনস্টলেশন কমান্ডটি স্বয়ংক্রিয়ভাবে পাইথন ৩.১১, নোড.জেএস ভি২২, রিপগ্রেপ, এফএফএমপিইজি, ভার্চুয়াল এনভায়রনমেন্ট, গ্লোবাল কমান্ড এবং এলএলএম-এর কনফিগারেশনসহ অসংখ্য ডিপেন্ডেন্সি পরিচালনা করে। ইনস্টলেশনের পরের ইন্টারফেসটি ক্লড কোডের মতো টার্মিনাল টুলগুলোর অনুরূপ, যা নির্দিষ্ট কমান্ডের মাধ্যমে এজেন্টের সাথে ইন্টারঅ্যাকশনের সুযোগ দেয়।

মডেল কনফিগারেশনের ক্ষেত্রে, বেছে নেওয়ার জন্য বিভিন্ন ধরনের ইনফারেন্স পরিষেবা প্রদানকারী রয়েছে: নুস পোর্টাল (সাবস্ক্রিপশন-ভিত্তিক, কোনো কনফিগারেশনের প্রয়োজন নেই), অ্যানথ্রোপিক (সরাসরি ক্লড ব্যবহার করে, যা একটি এপিআই কী বা ক্লড কোড দিয়ে অনুমোদিত হতে পারে), ওপেনরাউটার, ডিপসিক, হাগিং ফেস, আলিবাবা ক্লাউড ড্যাশস্কোপ (কুইন সিরিজ), গিটহাব কপাইলট, এবং স্থানীয় ওলাম মডেল সহ যেকোনো ওপেনএআই সামঞ্জস্যপূর্ণ ইন্টারফেস।

শাওমি MiMo-V2 সিরিজও অফার করে, যার মধ্যে রয়েছে লক্ষ লক্ষ কনটেক্সট টোকেন সাপোর্টকারী MiMo-V2-Pro, সম্পূর্ণ-মোডাল আন্ডারস্ট্যান্ডিং ক্ষমতাসম্পন্ন MiMo-V2-Omni এবং ফ্ল্যাশ মডেল। এছাড়াও শাওমি ৮ই এপ্রিল থেকে ২২শে এপ্রিল পর্যন্ত দুই সপ্তাহের একটি ফ্রি ট্রায়াল দিচ্ছে, যার মাধ্যমে ব্যবহারকারীরা হার্মিস এজেন্টকে সর্বশেষ সংস্করণে আপডেট করতে এবং নুস পোর্টালের মাধ্যমে বিনামূল্যে শাওমির বড় মডেলগুলো ব্যবহার করতে পারবেন।

হার্মিস এজেন্টের একটি অক্সিলিয়ারি মডেলস মডিউলও রয়েছে, যা হার্মিসের মধ্যে থাকা একগুচ্ছ হালকা মডেল কনফিগারেশন, যা বিশেষভাবে "সাইড টাস্ক" বা পার্শ্ব কাজ পরিচালনার জন্য ব্যবহৃত হয়। এগুলি মূল সংলাপের জন্য দায়ী নয়, কিন্তু এমন অনেক ঘন ঘন ঘটা ও গুরুত্বপূর্ণ কাজের দায়িত্বে থাকে, যেগুলোর জন্য মূল মডেলটিকে ব্যস্ত রাখা যুক্তিযুক্ত নয়।

উদাহরণস্বরূপ, ইমেজ বিশ্লেষণ, ওয়েব পেজ নিষ্কাশন, দক্ষতা মেলানো এবং স্মৃতি প্রক্রিয়াকরণের মতো বিভিন্ন কাজকে স্বয়ংক্রিয়ভাবে ভিন্ন ভিন্ন মডেল বরাদ্দ করা হবে। ডিফল্টরূপে, সহায়ক কাজগুলো ম্যানুয়াল কনফিগারেশনের প্রয়োজন ছাড়াই স্বয়ংক্রিয়ভাবে জেমিনি ফ্ল্যাশের ব্যবহার শনাক্ত করবে এবং অগ্রাধিকার দেবে।

এটি অ্যানথ্রোপিকের আজ চালু করা অ্যাডভাইজার ফিচারের মতোই; উভয়ই এমন ব্যবস্থা যা সেইসব পরিস্থিতির জন্য উপযুক্ত যেখানে মূল মডেলটি ব্যয়বহুল কিন্তু আপনি আনুষঙ্গিক কাজগুলোকে অপেক্ষাকৃত কম খরচের মডেলে স্থানান্তর করতে চান। অন্যদিকে, হার্মিস তার অন্তর্নিহিত আর্কিটেকচারের একটি মূল অংশ হিসেবে 'মাল্টি-মডেল অর্কেস্ট্রেশন'কে অন্তর্ভুক্ত করেছে।

মেসেজিং প্ল্যাটফর্মের ক্ষেত্রে, সমর্থিত পরিষেবাগুলির তালিকা ওপেনক্ল-এর মতোই, তবে টেলিগ্রাম, ডিসকর্ড, স্ল্যাক এবং লার্ক সবচেয়ে বেশি ফিচার-সমৃদ্ধ প্ল্যাটফর্মগুলোর মধ্যে অন্যতম, যা ভয়েস, ছবি এবং ফাইলের মতো বিভিন্ন ফরম্যাট সমর্থন করে। একটি একক গেটওয়ে প্রসেস সমস্ত প্ল্যাটফর্মকে সংযুক্ত করে এবং সমন্বিত সেশন ম্যানেজমেন্ট প্রদান করে।

হার্মিস এজেন্ট আসলে এমন কোনো টুল নয় যা কয়েক মিনিটে ইনস্টল করে দ্রুত ব্যবহার শুরু করা যায়; বরং এটি একটি অবকাঠামো যা আমাদের পরিচালনা ও রক্ষণাবেক্ষণ করতে হয়।

যদি আমরা কেবল এমন একটি এআই অ্যাসিস্ট্যান্ট চাই যা মোবাইল ফোনে মেসেজিংয়ের মাধ্যমে নিয়ন্ত্রণ করা যায়, তাহলে ওপেনক্ল (OpenClaw) একটি সহজতর উপায় হবে: একটি SOUL.md কনফিগারেশন ফাইল লিখুন, সেটি চালান, টেলিগ্রামের সাথে সংযুক্ত করুন, এবং আপনার কাজ শেষ।

হার্মিস এজেন্ট এমন পরিস্থিতিতে উপযুক্ত যেখানে আমাদের পুনরাবৃত্তিমূলক ও পরিবর্তনশীল কর্মপ্রবাহ রয়েছে এবং আমরা চাই যে এজেন্টটি ব্যবহারের অভ্যাস থেকে অভিজ্ঞতা সঞ্চয় করুক। আমরা আশা করি, তিন মাস পরের এজেন্টটি প্রথম দিনের এজেন্ট থেকে ভিন্ন হবে।

সোশ্যাল মিডিয়ায় কিছু নেটিজেন হার্মিস এজেন্টের বিভিন্ন অ্যাপ্লিকেশনের উদাহরণ শেয়ার করেছেন, যার মধ্যে রয়েছে বিজনেস অটোমেশন, যা একটি কোম্পানির কাস্টমার রিলেশনশিপ ম্যানেজমেন্ট (সিআরএম) এবং নলেজ বেসকে সংযুক্ত করে; মার্কেটিং ম্যানেজমেন্ট, যা কনটেন্ট তৈরি এবং সোশ্যাল মিডিয়া প্ল্যাটফর্মে প্রকাশনাকে স্বয়ংক্রিয় করে; এবং কোড জেনারেশনের মতো ক্লাসিক সফটওয়্যার ইঞ্জিনিয়ারিং প্রজেক্ট।

আমরা যখন এই প্রযুক্তিগুলোকে বিভিন্ন বাস্তব ব্যবসায়িক পরিস্থিতিতে প্রয়োগ করি, তখন একটি অনস্বীকার্য সত্য হলো যে এজেন্টরা দ্রুত বাস্তব উৎপাদন পরিবেশে প্রবেশ করছে।

হার্মিস প্রসঙ্গে কেউ কেউ বলেন এটি ওপেনক্ল-এর কেবল একটি 'হালকা বিকল্প', আবার অন্যরা এটিকে একক-এজেন্ট সিস্টেমের বিবর্তন হিসেবে দেখেন। যাই হোক না কেন, ওপেনক্ল দ্বারা নির্ধারিত কাঠামোর মধ্যে এজেন্টদের বিবর্তন কখনও থামবে না।

হার্মিস হোক বা ওপেনক্ল, বর্তমানের সব ওপেন-সোর্স এজেন্ট সলিউশনেরই নিজস্ব সীমাবদ্ধতা রয়েছে। এজেন্টদেরকে সত্যিকার অর্থে মূলধারায় প্রবেশ করতে এবং সাধারণ মানুষের দৈনন্দিন পরিকাঠামোর অংশ হয়ে ওঠার মতো রূপটি সম্ভবত এখনও তৈরি হয়নি।

জটিল মেমরি সিস্টেমের সমাধান করা কৃত্রিম বুদ্ধিমত্তার নিরাপত্তার ক্ষেত্রে বিশাল চ্যালেঞ্জ তৈরি করে। কৃত্রিম বুদ্ধিমত্তাকে অঙ্গপ্রত্যঙ্গ দেওয়ার জন্য তাকে শৃঙ্খলিত করার উপায় বের করতে হয়, এবং হারনেস-এর ইনস্টলেশন অত্যন্ত জটিল ও এতে প্রবেশের বাধা অনেক বেশি, যা দৃশ্যত বিভিন্ন সীমাবদ্ধতা তৈরি করে।

এটুকু বলাই যায় যে, হার্মিস এবার এজেন্টকে সত্যিই একটি নতুন দিকনির্দেশনা দিয়েছে। এটি এজেন্টকে এমন একটি যন্ত্র থেকে রূপান্তরিত করেছে যাকে ব্যবহার করে ফেলে দেওয়া হয়; এমন এক সঙ্গীতে পরিণত করেছে যে ব্যর্থতা থেকে শিখতে ও শিক্ষা মনে রাখতে পারে।

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।