ঘোড়ায় চড়ছে চিংড়ি! এক সপ্তাহ ধরে লবস্টার জগতে যে বেনামী মডেলটি ঘুরে বেড়াচ্ছে তা আসলে এই সর্বশেষ ব্যবহারকারীর অভিজ্ঞতার বিবরণ অন্তর্ভুক্ত

গত সপ্তাহে, গলদা চিংড়ি সম্প্রদায়ের মধ্যে একটি রহস্যময় মডেল প্রচারিত হতে শুরু করে: পনি-আলফা-২।

কোনও সংবাদ সম্মেলন বা আনুষ্ঠানিক পরিচয় ছাড়াই, এটি চুপচাপ ঝিপুর অটোক্ল প্ল্যাটফর্মের মধ্যে চলেছিল, যা ব্যবহারকারীদের বিটা পরীক্ষার জন্য উন্মুক্ত ছিল। অপ্রত্যাশিতভাবে, মুখের কথা দ্রুত ছড়িয়ে পড়ে, যার ফলে সবাই জিজ্ঞাসা করতে শুরু করে: এই বেনামী এআই মডেলটি আসলে কী?

আজ, রহস্যের সমাধান হয়েছে। এটি হল GLM-5-Turbo, "বিশ্বের প্রথম লবস্টার মডেল" যা আজ ঝিপু আনুষ্ঠানিকভাবে প্রকাশ করেছে, এবং 2025 সালের পর ঝিপুর প্রথম ক্লোজ-সোর্স মডেলও।

লবস্টার চালানোর সময় কেন সাধারণ-উদ্দেশ্য মডেল বারবার ব্যর্থ হয়?

যারা কখনও একটি লবস্টার পালন করেছেন তারা সম্ভবত এটি জানেন: মডেল চ্যাট বা লেখার কাজটি সহজেই সম্পন্ন হয়। কিন্তু যখন কাজগুলি বাস্তবে চালানোর কথা আসে, তখন প্রায়শই তৃতীয় ধাপের চারপাশে সমস্যা দেখা দিতে শুরু করে। টুল কল ব্যর্থ হয়, প্রসঙ্গ ভুলে যায়, দীর্ঘ কাজগুলি মাঝপথে ভেঙে যায় – সব ধরণের ঘটনা ঘটে।

সমস্যার মূল কাঠামোর মধ্যে নয়, বরং অন্তর্নিহিত মডেলের মধ্যেই নিহিত। একটি সাধারণ-উদ্দেশ্যপূর্ণ বৃহৎ মডেলের প্রশিক্ষণের উদ্দেশ্য হল সংলাপ, যেখানে কর্মপ্রবাহ বাস্তবায়ন সম্পূর্ণ ভিন্ন বিষয়। একবার এটি একাধিক ধাপ, একাধিক সরঞ্জাম একসাথে সংযুক্ত এবং ক্রমাগত বাস্তবায়ন সহ একটি বাস্তব-বিশ্বের গলদা চিংড়ির দৃশ্যপটে প্রবেশ করলে, এটি ব্যর্থ হয়।

এই সমস্যা সমাধানের জন্য GLM-5-Turbo তৈরি করা হয়েছিল। প্রশিক্ষণ ডেটা নির্মাণ থেকে শুরু করে অপ্টিমাইজেশনের উদ্দেশ্য পর্যন্ত, পুরো প্রক্রিয়াটি বিশেষভাবে লবস্টারের পরিস্থিতির জন্য অপ্টিমাইজ করা হয়েছিল, পাঁচটি মূল ক্ষমতা প্রশিক্ষণের উপর দৃষ্টি নিবদ্ধ করে।

হাতিয়ার আহ্বানের ক্ষেত্রে, বাহ্যিক হাতিয়ারের স্থিতিশীল আহ্বান এবং বিভিন্ন দক্ষতা বৃদ্ধি করা হয় এবং নিরবচ্ছিন্ন পরিচালনা একটি মৌলিক প্রয়োজনীয়তা। নির্দেশনা সম্মতির ক্ষেত্রে, জটিল এবং বহু-স্তরযুক্ত দীর্ঘ নির্দেশাবলী সঠিকভাবে ভেঙে ফেলা যেতে পারে, যা লক্ষ্য সনাক্তকরণ, পদক্ষেপ পরিকল্পনা এবং বহু-এজেন্ট সহযোগিতাকে সমর্থন করে।

নির্ধারিত এবং ধারাবাহিক কাজগুলি আরেকটি মূল লক্ষ্য। মডেলটি সময়ের সাথে সাথে নির্দেশাবলী বুঝতে পারে, সময়-চালিত পরিস্থিতি পরিচালনা করতে পারে এবং দীর্ঘ কাজের নিরবচ্ছিন্ন সম্পাদন নিশ্চিত করতে পারে। এর প্রোগ্রামিং ক্ষমতা GLM সিরিজের শক্তিকে অব্যাহত রাখে, ন্যূনতম মানব হস্তক্ষেপের সাথে দীর্ঘ-পরিসরের এজেন্টিক ইঞ্জিনিয়ারিং কাজগুলিকে সক্ষম করে, ভাইব কোডিং থেকে এজেন্টিক ইঞ্জিনিয়ারিংয়ে স্থানান্তরিত হয়। গতির দিক থেকে, এটি উচ্চ-থ্রুপুট, দীর্ঘ-চেইন পরিস্থিতির জন্য নির্দিষ্ট গতির উন্নতিও করেছে এবং এর প্রতিক্রিয়া স্থিতিশীলতা অনুরূপ মডেলগুলিকে নেতৃত্ব দেয়।

মূল্যায়নের দিক থেকে, জিএলএম-৫-টার্বো জিপু দ্বারা তৈরি লবস্টার পরিস্থিতির জন্য এন্ড-টু-এন্ড বেঞ্চমার্ক, জেডক্লাববেঞ্চে দেশীয় মডেলগুলির মধ্যে শীর্ষস্থান অর্জন করেছে।

ZClawBench তৈরির একটি নির্দিষ্ট পটভূমি রয়েছে।

OpenClaw-এর ক্রমবর্ধমান জনপ্রিয়তার সাথে সাথে, বর্তমান কাজের ধরণগুলি এখন ইনস্টলেশন এবং কনফিগারেশন, কোড ডেভেলপমেন্ট, তথ্য সংগ্রহ, ডেটা বিশ্লেষণ এবং কন্টেন্ট তৈরির মতো বিভিন্ন পরিস্থিতিতে কাজ করে।

ব্যবহারকারীর সংখ্যা প্রাথমিক ডেভেলপারদের থেকে প্রসারিত হয়ে এখন দক্ষতা-সচেতন অফিস কর্মী, আর্থিক পেশাদার, অপারেশন ইঞ্জিনিয়ার, কন্টেন্ট স্রষ্টা এবং গবেষণা বিশ্লেষকদের অন্তর্ভুক্ত করেছে। ZClawBench এই বাস্তব-বিশ্বের ব্যবহারের ক্ষেত্রে তৈরি, এবং এর প্রশ্নব্যাংক এবং পরীক্ষার ট্র্যাকগুলি এখন সম্পূর্ণরূপে সর্বজনীনভাবে উপলব্ধ।

এছাড়াও, GLM-5-Turbo iSoftStone এর Mechrevo বক্সের সাথেও ইন্টিগ্রেটেড, যা একটি নেটিভ AI এজেন্ট টার্মিনাল অভিজ্ঞতা তৈরি করে। তবে, একটি পার্শ্ব নোট উল্লেখ করার মতো: GLM-5-Turbo এর API মূল্যও এই বছর দ্বিতীয়বারের মতো বৃদ্ধি পেয়েছে, GLM-5 এর তুলনায় 20% বৃদ্ধি পেয়েছে।

যদিও লবস্টার-সম্পর্কিত কাজগুলিতে প্রায়শই কয়েক ডজন টুল কল এবং প্রাসঙ্গিক সংযোগ জড়িত থাকে, একটি সাধারণ আন্তঃবিভাগীয় সভার মিনিট সংকলন এবং কার্য বিতরণের জন্য টোকেন খরচ সাধারণ কথোপকথনের চেয়ে অনেক বেশি, উদ্যোগের জন্য খরচ হিসাবের মাত্রাও পরিবর্তিত হচ্ছে—

টোকেন খরচের পরিমাণ এখন আর মূল বিষয় নয়; সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো এআই কর্মীরা কতটা জনবল সাশ্রয় করেন।

মডেলটির পাশাপাশি, ব্যক্তি এবং ব্যবসার জন্য লবস্টার কম্বো খাবারও প্রকাশ করা হচ্ছে, যার ব্যক্তিগত এবং দলগত উভয় সংস্করণই উপলব্ধ।

আপনি একটি একক ব্যক্তি কোম্পানি, একটি স্টার্টআপ টিম, অথবা একটি বৃহৎ বা মাঝারি আকারের এন্টারপ্রাইজ হোন না কেন, আপনি আপনার ব্যবসায়িক স্কেলের উপর ভিত্তি করে নমনীয়ভাবে সাবস্ক্রাইব করতে পারেন, প্রতি অ্যাকাউন্টে সর্বোচ্চ 5টি টোকেন। টিম সংস্করণের মাধ্যমে এন্টারপ্রাইজগুলি প্রকৃত কর্মীর সংখ্যার উপর ভিত্তি করে নমনীয়ভাবে সাবস্ক্রাইব করতে পারে, যা টোকেন সরবরাহ এবং স্থিতিশীল অনলাইন এআই কর্মীদের একটি নিয়ন্ত্রণযোগ্য খরচে নিশ্চিত করে।

এর সাথে থাকা এন্টারপ্রাইজ-স্তরের নিরাপত্তা ব্যবস্থাপনা ব্যবস্থা, "ক্ল ফর এন্টারপ্রাইজ সিকিউরিটি", বিভিন্ন ধরণের ক্লের জন্য একীভূত সময়সূচী এবং অনুমতি অর্কেস্ট্রেশন সমর্থন করে। একটি কেন্দ্রীভূত ব্যবস্থাপনা কনসোলের মাধ্যমে, প্রতিটি এজেন্ট টাস্কের এক্সিকিউশন পাথ, টুল কল চেইন এবং রিসোর্স খরচ রিয়েল টাইমে পর্যবেক্ষণ এবং ভিজ্যুয়ালাইজ করা যেতে পারে।

লবস্টার মডেল, এন্টারপ্রাইজ এন্ট্রি পয়েন্টকে লক্ষ্য করে

শুধু ভূমিকা পড়া যথেষ্ট নয়; আমি এটি একটি বাস্তব কাজ দিয়ে পরীক্ষা করেছি এবং এখানে আমার অভিজ্ঞতা।

প্রথম দৃশ্যকল্পটি খুবই সহজ: ১০ মিনিট পরে একটি অ্যালার্ম সেট করুন, এবং যখন সময় আসবে, লার্ক আপনাকে "উঠে ঘুরে বেড়াতে" মনে করিয়ে দেবে। মডেলটি সরাসরি উত্তর দেয় যে ১৪:২২ রিমাইন্ডার সেট করা হয়েছে, এবং লার্ক ঠিক ১০ মিনিট পরে বার্তাটি গ্রহণ করে, কোনও পদক্ষেপ ছাড়াই ম্যানুয়াল হস্তক্ষেপের প্রয়োজন হয়।

দ্বিতীয় দৃশ্যপটে তথ্য সংগ্রহ, প্রযুক্তি জগতের দিনের আলোচিত বিষয়গুলির সারসংক্ষেপ অন্তর্ভুক্ত ছিল। মডেলটি একটি পরীক্ষার সরঞ্জামের মাধ্যমে পরিচালিত হয়েছিল, যা এনভিডিয়ার জিটিসি সম্মেলন, সাত দিনের মধ্যে শুরু হওয়া টেরাফ্যাব চিপ তৈরির প্রকল্পের মাস্কের ঘোষণা এবং সরকার কর্তৃক ছয়টি নতুন গুরুত্বপূর্ণ ভবিষ্যত শিল্পের সংযোজনের মতো গুরুত্বপূর্ণ তথ্য সংকলন করে।

শেষ দৃশ্যপটটি, যা কেবল মজা করার জন্য, একটু জটিল। লবস্টারটি লার্ক দ্বারা সরবরাহিত একটি ক্লাউড কম্পিউটারে চলে, যা একটি আলিবাবা ক্লাউড ইসিএস ভার্চুয়াল মেশিন। আমি এটিকে একটি তাপমাত্রা পর্যবেক্ষণ দক্ষতা লিখতে, এটিকে এনক্যাপসুলেট করতে এবং স্বয়ংক্রিয়ভাবে লোড এবং সক্রিয় করতে বলেছিলাম, তাপমাত্রা 40 ডিগ্রি সেলসিয়াসের বেশি হলে লার্ক সতর্কতা জারি করে। সমস্যা হল, ক্লাউড ভার্চুয়াল মেশিনগুলিতে ভৌত তাপমাত্রা সেন্সর নেই, তাই সরাসরি তাপমাত্রা পড়া কাজ করবে না।

মডেলটি আমার দিকনির্দেশনা দেওয়ার অপেক্ষায় আটকে থাকেনি। বরং, এটি পালাক্রমে পাঁচটি ভিন্ন পঠন পদ্ধতি চেষ্টা করে। কোনটিই কাজ না করার পর, এটি তাপমাত্রা অনুমান করার জন্য একটি প্রক্সি সূচক হিসাবে CPU লোড ব্যবহার শুরু করে এবং আমাকে বলে যে এটি কেন করেছে।

স্ক্রিপ্টটি লেখার পর এবং স্থানীয়ভাবে চালানোর পর, আমি SKILL.md লিখে openclaw.json-এ এটি নিবন্ধন করি, পুনরায় চালু করি এবং সফল লোডিং নিশ্চিত করার জন্য ডাক্তারের কাছে যাই। অবশেষে, লার্ক একটি নিশ্চিতকরণ পাঠায়: বর্তমান তাপমাত্রা 27°C, এবং সবকিছু স্বাভাবিক। পুরো প্রক্রিয়াটি নিরবচ্ছিন্ন ছিল এবং পরবর্তী কমান্ড পাঠানোর জন্য আমার অপেক্ষা করেনি।

তিনটি কাজ সম্পন্ন করার পর, টুলটি নিখুঁতভাবে কাজ করেছে, সময় নির্দেশাবলী সঠিকভাবে ব্যাখ্যা করা হয়েছে, এবং সংগৃহীত তথ্য এমন সিদ্ধান্তে পৌঁছেছে যা কেবল তালিকাভুক্তির বাইরেও ছিল। অবশ্যই, এগুলি তুলনামূলকভাবে স্ট্যান্ডার্ড লবস্টার-থিমযুক্ত কাজ; আরও জটিল মাল্টি-এজেন্ট সহযোগিতামূলক পরিস্থিতিতে আরও বাস্তব-বিশ্ব পরীক্ষার প্রয়োজন।

প্রেস টাইম অনুসারে, GLM-5-Turbo এখন অনলাইনে রয়েছে। ডেভেলপার এবং এন্টারপ্রাইজ ব্যবহারকারীরা BigModel.cn অথবা api.z.ai ওপেন প্ল্যাটফর্মের মাধ্যমে API কল করতে পারবেন, অথবা লবস্টার প্যাকেজের মাধ্যমে এটি অ্যাক্সেস করতে পারবেন।

GLM কোডিং প্ল্যান ম্যাক্স GLM-5-Turbo-তে একীভূত করা হয়েছে। প্রো প্ল্যানটি এই মাসে এটি সমর্থন করবে এবং লাইট প্ল্যানটি এপ্রিল মাসে উপলব্ধ হবে। দীর্ঘমেয়াদী স্থিতিশীল অপারেশন, ক্রমাগত ব্যাকগ্রাউন্ড এক্সিকিউশন, বা উচ্চতর লোডের প্রয়োজন এমন এজেন্ট পরিস্থিতিতে, লবস্টার প্ল্যানটি সুপারিশ করা হয়।

অটোক্ল আওলং-এর ডিফল্ট মডেলটি GLM-5-Turbo-তে পরিবর্তন করা হয়েছে। এখন থেকে ২২শে মার্চ পর্যন্ত, জ্বালানি প্যাকেজগুলিতে সীমিত সময়ের জন্য ছাড় রয়েছে, সর্বোচ্চ ৩৪% ছাড়। জ্বালানি প্যাকেজটি কেনার তারিখ থেকে ৭ দিনের জন্য বৈধ।

এটা লক্ষণীয় যে লবস্টারের দৃশ্যপট সাধারণ ব্যবহারকারীদের "আমার জন্য কাজ করছে এআই" এবং "আমার প্রশ্নের উত্তর দিচ্ছে এআই" এর মধ্যে পার্থক্যটি সত্যিকার অর্থে অনুভব করতে সাহায্য করেছিল। প্রথমটির জন্য সম্পূর্ণ ভিন্ন ক্ষমতার প্রয়োজন, যা লবস্টারের দৃশ্যপটের জন্য বিশেষভাবে প্রশিক্ষিত মডেল এবং সাধারণ-উদ্দেশ্য মডেলের মধ্যে উল্লেখযোগ্য ব্যবধান ব্যাখ্যা করে।

এজেন্ট যুগে, প্রতিযোগিতা শেষ পর্যন্ত সাধারণ ক্ষমতার স্তর নিয়ে নাও হতে পারে, বরং কে সত্যিই মসৃণভাবে, স্থিতিশীলভাবে কাজ করতে পারে এবং নির্দিষ্ট পরিস্থিতিতে উৎপাদনশীলতার হাতিয়ার হিসেবে উদ্যোগগুলি কীভাবে ব্যবহার করতে পারে তা নিয়ে। ক্ষমতা কেবল প্রবেশের টিকিট; আসল পরীক্ষা হল ধারাবাহিকভাবে ফলাফল প্রদানের ক্ষমতা।

এটি চেষ্টা করার জন্য এখানে লিঙ্কটি রয়েছে:

  • অটোক্ল আওলং ক্লায়েন্ট: https://autoglm.zhipuai.cn/autoclaw
  • জেড.এআই: জেড.এআই
  • Zhipu Qingyan APP/ওয়েব সংস্করণ

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।