মিনিম্যাক্স এম২.৭-এর বাস্তব পরীক্ষা: এআই যখন সিরিয়াস হয়ে ওঠে, তখন সে নিজেই তালগোল পাকিয়ে ফেলে।

লবস্টারটি জনপ্রিয় হওয়ার পর, পুরো ইন্টারনেট জুড়ে মনোযোগ ছিল "এটি কীভাবে ব্যবহার করা যায়" তার উপর—স্থানীয়ভাবে স্থাপন করা হবে নাকি ক্লাউডে, এক-ক্লিকে ইনস্টলেশন নাকি কমান্ড-লাইনে ইনস্টলেশন, উইচ্যাট নাকি লার্কের সাথে সংযোগ করা হবে… কিন্তু এর পরিবর্তে, কেউই গুরুত্ব দিয়ে সেই পুরোনো প্রশ্নটি করেনি: লবস্টারটিকে চালনাকারী 'মস্তিষ্ক'টি কি যথেষ্ট বুদ্ধিমান?

এটা আশ্চর্যজনক নয়। ওপেনএআই এবং গুগলের সম্প্রতি প্রকাশিত নতুন মডেলগুলো সবই মিনি বা ফ্ল্যাশ সংস্করণ, এবং এর আনুষ্ঠানিক তাৎপর্য প্রায় সুস্পষ্ট: এগুলো এজেন্টদের বিপুল পরিমাণ টোকেন ব্যবহারের জন্য বিশেষভাবে ডিজাইন করা হয়েছে।

মডেলটির সক্ষমতার সীমাবদ্ধতাগুলো সবচেয়ে কম আলোচিত বিষয় হয়ে উঠেছে।

লবস্টারের জন্য একটি সত্যিকারের উপযুক্ত মডেলের জন্য কেবল প্রচুর পরিমাণে সহজলভ্য, তৃপ্তিদায়ক ও সাশ্রয়ী টোকেনই প্রয়োজন হয় না, বরং এমন একটি মডেলও প্রয়োজন যা যথেষ্ট বুদ্ধিমান, যার হাতে-কলমে কাজ করার শক্তিশালী ক্ষমতা এবং প্রবল শেখার ক্ষমতা রয়েছে।

সম্প্রতি, মিনিম্যাক্স আনুষ্ঠানিকভাবে নতুন মিনিম্যাক্স এম২.৭ মডেলটি উন্মোচন করেছে, যা " এআই-এর স্ব-বিবর্তনকে সক্ষম করা " এবং " সবচেয়ে শক্তিশালী কোওয়ার্ক এজেন্ট মডেল " হওয়ার উপর গুরুত্ব দেয়। এটি কোডিংয়ের কাজ এবং সাধারণ অফিসের কাজ সামলাতে পারে, এবং একটি স্থিতিশীল এজেন্ট সিস্টেম তৈরি করার জন্য সক্রিয়ভাবে শিখতেও সক্ষম।

বিশেষত, এটি বেশিরভাগ মডেলের চেয়ে আরও বিস্তৃত পরিসরের কাজ করতে পারে । কোড লেখার ক্ষেত্রে, M2.7 রানটাইমের সময় একটি সিস্টেমে কী ঘটে তা সত্যিই বুঝতে পারে এবং SRE (সাইট রিলায়াবিলিটি ইঞ্জিনিয়ারিং) স্তরের সিস্টেম রিজনিং অর্জন করে: যেমন লগ বিশ্লেষণ করা, টাইমলাইনগুলোর মধ্যে সম্পর্ক স্থাপন করা, মূল কারণ অনুমান করা এবং অগ্রাধিকারভিত্তিক সমাধান প্রদান করা। নতুন মডেলটি SWE-Pro-তে ৫৬.২% পারফরম্যান্স অর্জন করেছে, যা প্রায় Opus 4.6-এর সমান।

অফিসের পরিবেশে এটি যথেষ্ট । এক্সেল, ওয়ার্ড এবং পাওয়ারপয়েন্ট ডকুমেন্টের জটিল সম্পাদনা ও একাধিক সংশোধনের ক্ষেত্রে, এম২.৭ উল্লেখযোগ্য উন্নতি দেখায়, বিশেষ করে আর্থিক বিশ্লেষণের মতো বিশেষ জ্ঞান ও প্রমিত ফরম্যাটিং প্রয়োজন এমন পরিস্থিতিতে। যদিও এটি পেশাদারদের পুরোপুরি প্রতিস্থাপন করতে পারে না, তবে কর্মপ্রবাহে একটি সহায়ক সরঞ্জাম হিসেবে এটি পুরোপুরি উপযুক্ত।

একাধিক এজেন্টের সহযোগিতায় এটি ভেঙে পড়বে না । এটি এম২.৭ দ্বারা বিশেষভাবে পরিমার্জিত একটি সক্ষমতা, যার বহু-ভূমিকা পরিস্থিতিতে সুস্পষ্ট সীমারেখা রয়েছে, এবং এটি ৫০টিরও বেশি দক্ষতা সম্পন্ন জটিল পরিবেশেও অত্যন্ত উচ্চ কমান্ড সম্মতি বজায় রাখতে পারে।

এরপর আসে এই আপডেটের মূল বিষয়টি: এটি স্ব-অপ্টিমাইজেশনে অংশ নিতে শুরু করে । মিনিম্যাক্স বলছে যে, M2.7 হলো তাদের প্রথম মডেল যা নিজের ইটারেশনে গভীরভাবে অংশগ্রহণ করে; শুধু "ইটারেশনে সহায়তা করা" নয়, বরং "নিজের ইটারেশনে গভীরভাবে অংশগ্রহণ করা"। স্ব-বিবর্তনে সক্ষম হওয়ায়, M2.7 বেশিরভাগ ওয়ার্কফ্লো পরিচালনা করার জন্য এজেন্ট হারনেসকে স্বায়ত্তশাসিতভাবে ইটারেট করতে পারে।

বাস্তব-পরীক্ষায় উন্নত পারফরম্যান্সের কারণে মিনিম্যাক্স এম২.৭ মুক্তির পরপরই লবস্টার তালিকায় দ্রুত র‍্যাঙ্কিংয়ে উপরে উঠে আসে এবং সর্বোচ্চ স্কোরের তালিকায় চতুর্থ স্থানে পৌঁছে যায়।

▲পিঞ্চবেঞ্চ লিডারবোর্ড হলো ওপেনক্ল-এর জন্য বিশেষভাবে তৈরি একটি মডেল মূল্যায়ন বেঞ্চমার্ক। এটি বাস্তব ওপেনক্ল ব্যবসায়িক পরিস্থিতিতে বড় মডেলগুলোর পারফরম্যান্স পরীক্ষা করে। ছবিতে টাস্ক সফলতার হারের মেট্রিকটি দেখানো হয়েছে। ক্লদ ওপাস ৪.৬-এর পরে মিনিম্যাক্স এম২.৭ চতুর্থ স্থানে রয়েছে। | https://pinchbench.com/

আমরা মিনিম্যাক্স এম২.৭ মডেল এবং মিনিম্যাক্স-এর ম্যাক্সক্ল-কে ক্লড কোড ও স্থানীয়ভাবে ডেপ্লয় করা লবস্টার-এর সাথে ইন্টিগ্রেট করেছি এবং এরপর প্রকৃত ডেভেলপমেন্ট প্রক্রিয়ায় সম্মুখীন হওয়া সমস্ত বাগ, ক্লান্তিকর আর্থিক ডেটা এবং বিপুল সংখ্যক দীর্ঘ-প্রক্রিয়ার কাজ এর কাছে হস্তান্তর করেছি।

দুই দিন পরীক্ষার পর আমরা দেখতে পেলাম যে, শুধু সফটওয়্যারটিকেই এআই-এর জন্য নতুন করে তৈরি করতে হবে তা নয়, বরং এআই মডেলটিকেও মানুষের উদ্দেশ্য বোঝা এবং মানুষকে সন্তুষ্ট করে এমন ফলাফল তৈরি করার পাশাপাশি, এআই কীভাবে কাজ করে ও এর কার্যপ্রবাহ কেমন তা বুঝতে হবে এবং নিজেকে আরও উন্নত করতে শিখতে হবে

মানব সহকারী হিসেবে এআই ওয়ার্কফ্লো ব্যবহার করা

OpenClaw-এর মতো এজেন্ট ফ্রেমওয়ার্কগুলোর জনপ্রিয়তার পর, প্রকৃত "এআই যুগের কর্মপ্রবাহ" হওয়া উচিত এমন যে, এআই মূল পরিচালন কেন্দ্র হিসেবে কাজ করবে, যা ডজন ডজন টুলকে আহ্বান করবে, অন্যান্য এআই সহযোগীদের নির্দেশনা দেবে এবং এমনকি এআই-এর নিজের কোডও অপ্টিমাইজ করবে।

মিনিম্যাক্স এম২.৭ নিজে থেকে কীভাবে বিকশিত হয় তা পরীক্ষা করার আগে, আমি প্রথমে এর এআই কার্যপ্রবাহটি দেখতে চাই। এটি কি সত্যিই একটি কার্যকরী এজেন্ট মডেল, নাকি এটি শুধু বেঞ্চমার্ক পরীক্ষার জন্য ভালো কিন্তু বাস্তব ব্যবহারে হতাশাজনক?

আমরা সুপরিচিত মেশিন লার্নিং চ্যালেঞ্জ ওয়েবসাইট ক্যাগল (Kaggle) থেকে ঐতিহাসিক স্টক ডেটা ডাউনলোড করেছি এবং তারপর, প্রতিযোগিতার শর্তানুযায়ী, প্রদত্ত ডেটার উপর ভিত্তি করে একটি ভিজ্যুয়াল অ্যানালাইসিস রিপোর্ট তৈরি করার জন্য মিনিম্যাক্স এম২.৭ (MiniMax M2.7)-কে যথাযথ ডেটা প্রসেসিং ও ফিচার ইঞ্জিনিয়ারিং করার নির্দেশ দিয়েছি।

ডেটা সেটটি বেশ বড়, এতে ৩,০০০-এরও বেশি সারণিবদ্ধ ডেটার সারি রয়েছে এবং ফাইলটির মোট আকার ৪৪৬.৩৫ মেগাবাইট। আমাদের লোকাল মেশিনে পাঁচটি সারণিবদ্ধ ডেটা ফাইল ডাউনলোড করার পর, এই কাজটি সম্পন্ন করার জন্য আমরা মিনিম্যাক্স এম২.৭ (MiniMax M2.7)-এর সাথে সমন্বিত ক্লড কোড (Claude Code) ব্যবহার করেছি।

এই বিশ্লেষণটি কার্যকরভাবে পরিচালনা করার জন্য নিম্নলিখিত পদক্ষেপগুলি প্রয়োজন: ডেটা পরিষ্কার ও সংগঠিত করার জন্য একজন ডেটা বিশ্লেষক; সংশ্লিষ্ট আর্থিক বাজার সম্পর্কে ধারণা দেওয়ার জন্য একজন ম্যাক্রো বিশ্লেষক; প্রাথমিক গাণিতিক মডেলিং সম্পন্ন করার জন্য একজন পরিসংখ্যান বিশ্লেষক; সংশ্লিষ্ট মডেলটি তৈরি করার জন্য একজন অ্যালগরিদম প্রকৌশলী; এবং পরিশেষে, একটি ভিজ্যুয়ালাইজেশন সমাধান সরবরাহ করার জন্য একজন ওয়েব প্রকৌশলী।

এরকম একটি জটিল কাজের সম্মুখীন হয়ে, মিনিম্যাক্স এম২.৭ আমার ইনস্টল করা বিভিন্ন দক্ষতার পূর্ণ ব্যবহার করেছিল। এটি প্রথমে অ্যানথ্রোপিকের দেওয়া xlsx ফাইলটি ব্যবহার করে সারণীভুক্ত ডেটা কাঠামোর তথ্য পড়ে নেয় এবং তারপর ধাপে ধাপে এগিয়ে গিয়ে প্যান্ডাস লাইব্রেরি (যা প্রায়শই সারণীভুক্ত ডেটা প্রক্রিয়াকরণে ব্যবহৃত হয়) স্বয়ংক্রিয়ভাবে ইনস্টল করার জন্য পাইথন কোড লেখা শুরু করে।

অবশেষে, মিনিম্যাক্স এম২.৭ একটি পূর্ণাঙ্গ ভিজ্যুয়ালাইজেশন সমাধানও প্রদান করেছে, যা একই সাথে রিটার্নের বণ্টন, বিভিন্ন ফিচারের গুরুত্ব ও ক্যাটাগরি র‍্যাঙ্কিং এবং একটি বিশদ ড্যাশবোর্ড প্রদর্শনের জন্য একাধিক ছবি তৈরি করে।

প্রদর্শিত ওয়েবপেজটিতে, ডেটা স্ক্রিপ্টকে সরাসরি একটি ইন্টারেক্টিভ ওয়েবপেজ সিস্টেমে রূপান্তর করার জন্য স্ট্রিমলিট লাইব্রেরি ব্যবহার করা হয়, যেখানে সমস্ত তথ্য ডাইনামিকভাবে দেখা যায়।

আমাদের দৈনন্দিন অফিসের ও প্রোগ্রামিংয়ের কাজ তো আছেই, মিনিম্যাক্স এই ধরনের বড় মাপের প্রকল্পের কাজও সফলভাবে সম্পন্ন করতে পারে।

প্রথমে আমরা আমাদের ফোনে লবস্টার অ্যাপটি ব্যবহার করে কম্পিউটারে থাকা ফাইলগুলোর সারসংক্ষেপ তৈরি করতে বলি। এরপর, আমরা মিনিম্যাক্স এম২.৭-কে এই ফাইলগুলোর উপর ভিত্তি করে একটি গবেষণা পরিকল্পনার ওয়ার্ড ডকুমেন্ট তৈরি করতে, প্রাসঙ্গিক কাগজপত্রগুলো দিয়ে একটি এক্সেল ডকুমেন্ট সাজাতে এবং সবশেষে দলীয় সভার জন্য একটি পিপিটি ডকুমেন্ট তৈরি করতে বলি, যার সবগুলোই সরাসরি ফোনে করা সম্ভব ছিল।

▲লোবস্টার, যা মিনিম্যাক্স এম২.৭-এর সাথে সংযুক্ত, দ্রুত চাহিদা মেটাতে পারে।

অফিস স্যুট পরিচালনা করা এখন খুবই সহজ।

অফিস ক্ষেত্রে এর সুবিধার কারণে মিনিম্যাক্স এম২.৭, পেশাগত জ্ঞান এবং কাজ সম্পাদনের সক্ষমতা পরিমাপক GDPval-AA মূল্যায়নে ১৪৯৫-এর একটি ELO স্কোর অর্জন করতে সক্ষম হয়েছে, যা দেশীয় মডেলগুলোর মধ্যে সর্বোচ্চ।

কিছুদিন আগে, এআই ওয়ার্ক অ্যাসিস্ট্যান্টদের জন্য তৈরি ভিজ্যুয়ালাইজেশন প্যানেলটি ভাইরাল হয়েছিল, যেখানে একটি বাস্তবসম্মত অ্যানিমে-স্টাইলের অফিসে একটি লবস্টারকে রাখা হয়েছিল এবং ব্যবহারকারীদের একটি মাত্র বাক্যে OpenClaw ইনস্টল করার সুযোগ দেওয়া হয়েছিল। আমরাও সফলভাবে এই Appso লবস্টারটিকে তার নিজস্ব একটি বাড়ি দিয়েছি, কিন্তু আমি যদি অ্যানিমে-স্টাইলের রুমের লেআউটটি পরিবর্তন করতে চাই? সেই দায়িত্ব MiniMax-এর উপর ছেড়ে দিন।

OpenClaw-এর ভিজ্যুয়াল লোকাল ইন্টারফেসে, আমরা সরাসরি "এই ছোট বাড়িটির স্টাইল আমি কীভাবে পরিবর্তন করব?" পাঠাতে পারি, এবং MiniMax M2.7 স্বয়ংক্রিয়ভাবে প্রজেক্টের কোড পড়ে আমাদের জানিয়ে দেবে কোন অংশগুলো পরিবর্তন করা যাবে এবং কীভাবে সেগুলো পরিবর্তন করতে হবে।

যেহেতু আমার ইনপুটের চাহিদা ছিল একটি বিজ্ঞান ও প্রযুক্তি বিষয়ক সম্পাদকীয় অফিসের স্টাইলের, তাই এটিকে পরিবর্তন করে একটি স্টার ওয়ার্স পোস্টার বানানো হয় এবং এর সাথে কম্পিউটারের সামনে বসে টাইপ করা এক ডজন লোককে যুক্ত করা হয়।

তবে, যেহেতু আমরা OpenClaw-এর মধ্যে Nano Banana Pro API Key কনফিগার করিনি, তাই MiniMax M2.7 স্বয়ংক্রিয়ভাবে OpenClaw-এর ভেতরে সাধারণ ছবি তৈরি করার জন্য কোড-ভিত্তিক পদ্ধতিটি বেছে নিয়েছে।

তারপর, এর সাথে কথা বলে আমরা এই শৈলীর উপর ভিত্তি করে একটি এডিটরিয়াল টাইকুন গেম ডিজাইন করতে পারি। যে বেশি কাজ সম্পন্ন করবে, সে একটি বড় অফিস পাবে এবং লেভেল আপ করতে পারবে।

যদি এটি MiniMax-এর অফিসিয়াল MaxClaw হয়, তবে এটি সরাসরি মাল্টিমোডাল জেনারেশন সমর্থন করে এবং কোনো অতিরিক্ত API কনফিগার করার প্রয়োজন ছাড়াই এক ধাপে ভিডিও, অডিও, ছবি ইত্যাদি তৈরি করতে পারে।

আমরা বেশ কয়েকটি মাস্ক মিম তৈরি করতে অফিশিয়াল জিআইএফ-স্টিকার-মেকার স্কিলটি ব্যবহার করেছি। ক্লাউডে ডেপ্লয় করা ম্যাক্সক্ল (MaxClaw) একটি যথেষ্ট সুরক্ষিত রানটাইম এনভায়রনমেন্ট নিশ্চিত করে, কিন্তু এটি আমাদের লোকাল কম্পিউটারের মতো যথেচ্ছভাবে বিভিন্ন লাইব্রেরি ফাইল ইনস্টল করার সুযোগ দেয় না।

অবশেষে, ভিডিওটিকে GIF-এ রূপান্তর করার সময়, MaxClaw আমাকে মনে করিয়ে দিল যে ক্লাউড সার্ভারে ffmpeg (একটি ওপেন-সোর্স মাল্টিমিডিয়া প্রসেসিং লাইব্রেরি) ইনস্টল করার জন্য এটির পর্যাপ্ত অনুমতি নেই।

▲MaxClaw-এর মধ্যে, আপনি সরাসরি MiniMax M2.7 ব্যবহার করতে পারেন, যা কোনো বিশেষ API কী কনফিগার করার প্রয়োজন ছাড়াই আমাদের জন্য মাল্টিমিডিয়া ফাইল তৈরি করতে Conch-এর মতো ভিডিও, অডিও এবং ইমেজ জেনারেশন মডেলগুলোকে স্বয়ংক্রিয়ভাবে কল করবে।

MaxClaw ডায়ালগ বক্সের নীচে থাকা 'Skills'-এ ক্লিক করলে MaxClaw-এ ইনস্টল করা সমস্ত স্কিলের বিবরণ দেখতে পাবেন। 'Ask MaxClaw'-এ ক্লিক করলে স্বয়ংক্রিয়ভাবে একটি বার্তা তৈরি হবে, যেখানে লেখা থাকবে "frontend-dev কী করতে পারে এবং কীভাবে এটি ব্যবহার করতে হয় তা আমাকে বলুন," যা আপনাকে এই স্কিলটি ব্যবহার করার পদ্ধতি শেখার প্রক্রিয়াটিতে নির্দেশনা দেবে।

GIF তৈরির দক্ষতার পাশাপাশি, MiniMax চমৎকার ভিজ্যুয়াল এফেক্ট তৈরির জন্য ফ্রন্ট-এন্ড ডেভেলপমেন্ট, ফুল-স্ট্যাক ব্যাক-এন্ড, অ্যান্ড্রয়েড ও আইওএস অ্যাপ্লিকেশন ডেভেলপমেন্ট এবং GLSL শেডিং প্রযুক্তিসহ একটি স্কিল লাইব্রেরিও প্রদান করে। আমরা সরাসরি Lobster-এ "Can you help me install the skills in this project https://github.com/MiniMax-AI/skills" লিখে পাঠাতে পারি, এবং Lobster স্বয়ংক্রিয়ভাবে স্কিলের ডকুমেন্টেশন খুঁজে বের করে ইনস্টলেশন সম্পন্ন করবে।

▲ডাউনলোড লিঙ্ক: https://github.com/MiniMax-AI/skills

এআই যখন সত্যিই কঠোর হয়ে ওঠে, তখন এটি নিজেকেও জড়িয়ে ফেলতে পারে।

দৈনন্দিন কাজ ও অফিসের পরিবেশে এর সম্পূর্ণ ওয়ার্কফ্লো এবং প্রকৃত ডেলিভারি সক্ষমতা ছাড়াও, মিনিম্যাক্স এম২.৭-এর যে বিষয়টি আমাদের সবচেয়ে বেশি মুগ্ধ করেছে তা হলো এর " মডেল সেলফ-ইটারেটিভ ক্লোজড লুপ "।

মিনিম্যাক্স একবার উল্লেখ করেছিল যে, মানব গবেষকদের কেবল সামগ্রিক দিকনির্দেশনা নিয়ন্ত্রণ করতে হবে এবং সিস্টেম তৈরির কাজটি মডেলের উপর ছেড়ে দিতে হবে, যা পরবর্তীতে একজন সলিউশন আর্কিটেক্ট হিসেবে স্বয়ংক্রিয়ভাবে ডেভেলপমেন্ট এজেন্ট হারনেস তৈরি করতে পারে।

একটি এজেন্ট হারনেসকে একটি এআই এজেন্টকে ঘিরে থাকা পরিচালন অবকাঠামোর একটি স্তর হিসেবে বোঝা যেতে পারে। মডেলটি চিন্তা করার জন্য দায়ী, আর হারনেসটি এই "চিন্তাশীল" সত্তাকে এমন একটি সিস্টেমে পরিণত করার জন্য দায়ী যা স্থিতিশীলভাবে কাজ সম্পাদন করতে পারে। এই সিস্টেমটি পরিচালন স্তর হিসেবে কাজ করে, যা বাস্তব পরিবেশে এজেন্টের স্থিতিশীল কার্যকারিতা নিশ্চিত করার জন্য দায়ী।

M2.7-এর ক্ষমতার সীমাবদ্ধতা পরীক্ষা করার জন্য, মিনিম্যাক্স এটিকে একটি অভ্যন্তরীণ স্ক্যাফোল্ডিং সিস্টেমের সফটওয়্যার ইঞ্জিনিয়ারিং পারফরম্যান্স অপ্টিমাইজ করার দায়িত্ব দিয়েছিল। ফলাফল? M2.7 কোনো মানুষের হস্তক্ষেপ ছাড়াই ১০০টিরও বেশি ইটারেটিভ লুপ সম্পন্ন করে।

এটি নিজের ব্যর্থতার গতিপথ বিশ্লেষণ করে, নিজস্ব পরিবর্তনের পরিকল্পনা করে, স্কাফোল্ডিং কোড পরিবর্তন করার পর মূল্যায়নটি আবার চালায় এবং অবশেষে ফলাফল তুলনা করে সিদ্ধান্ত নেয় যে এটিকে রাখা হবে নাকি আগের অবস্থায় ফিরিয়ে নেওয়া হবে। এই নিরলস অভ্যন্তরীণ সংগ্রামের মাধ্যমে এটি সর্বোত্তম সমাধানটি খুঁজে বের করে, যার ফলস্বরূপ মূল্যায়ন সেটে পারফরম্যান্স ৩০% বৃদ্ধি পায়।

"বৈজ্ঞানিক গবেষণা করার ক্ষেত্রে এআই-এর এই সক্ষমতা" সর্বজনীনভাবে উপলব্ধ টেস্ট সেটগুলিতেও যাচাই করা হয়েছে। মিনিম্যাক্স এম২.৭-কে বিশ্বের বৃহত্তম মেশিন লার্নিং প্রতিযোগিতা ক্যাগল-এর এমএলই লাইট টেস্ট সেটে অন্তর্ভুক্ত করা হয়েছিল।

২২টি প্রতিদ্বন্দ্বিতাপূর্ণ সমস্যার জন্য, M2.7 প্রতিটি রানের পরে অপ্টিমাইজেশনের পরামর্শ দিতে তার অভ্যন্তরীণ স্বল্পমেয়াদী মেমরি ফাইল এবং স্ব-প্রতিক্রিয়া পদ্ধতির উপর নির্ভর করে।

২৪ ঘণ্টার মধ্যে এটি ৯টি স্বর্ণপদক, ৫টি রৌপ্যপদক ও ১টি ব্রোঞ্জপদক জয় করে, যার পদক জয়ের হার ছিল ৬৬.৬%।

এই ফলাফলটি কেবল Opus-4.6 (75.7%) এবং GPT-5.4 (71.2%)-এর পরেই দ্বিতীয়, এবং Gemini-3.1-এর সাথে সমান।

যখন একটি মডেল সলিউশনস আর্কিটেক্টের ভূমিকা পালন করে, কোনো রকম ম্যানুয়াল কোডিং ছাড়াই মাত্র ৪ দিনে টেস্টিং ও কোড রিভিউ সহ একটি এজেন্ট সিস্টেম তৈরি করতে পারে, তখন সম্ভবত এআই উন্নয়নের চাকা ইতিমধ্যেই অটোমেটিক ট্রান্সমিশনে চলে গেছে।

এর অত্যন্ত শক্তিশালী কার্যক্ষমতার পাশাপাশি, মিনিম্যাক্স এম২.৭-এর অন্তর্নিহিত কাঠামো একে দীর্ঘমেয়াদী স্থিতিশীল স্মৃতি এবং শক্তিশালী আবেগীয় বুদ্ধিমত্তাও প্রদান করে, যার ফলে ইন্টারেক্টিভ রোল-প্লেয়িং-এর ক্ষেত্রে এটি প্রচলিত চ্যাটবটগুলোর চেয়ে উল্লেখযোগ্যভাবে ভালো পারফর্ম করে।

অফিসিয়াল টিম গিটহাবে ওপেনরুম নামে একটি মাল্টিমোডাল ইন্টারঅ্যাকশন সিস্টেম ওপেন-সোর্স করেছে। এটি একটি ওয়েব জিইউআই স্পেস যেখানে সবকিছুই ইন্টারঅ্যাক্ট করতে পারে, যা এআই-কে রিয়েল টাইমে স্পেসটির সাথে ইন্টারঅ্যাক্ট করার সুযোগ দেয়।

এআই নিজে নিজে কাজ করতে শিখতে শুরু করেছে, এবং এটি ভালো কোড লেখার চেয়েও বেশি গুরুত্বপূর্ণ।

এটি ব্যবহার করার পর, মিনিম্যাক্স এম২.৭-এর যে বিষয়টি আমাদের সত্যিই মনোযোগ আকর্ষণ করেছিল, তা ক্যাগল প্রতিযোগিতায় এর ৬৬.৬% সাফল্যের হার কিংবা অফিস স্যুটের সাবলীল উপস্থাপনা নয়।

বরং, এটি আরও একটি মৌলিক সমস্যা সমাধানের চেষ্টা করছে: এআই-কে কর্মপ্রবাহকে সত্যিকার অর্থে বুঝতে এবং এর বিবর্তনে অংশগ্রহণ করতে সক্ষম করে তোলা

অতীতে, সফটওয়্যার মানুষই লিখত এবং ব্যবহার করত। এখন, এআই সফটওয়্যার লেখা, পরিবর্তন করা এবং ব্যবহার করা শুরু করেছে। যখন কোনো মডেল মানুষের কোডিং ছাড়াই নিজে থেকে একটি সিস্টেম তৈরি করতে, পরীক্ষা করতে এবং পূর্বাবস্থায় ফিরিয়ে আনতে পারে, তখন ‘এআই গবেষণা ও উন্নয়ন’-এর চাকা অনেকটাই স্বয়ংক্রিয় সঞ্চালনে চলে গেছে।

‘লবস্টার কীভাবে ব্যবহার করা যায়’—এই প্রশ্নটি শীঘ্রই আর কোনো সমস্যা থাকবে না, কারণ সেই সিদ্ধান্ত নেওয়ার ভার আর আমাদের উপর থাকবে না।

বরং, এআই-ই নিজে থেকে কাজ করতে শিখতে শুরু করেছে।

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।