ঝিপু থেকে সদ্য প্রকাশিত GLM-5 অভিজ্ঞতা লাভের পর, অবশেষে আমি বুঝতে পারছি কেন এটি সিলিকন ভ্যালিতে অনেক জল্পনা-কল্পনার বিষয় হয়ে দাঁড়িয়েছে।

রহস্যময় "পনি আলফা" মডেলটি সম্পর্কে এক সপ্তাহ ধরে ইন্টারনেটে গুজব ছড়িয়ে পড়ছে।

কেউ কেউ বলছেন এটি একটি নতুন ব্র্যান্ডেড Claude 5, আবার কেউ কেউ বলছেন এটি একটি বড় কোম্পানির একটি গোপন অস্ত্র। এইমাত্র, রহস্যের সমাধান হল: "Pony Alpha" কোডনামযুক্ত এই নতুন মডেলটি বসন্ত উৎসবের জন্য Zhipu AI-এর বড় চমক – GLM-5 ছাড়া আর কেউ নয়।

▲ঝিপু ওয়েচ্যাট অফিসিয়াল অ্যাকাউন্ট থেকে স্ক্রিনশট

তাছাড়া, এটি ছিল ওপেন সোর্স।

যদি ২০২৫ সালই ছিল এআই কোড লিখতে শেখার বছর, তাহলে ২০২৬ সালের শুরুতে, টেসলার প্রাক্তন এআই পরিচালক আন্দ্রেজ কার্পাথির ভবিষ্যদ্বাণী অনুসারে, আমরা হয়তো "এজেন্টিক ইঞ্জিনিয়ারিং" এর যুগে প্রবেশ করতে চলেছি।

তবে, GPT-5.3-Codex এবং Claude Opus 4.6 এর তুলনায়, এটিকে ওপেন-সোর্স অবকাঠামোতে পরিণত করার ক্ষেত্রে প্রথম স্থান ছিল দেশীয় মডেল GLM-5।

এটি অভিজ্ঞতার জন্য এখানে লিঙ্কটি রয়েছে:

জেড.এআই: https://chat.z.ai
Zhipu Qingyan APP/ওয়েব সংস্করণ: https://chatglm.cn

সিলিকন ভ্যালিতে পনি.এ. আলফাকে বোকা বানানোর যে পণ্যটি আসলে ঝিপু জিএলএম-৫-এর একটি অগ্রদূত ছিল।

স্নেক বা টেট্রিসের মতো এআই লেখার প্রোগ্রামগুলি দেখতে এখন আর অবাক হওয়ার কিছু নেই। আসল পরীক্ষা হল চ্যালেঞ্জিং কিছু দিয়ে এটি পরীক্ষা করা।

আমরা GLM-5 কে একটি খুব নির্দিষ্ট পদার্থবিদ্যা সিমুলেশন প্রয়োজনীয়তার সাথে উপস্থাপন করেছি:

একটি ইন্টারেক্টিভ HTML, CSS এবং JavaScript স্যাটেলাইট সিস্টেম সিমুলেশন প্রোগ্রাম তৈরি করুন যা একটি স্যাটেলাইটের গ্রাউন্ড রিসিভারগুলিতে সংকেত পাঠানোর প্রক্রিয়া অনুকরণ করে। সিমুলেশনটিতে একটি স্যাটেলাইট পৃথিবীকে প্রদক্ষিণ করে এবং পর্যায়ক্রমে একাধিক গ্রাউন্ড রিসিভার দ্বারা প্রাপ্ত সংকেত প্রেরণ করে তা দেখানো উচিত।

তাৎক্ষণিকভাবে কোড প্রদানের পরিবর্তে, এটি কিছুক্ষণের জন্য বিরতি দেয় (একটি চিন্তা প্রক্রিয়া অনুকরণ করে) এবং অবশেষে আমার প্রয়োজনীয়তা অনুসারে একটি HTML ওয়েবপৃষ্ঠা তৈরি করে। স্ক্রিনে, স্যাটেলাইটটি কেবল চক্কর দিচ্ছিল না; এমনকি সংকেত সংক্রমণে একটি লহরের মতো ছড়িয়ে পড়া অ্যানিমেশনও ছিল যা ডপলার প্রভাবের ভিজ্যুয়াল রূপকের সাথে সঙ্গতিপূর্ণ ছিল।

এটি "অঙ্কন" শব্দটির পিছনের ভৌত আইনগুলি বোঝে, কেবল "অঙ্কন" করার ক্রিয়া নয়।

এরপর, আমরা অসুবিধা বাড়িয়ে দিলাম।

X-এ @scaling01 নামের একজন ব্যবহারকারী এটিকে খুব উচ্চ রেটিং দিয়েছেন: "পনি-আলফা হয় একটি AGI, অথবা সে আমার SVG প্রশ্নব্যাঙ্ক মুখস্থ করে ফেলেছে।"

এটি যাচাই করার জন্য, আমরা একটি অত্যন্ত বিমূর্ত পাইথন টাস্ক পরীক্ষা করেছি: "একমুখী রাস্তায় ট্র্যাফিক লাইট কীভাবে কাজ করে, যেখানে যানবাহন এলোমেলো হারে প্রবেশ করে তা কল্পনা করুন।"

৩ মিনিটেরও কম সময়ের মধ্যে, একটি গতিশীল ট্র্যাফিক প্রবাহ সিমুলেশন মানচিত্র উপস্থিত হয়েছিল।

যুক্তিটি অনবদ্য: সবুজ আলো চলাচলের অনুমতি দেয়, লাল আলোর জন্য সারিবদ্ধভাবে দাঁড়াতে হয়, এবং যানবাহনের ত্বরণ এবং গতি হ্রাসের এলোমেলোতা খুব ভালভাবে অনুকরণ করা হয়েছে। যাইহোক, এই ইন্টারফেসের নান্দনিকতা… আচ্ছা, ধরা যাক এগুলি কিছুটা "প্রাথমিক"।

@anurudhsharmaa নামে একজন নেটিজেন এমনকি একটি নান্দনিকভাবে মনোরম ওয়েবসাইট তৈরি করার জন্য এক লাইনের প্রম্পট ব্যবহার করেছেন।

ইতিমধ্যে, ব্যবহারকারী @zakarinoo7 একটি সম্পূর্ণ কার্যকরী মিডিয়া প্লেয়ার তৈরি করেছেন যা MP4/MP3 ডিকোডিং, প্লেলিস্ট পরিচালনা সমর্থন করে এবং এমনকি একটি ডার্ক মোড UIও অন্তর্ভুক্ত করে, যা সংকলনের পরে মাত্র 15MB এর মধ্যে।

এই দৃশ্যটি আমাকে এটি চেষ্টা করার জন্য অবিশ্বাস্যভাবে আগ্রহী করে তুলেছিল। তাই, আমি আবারও ক্লড কোড ব্যবহার করে GLM-5 কে আমার জন্য একটি স্টিকম্যান ওপেন-ওয়ার্ল্ড গেম তৈরি করতে বলেছিলাম।

কোড লেখার জন্য তাড়াহুড়ো করার পরিবর্তে, এটি একটি খুব "মানবিক" পদ্ধতি গ্রহণ করেছিল: প্রযুক্তি স্ট্যাক, মূল গেমপ্লে এবং বিশ্ব-নির্মাণ থেকে শুরু করে, এটি ধীরে ধীরে আমার চাহিদার সাথে সামঞ্জস্যপূর্ণ হয়েছিল।

এবং এর "নির্মাণ" প্রক্রিয়া চলাকালীন, আমি একজন বাছাইকারী ক্লায়েন্টের মতো কাজ করতে পারি, আমার সীমাকে মূল প্রয়োজনীয়তার বাইরে ঠেলে দিতে পারি এবং যেকোনো সময় নতুন ধারণা সন্নিবেশ করতে পারি:

মানচিত্রের চারপাশে দৌড়ানো খুব বিরক্তিকর; এমন একটি অর্থনৈতিক ব্যবস্থা থাকা দরকার যেখানে মাটিতে এলোমেলোভাবে সোনার মুদ্রা জন্মে।
কিছু অ্যাকশন উপাদান যোগ করা যাক: তীর ছুঁড়তে J টিপুন, এবং হাতাহাতি আক্রমণ করতে K টিপুন।
আমি যেসব জিনিস পাবো সেগুলো কোথায় রাখবো? এছাড়াও, একটি ব্যাকপ্যাক UI যোগ করুন যা আমি I কী টিপে অ্যাক্সেস করতে পারবো।
রাস্তার ধারে থাকা কাঠির মূর্তিগুলো কেবল অলংকরণ হতে পারে না; এনপিসি-র সাথে যোগাযোগ করার জন্য আমার এগুলো দরকার।

যখন এটি অবশেষে চালু হলো, তখন এর প্রভাবকে কেবল "নিখুঁত" হিসাবে বর্ণনা করা যেতে পারে:

যেহেতু সে নিজেকে একজন সিস্টেম আর্কিটেক্ট বলে দাবি করে, তাই GLM-5 অফিসিয়াল ওয়েবসাইটে প্রকাশিত হওয়ার পর, আমি তাকে এর জন্য একটি ম্যাক সিস্টেম তৈরি করতেও বলেছিলাম।

যদিও সামগ্রিক নকশাটি কিছুটা রুক্ষ, ক্লাসিক স্ক্রিন ব্যাকগ্রাউন্ড, উপরের স্ট্যাটাস বারে টাইম সিঙ্ক্রোনাইজেশন ডিসপ্লে এবং নীচের ডকে আইকন বিন্যাস – সবকিছুই "ড্র করা"। এবং আশ্চর্যজনকভাবে, এর প্রতিটি অ্যাপই আসলে খোলা যেতে পারে।

চিপ শিল্পের অর্ধেকের সাথে সামঞ্জস্যপূর্ণ, এটি GLM-5 এর "হত্যাকারী বৈশিষ্ট্য"।

বেঞ্চমার্কের ফলাফল দেখায় যে GLM-5 কোডিং এবং এজেন্ট উভয় ক্ষমতাতেই অত্যাধুনিক (SOTA) কর্মক্ষমতা অর্জন করে।

তথ্য মিথ্যা নয়। দুটি সবচেয়ে কুখ্যাত কঠিন প্রোগ্রামিং বেঞ্চমার্ক, SWE-bench-Verified এবং Terminal Bench 2.0-এ, GLM-5 যথাক্রমে 77.8 এবং 56.2 স্কোর করেছে। বাস্তব-বিশ্বের প্রোগ্রামিং অভিজ্ঞতার দিক থেকে, এটি Claude Opus 4.5-এর খুব কাছাকাছি।

GLM-5 কীভাবে এটি অর্জন করে? অফিসিয়াল রিপোর্টটি পর্যালোচনা করে, বেশ কয়েকটি পরামিতির পিছনে আমরা কয়েকটি মূল বিষয় খুঁজে পেয়েছি: MoE স্থাপত্য এবং অ্যাসিঙ্ক্রোনাস রিইনফোর্সমেন্ট লার্নিং।

মোট ৭৪৪ বাইট প্যারামিটার এবং মাত্র ৪০ বাইট অ্যাক্টিভেশন প্যারামিটার সহ, এটি বুদ্ধিমান এবং হালকা উভয়ই। কিন্তু এর আসল বৈশিষ্ট্য হল ঝিপু দ্বারা নির্মিত একেবারে নতুন "স্লাইম" ফ্রেমওয়ার্ক।

সহজভাবে বলতে গেলে: অতীতে, মডেল প্রশিক্ষণ ছিল "পরীক্ষা" নেওয়ার মতো, যেখানে আপনি প্রতিটি প্রশ্নের সঠিক উত্তর দেওয়ার জন্য একটি পয়েন্ট পেতেন, এবং মডেল উচ্চ স্কোর পাওয়ার জন্য উন্মত্তভাবে প্রশ্নগুলি মুখস্থ করতেন; অন্যদিকে, GLM-5 প্রশিক্ষণ হল "ইন্টার্নশিপ" এর মতো। স্লাইম নামক একটি পরিবেশে, এটি দীর্ঘমেয়াদী প্রকল্পগুলির একটি সিরিজ সম্পন্ন করে এবং ক্রমাগত প্রতিক্রিয়া এবং মিথস্ক্রিয়ার মাধ্যমে শেখে।

তদুপরি, এটি প্রথমবারের মতো ডিপসিক স্পার্স অ্যাটেনশনকে একীভূত করে। এর অর্থ হল, লক্ষ লক্ষ লাইনের কোড ধারণকারী প্রসঙ্গগুলির সাথে কাজ করার সময়, এটি কেবল হারিয়ে যাওয়া এড়াবে না, বরং স্থাপনার খরচও উল্লেখযোগ্যভাবে হ্রাস করবে।

কিন্তু যা আমাকে সবচেয়ে বেশি মুগ্ধ করেছে তা হল আনুষ্ঠানিক ঘোষণার নীচে স্বীকৃতির দীর্ঘ তালিকা। দেশীয়ভাবে উন্নত বৃহৎ আকারের মডেলটি এখন দেশীয়ভাবে উৎপাদিত চিপ ক্লাস্টারগুলিতে উচ্চ থ্রুপুট এবং কম ল্যাটেন্সি সহ স্থিতিশীল অপারেশন অর্জন করতে পারে।

হুয়াওয়ে অ্যাসেন্ড, মুর'স থ্রেডস, ক্যামব্রিকন, কুনলুন চিপ, মুক্সি, সুইয়ুয়ান, হাইগন…

▲ এতে এমন অনুভূতি রয়েছে যেন একজন খান একটি বিশাল সামরিক পর্যালোচনা করছেন।

এটি চীনের সেমিকন্ডাক্টর শিল্পের প্রায় অর্ধেক প্রতিনিধিত্ব করে, যার অর্থ হল GLM-5 এর ওপেন-সোর্সিং কেবল একটি সফ্টওয়্যার বিজয় নয়। এটি ইঙ্গিত দেয় যে দেশীয় AI ইকোসিস্টেম – অন্তর্নিহিত চিপ কম্পিউটিং শক্তি থেকে মধ্যবর্তী কাঠামো এবং তারপর উচ্চ-স্তরের মডেল পর্যন্ত – ধীরে ধীরে একটি সম্পূর্ণ বন্ধ লুপ তৈরি করেছে।

GLM-5 এর ওপেন-সোর্স রিলিজ এবং ক্লড কোড এবং ওপেনকোডের মতো মূলধারার সরঞ্জামগুলির সাথে এর একীকরণের মাধ্যমে, আমরা হয়তো সফটওয়্যার ইঞ্জিনিয়ারিং 2.0 এর দ্বারপ্রান্তে দাঁড়িয়ে আছি।

টেসলার প্রাক্তন এআই পরিচালক আন্দ্রেজ কার্পাথি ভবিষ্যদ্বাণী করেছিলেন যে "এজেন্ট ইঞ্জিনিয়ারিংয়ের যুগ" প্রত্যাশার চেয়েও দ্রুত এগিয়ে আসছে। ভবিষ্যতে, আপনাকে আর লাইন বাই লাইন বিল্ডিং ব্লকগুলি সাজানোর প্রয়োজন হবে না। আপনাকে কেবল সিস্টেমটি সংজ্ঞায়িত করতে হবে, নান্দনিকতা সংজ্ঞায়িত করতে হবে এবং "মজাদার" এবং "উপযোগী" কী তা সংজ্ঞায়িত করতে হবে।

তারপর, GLM-5 এর মতো একটি বৃহৎ মডেলকে একজন ফোরম্যানের মতো কাজ করতে দেখা, অন্তর্নিহিত কম্পিউটিং শক্তিকে আকাশচুম্বী ভবন তৈরিতে নির্দেশিত করা।

"কোডার"-এর ঐতিহ্যবাহী যুগ হয়তো সত্যিই শেষ হতে চলেছে।

কিন্তু আতঙ্কিত হবেন না, এর অর্থ এই নয় যে মানুষ অকেজো। বিপরীতে, যখন AI বাস্তবায়নের জটিলতাগুলি মোকাবেলা করে, তখন আপনার নান্দনিক বোধ, আপনার বিচারবুদ্ধি এবং একটি ভাল প্রশ্ন জিজ্ঞাসা করার ক্ষমতা মানবতার শেষ এবং সবচেয়ে শক্ত প্রতিরক্ষামূলক বাধা হয়ে দাঁড়াবে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো