“গরম থেকে নিম্ন” এই ওপেন-সোর্স তালিকায়, অবশেষে আমি বুঝতে পারছি কেন চীনা এআই ফিরে আসতে সক্ষম হয়েছে।

সাম্প্রতিক দিনগুলিতে, X-তে একটি ওপেন-সোর্স মডেলের স্তরের একটি তালিকা ব্যাপকভাবে প্রচারিত হয়েছে।

▲ ছবির উৎস: https://www.interconnects.ai/p/2025-open-models-year-in-review

শীর্ষ থেকে নিচ পর্যন্ত, দেশীয়ভাবে উন্নত ওপেন-সোর্স মডেলগুলি সেরাদের মধ্যে স্থান পেয়েছে, যেখানে ডিপসিক, কুয়েন, কিমি, ঝিপু এবং মিনিম্যাক্স শীর্ষ পাঁচটি বিশ্বব্যাপী ওপেন-সোর্স মডেল। অন্যদিকে, ওপেনএআই চতুর্থ স্তরে রয়েছে। জুকারবার্গের মেটা এবং লামা, যা তিনি সিলিকন ভ্যালির অর্ধেক প্রতিভা শিকার করে গড়ে তোলার চেষ্টা করেছিলেন, কেবল সম্মানসূচক মনোনয়ন পেয়েছে।

এই র‍্যাঙ্কিংটি দেশীয়ভাবে উন্নত মডেলদের অর্থপ্রদানের বিজ্ঞাপনের ফলাফল নয়, বা এটি চীনা স্ব-প্রচারের ঘটনাও নয়। বিখ্যাত এআই গবেষক নাথান ল্যাম্বার্ট এবং জার্মান রিসার্চ সেন্টার ফর এআই-এর পিএইচডি ছাত্র ফ্লোরিয়ান ব্র্যান্ডের ইন্টারকানেকটাই-তে প্রকাশিত একটি গবেষণাপত্র বিশ্বব্যাপী ওপেন-সোর্স মডেলগুলির একটি সম্পূর্ণ র‍্যাঙ্কিং প্রদান করে।

▲নাথান ল্যাম্বার্ট মেটা, ডিপমাইন্ড এবং হাগিং ফেসে কাজ করেছেন।

এই প্রবন্ধে গত এক বছরে বিশ্বব্যাপী ওপেন-সোর্স মডেলগুলির উন্নয়নের একটি বিশদ পর্যালোচনা প্রদান করা হয়েছে, যেখানে তুলে ধরা হয়েছে যে কীভাবে দেশীয় ওপেন-সোর্স মডেলগুলি, মূলত ডিপসিক এবং কিউয়েন, ওপেন সোর্সের মাধ্যমে সমগ্র এআই শিল্পের অপারেটিং নিয়ম পরিবর্তন করছে ।

প্রকৃতপক্ষে, ২০২৪ সালটি এখনও বিশ্বব্যাপী ওপেন সোর্সের জন্য লামার বছর হতে পারে। তবে, এই বছর, দেশীয়ভাবে উন্নত ওপেন সোর্স একটি উল্লেখযোগ্য প্রভাব ফেলছে, বিশ্বব্যাপী ওপেন সোর্স মডেলগুলিতে ডিফল্ট বিকল্পগুলিকে ক্রমাগত পুনর্নির্ধারণ করছে।

কর্মক্ষমতা, দাম, বাস্তুতন্ত্র, ব্যবহারযোগ্যতা… প্রতিটি দিক থেকেই এটি দ্রুত ক্লোজড-সোর্স জায়ান্টদের দিকে এগিয়ে যাচ্ছে, এমনকি কিছু দিক থেকে তাদের ছাড়িয়েও গেছে।

▲মার্কিন-চীন ওপেন-সোর্স মডেলের প্রকাশের ইতিহাস, জানুয়ারী ২০২৪ – নভেম্বর ২০২৫। ছবির উৎস: https://www.atomproject.ai/

আমরা যখন এখনও ভাবছি কখন দেশীয় মডেলগুলি ChatGPT এবং Gemini-এর সাথে তাল মেলাতে পারবে, তখন AI অস্ত্র প্রতিযোগিতায় আরেকটি প্রশ্ন উঠতে শুরু করেছে: কেন বিশ্বজুড়ে ডেভেলপাররা দেশীয় ওপেন-সোর্স মডেল ব্যবহার করছে?

ওপেন সোর্স মডেল, প্রতিষ্ঠিত এবং উদীয়মান উভয় খেলোয়াড়ই অংশগ্রহণ করে।

গত কয়েক মাস ধরে, দেশীয়ভাবে উন্নত ওপেন-সোর্স মডেলগুলির আপডেটের গতি প্রায় অবিরাম ছিল। এবং এটি কেবল একটি একক মডেল কোম্পানির সাফল্য নয়; এটি সমগ্র দেশীয় ওপেন-সোর্স ইকোসিস্টেম, যা ক্রমাগত সীমানা অতিক্রম করে দ্রুত ঊর্ধ্বমুখী বক্ররেখার মতো এগিয়ে চলেছে, ক্রমাগত বাধা অতিক্রম করছে।

নভেম্বর মাসে, কিমি কিমি কে২ থিংকিং প্রকাশ করে, যা একটি হাইব্রিড বিশেষজ্ঞ মডেল যার ট্রিলিয়ন ট্রিলিয়ন প্যারামিটার রয়েছে, যা তাৎক্ষণিকভাবে একাধিক লিডারবোর্ডে শীর্ষে উঠে আসে, এমনকি ওপেনএআই-এর জিপিটি-৫ এবং অ্যানথ্রপিকের ক্লড ৪.৫-কেও ছাড়িয়ে যায়।

অক্টোবরের শেষে, MiniMax আনুষ্ঠানিকভাবে MiniMax M2 হাইব্রিড এক্সপার্ট মডেল MoE প্রকাশ করে। Kimi-এর মতো, এটিও ওপেন সোর্স হিসেবে রয়ে গেছে। সামগ্রিক কর্মক্ষমতার দিক থেকে, MiniMax M2 পঞ্চম স্থানে রয়েছে, যা Gemini 2.5 Pro এবং Claude Opus 4.1-কে ছাড়িয়ে গেছে।

সেপ্টেম্বরে, ইউনকি সম্মেলনে, আলিবাবা সাতটি মডেলের একটি সিরিজ চালু করে, যা দৃষ্টি, বক্তৃতা, যুক্তি এবং প্রোগ্রামিংয়ের মতো একাধিক ক্ষেত্রে শ্রেষ্ঠত্ব অর্জন করে।

ডিপসিকের উত্থানের পর থেকে বিদেশী সোশ্যাল মিডিয়ায় চীনা ওপেন-সোর্স মডেলগুলির স্বীকৃতি অবিচ্ছিন্ন। "ব্যবহারে সহজ, সস্তা, ছোট কোম্পানিগুলির উন্নয়নের জন্য প্রথম পছন্দ, আমার পার্শ্ব প্রকল্পগুলি চীনা ওপেন-সোর্স মডেল ব্যবহার করে…" এই মন্তব্যগুলি X-এর সর্বত্র রয়েছে।

উদাহরণস্বরূপ, নেটিজেনরা কিমি কে২ থিংকিং-এর লেখার ধরণ এবং চিন্তার গভীরতা বিনিময়ের জন্য তার টোকেন ব্যবহারের প্রশংসা করেছেন।

কিছু নেটিজেন মিনিম্যাক্স এম২ কে ক্লড সনেট ৪ এর সাথে তুলনা করে বলেছেন যে এম২ শুধুমাত্র একবার ব্যবহারে একটি সম্পূর্ণ কার্যকরী ওয়েবসাইট তৈরি করতে পারে, কিন্তু সনেট ৪ ব্যর্থ হবে।

Qwen সম্পর্কে আরও অনেক পোস্ট আছে। ভার্সন 2.5 থেকে বর্তমান 3.0 পর্যন্ত, 480 বিলিয়ন প্যারামিটার সহ একটি বৃহৎ মডেল থেকে মাত্র 600 মিলিয়ন প্যারামিটার সহ একটি ছোট মডেল পর্যন্ত, ভিজ্যুয়াল ভাষা Qwen 3 VL থেকে কোড লেখা Qwen 3 Coder পর্যন্ত, প্রায় পুরো ওপেন সোর্স বাজারে Qwen এর উপস্থিতি রয়েছে।

এক সাক্ষাৎকারে, Airbnb-এর সিইও এমনকি খোলাখুলিভাবে বলেছিলেন যে OpenAI ভালো হলেও এটি তাদের জন্য উপযুক্ত নয়; যদিও চীনের ওপেন-সোর্স মডেল Qwen চমৎকার, তাদের কাজের জন্য ব্যবহারিকভাবে প্রযোজ্য, এবং OpenAI-এর চেয়ে ভালো এবং সস্তা।

ওপেন সোর্সের ক্ষেত্রে, এটা বলা ভুল হবে যে দেশীয় ওপেন সোর্স মডেল এখনও জনপ্রিয়তা পাচ্ছে; এটি ইতিমধ্যেই বিশ্বব্যাপী স্বীকৃত ওপেন সোর্স পছন্দ হয়ে উঠেছে।

মিনিম্যাক্স এম২, একটি ওপেন-সোর্স ইন্টেলিজেন্ট এজেন্ট যা বাস্তব-বিশ্বের অ্যাপ্লিকেশনগুলিতে ব্যবহার করা যেতে পারে।

যদি আমরা দেশীয় ওপেন-সোর্স মডেলের সুবিধাগুলি ব্যাখ্যা করার জন্য নির্দিষ্ট উদাহরণ ব্যবহার করতে চাই, তাহলে অতীতে আমরা ভাগ করে নেওয়া বেশ কয়েকটি ওপেন-সোর্স সরঞ্জামের বাস্তব-বিশ্ব পরীক্ষার অভিজ্ঞতা ইতিমধ্যেই উত্তর প্রদান করে।

সম্প্রতি প্রকাশিত হয়েছে Kimi K2 Thinking, যার মধ্যে একটি অতি-দীর্ঘ চিন্তাভাবনা চেইন রয়েছে যা একবারে 300টি টুল কল কার্যকর করতে পারে; এছাড়াও রয়েছে Zhipu AutoGLM 2.0, মোবাইল ফোনের জন্য ডিজাইন করা একটি সর্বজনীন এজেন্ট; এবং AI যুগে অ্যান্ড্রয়েডের জন্য Alibaba Tongyi মডেল পরিবার।

▲২০২৫ সালের প্রথম প্রান্তিকে দেশীয় এআই মডেল নির্মাতা এবং স্টার্টআপগুলির কৃত্রিম বিশ্লেষণ পরিসংখ্যান

যদিও এই মডেলগুলি সবই ওপেন সোর্স, তাদের প্রত্যেকের নিজস্ব প্রযুক্তিগত বৈশিষ্ট্য রয়েছে, যা দেশীয় ওপেন সোর্স মডেলগুলির মানচিত্রকে আরও সম্পূর্ণ এবং সমৃদ্ধ করার চেষ্টা করে।

K2 থিংকিং ট্রিলিয়ন প্যারামিটার সহ একটি বৃহৎ মডেলের উপর দৃষ্টি নিবদ্ধ করে এবং এর নিজস্ব KDA (কিমি ডেল্টা অ্যাটেনশন) মেকানিজম রয়েছে; ডিপসিক হাইব্রিড অ্যাটেনশনের উপর দৃষ্টি নিবদ্ধ করে, যা উল্লেখযোগ্যভাবে খরচ কমায়; এই আপডেটে, মিনিম্যাক্স M2 তার পদ্ধতি পরিবর্তন করেছে এবং সম্পূর্ণ মনোযোগ ব্যবহার করেছে, মাত্র 230 বিলিয়ন মডেল প্যারামিটার সহ।

M2 ভালো কিনা তা দেখার জন্য, আমরা একটি সহজ পরীক্ষা করেছিলাম, যখনই সম্ভব চেষ্টা করে দেখার নীতি মেনে।

আমাদের প্রথম কাজ ছিল তাকে একটি এক্সেল স্প্রেডশিট থেকে ডেটা প্রক্রিয়া করানো। আমরা তাকে এই বছরের জাতীয় সিভিল সার্ভিস পরীক্ষার জন্য চাকরির পোস্টিংয়ের একটি টেবিল পাঠিয়েছিলাম এবং টেবিলের বিষয়বস্তুর উপর ভিত্তি করে সিভিল সার্ভিস পদগুলি পরীক্ষা করার জন্য একটি সাধারণ টুল ডিজাইন করতে বলেছিলাম।

টেবিলটিতে প্রচুর পরিমাণে ডেটা রয়েছে, আকারে ১০ এমবি, এবং এতে ২০,০০০ এরও বেশি চাকরির পোস্টিং রয়েছে। মিনিম্যাক্স এম২ এর একটি বিশেষ বৈশিষ্ট্য হল এটি ব্যবহারকারীকে জিজ্ঞাসা করে যে কাজটি সম্পাদনের আগে কোনও সমন্বয় প্রয়োজন কিনা।

তাদের টেকনিক্যাল ব্লগে, তারা উল্লেখ করেছে যে M2 "ইন্টারলিভড থিংকিং" কৌশল ব্যবহার করে, যা প্রথম ক্লড সনেট 4 মডেলে প্রয়োগ করা হয়েছিল, কিন্তু এর গ্রহণ এখনও খুব সীমিত।

মিনিম্যাক্স ব্যবহারকারীদের মডেলের "থিঙ্ক" ট্যাগ ব্যবহার করে তাদের চিন্তাভাবনা সংরক্ষণ করার জন্য একটি টিপস প্রদান করে। M2 ইন্টারলিভড চিন্তাভাবনার উপর নির্ভর করে এবং স্মৃতির জন্য প্রসঙ্গ অপরিহার্য; এই তথ্য সংরক্ষণ করা আরও ভালো ইন্টারলিভড চিন্তাভাবনার জন্য সহায়ক।

▲মিনিম্যাক্স ইঞ্জিনিয়ারিং ডিরেক্টর ফ্যাক্স ব্যাখ্যা করেছেন যে কীভাবে ইন্টারলিভড চিন্তাভাবনা মডেলগুলিকে এজেন্টের কাজগুলি আরও ভালভাবে সম্পাদন করতে দেয়।

সহজ কথায়, ইন্টারলিভড চিন্তাভাবনা হল "একটি বড় মডেল তৈরি করে (টুল/কলিং ইন্টারফেস ব্যবহার করে), থামুন এবং চিন্তা করুন, তারপর আবার কাজ করুন, এবং তারপর আবার চিন্তা করুন", একটি কাজকে এগিয়ে নিয়ে যাওয়ার বিষয়ে, বরং একগুচ্ছ ধারণা নিয়ে চিন্তা করা এবং তারপর সেগুলি একবারে বাস্তবায়ন করা।

সম্প্রতি আপডেট করা কিমি কে২ থিংকিং ইন্টারলিভড থিংকিং কৌশলটিও ব্যবহার করে । চিন্তাভাবনা এবং ধারণাগুলিকে একই সাথে আহ্বান করার এই পদ্ধতি মডেলটিকে প্রতিবার টুল আউটপুট পাওয়ার পরে তার পরিকল্পনাগুলি অবিলম্বে পর্যালোচনা এবং সামঞ্জস্য করতে দেয়। এটি বিশেষ করে দীর্ঘ প্রক্রিয়া এবং অনিশ্চিত ফলাফল সহ এজেন্ট কাজের জন্য উপযুক্ত।

▲ এখানে অভিজ্ঞতা নিন: https://2rfxtimus5nr.space.minimaxi.com/; পরীক্ষা শেষ হলেও, আপনি এখনও দেখতে পাচ্ছেন যে MiniMax M2 এর এক্সেল স্প্রেডশিট ডেটা প্রক্রিয়া করার ক্ষমতাকে অবমূল্যায়ন করা উচিত নয়।

চূড়ান্ত ফলাফলটি খুবই নির্ভুল, ২০,৭১৪টি চাকরির পোস্টিং দেখানো হয়েছে এবং এতে আবেদনকারী সম্প্রতি স্নাতক কিনা, তৃণমূল পর্যায়ের পদে বছরের পর বছর অভিজ্ঞতা আছে কিনা এবং বসবাসের জায়গা আছে কিনা তার পরিসংখ্যান অন্তর্ভুক্ত রয়েছে। বাজারে থাকা কিছু বেতনভুক্ত চাকরি নির্বাচন সরঞ্জামের তুলনায়, এজেন্ট ব্যবহার করে স্বয়ংক্রিয়ভাবে একটি তৈরি করা অনেক বেশি সুবিধাজনক।

আমরা এটিকে কিছু গভীর গবেষণাও করতে বলেছিলাম, এটিকে M2 সম্পর্কে তথ্য দিয়েছিলাম এবং এটিকে একটি সুন্দর পাওয়ারপয়েন্ট উপস্থাপনা তৈরি করতে সাহায্য করেছিলাম।

▲প্রিভিউ লিঙ্ক: https://z4czsdfoakc7.space.minimaxi.com/

শুরু থেকে একটি পণ্য তৈরির ভাইব কোডিং অভিজ্ঞতার পাশাপাশি, মিনিম্যাক্স ক্লড কোডের মতো কমান্ড-লাইন সরঞ্জামগুলি বা কার্সার এবং ভিএস কোডের মতো ডেভেলপমেন্ট প্ল্যাটফর্মগুলিকে কীভাবে একীভূত করতে হয় সে সম্পর্কে বিস্তারিত টিউটোরিয়ালও সরবরাহ করে।

▲মিনিম্যাক্স এম২ মডেল এপিআই ব্যবহার করে ক্লড কোড

ইন্টারলিভড চিন্তাভাবনা মডেলগুলিকে আরও স্মার্ট করে তোলে, কখন কোন টুলটি ব্যবহার করতে হবে তা জানার মাধ্যমে। কিন্তু MiniMax M2 এর আরেকটি প্রযুক্তিগত বৈশিষ্ট্য রয়েছে: এটি একটি পূর্ণ মনোযোগ প্রক্রিয়া ব্যবহার করে, যা আদর্শের ব্যতিক্রম ।

আমরা পূর্বে আলোচনা করেছি যে ডিপসিক কীভাবে এত কম খরচে অর্জন করে, তার অন্যতম গুরুত্বপূর্ণ কারণ হল এর স্পার্স অ্যাটেনশন এবং হাইব্রিড অ্যাটেনশন মেকানিজমের ব্যবহার । স্পার্স অ্যাটেনশন মডেলটিকে গুরুত্বপূর্ণ তথ্যের উপর নির্বাচনীভাবে ফোকাস করতে দেয়, ঠিক যেমন মানুষ টোকেন প্রক্রিয়াকরণের সময় গৌণ তথ্য উপেক্ষা করে।

অন্যান্য কৌশলের সাথে এটিকে একত্রিত করে, আমরা মডেলের অনুমানের গতি উন্নত করতে পারি এবং আউটপুট মানের উপর প্রভাব না ফেলে খরচ কমাতে পারি।

▲ মূল ব্লগ পোস্ট: https://huggingface.co/blog/MiniMax-AI/why-did-m2-end-up-as-a-full-attention-model

মিনিম্যাক্স টিম একটি প্রযুক্তিগত ব্লগ পোস্টও লিখেছে যেখানে ব্যাখ্যা করা হয়েছে কেন তারা স্কয়ার ওয়ানে ফিরে গেছে এবং পূর্ণ মনোযোগ প্রক্রিয়া বেছে নেওয়া অব্যাহত রেখেছে, এমন একটি পদ্ধতি যা প্রশিক্ষণ এবং অনুমানের চাপ বাড়ায়।

তারা উল্লেখ করেছেন যে এর মূল কারণ হল "নির্দিষ্ট কর্মক্ষমতা"। বর্তমানে যাকে স্পার্স অ্যাটেনশন বা দক্ষ মনোযোগ বলা হয় তার বেশিরভাগই মডেলটিকে আরও ভালোভাবে পারফর্ম করানোর জন্য নয়, বরং কেবল কম্পিউটিং রিসোর্স সংরক্ষণ এবং খরচ কমানোর জন্য।

পূর্ণ মনোযোগ মডেলগুলি এখনও উচ্চতর কর্মক্ষমতা এবং নির্ভরযোগ্যতা প্রদান করে। যাইহোক, প্রসঙ্গ দৈর্ঘ্যের প্রয়োজনীয়তা বৃদ্ধি পেতে থাকে এবং GPU কম্পিউটিংয়ের বৃদ্ধির হার ধীর হয়ে যায়, রৈখিক এবং বিক্ষিপ্ত মনোযোগের সম্ভাবনা ধীরে ধীরে আবির্ভূত হতে পারে।

MiniMax M2 বর্তমানে সীমিত কম্পিউটিং রিসোর্সের মাধ্যমে যতটা সম্ভব গুণমান, গতি এবং দামের মধ্যে ভারসাম্য অর্জনের চেষ্টা করছে, এবং এবার এটি সত্যিই সফল হয়েছে।

অতএব, কিছুটা হলেও, অনেকেই মনে করেন যে ওপেন সোর্স মানে অন্যদের কাছে বিনামূল্যে প্রযুক্তি প্রদান করা; কিন্তু প্রযুক্তিগত উন্নয়নের ইতিহাসে, ওপেন সোর্স হল বিভিন্ন প্রযুক্তির সংঘর্ষ এবং বিভিন্ন গবেষকদের সহযোগিতা করার সুযোগ দেওয়া, যার ফলে আরও প্রযুক্তিগত উদ্ভাবন অর্জন করা সম্ভব।

তিনি বলেন, যখন বৃহৎ মাপের মডেল বিশ্লেষণ প্ল্যাটফর্ম, কৃত্রিম বিশ্লেষণ, তার প্ল্যাটফর্মে MiniMax M2 এর সামগ্রিক কর্মক্ষমতা উপস্থাপন করে, তখন এটি দেশীয় ওপেন সোর্স প্রযুক্তির কথাও উল্লেখ করে।

ওপেন সোর্স ক্ষেত্রে চীনের এআই ল্যাবস একটি শীর্ষস্থানীয় অবস্থান বজায় রেখেছে।
মিনিম্যাক্সের প্রকাশ ওপেন-সোর্স এআই ক্ষেত্রে চীনের শীর্ষস্থান অব্যাহত রেখেছে, যে অবস্থানটি ২০২৪ সালের শেষের দিকে ডিপসিক দ্বারা শুরু হয়েছিল এবং ডিপসিক, আলিবাবা, ঝিপু এবং কিমি সহ অন্যান্যদের পরবর্তী প্রকাশগুলি দ্বারা এটি বজায় রাখা হয়েছে।

এটা সত্যি। আমরা DeepSeek R2 এর জন্য এক বছর অপেক্ষা করেছিলাম, কিন্তু এর পরিবর্তে আমরা Kimi K2 দেখতে পেলাম, যা বিদেশে হিট হয়েছিল, Zhipu GLM সিরিজ এবং Qwen সিরিজ, যার উপর প্রায় প্রতিটি ডেভেলপার নির্ভর করে।

এই সমস্ত দেশীয়ভাবে বিকশিত ওপেন-সোর্স মডেল, তাদের বিভিন্ন প্রযুক্তিগত পদ্ধতি এবং বিভিন্ন প্রয়োগের দিকনির্দেশনা সহ, সম্পূর্ণরূপে একত্রিত হলেই কেবল তাদের প্রকৃত সুবিধা এবং শক্তি থাকে, যা ক্লোজড-সোর্সকে "ভালো মডেল" এর একমাত্র প্রতিনিধি হতে বাধা দেয়।

▲ হাগিং ফেসে, শীর্ষ চারটি জনপ্রিয় মডেলের সবগুলোই দেশীয়ভাবে তৈরি ওপেন-সোর্স মডেল; ছবির উৎস: https://huggingface.co/models?sort=trending

ক্লোজড-সোর্স কোড ক্লোজড-সোর্স কোডকে পরাজিত করতে পারে না; কেবল ওপেন-সোর্স কোডই বাধা অতিক্রম করতে পারে।

কিছুক্ষণ আগে, Xiaohongshu's 1024 Programmers Day-তে, Hugging Face-এর প্রতিষ্ঠাতা উল্লেখ করেছিলেন যে ওপেন সোর্স এবং ক্লোজড সোর্সের মধ্যে ব্যবধান কমছে, এবং চীন এই ক্ষেত্রে তুলনামূলকভাবে এগিয়ে। Xiaohongshu-এর টেকনিক্যাল প্রধান আরও বলেছিলেন যে ওপেন সোর্স সমাজে AI ব্যবহারের খরচ কমায় এবং প্রযুক্তিকে এগিয়ে নিয়ে যাওয়ার জন্য সকলের শক্তিকে একত্রিত করে।

নিঃসন্দেহে, ওপেন সোর্স একটি ভালো জিনিস, কিন্তু কেউই আশা করেনি যে ক্লোজড সোর্সকে পরাজিত করবে এমন জিনিসটিই ওপেন সোর্স নিজেই হবে।

ডিপসিকের উত্থান কেবল বিশ্বের কাছে একটি নতুন মডেলের প্রশিক্ষণ যুক্তি প্রকাশ করেনি, কম খরচে সমানভাবে চমকপ্রদ ফলাফল অর্জন করেছে, বরং আরও গুরুত্বপূর্ণ বিষয় হল, এটি দেশীয় এআই-এর সমগ্র পরিচালনা পদ্ধতির জন্য একটি স্পষ্ট দিকনির্দেশনা প্রদান করেছে।

এটি সকলকে উপলব্ধি করতে সাহায্য করেছিল যে, সেই সময়ে যখন মার্কিন যুক্তরাষ্ট্র বিশ্বব্যাপী AI আলোচনার একচেটিয়া অধিকারী ছিল, তখন ওপেন সোর্সই ছিল নিজেকে দৃশ্যমান করার একমাত্র উপায়।

▲OpenAI-এর ট্রিলিয়ন ডলারের কম্পিউটিং পাওয়ার ব্যবসায়িক সাম্রাজ্য, যার মধ্যে রয়েছে Google, Meta, Anthropic, ইত্যাদি।

অবশ্যই, ওপেন সোর্স বেছে নেওয়ার পিছনে আরও অনেক নির্দিষ্ট কারণ রয়েছে। ওপেনএআই, অ্যানথ্রপিক এবং জেমিনি সকলেই বন্ধ দরজার আড়ালে তাদের নিজস্ব সিস্টেম তৈরি করছে। তারা সীমাহীন গ্রাফিক্স কার্ড দিয়ে বৃহত্তর মডেলগুলিকে প্রশিক্ষণ দিতে পারে এবং শত শত বিলিয়ন ডলার তহবিল সংগ্রহ করতে পারে।

তবে, দেশীয়ভাবে উন্নত মডেলগুলির মুখোমুখি হওয়া দ্বিধা হল কম্পিউটিং পাওয়ারের ঘাটতি এবং চিপের সীমাবদ্ধতা… যদি মডেলগুলি ভাগ করা না হয়, তাহলে কেউ কম্পিউটিং পাওয়ার পুনরায় ব্যবহার করতে পারবে না। একটি ব্যবহারযোগ্য মৌলিক মডেল ছাড়া, এর অর্থ হল সবকিছুই শুরু থেকে শুরু করতে হবে। Baidu প্রাথমিকভাবে তার ব্যবসায়িক মডেলের জন্য মডেলটিকে ক্লোজ-সোর্স রাখার সিদ্ধান্ত নিয়েছিল; এই বছরের জুনে, তারা Wenxin Big Model 4.5 সিরিজের অফিসিয়াল ওপেন-সোর্সিংও ঘোষণা করেছিল।

অন্যদিকে, অনেক দেশীয় মডেল নির্মাতা রয়েছে এবং প্রতিযোগিতাও খুব তীব্র। যদি সে ওপেন সোর্স না চায়, তাহলে অন্যরা ওপেন সোর্স করবে; যদি সে সোর্স বন্ধ করতে চায়, তাহলে ব্যবহারকারীরা অন্যান্য মডেল বেছে নিতে পারে।

▲ছবির উৎস: https://a16z.substack.com/p/charts-of-the-week-open-model-of

কিছুক্ষণ আগে, a16z ওপেন-সোর্স মডেলগুলির উপর তথ্য সংকলন করেছে, এবং ফলাফলগুলি দেখিয়েছে যে দেশীয় ওপেন-সোর্স মডেলগুলির ক্রমবর্ধমান ডাউনলোডগুলি কেবল আমেরিকান মডেলগুলিকেই ছাড়িয়ে যায় না, বরং লিডটিও প্রসারিত হচ্ছে।

এই বছরের এপ্রিলে, স্ট্যানফোর্ড বিশ্ববিদ্যালয় একটি 2025 এআই সূচক প্রতিবেদনও প্রকাশ করেছে, যেখানে ওপেন-সোর্স এবং ক্লোজড-সোর্স মডেলের কর্মক্ষমতা, সেইসাথে চীন এবং মার্কিন যুক্তরাষ্ট্রের মডেলগুলির কর্মক্ষমতা তুলনা করা হয়েছে। এই প্রতিবেদনের তথ্য কেবল এই বছরের ফেব্রুয়ারি পর্যন্ত; আগামী বছরের মধ্যে, দেশীয় ওপেন-সোর্স মডেলগুলি সম্ভবত ক্লোজড-সোর্স এবং আমেরিকান উভয় মডেলকেই ছাড়িয়ে যাবে।

যদি আমরা দেশীয় ওপেন সোর্সের সুবিধাগুলিকে তাদের সর্বনিম্ন সম্ভাব্য স্তরে ভেঙে ফেলি, তাহলে আমরা দেখতে পাব যে আমাদের বর্তমান নেতৃত্ব একটি সম্পূর্ণ এবং বিশাল ওপেন সোর্স সিস্টেমের কারণে। এই সিস্টেমের প্রতিটি লিঙ্ক দেশীয় ওপেন সোর্সের ক্ষমতাকে ক্রমশ শক্তিশালী করে তুলছে।

▲দেশীয় ওপেন-সোর্স মডেলগুলির সম্প্রদায়ের মূল্যায়ন, যেমন, Elo র‍্যাঙ্কিং, অথবা কৃত্রিম বিশ্লেষণ বেঞ্চমার্ক পরীক্ষায় অঞ্চল অনুসারে পারফরম্যান্স তুলনা, দেশীয় ওপেন-সোর্স মডেলগুলি একটি শীর্ষস্থানে রয়েছে। | ছবির উৎস: https://www.atomproject.ai/

ডিপসিক তার খরচ কাঠামো এবং দক্ষ অনুমানের মাধ্যমে প্রথম ফাঁকটি খুলে দিয়েছে; কুয়েন তার ইকোসিস্টেম স্কেল দিয়ে ফাঁকটি ভেঙে দিয়েছে; অন্যদিকে, মিনিম্যাক্স, ঝিপু এবং কিমি এই ফাঁক আরও প্রশস্ত করার জন্য বিভিন্ন প্রযুক্তিগত পদ্ধতি ব্যবহার করেছে।

যখন বিশ্বজুড়ে ছোট দলগুলি ফাইন-টিউনিংয়ের জন্য Qwen, ইনফারেন্স ফাউন্ডেশনের জন্য DeepSeek এবং এজেন্ট যাচাইয়ের জন্য MiniMax ব্যবহার করে, তখন দেশীয় ওপেন-সোর্স সমাধানগুলি নির্বাচিত থেকে ডিফল্ট হয়ে উঠেছে। ফলস্বরূপ, বিশ্বব্যাপী ওপেন-সোর্স ইকোসিস্টেমের কেন্দ্র চীনের দিকে সরে যেতে শুরু করেছে।

গত মাসে, জেনসেন হুয়াং একটি এআই শীর্ষ সম্মেলনে এক সাক্ষাৎকারে বলেছিলেন যে "চীন এআই দৌড়ে জিতবে।" তবে, তিনি তাৎক্ষণিকভাবে এনভিডিয়ার অফিসিয়াল অ্যাকাউন্ট, এক্স-এর মাধ্যমে তার বক্তব্য প্রত্যাহার করে নিয়েছিলেন, স্পষ্ট করে দিয়েছিলেন যে চীন আসলে "এআই দৌড়ে মার্কিন যুক্তরাষ্ট্রের চেয়ে মাত্র ন্যানোসেকেন্ড পিছিয়ে।"

এই প্রথমবার নয় যে হুয়াং এআই দৌড়ে চীনের অবস্থানের কথা উল্লেখ করেছেন। তিনি একাধিক প্রকাশ্যে বলেছেন যে ওপেন-সোর্স মডেলগুলি অত্যন্ত গুরুত্বপূর্ণ, তা ডেভেলপার, স্টার্টআপ, এমনকি তথাকথিত এআই দৌড়ের জন্যও।

এই বছরের অক্টোবরে NVIDIA GTC সম্মেলনে, জেনসেন হুয়াং তার বক্তৃতায় আবার উল্লেখ করেছিলেন যে বিশ্বব্যাপী ওপেন সোর্স মডেল বাজারে, চীনের টংই কিয়ানওয়েন প্রথম স্থানে রয়েছে এবং বাজারের বেশিরভাগ অংশ দখল করে আছে।

▲ প্রায় ৬০% কোয়েন

এই বছরের এপ্রিলে, তিনি ওয়াশিংটনে এক প্রযুক্তি সম্মেলনে বলেছিলেন, "নিঃসন্দেহে, হুয়াওয়ে বিশ্বের সবচেয়ে শক্তিশালী প্রযুক্তি কোম্পানিগুলির মধ্যে একটি… কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে চীনও পিছিয়ে নেই। আমরা খুব, খুব কাছাকাছি… বিশ্বের ৫০% কৃত্রিম বুদ্ধিমত্তা গবেষক চীনা। আমাদের প্রতিযোগিতা করতে হবে।"

তবে, ওপেন সোর্সের প্রতিযোগিতায়, মেটা থেকে মার্কিন ওপেন সোর্স লিডার লামার দিকে তাকান। গত এপ্রিলে, লামা 3 মুক্তি পায়, তারপরে জুলাই মাসে লামা 3.1, সেপ্টেম্বরে লামা 3.2 এবং তারপরে এই বছরের এপ্রিলে আশ্চর্যজনক লামা 4। এর চেয়েও উন্নত সংস্করণ, বেহেমথ, এখনও মুক্তি পায়নি।

▲এপ্রিল মাসে মুক্তিপ্রাপ্ত লামা ৪-এ তিনটি সংস্করণের কথা উল্লেখ করা হয়েছে: বেহেমথ, ম্যাভেরিক এবং স্কাউট। মনে হচ্ছে বেহেমথ পরিত্যক্ত হয়ে গেছে।

এরপর, মেটা সম্পর্কে একমাত্র খবর ছিল জুকারবার্গ প্রতিভা চোরাচালানের জন্য বিশাল বেতনের প্রস্তাব দিয়েছিলেন এবং তারপরে সম্প্রতি ৬০০ জনকে ছাঁটাই করেছিলেন। এমনকি টুরিং পুরস্কার বিজয়ী ইয়ান লেকুনও নিজের ব্যবসা শুরু করার জন্য পদত্যাগ করেছিলেন।

জাকারবার্গ সম্ভবত কখনও কল্পনাও করেননি যে সিলিকন ভ্যালিতে ওপেন সোর্স ব্যবহারের তার পছন্দ, যা তাকে একজন অনন্য ব্যক্তিত্বে পরিণত করেছে, ডিপসিককে ছাড়িয়ে যাবে, যা এই জানুয়ারিতে জনপ্রিয়তা অর্জন করেছিল। ফলস্বরূপ, মেটা এখন একটি দ্বিধায় পড়ে গেছে: ওপেন সোর্স কোনও বিকল্প নয়, এবং ক্লোজড সোর্স কোনও কার্যকর বিকল্প নয়।

এটা মেনে না নেওয়া কঠিন যে লামার সাফল্যের অর্ধেক দেশীয় ওপেন-সোর্স প্রযুক্তির জন্য।

▲মেটা-সম্পর্কিত ডেরিভেটিভ মডেল এবং মিস্ট্রাল এআই-এর প্রাথমিক নেতৃত্বকে আলিবাবার কোয়েন মডেল সম্পূর্ণরূপে ছাড়িয়ে গেছে।

কিছুদিন আগে, সোশ্যাল মিডিয়া ব্রাউজ করার সময়, আমি একটি মন্তব্য দেখেছিলাম যাতে বলা হয়েছিল, "ওপেন সোর্স হল আপনার প্রতিপক্ষকে আপনার ছেলেতে পরিণত করার মতো; কোনও ছেলে তার বাবাকে মারবে না।" কথাগুলো হয়তো অশোভন, কিন্তু সত্য কথাটি সঠিক। এআই-এর ওপেন সোর্স চক্রে, চীনের প্রতিনিধিত্বমূলক ওপেন সোর্স মডেল স্পষ্টতই এআই বাস্তুতন্ত্রের ভিত্তি হয়ে উঠেছে।

দেশীয়ভাবে উন্নত ওপেন-সোর্স প্রযুক্তির নেতৃত্বে এআই মডেলের এই তরঙ্গ, এআই-এর ভবিষ্যৎ কে নির্ধারণ করতে পারে সেই প্রশ্নটিকে বদলে দিচ্ছে। এটি আমাদের প্রত্যেককে কম খরচে এবং দ্রুত গতিতে বিশ্বের সবচেয়ে উন্নত এবং ব্যবহারকারী-বান্ধব এআই ব্যবহার করতে সক্ষম করবে।

শেষ ছবির বিস্তারিত নিম্নরূপ।

▲উপর থেকে নিচ পর্যন্ত:
অত্যাধুনিক মডেল: ডিপসিক, কিউয়েন, মুনশট এআই (কিমি)
প্রধান প্রতিযোগী: Z.Ai, MiniMax
দেখার মতো কোম্পানি: StepFun, InclusionAI/Ant Financial, Meituan, Tencent, IBM, Nvidia, Google, Mistral
দক্ষতার ক্ষেত্র: OpenAI, Ai2, Moondream, Arcee, RedNote, HuggingFace, LiquidAI, Microsoft, Xiaomi, Mohammed bin Zayed University for Artificial Intelligence। উদীয়মান কোম্পানি: ByteDance Seed, Apertus, OpenBMB, Motif, Baidu, Marin Community, InternLM, OpenGVLab, ServiceNow, Skywork।
সম্মানসূচক মেনশন: টিএনজি গ্রুপ, মেটা, কোহের, বেইজিং ইনস্টিটিউট অফ আর্টিফিশিয়াল ইন্টেলিজেন্স, মাল্টিমোডাল আর্ট প্রজেকশন, হুয়াওয়ে

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো