DeepSeeek V4 প্রকাশিত হয়েছে, যা Gemini, ChatGPT এবং Claude-এর উপর কিছু যুগান্তকারী সাফল্য অর্জন করেছে।

চীনের ডিপসিক -এর সিলিকন ভ্যালির এআই আসরে বিনা আমন্ত্রণে হাজির হওয়ার একটি অভ্যাস রয়েছে, এবং এবারও তারা বহু প্রতীক্ষিত ভি৪ প্রিভিউ নিয়ে হাজির হয়েছে। হ্যাংঝৌ-ভিত্তিক এই কোম্পানিটি তাদের সর্বশেষ এআই মডেলটি প্রকাশ করেছে, যা নির্দিষ্ট কিছু ক্ষেত্রে জনপ্রিয় আমেরিকান মডেলগুলোকেও ছাড়িয়ে গেছে।

DeepSeek দুটি নতুন মডেল চালু করেছে: V4-Pro (এক্সপার্ট মোড) এবং V4-Flash (ইনস্ট্যান্ট মোড)। প্রথমটি যেখানে ১.৬ ট্রিলিয়ন প্যারামিটারের একটি বিশাল মডেল, সেখানে দ্বিতীয়টিতে তুলনামূলকভাবে সহজে পরিচালনাযোগ্য ২৮৪ বিলিয়ন প্যারামিটার রয়েছে। তবে, দুটি মডেলেই এক মিলিয়ন টোকেনের একটি কনটেক্সট উইন্ডো আছে।

ডিপসিক ঠিক কী প্রকাশ করেছে?

এর চেয়েও গুরুত্বপূর্ণ বিষয় হলো, উভয় মডেলই ওপেন সোর্স, অর্থাৎ এগুলো হাগিং ফেস থেকে ডাউনলোড করে আপনার হার্ডওয়্যারে স্থানীয়ভাবে চালানো যায়। তবে, ভি৪-প্রো-এর বিশাল আকারের কারণে এটিকে স্থানীয়ভাবে চালানোর জন্য আপনার যথেষ্ট পরিমাণ ভিআরএএম (VRAM) প্রয়োজন হবে।

এই ঘোষণার সবচেয়ে আকর্ষণীয় অংশগুলোর মধ্যে একটি হলো জেমিনি , চ্যাটজিপিটি এবং ক্লডের মতো জনপ্রিয় এআই মডেলগুলোর সাথে এর তুলনা। উদাহরণস্বরূপ, ভি৪-প্রো কোডিংয়ে দারুণ পারফর্ম করে, কোডফোর্সেস রেটিংয়ে ৩,২০৬ স্কোর করে, যা জিপিটি-৫.৪-এর ৩,১৬৮ এবং জেমিনি ৩.১-এর ৩,০৫২-কে ছাড়িয়ে গেছে। এটি এটিকে প্রতিযোগিতামূলক প্রোগ্রামিং কাজের জন্য সবচেয়ে শক্তিশালী ওপেন মডেলে পরিণত করেছে।

LiveCodeBench-এ V4-Pro ৯৩.৫ স্কোর করেছে, যা Claude Opus 4.6-এর ৮৮.৮ এবং Gemini-এর ৯১.৭-এর চেয়ে বেশি। একইভাবে, এজেন্টিক টাস্কের জন্য Toolathlon-এ এটি ৫১.৮ স্কোর করে, যা Claude (৪৭.২) এবং Gemini (৪৮.৮) উভয়কেই ছাড়িয়ে গেছে। অন্যদিকে, দ্রুততর এবং অধিক কার্যকর V4-Flash, অনেক কম কম্পিউট খরচে সাধারণ এজেন্ট টাস্কের ক্ষেত্রে V4-Pro-এর সমকক্ষ পারফর্ম করে।

V4-Pro কোথায় প্রতিযোগীদের ছাড়িয়ে যায়?

বেঞ্চমার্ক ডিপসিক ভি৪-প্রো ক্লদ অপাস ৪.৬ জিপিটি-৫.৪ জেমিনি ৩.১ প্রো
কোডফোর্সেস (রেটিং) ৩,২০৬ ৩,১৬৮ ৩,০৫২
লাইভকোডবেঞ্চ (পাস@১) ৯৩.৫ ৮৮.৮ ৯১.৭
এপেক্স শর্টলিস্ট (পাস@১) ৯০.২ ৮৫.৯ ৭৮.১ ৮৯.১
SWE দ্বারা যাচাইকৃত (সমাধান করা হয়েছে) ৮০.৬ ৮০.৮ ৮০.৬
টুল্যাথলন (পাস@১) ৫১.৮ ৪৭.২ ৫৪.৬ ৪৮.৮
টার্মিনাল বেঞ্চ ২.০ (অ্যাক) ৬৭.৯ ৬৫.৪ ৭৫.১ ৬৮.৫
এমআরসিআর ১এম লং কনটেক্সট ৮৩.৫ ৯২.৯ ৭৬.৩
HMMT 2026 গণিত ৯৫.২ ৯৬.২ ৯৭.৭ ৯৪.৭
IMOAnswerBench ৮৯.৮ ৭৫.৩ ৯১.৪ ৮১.০

তবে, এমন বেশ কিছু ক্ষেত্র রয়েছে যেখানে ডিকসিক-এর নতুন মডেলটি প্রতিযোগীদের থেকে পিছিয়ে আছে। উদাহরণস্বরূপ, দীর্ঘ-প্রসঙ্গ পুনরুদ্ধারের ক্ষেত্রে ক্লদ-এর ওপাস ৪.৬ এগিয়ে আছে। এমআরসিআর ১এম-এ এর স্কোর ৯২.৯, যেখানে ভি৪-প্রো-এর স্কোর ৮৩.৫। জিপিটি-৫.৪ এখনও টার্মিনাল বেঞ্চ ২.০-তে ৭৫.১ স্কোর নিয়ে শীর্ষে রয়েছে, যেখানে ভি৪-প্রো-এর স্কোর ৬৭.৯।

যেখানে DeepSeek প্রতিযোগীদের থেকে সত্যিই আলাদা, তা হলো এর মূল্য নির্ধারণ। V4-Pro-এর প্রতি মিলিয়ন আউটপুট টোকেনের দাম ৩.৪৮ ডলার, যা সমতুল্য ওয়ার্কলোডের জন্য OpenAI-এর ৩০ ডলার এবং Anthropic-এর ২৫ ডলারের তুলনায় সম্ভাব্য গ্রাহকদের কাছে অনেক বেশি আকর্ষণীয় মনে হতে পারে। কিন্তু এআই-চালিত অ্যাপ তৈরি করা সাধারণ ডেভেলপারদের জন্য এই ব্যবধানটি বিশাল।