চীনের ডিপসিক -এর সিলিকন ভ্যালির এআই আসরে বিনা আমন্ত্রণে হাজির হওয়ার একটি অভ্যাস রয়েছে, এবং এবারও তারা বহু প্রতীক্ষিত ভি৪ প্রিভিউ নিয়ে হাজির হয়েছে। হ্যাংঝৌ-ভিত্তিক এই কোম্পানিটি তাদের সর্বশেষ এআই মডেলটি প্রকাশ করেছে, যা নির্দিষ্ট কিছু ক্ষেত্রে জনপ্রিয় আমেরিকান মডেলগুলোকেও ছাড়িয়ে গেছে।
DeepSeek দুটি নতুন মডেল চালু করেছে: V4-Pro (এক্সপার্ট মোড) এবং V4-Flash (ইনস্ট্যান্ট মোড)। প্রথমটি যেখানে ১.৬ ট্রিলিয়ন প্যারামিটারের একটি বিশাল মডেল, সেখানে দ্বিতীয়টিতে তুলনামূলকভাবে সহজে পরিচালনাযোগ্য ২৮৪ বিলিয়ন প্যারামিটার রয়েছে। তবে, দুটি মডেলেই এক মিলিয়ন টোকেনের একটি কনটেক্সট উইন্ডো আছে।
ডিপসিক ঠিক কী প্রকাশ করেছে?
এর চেয়েও গুরুত্বপূর্ণ বিষয় হলো, উভয় মডেলই ওপেন সোর্স, অর্থাৎ এগুলো হাগিং ফেস থেকে ডাউনলোড করে আপনার হার্ডওয়্যারে স্থানীয়ভাবে চালানো যায়। তবে, ভি৪-প্রো-এর বিশাল আকারের কারণে এটিকে স্থানীয়ভাবে চালানোর জন্য আপনার যথেষ্ট পরিমাণ ভিআরএএম (VRAM) প্রয়োজন হবে।
এই ঘোষণার সবচেয়ে আকর্ষণীয় অংশগুলোর মধ্যে একটি হলো জেমিনি , চ্যাটজিপিটি এবং ক্লডের মতো জনপ্রিয় এআই মডেলগুলোর সাথে এর তুলনা। উদাহরণস্বরূপ, ভি৪-প্রো কোডিংয়ে দারুণ পারফর্ম করে, কোডফোর্সেস রেটিংয়ে ৩,২০৬ স্কোর করে, যা জিপিটি-৫.৪-এর ৩,১৬৮ এবং জেমিনি ৩.১-এর ৩,০৫২-কে ছাড়িয়ে গেছে। এটি এটিকে প্রতিযোগিতামূলক প্রোগ্রামিং কাজের জন্য সবচেয়ে শক্তিশালী ওপেন মডেলে পরিণত করেছে।
LiveCodeBench-এ V4-Pro ৯৩.৫ স্কোর করেছে, যা Claude Opus 4.6-এর ৮৮.৮ এবং Gemini-এর ৯১.৭-এর চেয়ে বেশি। একইভাবে, এজেন্টিক টাস্কের জন্য Toolathlon-এ এটি ৫১.৮ স্কোর করে, যা Claude (৪৭.২) এবং Gemini (৪৮.৮) উভয়কেই ছাড়িয়ে গেছে। অন্যদিকে, দ্রুততর এবং অধিক কার্যকর V4-Flash, অনেক কম কম্পিউট খরচে সাধারণ এজেন্ট টাস্কের ক্ষেত্রে V4-Pro-এর সমকক্ষ পারফর্ম করে।
V4-Pro কোথায় প্রতিযোগীদের ছাড়িয়ে যায়?
| বেঞ্চমার্ক | ডিপসিক ভি৪-প্রো | ক্লদ অপাস ৪.৬ | জিপিটি-৫.৪ | জেমিনি ৩.১ প্রো |
| কোডফোর্সেস (রেটিং) | ৩,২০৬ | — | ৩,১৬৮ | ৩,০৫২ |
| লাইভকোডবেঞ্চ (পাস@১) | ৯৩.৫ | ৮৮.৮ | — | ৯১.৭ |
| এপেক্স শর্টলিস্ট (পাস@১) | ৯০.২ | ৮৫.৯ | ৭৮.১ | ৮৯.১ |
| SWE দ্বারা যাচাইকৃত (সমাধান করা হয়েছে) | ৮০.৬ | ৮০.৮ | — | ৮০.৬ |
| টুল্যাথলন (পাস@১) | ৫১.৮ | ৪৭.২ | ৫৪.৬ | ৪৮.৮ |
| টার্মিনাল বেঞ্চ ২.০ (অ্যাক) | ৬৭.৯ | ৬৫.৪ | ৭৫.১ | ৬৮.৫ |
| এমআরসিআর ১এম লং কনটেক্সট | ৮৩.৫ | ৯২.৯ | — | ৭৬.৩ |
| HMMT 2026 গণিত | ৯৫.২ | ৯৬.২ | ৯৭.৭ | ৯৪.৭ |
| IMOAnswerBench | ৮৯.৮ | ৭৫.৩ | ৯১.৪ | ৮১.০ |
তবে, এমন বেশ কিছু ক্ষেত্র রয়েছে যেখানে ডিকসিক-এর নতুন মডেলটি প্রতিযোগীদের থেকে পিছিয়ে আছে। উদাহরণস্বরূপ, দীর্ঘ-প্রসঙ্গ পুনরুদ্ধারের ক্ষেত্রে ক্লদ-এর ওপাস ৪.৬ এগিয়ে আছে। এমআরসিআর ১এম-এ এর স্কোর ৯২.৯, যেখানে ভি৪-প্রো-এর স্কোর ৮৩.৫। জিপিটি-৫.৪ এখনও টার্মিনাল বেঞ্চ ২.০-তে ৭৫.১ স্কোর নিয়ে শীর্ষে রয়েছে, যেখানে ভি৪-প্রো-এর স্কোর ৬৭.৯।
যেখানে DeepSeek প্রতিযোগীদের থেকে সত্যিই আলাদা, তা হলো এর মূল্য নির্ধারণ। V4-Pro-এর প্রতি মিলিয়ন আউটপুট টোকেনের দাম ৩.৪৮ ডলার, যা সমতুল্য ওয়ার্কলোডের জন্য OpenAI-এর ৩০ ডলার এবং Anthropic-এর ২৫ ডলারের তুলনায় সম্ভাব্য গ্রাহকদের কাছে অনেক বেশি আকর্ষণীয় মনে হতে পারে। কিন্তু এআই-চালিত অ্যাপ তৈরি করা সাধারণ ডেভেলপারদের জন্য এই ব্যবধানটি বিশাল।