
"সার্ভার ব্যস্ত, দয়া করে পরে আবার চেষ্টা করুন।"
এক বছর আগে, আমিও সেই ব্যবহারকারীদের মধ্যে একজন ছিলাম যারা এই বিবৃতিতে সম্পূর্ণরূপে মুগ্ধ হয়েছিলেন।

এক বছর আগে (২০ জানুয়ারী, ২০২৫) আজকের দিনে ডিপসিক R1 দিয়ে আত্মপ্রকাশ করে, এটি আবির্ভূত হওয়ার মুহূর্ত থেকেই বিশ্বব্যাপী মনোযোগ আকর্ষণ করে।
সেই সময়, ডিপসিককে সুচারুভাবে ব্যবহার করার জন্য, আমি সমস্ত স্ব-স্থাপনা টিউটোরিয়ালগুলি দেখেছিলাম এবং "XX – ডিপসিক পূর্ণ সংস্করণ" বলে দাবি করা অনেক অ্যাপ্লিকেশন ডাউনলোড করেছিলাম।

এক বছর পর, সত্যি বলতে, আমি অনেক কমবার ডিপসিক খুলি।
ডুবাও ছবি অনুসন্ধান এবং তৈরি করতে পারে, কিয়ানওয়েন তাওবাও এবং গাওড ম্যাপের সাথে একীভূত হয়েছে, এবং ইউয়ানবাওতে রিয়েল-টাইম ভয়েস ডায়ালগ এবং ওয়েচ্যাট অফিসিয়াল অ্যাকাউন্ট সহ একটি কন্টেন্ট ইকোসিস্টেম রয়েছে; চ্যাটজিপিটি এবং জেমিনির মতো বিদেশী অত্যাধুনিক (SOTA) মডেল পণ্যগুলির কথা তো বাদই দিলাম।
এই সর্বশক্তিমান এআই সহকারীরা যখন তাদের বৈশিষ্ট্য তালিকা প্রসারিত করছে, তখন আমি বাস্তবসম্মতভাবে নিজেকে জিজ্ঞাসা করি, "যখন আরও সুবিধাজনক বিকল্প রয়েছে তখন কেন ডিপসিকের সাথেই থাকব?"
তাই, ডিপসিক আমার ফোনের প্রথম স্ক্রিন থেকে দ্বিতীয় স্ক্রিনে চলে গেল, এবং প্রতিদিন খোলা থাকা আবশ্যকীয় বিষয় থেকে এমন কিছুতে পরিণত হল যা আমি মাঝে মাঝেই ভাবতাম।
অ্যাপ স্টোরের র্যাঙ্কিং দেখে মনে হচ্ছে এই "হৃদয়ের পরিবর্তন" কেবল আমার কল্পনা নয়।

▲ বিনামূল্যে অ্যাপ ডাউনলোড চার্টের শীর্ষ তিনটি স্থানে এখন প্রধান চীনা ইন্টারনেট কোম্পানিগুলির "বিগ থ্রি" এর আধিপত্য রয়েছে, অন্যদিকে ডিপসিক, যা একসময় শীর্ষ স্থান অধিকার করেছিল, ধীরে ধীরে সপ্তম স্থানে নেমে গেছে।
"সর্বশক্তিমান," "মাল্টিমোডাল," এবং "এআই সার্চ" বলে চিৎকার করে এমন প্রতিযোগীদের মধ্যে ডিপসিক আলাদাভাবে দাঁড়িয়ে আছে। এর ন্যূনতম ৫১.৭ এমবি ইনস্টলেশন প্যাকেজের মাধ্যমে, এটি ট্রেন্ডের পিছনে ছুটছে না, মার্কেটিংয়ে জড়িত নয় এবং এখনও ভিজ্যুয়াল রিজনিং বা মাল্টিমোডাল বৈশিষ্ট্যগুলিও বাস্তবায়ন করেনি।
কিন্তু এটাই সবচেয়ে আকর্ষণীয় অংশ। আপাতদৃষ্টিতে, এটি সত্যিই "পিছিয়ে পড়েছে" বলে মনে হচ্ছে, কিন্তু বাস্তবে, ডিপসিক-সম্পর্কিত মডেল কলগুলি এখনও বেশিরভাগ প্ল্যাটফর্মের জন্য পছন্দের পছন্দ।
যখন আমি গত এক বছরে ডিপসিকের কর্মকাণ্ডের সারসংক্ষেপ করার চেষ্টা করলাম, এই একক ডাউনলোড চার্ট থেকে আমার মনোযোগ সরিয়ে বিশ্বব্যাপী এআই উন্নয়নের দিকে তাকালাম, কেন এটি এত তাড়াহুড়ো করছে না এবং আসন্ন ভি৪ শিল্পে কী নতুন ধাক্কা আনতে চলেছে তা বুঝতে পারলাম, তখন আমি দেখতে পেলাম যে এই "সপ্তম স্থান" ডিপসিকের কাছে অর্থহীন। এটি সর্বদা "ভূত" যা দৈত্যদের রাতে জাগিয়ে রাখে।
পিছিয়ে পড়ছেন? ডিপসিকের নিজস্ব ছন্দ আছে।
বিশ্বব্যাপী AI জায়ান্টরা যখন মূলধন দ্বারা চালিত হচ্ছে এবং বাণিজ্যিকীকরণের মাধ্যমে মুনাফা অর্জন করছে, তখন DeepSeek একাকী মুক্ত এজেন্টের মতো কাজ করে। এর প্রতিযোগীদের দিকে তাকান: ঝিপু এবং মিনিম্যাক্সের মতো দেশীয় কোম্পানি, যারা সম্প্রতি হংকং স্টক এক্সচেঞ্জে তালিকাভুক্ত হয়েছে, এবং OpenAI এবং Anthropic-এর মতো আন্তর্জাতিক কোম্পানি, যারা ব্যাপক বিনিয়োগ পাচ্ছে।
ব্যয়বহুল কম্পিউটিং পাওয়ার রেস বজায় রাখার জন্য, এমনকি মাস্কও মূলধনের লোভ সামলাতে পারেনি, কয়েকদিন আগে xAI-এর জন্য ২০ বিলিয়ন ডলার সংগ্রহ করেছে।
তবে, ডিপসিক আজও "শূন্য বহিরাগত তহবিল" রেকর্ড বজায় রেখেছে।

▲গড় কোম্পানির রিটার্ন অনুসারে বার্ষিক শীর্ষ ১০০টি প্রাইভেট ইকুইটি ফার্মের তালিকায় হুয়ানফ্যাং কোয়ান্টেটিভেটিভ ফান্ড সপ্তম স্থানে এবং ১০ বিলিয়ন আরএমবি ছাড়িয়ে পরিচালিত সম্পদের দিক থেকে দ্বিতীয় স্থানে রয়েছে। | ছবির উৎস: https://www.simuwang.com/news/285109.html
এমন এক যুগে যেখানে সবাই নগদ অর্থ উত্তোলন এবং বিনিয়োগকারীদের কাছে ফলাফল পৌঁছে দেওয়ার জন্য তাড়াহুড়ো করছে, ডিপসিক পিছিয়ে থাকার সাহস করে কারণ এর পিছনে একটি দুর্দান্ত "টাকা-মুদ্রণ যন্ত্র" রয়েছে: ম্যাজিক স্কয়ার কোয়ান্ট।
ডিপসিকের মূল কোম্পানি হিসেবে, এই পরিমাণগত তহবিলটি গত বছর ৫৩% এর ব্যতিক্রমী উচ্চ রিটার্ন অর্জন করেছে, যার মুনাফা $৭০০ মিলিয়ন (প্রায় ৫ বিলিয়ন আরএমবি) ছাড়িয়ে গেছে।
লিয়াং ওয়েনফেং "ডিপসিক এজিআই" এর নতুন স্বপ্নকে সমর্থন করার জন্য সরাসরি এই পুরানো অর্থ ব্যবহার করেছিলেন। এই মডেলটি ডিপসিককে তার আর্থিক অবস্থার উপর অত্যন্ত বিলাসবহুল নিয়ন্ত্রণও দিয়েছে।

- বিনিয়োগকারীদের কোনও হস্তক্ষেপ ছিল না।
- বৃহৎ কর্পোরেশনের সাধারণ সমস্যাগুলি ছাড়া, প্রচুর তহবিল অর্জনকারী অনেক ল্যাব কাগজের সম্পদ এবং অভ্যন্তরীণ দ্বন্দ্বের অহংকারে ডুবে গেছে, যেমন থিঙ্কিং মেশিন ল্যাব, যা সম্প্রতি কর্মীদের চলে যাওয়ার ঘন ঘন রিপোর্টে জর্জরিত হয়েছে; এবং জুকারবার্গের মেটা এআই ল্যাব, যা বিভিন্ন কেলেঙ্কারিতে জড়িয়ে পড়েছে।
- কেবলমাত্র প্রযুক্তির উপর দৃষ্টি নিবদ্ধ করে, ডিপসিক, বহিরাগত মূল্যায়নের চাপ থেকে মুক্ত, তার আর্থিক বিবরণী উন্নত করার জন্য একটি সর্ব-সমন্বিত অ্যাপ চালু করার জন্য তাড়াহুড়ো করার প্রয়োজন নেই, অথবা মাল্টিমোডাল উন্নয়নে জড়িত হয়ে বাজারের প্রবণতা অনুসরণ করারও প্রয়োজন নেই। এটি কেবল তার প্রযুক্তির জন্য দায়ী, তার আর্থিক বিবরণীর জন্য নয়।
যে স্টার্টআপগুলিকে ভিসিদের কাছে "দৈনিক সক্রিয় ব্যবহারকারী বৃদ্ধি" প্রমাণ করতে হবে, তাদের জন্য অ্যাপ স্টোর ডাউনলোড র্যাঙ্কিং একটি গুরুত্বপূর্ণ বিষয়। কিন্তু যে ল্যাব সম্পূর্ণরূপে AI বিকাশের জন্য দায়ী, পর্যাপ্ত তহবিল রয়েছে এবং KPI-এর মাধ্যমে অর্থ দ্বারা নিয়ন্ত্রিত হতে চায় না, তাদের জন্য এই বাজার র্যাঙ্কিংয়ে পিছিয়ে পড়া তার সেরা সুরক্ষা হতে পারে, যা তাদের মনোযোগ বজায় রাখতে এবং বহিরাগত শব্দ এড়াতে সাহায্য করবে।

▲ তাছাড়া, কোয়েস্টমোবাইলের রিপোর্ট অনুসারে, ডিপসিকের প্রভাব মোটেও "পিছিয়ে পড়েনি"।
জীবন পরিবর্তন এবং বিশ্বব্যাপী কৃত্রিম বুদ্ধিমত্তা অস্ত্র প্রতিযোগিতায় প্রভাব ফেলা।
আমরা অন্য, আরও ভালো AI অ্যাপ্লিকেশন বেছে নিয়েছি কিনা, তা নিয়ে ডিপসিক যদি মোটেও চিন্তিত নাও থাকে, তবুও গত এক বছর ধরে এর প্রভাব সমস্ত শিল্পেই অনুভূত হয়েছে।
সিলিকন ভ্যালিতে ডিপসিক বিপ্লব
প্রাথমিক দিনগুলিতে, ডিপসিক কেবল একটি কার্যকর হাতিয়ারই ছিল না, বরং একটি ট্রেন্ডসেটারও ছিল, যা সিলিকন ভ্যালির জায়ান্টদের দ্বারা অত্যন্ত দক্ষ এবং কম খরচে যত্ন সহকারে তৈরি উচ্চ-প্রতিবন্ধকতার মিথকে ভেঙে দিয়েছে।

▲ ছবির উৎস: https://openaiglobalaffairs.substack.com/p/deepseek-at-1
যদি এক বছর আগের AI প্রতিযোগিতাটি ছিল কার GPU বেশি এবং কার মডেল প্যারামিটার বেশি তা নিয়ে, তাহলে DeepSeek-এর উত্থান সেই প্রতিযোগিতার নিয়মগুলিকে সম্পূর্ণরূপে পুনর্লিখন করেছে। OpenAI এবং এর অভ্যন্তরীণ দল (The Prompt) দ্বারা প্রকাশিত একটি সাম্প্রতিক সারসংক্ষেপ এবং পর্যালোচনায়, তাদের স্বীকার করতে হয়েছিল যে…
ডিপসিক আর১-এর মুক্তি সেই সময়ে এআই প্রতিযোগিতায় একটি "ঝাঁকুনি" সৃষ্টি করেছিল এবং এমনকি এটিকে "ভূমিকম্পের ধাক্কা" হিসাবেও বর্ণনা করা হয়েছিল।
ডিপসিক তার কার্যক্রমের মাধ্যমে ধারাবাহিকভাবে প্রমাণ করেছে যে উচ্চ-স্তরের মডেলিং ক্ষমতার জন্য অত্যধিক কম্পিউটিং শক্তির প্রয়োজন হয় না।
আইসিআইএস ইন্টেলিজেন্স সার্ভিসেসের সাম্প্রতিক বিশ্লেষণ অনুসারে, ডিপসিকের উত্থান এই ধারণাটিকে সম্পূর্ণরূপে ভেঙে দিয়েছে যে কম্পিউটিং শক্তি কর্মক্ষমতা নির্ধারণ করে। এটি বিশ্বকে দেখিয়েছে যে সীমিত চিপ এবং অত্যন্ত কম খরচের সাথেও, শীর্ষ-স্তরের মার্কিন সিস্টেমের সাথে তুলনীয় কর্মক্ষমতা সম্পন্ন মডেলগুলিকে প্রশিক্ষণ দেওয়া সম্ভব।

▲ এআই দৌড় একটি দীর্ঘ ম্যারাথনে রূপান্তরিত হচ্ছে | ছবির উৎস: https://www.icis.com/asian-chemical-connections/2026/01/a-year-on-from-deepseek-us-versus-china-in-the-ai-race/
এর ফলে বিশ্বব্যাপী কৃত্রিম বুদ্ধিমত্তার প্রতিযোগিতা "সবচেয়ে স্মার্ট মডেল তৈরি" থেকে "কে মডেলটিকে আরও দক্ষ, সস্তা এবং স্থাপন করা সহজ করে তুলতে পারে" -এ সরাসরি পরিবর্তিত হয়েছে।
মাইক্রোসফটের প্রতিবেদনে "বিকল্প" প্রবৃদ্ধি
সিলিকন ভ্যালির জায়ান্টরা এখনও পেইড সাবস্ক্রাইবারদের জন্য প্রতিযোগিতা করছে, কিন্তু ডিপসিক জায়ান্টদের ভুলে যাওয়া জায়ান্টদের কাছে নিজেদের প্রতিষ্ঠিত করতে শুরু করেছে।
গত সপ্তাহে প্রকাশিত মাইক্রোসফটের "২০২৫ গ্লোবাল এআই অ্যাডপশন রিপোর্ট"-এ, ডিপসিকের উত্থানকে ২০২৫ সালের "সবচেয়ে অপ্রত্যাশিত উন্নয়ন"গুলির মধ্যে একটি হিসাবে তালিকাভুক্ত করা হয়েছে। প্রতিবেদনে একটি আকর্ষণীয় পরিসংখ্যান প্রকাশ করা হয়েছে:
- আফ্রিকায় উচ্চ ব্যবহার: ডিপসিকের বিনামূল্যের কৌশল এবং ওপেন-সোর্স প্রকৃতির কারণে, ব্যয়বহুল সাবস্ক্রিপশন ফি এবং ক্রেডিট কার্ডের বাধা দূর করা হয়েছে। আফ্রিকায় এর ব্যবহারের হার অন্যান্য অঞ্চলের তুলনায় ২ থেকে ৪ গুণ বেশি।
- সীমাবদ্ধ বাজার দখল: যেসব অঞ্চলে মার্কিন প্রযুক্তি জায়ান্টদের পৌঁছাতে সমস্যা হচ্ছে বা যাদের পরিষেবা সীমিত, সেখানে ডিপসিক প্রায় একমাত্র বিকল্প হয়ে উঠেছে। তথ্য অনুযায়ী, অভ্যন্তরীণভাবে এটির বাজারের ৮৯%, বেলারুশে ৫৬% এবং কিউবায় ৪৯% অংশ রয়েছে।
মাইক্রোসফটকে তাদের প্রতিবেদনে স্বীকার করতে হয়েছে যে ডিপসিকের সাফল্য আরও নিশ্চিত করে যে কৃত্রিম বুদ্ধিমত্তার ব্যাপক গ্রহণ কেবল মডেলটি কতটা শক্তিশালী তার উপরই নির্ভর করে না, বরং কে এটি ব্যবহার করতে পারে তার উপরও নির্ভর করে।

▲বিশ্বব্যাপী দক্ষিণাঞ্চলে AI গ্রহণে উন্নতির জন্য এখনও উল্লেখযোগ্য সুযোগ রয়েছে | https://www.microsoft.com/en-us/corporate-responsibility/topics/ai-economy-institute/reports/global-ai-adoption-2025/
পরবর্তী বিলিয়ন এআই ব্যবহারকারী হয়তো ঐতিহ্যবাহী প্রযুক্তি কেন্দ্র থেকে আসবে না, বরং ডিপসিকের আওতাভুক্ত অঞ্চল থেকে আসবে।
ইউরোপ: আমরা ডিপসিকও করতে চাই
ডিপসিকের প্রভাব সিলিকন ভ্যালির বাইরেও বিস্তৃত, ইউরোপ সহ বিশ্বজুড়ে ছড়িয়ে পড়েছে।
ইউরোপ দীর্ঘদিন ধরে নিষ্ক্রিয়ভাবে আমেরিকান এআই ব্যবহার করে আসছে, এবং যদিও এর নিজস্ব মডেল, মিস্ট্রাল, এটি তুলনামূলকভাবে অজানা রয়ে গেছে। ডিপসিকের সাফল্য ইউরোপীয়দের একটি নতুন পথ দেখিয়েছে: যদি একটি সীমিত সম্পদের চীনা ল্যাব এটি করতে পারে, তাহলে ইউরোপ কেন পারবে না?

ওয়্যার্ড ম্যাগাজিনের সাম্প্রতিক এক প্রতিবেদন অনুসারে, ইউরোপীয় প্রযুক্তি জগতে "ডিপসিকের একটি ইউরোপীয় সংস্করণ তৈরির" জন্য একটি প্রতিযোগিতা চলছে। অনেক ইউরোপীয় ডেভেলপার বৃহৎ আকারের ওপেন-সোর্স মডেল তৈরি করছেন, যেখানে SOOFI নামক একটি ইউরোপীয় ওপেন-সোর্স প্রকল্প স্পষ্টভাবে বলেছে, "আমরা ইউরোপীয় ডিপসিক হয়ে উঠব।"
গত এক বছরে ডিপসিকের প্রভাব "এআই সার্বভৌমত্ব" নিয়ে ইউরোপের উদ্বেগকেও আরও বাড়িয়ে তুলেছে। তারা বুঝতে শুরু করেছে যে মার্কিন যুক্তরাষ্ট্রের ক্লোজড-সোর্স মডেলের উপর অতিরিক্ত নির্ভরতা একটি ঝুঁকি, এবং ডিপসিকের দক্ষ, ওপেন-সোর্স মডেলই তাদের প্রয়োজনীয় রেফারেন্স।
V4 সম্পর্কে, কিছু তথ্য লক্ষণীয়।
প্রভাব অব্যাহত রয়েছে। যদি এক বছর আগে R1 ডিপসিকের AI শিল্পের জন্য একটি প্রদর্শনী ছিল, তাহলে আসন্ন V4 কি আরেকটি বিপরীতমুখী পদক্ষেপ হবে?
গত কয়েকদিনের বিক্ষিপ্ত ফাঁস এবং সম্প্রতি প্রকাশিত প্রযুক্তিগত গবেষণাপত্রের উপর ভিত্তি করে, আমরা V4 সম্পর্কিত তিনটি গুরুত্বপূর্ণ সংকেত সংকলন করেছি যা সবচেয়ে উল্লেখযোগ্য।
১. "চন্দ্র নববর্ষের আশ্চর্য আক্রমণ"-এর পুনরাবৃত্তি করা
ডিপসিকের মনে হচ্ছে চন্দ্র নববর্ষকে কেন্দ্র করে নানান ধরণের গাড়ি তৈরির প্রবণতা রয়েছে। সূত্রের খবর, ডিপসিক তাদের পরবর্তী প্রজন্মের ফ্ল্যাগশিপ মডেল, ভি৪, ফেব্রুয়ারির মাঝামাঝি (চন্দ্র নববর্ষের কাছাকাছি) বাজারে আনার পরিকল্পনা করছে। গত বছরের আর১ও এই সময়েই বাজারে আসে, যা পরবর্তীতে বসন্ত উৎসবের ছুটির সময় বিশ্বব্যাপী আলোড়ন সৃষ্টি করে।
এটা অবশ্যই বলা উচিত যে এই সময় ইউরোপীয় এবং আমেরিকান প্রযুক্তিগত মহলে স্বাভাবিক রিলিজ কনজেশনের সময়কাল এড়ায় এবং দীর্ঘ ছুটির সময় ব্যবহারকারীদের নতুন জিনিস চেষ্টা করার আকাঙ্ক্ষার পূর্ণ ব্যবহার করে, যা প্রকৃতপক্ষে ভাইরাল বিস্তারের বীজ বপন করতে পারে।

২. মূল ক্ষমতা হল ভলিউমেট্রিক কোড এবং অত্যন্ত দীর্ঘ প্রসঙ্গ।
আজকের বিশ্বে যেখানে সাধারণ কথোপকথন ক্রমশ একীভূত হয়ে উঠছে, V4 আরও কঠোর অগ্রগতি বেছে নিয়েছে: উৎপাদনশীলতা-স্তরের কোডিং ক্ষমতা।
ডিপসিকের ঘনিষ্ঠ সূত্র অনুসারে, V4 বেঞ্চমার্কে V3.2-এর চমৎকার পারফরম্যান্সের মধ্যেই থেমে থাকেনি, বরং অভ্যন্তরীণ পরীক্ষায়, এর কোড জেনারেশন এবং প্রক্রিয়াকরণ ক্ষমতা সরাসরি অ্যানথ্রপিকের ক্লড এবং ওপেনএআই-এর জিপিটি সিরিজকে ছাড়িয়ে গেছে।

আরও গুরুত্বপূর্ণ বিষয় হল, V4 বর্তমান প্রোগ্রামিং AI-এর একটি প্রধান সমস্যা সমাধানের চেষ্টা করে: "অত্যন্ত দীর্ঘ কোড পরামর্শ" পরিচালনা করা। এর অর্থ হল V4 আর কেবল একটি সহকারী নয় যা আমাদের দুটি লাইনের স্ক্রিপ্ট লিখতে সাহায্য করে; এর লক্ষ্য হল জটিল সফ্টওয়্যার প্রকল্পগুলি বোঝার এবং বৃহৎ আকারের কোডবেসগুলি পরিচালনা করার ক্ষমতা থাকা।
এটি অর্জনের জন্য, V4 প্রশিক্ষণ প্রক্রিয়াটিও উন্নত করেছে যাতে বিশাল ডেটা প্যাটার্ন মোকাবেলা করার সময় প্রশিক্ষণের অগ্রগতির সাথে সাথে মডেলটি "অবনতি" না পায়।
৩. মূল প্রযুক্তি: এনগ্রাম
V4 মডেলের চেয়েও উল্লেখযোগ্য হল গত সপ্তাহে পিকিং বিশ্ববিদ্যালয়ের একটি দলের সহযোগিতায় ডিপসিক কর্তৃক প্রকাশিত একটি যুগান্তকারী গবেষণাপত্র।
এই গবেষণাপত্রটি সীমিত কম্পিউটিং ক্ষমতা সত্ত্বেও ডিপসিকের অব্যাহত সাফল্যের আসল রহস্য প্রকাশ করে: "এনগ্রাম" নামে একটি নতুন প্রযুক্তি।

বিশ্বব্যাপী AI কম্পিউটিং পাওয়ার প্রতিযোগিতার অন্যতম গুরুত্বপূর্ণ ক্ষেত্র হল HBM (হাই ব্যান্ডউইথ মেমোরি)। প্রতিযোগীরা যখন মেমোরি বাড়ানোর জন্য H100 গ্রাফিক্স কার্ড মজুদ করে রাখছে, তখন ডিপসিক আবারও একটি অস্বাভাবিক পথ বেছে নিয়েছে।
- গণনা এবং স্মৃতির বিভাজন: বিদ্যমান মডেলগুলিতে প্রায়শই মৌলিক তথ্য পুনরুদ্ধারের জন্য প্রচুর পরিমাণে ব্যয়বহুল কম্পিউটিং শক্তির প্রয়োজন হয়। এনগ্রাম প্রযুক্তি মডেলগুলিকে প্রতিবার গণনার জন্য কম্পিউটিং শক্তি নষ্ট না করে দক্ষতার সাথে এই তথ্য পুনরুদ্ধার করতে দেয়।
- এরপর সঞ্চিত মূল্যবান কম্পিউটিং শক্তি বিশেষভাবে আরও জটিল উচ্চ-স্তরের যুক্তি পরিচালনা করার জন্য ব্যবহৃত হয়।
- গবেষকরা বলছেন যে এই কৌশলটি মেমরির সীমাবদ্ধতাগুলিকে এড়িয়ে যেতে পারে, মডেলগুলির র্যাডিকাল প্যারামিটার স্কেলিং সক্ষম করে, সম্ভাব্যভাবে মডেলের প্যারামিটারের আকার আরও বাড়িয়ে তোলে।

গ্রাফিক্স কার্ড রিসোর্সের ক্রমবর্ধমান অভাবের পটভূমিতে, ডিপসিকের এই গবেষণাপত্রটি ইঙ্গিত দেয় যে তারা কখনই কেবল হার্ডওয়্যারের উপর তাদের সমস্ত আশা রাখেনি।
গত এক বছরে ডিপসিকের বিবর্তন মূলত এআই শিল্পে সাধারণ জ্ঞানের সমস্যাগুলিকে বিপরীতমুখী উপায়ে সমাধান করার বিষয়ে।
এটি বছরে ৫ বিলিয়ন ডলার আয় করে, যা হাজার হাজার ডিপসিক আর১ ইন্সট্যান্সকে প্রশিক্ষণ দেওয়ার জন্য যথেষ্ট, কিন্তু কম্পিউটিং পাওয়ার এবং গ্রাফিক্স কার্ডের উপর মনোযোগ দেওয়ার পরিবর্তে এবং জনসাধারণের কাছে পৌঁছানোর বা অর্থায়ন চাওয়ার কোনও খবর ছাড়াই, এটি ব্যয়বহুল এইচবিএমকে সস্তা মেমোরি দিয়ে কীভাবে প্রতিস্থাপন করা যায় তা নিয়ে গবেষণা শুরু করেছে।
গত এক বছর ধরে, এটি অল-রাউন্ড মডেলের জন্য ট্র্যাফিক প্রায় সম্পূর্ণরূপে বন্ধ করে দিয়েছে। সমস্ত মডেল বিক্রেতারা প্রতি মাসে একটি বড় আপডেট এবং প্রতি সপ্তাহে একটি ছোটখাটো আপডেট আপডেট করার পটভূমিতে, এটি ইনফারেন্স মডেলগুলির উপর মনোনিবেশ করেছে এবং বারবার তার পূর্ববর্তী ইনফারেন্স মডেল পেপারগুলিকে উন্নত করেছে।
স্বল্পমেয়াদে এই সব পছন্দ "ভুল"। তহবিল ছাড়া, তারা কীভাবে সম্পদের ক্ষেত্রে OpenAI-এর সাথে প্রতিযোগিতা করতে পারবে? কাঁচা ছবি এবং ভিডিও প্রক্রিয়াকরণ সহ মাল্টিমোডাল, সর্বাঙ্গীন অ্যাপ্লিকেশন তৈরি না করে, তারা কীভাবে ব্যবহারকারীদের ধরে রাখতে পারবে? স্কেলের আইন এখনও ব্যর্থ হয়নি; কম্পিউটিং শক্তি সঞ্চয় না করে, তারা কীভাবে সবচেয়ে শক্তিশালী মডেল তৈরি করতে পারবে?

তবে, যদি আমরা দীর্ঘ সময়রেখার দিকে তাকাই, তাহলে দেখা যাবে যে এই "ভুল" পছন্দগুলি ডিপসিকের V4 এবং R2 এর জন্য পথ তৈরি করতে পারে।
এটিই ডিপসিকের মূল দর্শন: যখন সবাই সম্পদের জন্য ছুটছে, তখন এটি দক্ষতার উপর দৃষ্টি নিবদ্ধ করছে; যখন সবাই বাণিজ্যিকীকরণের পিছনে ছুটছে, তখন এটি প্রযুক্তির সীমা অতিক্রম করছে। V4 কি এই পথেই চলবে? নাকি এটি "সাধারণ জ্ঞানের" সাথে আপস করবে? আগামী সপ্তাহগুলিতে উত্তরটি প্রকাশিত হতে পারে।
কিন্তু অন্তত এখন আমরা জানি যে AI শিল্পে, কখনও কখনও স্বজ্ঞাত চিন্তাভাবনাই সবচেয়ে সাধারণ জ্ঞান।
পরের বার, আবার ডিপসিকের সময় হবে।
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
