মাস্ক একটি বিষয় বোঝার জন্য ১০ বিলিয়ন ডলার ব্যয় করেছেন: কোডিং এজেন্ট না হওয়াটা মৃত্যুর জন্য অপেক্ষা করারই সমতুল্য।

১.

ওপেনএআই-এর দুই ঘোর প্রতিদ্বন্দ্বী, অ্যানথ্রোপিক ও মাস্ক, অবশেষে নিজেদের মধ্যকার বিদ্বেষ দূরে সরিয়ে রেখে মাসের শুরুতে একটি জোট গঠন করেছে।

এর আগে অ্যানথ্রোপিক এবং মাস্কের মধ্যে সম্পর্কটা ছিল টানাপোড়েনের: এই বছরের ফেব্রুয়ারিতে, মাস্ক তার এক্স অ্যাকাউন্টে অ্যানথ্রোপিককে "ওয়েক," "শয়তান," এবং "মানববিদ্বেষী" বলে অভিযুক্ত করেন এবং বলেন যে সংস্থাটি "সভ্যতা-বিরোধী"।

পেছন ফিরে তাকালে দেখা যায়, এই আক্রমণটি মাস্কের গতানুগতিকতাহীন ব্যক্তিত্বের কারণে ঘটেনি, বরং অ্যানথ্রোপিকের কোনো একটি কাজ তাঁর অনুভূতিতে আঘাত করেছিল এবং এর পেছনে একটি কারণও ছিল।

এর আগে, xAI অভ্যন্তরীণভাবে Cursor ব্যবহার করত, কিন্তু এই বছরের শুরুতে কর্মীরা দেখতে পান যে xAI-এর Cursor কর্পোরেট অ্যাকাউন্টে Claude মডেলটি হঠাৎ করে ব্যবহার অনুপযোগী হয়ে পড়েছে।

উ ইউহুয়াই, সহ-প্রতিষ্ঠাতা যিনি সেই সময়েও xAI-তে কর্মরত ছিলেন, সকল কর্মীদের কাছে পাঠানো একটি ইমেইলে বলেন: "অ্যানথ্রোপিক তার নীতি হালনাগাদ করেছে, যেখানে কার্সরকে তার প্রধান প্রতিযোগীদের ক্লড মডেল কল করার ক্ষমতা না দেওয়ার নির্দেশ দেওয়া হয়েছে।"

সেই সময়ে, উ ইউহুয়াই তার চিঠিতে একটি বেশ আকর্ষণীয় বাক্য লিখেছিলেন:

এটা একই সাথে দুঃসংবাদ এবং সুসংবাদ। আমাদের উৎপাদনশীলতা প্রভাবিত হবে, কিন্তু এটি আমাদের নিজস্ব কোডিং পণ্য এবং মডেল তৈরি করতেও উৎসাহিত করবে।

সেই সময়ে xAI-এর শীর্ষ ব্যবস্থাপনা কেন তাদের নিজস্ব কোডিং পণ্য তৈরি করাকে অত্যন্ত গুরুত্বপূর্ণ বলে মনে করেছিল?

এরপর যা ঘটেছিল তা সুবিদিত। এক্সএআই-এর পুরো প্রতিষ্ঠাতা দল পালিয়ে যায়, এবং মাস্ক রাগের মাথায় তার আর্থিক ক্ষমতা ব্যবহার করে কার্সরকে চূড়ান্ত আঘাত হানেন:

গত মাসের শেষে, স্পেসএক্স এবং কার্সর প্রোগ্রামিং ও জ্ঞান-ভিত্তিক কাজের জন্য এআই মডেল প্রশিক্ষণের লক্ষ্যে একটি অভূতপূর্ব কৌশলগত অংশীদারিত্ব যৌথভাবে ঘোষণা করেছে; এর পাশাপাশি, স্পেসএক্স ৬০ বিলিয়ন ডলারে কার্সরকে অধিগ্রহণ করার অথবা সহযোগিতা ফি হিসেবে ১০ বিলিয়ন ডলার পরিশোধ করার অধিকারও অর্জন করেছে।

" programming " এই মূল নির্দেশকটি লক্ষ্য করুন, যা পরবর্তীতে কল-ব্যাক অংশে ব্যবহৃত হবে।

২.

সম্প্রতি আমি থিও ব্রাউনের একটি ভিডিও দেখেছি, যিনি কার্সরের একজন প্রাথমিক বিনিয়োগকারী, অ্যানথ্রোপিকের একজন কট্টর সমালোচক এবং টি৩-এর প্রতিষ্ঠাতা।

আমি মূলত অ্যাস্ট্রাজেনেকা এবং স্পেসএক্স-এর অসৎ কার্যকলাপের সমালোচনা দেখতেই ক্লিক করেছিলাম, কিন্তু অপ্রত্যাশিতভাবে, আমি স্পেসএক্স ও কার্সার-এর যৌথ উদ্যোগ সম্পর্কে একটি অনন্য অথচ অত্যন্ত যুক্তিসঙ্গত বিশ্লেষণ খুঁজে পেলাম:

৬০ বিলিয়নের অধিগ্রহণের বিষয়টি বাদ দিলেও, শুধুমাত্র ১০ বিলিয়ন সহযোগিতা ফি বিবেচনা করলে— থিও ভিডিওতে বলেছেন যে তিনি বিশ্বাস করেন, "এমনকি যদি শুধু কার্সরের ব্যবহারকারীর ডেটা বিনিময়ও হয়, তাহলেও এই ১০ বিলিয়ন সার্থক।"

তাহলে এই ডেটাটা কী? আপনি থিও-র ভিডিও দেখলে, তিনি বিষয়টি খুব পরিষ্কারভাবে ব্যাখ্যা করবেন। কিন্তু সময় বাঁচাতে, আমরা এখানে সংক্ষেপে বিষয়টি তুলে ধরছি:

এআই-এর সাথে আমাদের কথোপকথনটি একটি আদান-প্রদানের প্রক্রিয়া: আপনি প্রশ্ন করেন বা অনুরোধ জানান, এবং এটি উত্তর দেয়; কোডিং এজেন্টও একইভাবে কাজ করে, তবে পার্থক্য হলো এটি কোড ফেরত দেয়।

একটি উচ্চ-মানের সংলাপ, যার মধ্যে ব্যবহারকারীর নির্দেশ, মডেলের চিন্তাভাবনা, এজেন্টের পরিকল্পনা, কোড আউটপুট এবং যাচাইকরণ সহ সম্পূর্ণ প্রক্রিয়াটি অন্তর্ভুক্ত —এই সবকিছুর সম্মিলিত রূপকে একটি সম্পূর্ণ এজেন্টিক লুপ বলা যেতে পারে— উচ্চ-মূল্যের প্রশিক্ষণ ডেটাতে পরিণত হয়। রিইনফোর্সমেন্ট লার্নিং-এর জন্য এই ডেটা মডেলে সরবরাহ করলে বাস্তব-জগতের পরিস্থিতিতে মডেলটির কর্মক্ষমতা আরও উন্নত হতে পারে।

কার্সরের কাছে এটি আছে, এবং স্পেসএক্স ঠিক এই ডেটাটাই চায়।

কিন্তু এই তথ্য কোথা থেকে আসে?

উত্তরটি সহজ: একজন মডেল ভেন্ডর হিসেবে, এই উচ্চ-মানের ডেটার সবচেয়ে সরাসরি উৎস হতে পারে শুধুমাত্র আপনার নিজস্ব কোডিং এজেন্ট প্রোডাক্ট— যথা, অ্যানথ্রোপিক-এর ক্লড কোড, ওপেনএআই-এর কোডেক্স, এবং কিমি-এর কিমি কোড।

এখন আপনার বোঝা উচিত কেন, অ্যানথ্রোপিক কর্তৃক 'নিষিদ্ধ' হওয়ার পর, উ ইউহুয়াই সকল কর্মীকে পাঠানো একটি ইমেইলে xAI-এর নিজস্ব কোডিং পণ্য ও মডেল তৈরির প্রস্তাব দিয়েছিলেন। xAI সেই সময়েই বিষয়টি পরিষ্কারভাবে বুঝে গিয়েছিল:

আমাদের নিজস্ব কোডিং পণ্য ছাড়া, আমাদের কাছে উচ্চ-মানের রিইনফোর্সমেন্ট লার্নিং ডেটার অভাব রয়েছে; উচ্চ-মানের ডেটা ছাড়া আমরা সত্যিকারের ব্যবহারিক কোডিং মডেলকে প্রশিক্ষণ দিতে পারি না।

যদিও এটি কিছুটা চরম শোনাতে পারে, এবার আমরা মূল কথায় আসা যাক: মডেল প্রস্তুতকারকদের জন্য সত্যিকারের প্রতিযোগিতামূলক প্রোগ্রামিং মডেল তৈরি করতে হলে, তাদের নিজস্ব কোডিং এজেন্ট পণ্য তৈরি করাই একমাত্র উপায়।

৩.

বৃহৎ ভাষা মডেলগুলো স্ফটিক গোলকের মতো, যা সমগ্র ইন্টারনেট থেকে সংগৃহীত ডেটা ব্যবহার করে প্রশিক্ষিত এবং সবকিছু উত্তর দিতে সক্ষম বলে মনে হয়, কিন্তু তার মানে এই নয় যে তারা সমস্ত প্রশ্নের উচ্চ-মানের উত্তর দিতে পারবে।

গিটহাবের কোটি কোটি কোড এন্ট্রি দিয়ে প্রশিক্ষণ দিলে একটি কোডিং মডেলকে অবশ্যই প্রশিক্ষিত করা যায়। 'লার্নিং রেজাল্টস' বা 'ফলাফল শেখার' পেছনের যুক্তি এটাই, এবং এটি বৈধ। সর্বোপরি, কোডিং কাজের ফলাফল যাচাইযোগ্য: কোডটি চলে কি না বা টেস্ট পাস করে কি না, সেটাই প্রমাণ।

তবে, ফলাফল পর্যন্ত পৌঁছানোর প্রক্রিয়াটি একটি জটিল শৃঙ্খল, যার মধ্যে রয়েছে বহু-ধাপের সিদ্ধান্ত গ্রহণ, ভুল সংশোধন এবং উদ্দেশ্যের সামঞ্জস্য বিধান। ব্যবহারকারীর গ্রহণ, প্রত্যাখ্যান, সম্পন্ন করা, প্রত্যাহার, পরবর্তী প্রশ্ন, এমনকি মডেলটি একাধিকবার ব্যর্থ হলে বা সম্পূর্ণ ভুল করলে মৌখিক তিরস্কারের প্রতিটি ঘটনাই এই শৃঙ্খল বরাবর প্রক্রিয়াগত সংকেত।

রিইনফোর্সমেন্ট লার্নিং-এ দুই ধরনের সুপারভিশন রয়েছে। একটিকে বলা হয় আউটকাম সুপারভিশন, যা শুধুমাত্র পরীক্ষা করে দেখে যে কোডটি শেষ পর্যন্ত সফলভাবে চলে কি না। তবে, আউটকাম সুপারভিশনের ফলে "হ্যাকারদের পুরস্কৃত করা" নামক একটি ঘটনা ঘটতে পারে: কোডটি চালানোর জন্য মডেলটি অপ্রয়োজনীয়, দুর্বল এবং যৌক্তিকভাবে ত্রুটিপূর্ণ কোড লিখতে পারে, কিন্তু যেহেতু এটি পরীক্ষিত, তাই মডেলটি মনে করে যে এটি সঠিকভাবে শিখেছে।

আরেক ধরনের প্রক্রিয়াকে বলা হয় প্রসেস সুপারভিশন, যা ইনফারেন্স পাথের প্রতিটি ধাপকে স্কোর প্রদান করে। এই প্রসেস সিগন্যালগুলো শুধুমাত্র কোডিং এজেন্টের রানটাইম এনভায়রনমেন্টের মধ্যেই তৈরি হতে পারে। একটি গিটহাব রিপোজিটরিতে কেবল ফলাফলই থাকে; এমনকি স্বতন্ত্র কমিট হিস্ট্রি বা পুল রিকোয়েস্ট দেখলেও কোনো বৈধ প্রসেস সিগন্যাল প্রকাশ পাবে না।

যখন কার্যকর এবং স্বাধীনভাবে প্রাপ্তিসাধ্য প্রসেস সিগন্যালের অভাব থাকে, তখন কিছু মডেল প্রস্তুতকারক 'ডিস্টিলেশন' পদ্ধতি ব্যবহার করে, যা আপনার ইতিমধ্যেই জানা উচিত।

ডিস্টিলেশনের যুক্তিটি সহজ: একই ইনপুট দেওয়া হলে, টিচার মডেল যা আউটপুট দেবে, স্টুডেন্ট মডেলও ঠিক তাই আউটপুট দিতে শিখবে। তবে, যদিও ডিস্টিলেশন চিন্তন প্রক্রিয়াকে ধরতে পারে, আমরা যা পাই তা ডিস্টিলড টিচার মডেলের ভেতরের সম্ভাব্যতা বিন্যাসের চেয়ে চূড়ান্ত ফলাফলের বেশি কাছাকাছি থাকে।

যদি কোনো শিক্ষার্থী শিক্ষকের যুক্তিধারা থেকে বিচ্যুত হয়, তবে একটি মাত্র ভুল উত্তরও তার জন্য বিচ্যুতির কারণ হতে পারে।

এর মূল কারণ হলো রিইনফোর্সমেন্ট লার্নিং-এর একটি মৌলিক সীমাবদ্ধতা: পলিসি গ্রেডিয়েন্ট থিওরেম অনুযায়ী, অপটিমাইজেশন স্যাম্পলগুলো আদর্শগতভাবে সেই মডেল দ্বারাই তৈরি হওয়া উচিত, যেটিকে বর্তমানে অপটিমাইজ করা হচ্ছে। এই ধরনের ডেটাকে অন-পলিসি ডেটা বলা হয়। অন্য মডেলের প্রোডাক্ট (যা অন্য মডেল থেকে সংগৃহীত) ব্যবহার করে নিজের মডেলকে প্রশিক্ষণ দেওয়া অফ-পলিসি ডেটার শ্রেণিতে পড়ে। যদিও মডেলটি এই অফ-পলিসি ডেটা থেকে অবশ্যই শিখতে পারে, কিন্তু এটি মূল মডেলের ভেতরের প্রোবাবিলিটি ডিস্ট্রিবিউশনের তথ্য শিখতে পারে না।

কার্সরের মতো কোম্পানি, যারা নিজেরাও কোডিং এজেন্ট পণ্য, তাদের কাছেই সবচেয়ে খাঁটি, কার্যকর এবং উচ্চ-মানের প্রশিক্ষণ ডেটা রয়েছে। বাস্তব-জগতের পরিবেশে কোডিং মডেল প্রশিক্ষণের জন্য কার্সর পণ্যটিই সর্বোত্তম ক্ষেত্র।

এই যুক্তিটি প্রমাণ করার জন্য আমরা বছরের শুরুতে কার্সরের 'ক্র্যাশ' ব্যবহার করতে পারি।

৪.

APPSO-এর পাঠকদের হয়তো মনে আছে যে, কার্সর বছরের শুরুতে কম্পোজার ২ প্রকাশ করেছিল, যাকে "পরবর্তী প্রজন্মের বিশেষায়িত প্রোগ্রামিং মডেল" হিসেবে প্রচার করা হয়েছিল। এটির ওপর প্রযুক্তিগত প্রতিবেদনগুলো তুলনামূলকভাবে সংযত ছিল এবং এর অন্তর্নিহিত মডেল সম্পর্কে কোনো নির্দিষ্ট তথ্য প্রদান করেনি।

এর কিছুক্ষণ পরেই, নেটিজেনরা সর্বজনীনভাবে উপলব্ধ কোড স্নিপেট এবং স্ক্রিনশটগুলিতে কিমির মডেল আইডি খুঁজে পায় এবং ডেভেলপার কমিউনিটিতে তা ছড়িয়ে পড়ে, যা কার্সরের ভিপি লি রবিনসনকে এই বিষয়টি স্পষ্ট করতে বাধ্য করে: "কম্পোজার ২ প্রকৃতপক্ষে একটি ওপেন-সোর্স প্ল্যাটফর্ম থেকেই তৈরি হয়েছে। শেষ পর্যন্ত, মডেলটির কম্পিউটিং ক্ষমতার মাত্র প্রায় ১/৪ অংশ সেই প্ল্যাটফর্ম থেকে এসেছে, আর বাকি ৩/৪ অংশ আমাদের দ্বারা প্রশিক্ষিত হয়েছে।"

কয়েক ঘণ্টা পর, কার্সরের সহ-প্রতিষ্ঠাতা আমান সাঙ্গারও একটি ক্ষমা প্রার্থনা পোস্ট করেন: "শুরুতে কিমি বেসের কথা উল্লেখ না করাটা ভুল ছিল।"

পাঁচ দিন পর, কার্সর কম্পোজার ২-এর সম্পূর্ণ প্রযুক্তিগত প্রতিবেদনটি প্রকাশ করে, যেখানে দেখানো হয় যে এর ভিত্তি ছিল কিমি কে২.৫, লাইসেন্সদাতা ছিল ফায়ারওয়ার্কস এআই, এবং সাধারণ প্রক্রিয়াটি ছিল কে২.৫-এর ওপর প্রশিক্ষণ দিয়ে তারপর বৃহৎ পরিসরে রিইনফোর্সমেন্ট লার্নিং (আরএল) চালিয়ে যাওয়া।

মূল বিষয়টি হলো, কম্পোজার ২-এর আরএল (RL) একটি প্রকৃত কার্সর সেশনে চলে এবং প্রোডাকশন ডেপ্লয়মেন্টের মতোই হুবহু একই টুলস ও হারনেস ব্যবহার করে।

কার্সর এই প্রক্রিয়াটিকে "রিয়েল-টাইম রিইনফোর্সমেন্ট লার্নিং" বলে, যার অর্থ হলো ব্যবহারকারীর প্রতিক্রিয়া পর্যবেক্ষণ করতে, ডেটা সংগ্রহ করতে এবং সেগুলোকে রিওয়ার্ড সিগন্যালে একত্রিত করতে মডেলের চেকপয়েন্ট সরাসরি কার্সরের প্রোডাকশন এনভায়রনমেন্টে স্থাপন করা—এটি প্রতি ৫ ঘণ্টার মতো দ্রুত মডেলের সংস্করণ পরিবর্তন করতে পারে এবং তারপর চক্রটি পুনরাবৃত্তি করে এটিকে কার্সরে স্থাপন করা চালিয়ে যেতে পারে।

এর সবচেয়ে চরম উদাহরণ হলো কার্সরের স্বয়ংক্রিয় কোড কমপ্লিশনের ট্যাব ফিচারটি, যা প্রতিদিন ৪০ কোটিরও বেশি অনুরোধ প্রসেস করে। যখনই কোনো ব্যবহারকারী অক্ষর টাইপ করেন বা কার্সর নাড়ান, মডেলটি পরবর্তী পদক্ষেপটি অনুমান করে। যদি অনুমানের নির্ভরযোগ্যতা বেশি হয়, তবে এটি সাজেশন প্রদর্শন করে এবং ব্যবহারকারী অটো-কমপ্লিশনটি গ্রহণ করার জন্য ট্যাব চাপেন।

এই ফিচারটি অনলাইন রিইনফোর্সমেন্ট লার্নিং ব্যবহার করে, যা এই ইন্ডাস্ট্রিতে একটি অনন্য বৈশিষ্ট্য। কার্সর অত্যন্ত দ্রুত গতিতে (যেমন প্রতি দেড় থেকে দুই ঘণ্টায়) ব্যবহারকারীদের জন্য ট্যাব-এর মডেলের সক্ষমতা আপডেট করতে পারে এবং প্রশিক্ষণের জন্য সরাসরি প্রোডাক্টের ভেতর থেকেই অন-পলিসি ডেটা সংগ্রহ করে।

এই উচ্চ-ফ্রিকোয়েন্সির, প্রায়-রিয়েল-টাইম ফিডব্যাক লুপটি ট্যাবকে ব্যবহারকারীর অত্যন্ত সূক্ষ্ম উদ্দেশ্য বুঝতে সাহায্য করে। কার্সার প্রকাশ করেছে যে এই পদ্ধতিটি ট্যাবের প্রত্যাখ্যানের হার ২১% কমিয়েছে এবং গ্রহণের হার ২৮% বাড়িয়েছে।

কম্পোজার মডেলের প্রসঙ্গে ফিরে আসলে, বিষয়গুলো স্পষ্ট হওয়ার পর কিমি-র কিছু কর্মী তাদের আগের ব্যঙ্গাত্মক টুইটগুলো মুছে ফেলেন এবং কিমি-র অফিশিয়াল অ্যাকাউন্ট থেকে অভিনন্দন জানানো হয়।

মাস্কের হিসাব অনুযায়ী ৬০ বিলিয়ন ডলার মূল্যমানের একটি কোডিং এজেন্ট অ্যাপ্লিকেশন লেয়ার কোম্পানি, যারা নিজেদের মডেল বেস তৈরি করে না, তারাও তাদের নিজস্ব ডেটা ফ্লাইহুইল ব্যবহার করে এমন স্বত্বাধিকারযুক্ত প্রোগ্রামিং মডেল বের করে আনতে পারে যা বেস মডেলকে ছাড়িয়ে যায়।

সুতরাং, ‘কার্সর ক্র্যাশ করেছে’ বলার চেয়ে বরং এটা বলাই বেশি সঠিক যে, এটি কোডিং এজেন্ট প্রোডাক্টের গুরুত্বের একটি নিখুঁত উদাহরণ।

রিয়েল-টাইম আরএল (RL) সম্পর্কিত অন্য একটি প্রবন্ধে কার্সর লিখেছেন: "(একটি প্রোগ্রামিং মডেলকে প্রশিক্ষণ দেওয়ার ক্ষেত্রে) সবচেয়ে বড় চ্যালেঞ্জ হলো ব্যবহারকারীকে মডেল করা। কম্পোজারের প্রোডাকশন এনভায়রনমেন্টে শুধু কমান্ড কার্যকরকারী একটি কম্পিউটারই থাকে না, বরং সেটিকে তত্ত্বাবধান ও নির্দেশনা দেওয়ার জন্য মানুষও থাকে। একটি কম্পিউটারকে সিমুলেট করা সহজ, কিন্তু সেটিকে ব্যবহারকারী মানুষদের সিমুলেট করা কঠিন।"

প্রোগ্রামিং মডেলের ক্ষেত্রে শীর্ষস্থানীয় মডেল বিক্রেতাদের মধ্যে এই বক্তব্যটি ক্রমশ একটি সর্বসম্মত ধারণায় পরিণত হচ্ছে। আপনি যদি বেঞ্চমার্ক তালিকা এবং সাধারণ ব্যবহারকারীদের পর্যালোচনা দেখেন, তাহলে দেখতে পাবেন যে শীর্ষ বিক্রেতারা সকলেই তাদের নিজস্ব কোডিং এজেন্ট/প্রোগ্রামিং পণ্যগুলিতে প্রচুর বিনিয়োগ করছে। একমাত্র পার্থক্য হলো, কে ব্যবহারকারীর বেশি কাছাকাছি।

SWE-bench এবং LLM-Stats-এর মতো তুলনামূলকভাবে নির্ভরযোগ্য র‍্যাঙ্কিং তালিকাগুলোকে উদাহরণ হিসেবে নিলে, Claude, GPT, Gemini, এবং Kimi-এর মতো মডেলগুলোই মূলত শীর্ষ দশে আধিপত্য বিস্তার করে। এরা সকলেই মডেল বিক্রেতা, যারা তাদের নিজস্ব কোডিং এজেন্ট পণ্য (যার মধ্যে CLI, IDE, এবং কোডিং এজেন্ট সমন্বিত ডেস্কটপ ক্লায়েন্ট অন্তর্ভুক্ত) তৈরি করেছে।

কিছু তালিকায় কয়েকটি ব্যতিক্রম দেখা যায়, যেমন মেটা ( মিউজ স্পার্ক) এবং ডিপসিক, যারা তাদের নিজস্ব কোডিং এজেন্ট তৈরি করেনি।

তবে, আপনি দেখবেন যে এই বিপরীতধর্মী মডেলগুলো আরও নির্ভরযোগ্য বেঞ্চমার্কগুলোতে র‍্যাঙ্ক করতে হিমশিম খায়, যেগুলো বাস্তব-জগতের পরিস্থিতির কাছাকাছি এবং দূষণমুক্ত। উদাহরণস্বরূপ, DeepSeek শুধুমাত্র SWE-bench bash-এ ৭০% স্কোর করে নবম স্থানে থাকে, কিন্তু SWE-bench Pro-তে এর স্কোর কমে প্রায় ১৫%-এ নেমে আসে।

ওপেনরাউটারের বাস্তব ট্র্যাফিক ডেটা এই অসঙ্গতিটি ব্যাখ্যা করতে পারে: প্ল্যাটফর্মটির ২০২৫ সালের প্রতিবেদনে দেখা যায় যে, ক্লড টোকেনের ৮০%-এর বেশি ব্যবহার প্রোগ্রামিং এবং প্রযুক্তিগত কাজে হয়েছে, অন্যদিকে ডিপসিক টোকেনের ব্যবহার মূলত সাধারণ কথাবার্তা এবং রোল-প্লেয়িংয়েই সীমাবদ্ধ ছিল।

যেসব বিক্রেতার নিজস্ব কোডিং পণ্য নেই, তারা হয়তো কিছু কোডিং টাস্ক বেঞ্চমার্কে উচ্চ র‍্যাঙ্ক পেতে পারে, কিন্তু আরও কঠিন বাস্তব-জগতের ইঞ্জিনিয়ারিং বেঞ্চমার্কে এবং বাস্তব ট্র্যাফিকের ক্ষেত্রে, যেখানে ব্যবহারকারীরা ভোট দেওয়ার জন্য টোকেন ব্যবহার করে, সেখানে তাদের অযোগ্যতা প্রকাশ পাবে।

শুধু কার্সরই নয়, অ্যানথ্রোপিকও ২০২৫ সালের নভেম্বরে প্রকাশিত একটি পেপারে স্পষ্টভাবে প্রকাশ করেছে যে তারা ঠিক একই কাজ করছে: "আমরা অ্যানথ্রোপিকের নিজস্ব বাস্তব প্রোডাকশন প্রোগ্রামিং পরিবেশে প্রশিক্ষণ দিই।" অর্থাৎ, অ্যানথ্রোপিক প্রশিক্ষণের জন্য ক্লড কোড ব্যবহার করে তার কর্মীদের ইন্টারঅ্যাকশন ডেটা ক্লড মডেলে ফিডব্যাক হিসেবে পাঠায়।

৫.

কৃত্রিম বুদ্ধিমত্তার বিবর্তনে, উৎপাদন উপাদানের সংজ্ঞায় একটি গভীর পরিবর্তন এসেছে। যদিও তিনটি ঐতিহ্যবাহী মূল উপাদান—কম্পিউটিং শক্তি, গবেষণা এবং প্রশিক্ষণ ডেটা—মোট পরিমাণে ক্রমাগত বৃদ্ধি পাচ্ছে, এগুলোর কাঠামোগত ভারসাম্য মারাত্মকভাবে নষ্ট হয়ে গেছে।

আজকের প্রধান এআই জায়ান্টরা কম্পিউটিং ক্ষমতার উপর তাদের মূলধনী ব্যয় (CapEx) উল্লেখযোগ্যভাবে বাড়িয়েছে, যার ফলে কম্পিউটিং পরিকাঠামো বর্তমান জনসমাজে আলোচনার প্রধান বিষয় হয়ে উঠেছে। তবে বাস্তবে, বিশেষ করে প্রোগ্রামিংয়ের ক্ষেত্রে, মডেল বিক্রেতারা যখন গিটহাব রিপোজিটরি এবং স্ট্যাক ওভারফ্লো-এর মতো ইন্টারনেটে সর্বজনীনভাবে উপলব্ধ কোড ডেটাকে 'সব মাছ ধরার জন্য পুকুর শুকিয়ে ফেলার' মতো করে ব্যবহার করছে, তখন কোড তৈরি এবং যৌক্তিক যুক্তির ক্ষেত্রে মডেলের সীমাবদ্ধতাগুলো ধীরে ধীরে স্পষ্ট হয়ে উঠছে।

এই কারণেই শিল্পক্ষেত্রের ঐকমত্য ধীরে ধীরে একটি উদীয়মান নতুন কৌশলগত উচ্চভূমির দিকে সরে যাচ্ছে:

যে কোনো মডেল ভেন্ডর যারা শীর্ষ-স্তরের কোডিং দক্ষতায় পারদর্শী হতে চায়, তাদের জন্য নিজস্ব কোডিং এজেন্ট পণ্য তৈরি করা এখন আর কোনো ঐচ্ছিক ব্যবসায়িক পথ নয়, বরং অন্তর্নিহিত মডেলের নিরন্তর বিবর্তন নিশ্চিত করার একটি মূল ভিত্তি।

যেমনটা APPSO আগে যুক্তি দিয়েছিল, শুধুমাত্র সর্বজনীনভাবে উপলব্ধ ডেটা থেকে শেখাটা অনেকটা সফল ব্যক্তিদের সাফল্যের পথ না বুঝে শুধু তাদের ফলাফল জানার মতো। সাফল্য সম্পর্কে সঠিক ধারণা মোটেও এমন হওয়া উচিত নয়। একটি বাস্তব প্রোগ্রামিং পরিবেশে, কী ভুল হয়েছে, কীভাবে হয়েছে, এবং কীভাবে প্রয়োজনীয়তাগুলো সঠিকভাবে বোঝা ও দক্ষতার সাথে বাস্তবায়ন করা যায়—অর্থাৎ সঠিক প্রক্রিয়াটি বোঝা—শুধুমাত্র সঠিক ফলাফল পাওয়ার চেয়ে অনেক বেশি মূল্যবান।

শুধুমাত্র নিজস্ব কোডিং পণ্য থাকার মাধ্যমেই মডেল বিক্রেতারা উচ্চ-মানের 'প্রক্রিয়া তত্ত্বাবধান' সংকেত অর্জন করতে পারে, যার ফলে কোডিং/ইনফারেন্স সক্ষমতার প্রতিযোগিতার পরবর্তী পর্যায়ে তারা একটি প্রযুক্তিগত সুবিধা বজায় রাখতে পারে।

অন্যথায়, তাদের স্পেসএক্সএআই যা করেছিল তাই করতে হতো এবং কোডিং এজেন্ট পণ্য প্রস্তুতকারী সংস্থাগুলোর সাথে অংশীদারিত্ব করতে অর্থ ব্যয় করতে হতো।

তবে, সব মডেল নির্মাতা মাস্কের মতো ধনী নন, এবং ২০২৬ সাল থেকে বড় বড় প্রতিষ্ঠানগুলোর মধ্যে ক্ষমতার বিভাজন, জোট এবং এলাকা দখলের লড়াই আরও তীব্র হয়ে উঠবে। যখন নিজস্ব কোডিং পণ্যবিহীন কোনো মডেল নির্মাতা অবশেষে এই বিষয়টি উপলব্ধি করবে, তখন তার বেছে নেওয়ার মতো যথেষ্ট অংশীদার নাও থাকতে পারে, এবং সেই অনুযায়ী সহযোগিতার মূল্যও বেড়ে যাবে।

প্রধান মার্কিন মডেল নির্মাতাদের পরিস্থিতি সাধারণত সুপরিচিত, তাই আমরা এখানে বিস্তারিত আলোচনা করব না। অ্যাপসো (APPSO) আরও উল্লেখ করেছে যে, বেশিরভাগ মূলধারার দেশীয় মডেল নির্মাতা এবং এআই (AI) জায়ান্টরা ইতোমধ্যেই কোডিং এজেন্ট পণ্যের ক্ষেত্রে প্রবেশ করেছে।

দেশীয় বৃহৎ সংস্থাগুলো প্রধানত নেটিভ এআই আইডিই বা আইডিই প্লাগইন নিয়ে কাজ করছে: বাইটড্যান্স গত বছরের একেবারে শুরুতে TRAE চালু করেছে, আলিবাবার আছে Qoder, টেনসেন্টের আছে CodeBuddy, এবং বাইদুর আছে Comate, ইত্যাদি।

এআই কোম্পানিগুলোর মধ্যে মুন'স ডার্ক সাইডই প্রথম একটি স্বাধীন কোডিং এজেন্ট পণ্য তৈরি করে, যা মূলত সিএলআই ইন্টারফেসসহ কিমি কোড। তবে, কিমি আগেই জানিয়েছিল যে সিএলআই নেটিভ প্রোগ্রামিং পণ্যগুলোর চূড়ান্ত রূপ হবে না

আরেকটি পদ্ধতি হলো মডেল বিক্রেতাদের নিজস্ব এপিআই পরিষেবা এবং কোডিং পরিকল্পনা প্রদান করা। এইভাবে, ব্যবহারকারী যে এআই ডেভেলপমেন্ট পরিবেশই ব্যবহার করুক না কেন, মডেল বিক্রেতা সার্ভার-সাইড এপিআই রেকর্ডের মাধ্যমে এমন প্রসেস ডেটা পেতে পারেন যা নেটিভ কোডিং পণ্যের প্রায় অনুরূপ।

তবে, এটি কেবল একটি কাছাকাছি সাদৃশ্য, হুবহু মিল নয়। মূল সমস্যাটি হলো, সার্ভার-সাইড এপিআই-এর অনুরোধ-প্রতিক্রিয়া লগগুলো এখনও পণ্যের সাথে গভীরভাবে উত্তরাধিকারসূত্রে প্রাপ্ত মিথস্ক্রিয়ার ধরণগুলো থেকে উল্লেখযোগ্যভাবে ভিন্ন।

যেসব ভেন্ডরের নিজস্ব বিল্ট-ইন প্রোডাক্ট (যেমন কার্সর, ক্লড ডেস্কটপ, এবং কোডেক্স) আছে, তাদের কাছে সবচেয়ে সরাসরি ও সুস্পষ্ট ফিডব্যাক সিগন্যাল থাকে, অন্যদিকে এপিআই (API) সাইড তুলনামূলকভাবে অস্পষ্ট ও পরোক্ষ অনুমান প্রদান করে। সহজ কথায়, এপিআই সাইড ব্যবহারকারীর অনুরোধ এবং প্রতিক্রিয়া দেখতে পেলেও, ব্যবহারকারী শেষ পর্যন্ত কোডটি গ্রহণ করেছে কিনা, কোডটি সফলভাবে চলছে কিনা, বা এটি কী ধরনের বাগ তৈরি করেছে, সে সম্পর্কে তাদের কোনো ধারণা থাকে না। তারা ব্যবহারকারীর চূড়ান্ত আচরণের এই গুরুত্বপূর্ণ লেবেলটি বুঝতে পারে না, ফলে সর্বোচ্চ মানের রিইনফোর্সমেন্ট লার্নিং অর্জন করতে ব্যর্থ হয়।

আধ্যাত্মিকভাবে বলতে গেলে, ভাষাই হলো জগৎ, এবং কোড হলো তার সমাধান। কোড এই জগতের অধিকাংশ কাজই প্রকাশ করতে পারে, এবং এটি একটি বিবর্ধক (অ্যামপ্লিফায়ার) হিসেবেও কাজ করে, যা শীর্ষ প্রতিভাদের তাদের উৎপাদনশীলতা বহুগুণে বাড়িয়ে তুলতে সাহায্য করে।

শুধুমাত্র সেরা কোডিং মডেলগুলোই সেরা প্রতিভার যোগ্য। যদি শীর্ষস্থানীয় মডেল সরবরাহকারীরা কোডিংকে গুরুত্ব না দেয়, তবে তারা অনিবার্যভাবে শীর্ষস্থান থেকে ছিটকে পড়বে।

অবশ্যই, বাস্তবে প্রতিটি মডেল নির্মাতা কোডিংকে গুরুত্ব দেবে—কিন্তু বরং, নতুন এই প্রেক্ষাপটে, যেসব পণ্যের নিজস্ব নিয়ন্ত্রণযোগ্য নেটিভ কোডিং এজেন্ট নেই, সেগুলো খুব সম্ভবত সেইসব নির্মাতাদের থেকে ধীরে ধীরে পিছিয়ে পড়বে যাদের কাছে এ ধরনের পণ্য রয়েছে।

মাত্র কয়েকদিন আগে, মিনিম্যাক্স তার ডেস্কটপ ক্লায়েন্ট প্রোডাক্টের জন্য একটি বড় আপডেটও প্রকাশ করেছে: ম্যাভিস ফিচার, যা একটি সম্পূর্ণ নতুন মাল্টি-এজেন্ট অর্কেস্ট্রেশন আর্কিটেকচার নিয়ে এসেছে এবং এটি কোডিং টাস্কের ক্ষেত্রে ক্লায়েন্টের সাপোর্টকেও উল্লেখযোগ্যভাবে উন্নত করে।

পূর্বে মিনিম্যাক্স শুধুমাত্র ডেস্কটপ সংস্করণ চালু করেছিল, কিন্তু এতে নেটিভ কোডিং এবং এজেন্ট বৈশিষ্ট্য অন্তর্ভুক্ত ছিল না।

এর পরে, ১৫ই মে আলিবাবা আনুষ্ঠানিকভাবে Qoder 1.0 প্রকাশ করে – এই পণ্যটিকে আনুষ্ঠানিকভাবে একটি IDE থেকে একটি পূর্ণাঙ্গ এজেন্ট পণ্যে উন্নীত করা হয় (আলিবাবার আনুষ্ঠানিক নাম হলো ইন্টেলিজেন্ট এজেন্ট সেলফ-ডেভেলপমেন্ট ওয়ার্কবেঞ্চ)।

একই সাথে, xAI-এর Grok Build CLI অবশেষে আনুষ্ঠানিকভাবে চালু করা হয়েছে।

হ্যাঁ, ঠিকই ধরেছেন, এটি সেই কোডিং এজেন্ট যা এক্সএআই (xAI) নিজেরাই তৈরি করেছে, এই বছরের শুরুতে অ্যানথ্রোপিক (Anthropic) এবং কার্সার (Cursor) কর্তৃক তাদের অ্যাকাউন্টগুলো নিষিদ্ধ হওয়ার পর।

আর এখন, আরও বেশ কয়েকটি তৈরি কেস রয়েছে।

মনে হচ্ছে সবাই একমত যে Cursor, Codex, এবং Claude ডেস্কটপ ক্লায়েন্টগুলো সঠিক পথেই এগোচ্ছে।

৬.

কোডিং থেকে আলোচনাকে সরাসরি এজেন্ট পর্যন্ত প্রসারিত করলেও একই কথা প্রযোজ্য।

যদিও কোডিং টাস্কের জন্য কিছু ট্র্যাজেক্টরি ডেটা সর্বজনীনভাবে উপলব্ধ কর্পোরা-তে (যেমন গিটহাব কমিট রেকর্ড/পিআর, যদিও এর মান উন্নত নয়) পাওয়া যেতে পারে, এজেন্ট টাস্কের জন্য ট্র্যাজেক্টরি ডেটা—যার মধ্যে মাউস নাড়ানো ও ক্লিক করা, টাচস্ক্রিন ব্যবহার করা এবং ইনপুট বক্স পূরণ করা অন্তর্ভুক্ত, কিন্তু এগুলোর মধ্যেই সীমাবদ্ধ নয়—সর্বজনীন উপলব্ধ কর্পোরা-তে পাওয়া যায় না।

সুতরাং, আমরা দেখতে পাই যে এজেন্ট পরিচালনার ক্ষুদ্রতম বাস্তবায়ন পথেও—অর্থাৎ ব্রাউজার প্লাগইনে, যা মোটেও উচ্চমানের বলে মনে হয় না—প্রায় প্রতিটি মডেল বিক্রেতা নিজস্ব প্লাগইন তৈরি করে।

ওপেনএআই ২০২৫ সালের জানুয়ারিতে অপারেটর চালু করেছিল—এটিকে "এআই-স্বয়ংক্রিয় ব্রাউজার" না বলে, এটি মূলত একটি বৃহৎ পরিসরের ডেটা সংগ্রহের ডিভাইস। অপারেটর ব্যবহারকারী প্রত্যেকে বিনামূল্যে ওপেনএআই-কে নীতি-সম্পর্কিত ডেটা সরবরাহ করছেন।

পরবর্তীকালে, ওপেনএআই চ্যাটজিপিটি এজেন্ট এবং কোডেক্স ডেস্কটপ অ্যাপ্লিকেশনের একটি নতুন সংস্করণ তৈরি করে; অ্যানথ্রোপিকের ক্ষেত্রেও একই কথা প্রযোজ্য; সম্প্রতি, কিমি নীরবে ওয়েবব্রিজ নামে একটি প্রজেক্ট তৈরি করেছেন, যা মূলত একটি ব্রাউজার প্লাগইন।

এমনকি চীনের অন্যতম বৃহৎ মডেল কোম্পানি ডিপিন, যা গত দুই বছর ধরে তার কার্যকলাপে সবচেয়ে সংযত ছিল, তারাও সম্প্রতি এজেন্টদের প্রতি আগ্রহ দেখাতে শুরু করেছে।

পূর্ববর্তী এক সাক্ষাৎকারে সিইও লিয়াং ওয়েনফেং উল্লেখ করেছিলেন যে, গণিত এবং কোড হলো এজিআই-এর জন্য স্বাভাবিক পরীক্ষাক্ষেত্র, অনেকটা ‘গো’ খেলার মতো—একটি বদ্ধ ও যাচাইযোগ্য সিস্টেম, যার স্ব-শিক্ষার মাধ্যমে উচ্চ বুদ্ধিমত্তা অর্জনের সম্ভাবনা রয়েছে।

এই বিবৃতির অন্তর্নিহিত অর্থ হলো, ডিপসিক সবসময় কোডিং এবং এজেন্টদের বাণিজ্যিকীকরণের পরিবর্তে গবেষণা ও পরীক্ষামূলক ক্ষেত্র হিসেবেই বিবেচনা করেছে।

তবে, এই বছরের মার্চ মাসে, DeepSeek একবারে এক ডজনেরও বেশি এজেন্ট-সম্পর্কিত পদ প্রকাশ করে, যার মধ্যে সর্বপ্রথম মডেল স্ট্র্যাটেজি প্রোডাক্ট ম্যানেজার (এজেন্ট-কেন্দ্রিক) পদটিও ছিল। সেই সময়ে চাকরির বিবরণে "এজেন্ট মূল্যায়ন সিস্টেম এবং প্রশিক্ষণ ডেটা সলিউশনের নকশার নেতৃত্ব দেওয়া" অন্তর্ভুক্ত ছিল এবং "Claude Code ও Manus-এর মতো প্রোডাক্টের গভীর ব্যবহার"-এর প্রয়োজন ছিল।

APPSO উল্লেখ করেছে যে DeepSeek সম্প্রতি এজেন্ট প্রোডাক্ট ম্যানেজার এবং হারনেস প্রোডাক্ট ম্যানেজারের মতো পদে চাকরির বিজ্ঞপ্তি দিয়েছে—স্পষ্টতই, DeepSeek একটি স্বাধীন, নেটিভ কোডিং/এজেন্ট প্রোডাক্ট তৈরি করতে যাচ্ছে।

পূর্ববর্তী প্রতিবেদনগুলোতে ইঙ্গিত দেওয়া হয়েছিল যে, DeepSeek V3.2 তার প্রশিক্ষণ প্রক্রিয়ার সময় প্রায় দুই হাজার সিন্থেটিক এজেন্ট প্রশিক্ষণ পরিবেশ এবং আশি হাজারেরও বেশি জটিল নির্দেশনা অন্তর্ভুক্ত করেছিল। তবে, মনে হচ্ছে যে সিন্থেটিক প্রশিক্ষণ ডেটা DeepSeek-কে কেবল এই পর্যন্তই নিয়ে যেতে পারে; বাকি অংশ—বাস্তব-জগতের পরিবেশে প্রকৃত ব্যবহারকারীদের আসল সাফল্য ও ব্যর্থতা—শুধুমাত্র তাদের নিজস্ব এজেন্ট প্রোডাক্টের মাধ্যমেই পাওয়া সম্ভব।

DeepSeek গত তিন বছর ধরে অত্যন্ত সংযমের সাথে তার মডেল এবং পণ্যগুলির উন্নয়ন করে আসছে ( গত মাসেই কেবল তার অফিসিয়াল ওয়েবসাইটে মাল্টিমোডাল সক্ষমতা যুক্ত করেছে)। তবে, বর্তমানে কোডিংয়ের কাজে DeepSeek-এর জন্য অত্যাধুনিক (SOTA) পারফরম্যান্স অর্জন করা ক্রমশ কঠিন হয়ে পড়ছে , এবং এমনকি পূর্বে যা অর্জন করেছিল তাও শীঘ্রই ছাড়িয়ে যাচ্ছে।

যখন মূল শক্তি গবেষণার ওপর নির্ভর করে ফ্লাইহুইলটিকে আর টিকিয়ে রাখতে পারছিল না, তখন অবশেষে ডিপসিক পদক্ষেপ নিল।

৭.

অবশেষে, গল্পের শুরুতে ফিরে যাওয়া যাক।

‘দ্য ইনফরমেশন’-এর প্রতিবেদন অনুযায়ী, সংশ্লিষ্ট সূত্রের বরাত দিয়ে জানা গেছে যে, মাস্কের ৬০ বিলিয়ন ডলারের অধিগ্রহণ প্রস্তাব বা ১০ বিলিয়ন ডলারের সহযোগিতা গ্রহণ করার সময় কার্সর জানিয়েছে, তারা নতুন মডেল তৈরির জন্য এক্সএআই (xAI)-এর সঙ্গে সহযোগিতা করবে না, বরং নিজেদের কম্পোজার মডেলকে আরও উন্নত করার দিকে মনোযোগ দেবে।

এর অর্থ হতে পারে যে, মাস্ক কার্সরকে কিনে নিলেও বা অধিগ্রহণ করলেও, এটিকে তার ডেটা ফ্লাইহুইলের মূল অংশটি ধরে রাখতে হবে।

তথ্যের মালিকানাই হলো বিবাদের সবচেয়ে গুরুত্বপূর্ণ গোপন কারণ।

যখন সমস্ত শীর্ষ মডেল নির্মাতারা তাদের নিজস্ব পণ্য তৈরি করেছে, এবং সমস্ত শীর্ষ পণ্য নির্মাতারা তাদের নিজস্ব মডেলদের প্রশিক্ষণ দেওয়া শুরু করেছে, তখন 'মডেল কোম্পানি' এবং 'পণ্য কোম্পানি'-র মধ্যেকার ইতিমধ্যেই অস্পষ্ট সীমারেখাটি আরও বেশি করে বিলীন হয়ে যাচ্ছে বলে মনে হচ্ছে…

এই খেলা সবে শুরু হয়েছে।

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট: iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।