প্রকৃত পরীক্ষায়, GPT-5.3-Codex কে OpenAI-এর ইতিহাসে প্রথম উচ্চ-ঝুঁকিপূর্ণ মডেল হিসেবে চিহ্নিত করা হয়েছিল, এমনকি এর APIও এখনও আমাদের কাছে উপলব্ধ নয়।

আজ সকালে প্রকাশিত GPT-5.3-Codex কে বিভিন্ন স্থানীয় এজেন্টের জনপ্রিয়তার সাম্প্রতিক উত্থানের বিরুদ্ধে OpenAI-এর একটি শক্তিশালী পাল্টা আক্রমণ হিসেবে দেখা যেতে পারে, এবং মূলত অ্যানথ্রোপিকের বিরুদ্ধে একটি পাল্টা আক্রমণ হিসেবে দেখা যেতে পারে।

কিছুদিন আগে OpenAI কর্তৃক প্রকাশিত কোডেক্স ডেস্কটপ অ্যাপ্লিকেশনের মাধ্যমে, Skill, Cowork, Claude Code, এমনকি Openclaw-এর মতো জনপ্রিয় টুলগুলি যে ফাংশনগুলি ব্যবহার করে তা এখন কোডেক্স শেল এবং GPT-5.3-Codex মডেলের ক্ষমতার মাধ্যমে অর্জন করা যেতে পারে।

▲ কোডেক্স অ্যাপের মধ্যে, আপনি সরাসরি GPT-5.3-কোডেক্স মডেল নির্বাচন করতে পারেন এবং গভীর চিন্তাভাবনার তীব্রতাও চয়ন করতে পারেন।

আমরা আগে Cowork-এর ক্ষমতাগুলি যেভাবে চালু করেছিলাম, ঠিক তেমনই, আমরা Codex-কে কিছু অনুরূপ কাজ সম্পূর্ণ করার জন্যও বরাদ্দ করেছি, যেমন স্থানীয় ফাইলগুলি সরাসরি প্রক্রিয়াকরণ করা, বিভিন্ন ফর্ম্যাট রূপান্তর করা, বিভিন্ন দক্ষতা একত্রিত করা, Word/PPT/Excel ফাইল তৈরি করা, ভিডিও ডাউনলোড করা, অ্যাপ তৈরি করা ইত্যাদি।

GPT-5.3-Codex অসাধারণভাবে ভালো পারফর্ম করে। Claude Code শুরু থেকে ইনস্টল করার তুলনায়, নতুন ব্যবহারকারীদের জন্য সরাসরি Codex ডাউনলোড করা একটি ভালো বিকল্প। ভবিষ্যতে মডেল বিক্রেতাদের মধ্যেও এটি একটি প্রবণতা; প্রাথমিকভাবে, সবাই স্থানীয় এজেন্ট তৈরি করার জন্য জটিল কমান্ড-লাইন টার্মিনাল দিয়ে শুরু করেছিল, কিন্তু তারা ধীরে ধীরে ব্যবহারকারী-বান্ধব ভিজ্যুয়াল ইন্টারফেসে ফিরে আসছে।

গত কয়েকদিনে কোডেক্সের অনলাইন পর্যালোচনাগুলি উল্লেখযোগ্যভাবে বিপরীত হয়েছে, অনেক ডেভেলপার ক্লড কোড থেকে কোডেক্সে স্যুইচ করেছেন। চীনের কিছু স্বাধীন ডেভেলপার আরও বলেছেন যে কোডেক্স প্লাস সদস্যরা ক্লডের প্রায়শই করা নির্মম অ্যাকাউন্ট নিষেধাজ্ঞা ছাড়াই এটি ব্যবহার করতে পারবেন।

আল্ট্রাম্যান উত্তেজিতভাবে ঘোষণা করলেন যে কোডেক্সের সক্রিয় ব্যবহারকারীর সংখ্যা ১০ লক্ষ ছাড়িয়ে গেছে। তার মডেল আপডেট ব্লগটিও অকপট এবং উদার প্রশংসায় ভরে উঠেছে।

GPT-5.3-Codex হল আমাদের প্রথম স্ব-নির্মিত মডেল । 5.3-Codex ব্যবহার করে, আমরা এটিকে এত দ্রুত গতিতে প্রকাশ করতে সক্ষম হয়েছি।

ক্লডের দলের সাথে দুই সপ্তাহ ধরে কাজ করে, ক্লড কোড—১০০% এআই কোড—ব্যবহার করে Cowork এর মতো কিছু তৈরি করা; এবং তারপরে গত বছরের শেষের দিকে OpenAI-এর একটি নিবন্ধ, "কোডেক্স ব্যবহার করে ২৮ দিনে সোরার একটি অ্যান্ড্রয়েড সংস্করণ তৈরি করা"—এজেন্টদের যুগ সত্যিই এসে গেছে।

আমার ChatGPT এবং Claude কোডটি Codex দিয়ে প্রতিস্থাপন করুন।

বেশিরভাগ স্থানীয় এজেন্টের মতো, টার্মিনাল হোক বা Cowork, আমরা প্রথমে একটি কার্যকরী ফোল্ডার নির্বাচন করি। কোডেক্সে, আমরা একাধিক প্রকল্প তৈরি করতে পারি, সংশ্লিষ্ট ফোল্ডার নির্বাচন করতে পারি এবং তারপর কথোপকথন শুরু করতে পারি; কোডেক্স এই থ্রেডগুলিকে কল করে।

সবচেয়ে সাধারণ এবং সহজ উদাহরণ দিয়ে শুরু করা যাক। আমরা একটি খালি ডাউনলোড ফোল্ডার যোগ করেছি, তারপর "একটি থ্রেড শুরু করুন" এ ক্লিক করেছি এবং GPT-5.3-Codex মডেলটি নির্বাচন করেছি; ঠিক ChatGPT-তে কথোপকথনের মতো, আমরা কমান্ডগুলি প্রবেশ করিয়েছি।

আমরা কোডেক্সকে আমাদের জন্য একটি X ভিডিও ডাউনলোড করতে বলেছিলাম। কোডেক্স স্বয়ংক্রিয়ভাবে এটি পরিচালনা করার জন্য উপলব্ধ দক্ষতা পরীক্ষা করে এবং তারপর yt-dlp টুল ব্যবহার করে এটি ডাউনলোড করে। ভিডিওটি চার ঘন্টারও বেশি সময় ধরে ছিল এবং কোডেক্স ডায়ালগ বক্সে ডাউনলোডের অগ্রগতি আপডেট করতে থাকে।

▲GIF ছবির গতি বাড়ানো হয়েছে।

ভিডিওটি ডাউনলোড করার পর, আমরা ভিডিওটির ট্রান্সক্রিপ্টটি বের করতে, আমাদের একটি দ্বিভাষিক নথি সরবরাহ করতে এবং অবশেষে পুরো প্রক্রিয়াটিকে একটি স্কিল-এ প্যাকেজ করতে বলতে পারি যাতে পরের বার সহজে ব্যবহার করা যায়।

যদি আপনার ভিডিওতে আকর্ষণীয় ক্লিপ থাকে এবং আপনি ভিডিওটি ট্রিম করতে চান অথবা ট্রিম করা ভিডিওটিকে GIF-তে রূপান্তর করতে চান, তাহলে আপনি কোডেক্সে এটি করতে পারেন।

উদাহরণস্বরূপ, আমরা একটি ভিডিও ডাউনলোড করি এবং তারপর একটি নতুন ভিডিও তৈরি করার জন্য ভিডিওটির ৫ সেকেন্ড থেকে ২৫ সেকেন্ড পর্যন্ত ক্রপ করতে বলি। GPT-5.3-Codex এর দ্রুত টোকেন প্রক্রিয়াকরণের জন্য ধন্যবাদ, পুরো প্রক্রিয়াটি সম্পন্ন করতে খুব বেশি সময় লাগে না; এটি স্থানীয় কম্পিউটারের হার্ডওয়্যার ডিকোডিং এবং এনকোডিং ক্ষমতার উপর নির্ভর করে।

▲ GIF ছবিটি দ্রুত তৈরি করা হয়েছে।

বিকল্পভাবে, আমরা সরাসরি ভিডিওটির প্রথম ৫ সেকেন্ডকে একটি GIF ফাইলে রূপান্তর করতে বলতে পারি, যাতে নিশ্চিত করা যায় যে আকার ১০MB এর মধ্যে আছে, ফ্রেম রেট সামঞ্জস্য করা যায় এবং স্পষ্টতার জন্য প্রস্থ ৬৪০px এ নিয়ন্ত্রিত।

শীঘ্রই, আমরা সংশ্লিষ্ট GIF ফাইলটি পাব। আরও চরম, এটি প্রতি সেকেন্ডে 30 ফ্রেমে পুরো ভিডিওটিকে ছবিতে রূপান্তর করতে পারে, প্রতিটি ফ্রেমই একটি ছবি।

স্থানীয় ফাইলগুলির জন্য এই সরাসরি প্রক্রিয়াকরণ ক্ষমতা, টার্মিনাল-বেঞ্চ-২ টেস্ট স্যুটে GPT-5.3-কোডেক্সের চমৎকার কর্মক্ষমতা সহ, কোডেক্সকে বিভিন্ন উৎপাদনশীলতা এবং দক্ষতা সরঞ্জামের কার্যকরী প্রয়োজনীয়তাগুলি মূলত পূরণ করতে সক্ষম করে।

তুলনামূলকভাবে, সদ্য প্রকাশিত Claude Opus 4.6 টার্মিনাল-বেঞ্চ 2.0-এ 65.4% এবং GPT-5.3-Codex-এ 77.3% স্কোর করেছে।

▲ ছবির উৎস: https://x.com/neilsuperduper/status/2019486017703547309/

উদাহরণস্বরূপ, যদি এই ফোল্ডারে একাধিক ছবি থাকে, তাহলে আমাদের প্রথম প্রয়োজন হল এই ছবি ফাইলগুলির বিষয়বস্তু অনুসারে নাম পরিবর্তন করা, এবং ফাইলের নামগুলি 20 অক্ষরের বেশি না রাখা, প্রতীক ব্যবহারের অনুমতি না দিয়ে।

▲ GIF ছবিটি দ্রুত তৈরি করা হয়েছে।

স্বয়ংক্রিয় পরিবর্তন সম্পন্ন হওয়ার পর, আমরা এটিকে উল্লম্বভাবে বা অনুভূমিকভাবে এই ছবিগুলিকে একসাথে সেলাই করতে বলতে পারি। কোডেক্স সংশ্লিষ্ট সরঞ্জামগুলিকে কল করে এটি করতে পারে।

ক্লড স্কিলসের মতো, কোডেক্স স্কিলস মার্কেটপ্লেস থেকে বিস্তৃত দক্ষতা ইনস্টল করতে পারে এবং এটি ইতিমধ্যেই অ্যাপ্লিকেশনের মধ্যে বেশ কয়েকটি দক্ষতা অফার করে, যার মধ্যে রয়েছে pptx, xls, word, canvas এবং notion।

মৌলিক প্রোগ্রামিং দক্ষতায় ফিরে এসে, আপগ্রেড করা GPT-5.3-Codex GPT-5.2 এর তুলনায় উল্লেখযোগ্যভাবে ভালো পারফর্ম করে। আমরা সরাসরি এটিকে "Word of the Day" অ্যাপ লিখতে বলেছিলাম। ChatGPT, যা কেবল ক্যানভাস ব্যবহার করে একটি অ-স্থানান্তরযোগ্য ওয়েবপেজ প্রদান করে, তার বিপরীতে, Codex আপনাকে স্থানীয়ভাবে প্রকল্পটি তৈরি করতে এবং তারপর Vercel বা Cloudflare এর মতো দক্ষতা ব্যবহার করে এটি একটি ওয়েবপেজে স্থাপন করতে দেয়।

এখানে আমরা এক্সট্রা হাই রিজনিং মোড নির্বাচন করেছি। প্রতিটি অপারেশনের আগে, GPT-5.3-কোডেক্স আমাকে পরবর্তী অপারেশন বিকল্পের জন্য জিজ্ঞাসা করবে। এটি এই সত্যের সাথেও সম্পর্কিত যে কোডেক্স সরাসরি কাজের পরিস্থিতি অনুসারে বিভিন্ন দক্ষতা কল করতে পারে। এর মধ্যে, ব্রেনস্টর্মিং স্কিল স্বয়ংক্রিয়ভাবে একটি ক্রমাগত সংলাপ মোড পরিচালনা করবে।

পরিশেষে, এটি মূলত আমার প্রাথমিকভাবে অনুরোধ করা সমস্ত বৈশিষ্ট্য পূরণ করেছে এবং এটি ম্যাকওএস, আইওএস এবং অ্যান্ড্রয়েড সংস্করণের জন্য আরও উন্নত করা যেতে পারে।

যদি আমাদের কাছে আগে থেকে কোনও কোড প্রজেক্ট থাকে, তাহলে আমরা প্রজেক্ট ফোল্ডারটি নির্বাচন করে কোডেক্সে খুলতে পারি। GPT-5.3-Codex প্রজেক্টের বাগগুলি বিশ্লেষণ করবে এবং সেগুলি ঠিক করবে।

দীর্ঘদিন ধরে, অ্যানথ্রপিকের সনেট/অপাস মডেল এবং ক্লড কোড টুল ডেভেলপারদের পছন্দের পছন্দ ছিল, টুল এবং মডেল উভয় ক্ষেত্রেই। প্রোগ্রামিংয়ে, বিশেষ করে লং-কোড লজিক্যাল রিজনিংয়ে, ওপেনএআই-এর পিছিয়ে থাকার কারণে অনেক ডেভেলপার পক্ষ পরিবর্তন করতে বাধ্য হয়েছিল।

GPT-5.3-Codex-এর আবির্ভাব এই বিতর্কের অবসান ঘটানোর উদ্দেশ্যেই করা হয়েছিল। এখন, GPT-5.3-Codex কেবল প্রোগ্রামিং বেঞ্চমার্ক এবং বাস্তব-বিশ্বের কর্মক্ষমতার ক্ষেত্রেই তার নিজস্ব পূর্বসূরিকে ছাড়িয়ে যায় না, বরং প্রতিযোগীদের মডেলগুলিকে পুরোপুরি ছাড়িয়ে যাওয়ার লক্ষণও দেখায়। এটি সত্যিই কোড লেখার, পরীক্ষা করার এবং অনুমান করার ক্ষমতা রাখে।

এই মডেল পরিচিতি ব্লগের ওয়েবসাইট ডেভেলপমেন্ট বিভাগে গেম প্রজেক্টটি একটি গুরুত্বপূর্ণ কেস স্টাডি ছিল। আমরা GPT-5.3-Codex কে একটি সহজ পদার্থবিদ্যা-ভিত্তিক পিনবল গেম তৈরি করতেও বলেছিলাম। যদিও সামগ্রিক ফলাফল আমার প্রত্যাশা পূরণ করেনি—আমি বিশেষভাবে ইঙ্গিতগুলিতে একটি RPG অনুরোধ করেছিলাম—GPT-5.3-Codex দ্বারা প্রদত্ত ইন্টারফেসটি এখনও খুব প্রাথমিক ছিল। তবে, এটি এখনও খেলার যোগ্য।

আমরা X-তে GPT-5.3-Codex দিয়ে তৈরি কিছু ছোট গেমও খুঁজে পেয়েছি, যেমন এই সুপার মারিও-সদৃশ মুদ্রা সংগ্রহের গেম।

▲সূত্র: https://x.com/Angaisb_/status/2019548783869325331

শক্তিশালীদের মধ্যে সবসময়ই শক্তিশালী খেলোয়াড় থাকে।

অ্যানথ্রপিকের জন্য, ওপেনএআই আজ যা করছে তা আমরা ইতিমধ্যেই করেছি। সেটা কোড, এজেন্ট ক্ষমতা, অথবা স্থানীয় এজেন্ট তৈরি শুরু করা, পূর্ববর্তী কোডেক্স টার্মিনাল থেকে ম্যাকওএস অ্যাপে রূপান্তর করা।

প্রযুক্তির জগতে, OpenAI ক্লডের পদাঙ্ক অনুসরণ করছে বলে মনে হচ্ছে। ক্লড কোডিংয়ের সাথে গভীরভাবে জড়িত, অন্যদিকে OpenAI Sora, দৈনিক প্রতিবেদন, ব্রাউজার এবং ChatGPT এজেন্টদের উপর কাজ করছে, কিন্তু তাদের কেউই খুব বেশি সাফল্য পায়নি, তাই তারা কোডিংয়ের উপরও মনোযোগ দিতে শুরু করেছে। ক্লড জানুয়ারির শুরুতে Cowork চালু করে এবং OpenAI ফেব্রুয়ারির শুরুতে কোডেক্স অ্যাপ প্রকাশ করে একই পদ্ধতি অনুসরণ করে।

আজকের রিলিজের মতোই, রাত ১:৪৫ মিনিটে, ক্লড আনুষ্ঠানিকভাবে ক্লড ওপাস ৪.৬ চালু করে, তারপরে ওপেনএআই GPT-5.3-কোডেক্স প্রকাশ করে। উভয় মডেলই আসলে এজেন্টদের আরও শক্তিশালী মৌলিক ক্ষমতা প্রদানের জন্য ডিজাইন করা হয়েছে। আগে, এটি কোড/ভাইব কোডিং সম্পর্কে ছিল, কিন্তু এখন, একজন এজেন্টের জন্য ভাল পারফর্ম করার জন্য, এটি মূলত "ভালো কোড লেখা" সম্পর্কে।

যদিও Opus 4.6 SWE-Bench-এ Opus 4.5-এর চেয়েও খারাপ পারফর্ম করে এবং Terminal-Bench 2.0-এ GPT-5.3-Codex-এর মতো শক্তিশালী নয়, Opus অভূতপূর্বভাবে প্রসঙ্গ দৈর্ঘ্য দশ লক্ষ টোকেনের উইন্ডোতে বৃদ্ধি করেছে। তাছাড়া, এই বেঞ্চমার্কগুলির পারফরম্যান্স উল্লেখযোগ্যভাবে আলাদা নয়।

ক্লড বললেন, "আমার সনেট ৫ এখনও মুক্তি পায়নি; আসল দক্ষতা এখানেই আসে।"

আমরা অনলাইনে Opus 4.6 এর জন্য কিছু সাম্প্রতিক পরীক্ষামূলক কেসও পেয়েছি। কিছু নেটিজেন বলেছেন যে Claude 4.6 Opus শুধুমাত্র একটি কলের মাধ্যমে তার সম্পূর্ণ কোডবেস সম্পূর্ণরূপে পুনর্নির্মাণ করেছে, কোডের মূল অগোছালো "বাজে পাহাড়" মডুলারাইজ করেছে। Opus এর মতো অন্য কোনও মডেল এটি করতে পারে না।

কিছু নেটিজেন Opus 4.6 এবং 4.5 এর তুলনা করেছেন, যেখানে উভয় মডেলই একই ব্যবস্থাপনা খেলা খেলে দেখেছেন যে কার অ্যাকাউন্টের স্তর, সম্পদ এবং সরঞ্জাম বেশি। পরীক্ষামূলক ব্লগার উল্লেখ করেছেন যে সংস্করণ 4.6 প্রাথমিক পর্যায়ে কৌশল প্রণয়ন করতে বেশি সময় নিয়েছে, কিন্তু আরও ভালো কৌশলগত সিদ্ধান্ত নিয়েছে এবং শেষ পর্যন্ত উল্লেখযোগ্যভাবে এগিয়ে গেছে।

আরেকজন নেটিজেনও একটি গেম তৈরি করেছেন, কিন্তু এটি পোকেমনের ক্লোন। ব্লগার উল্লেখ করেছেন যে এটিই এআই ব্যবহার করে তার তৈরি করা সবচেয়ে দুর্দান্ত জিনিস। তিনি উল্লেখ করেছেন যে ক্লড ওপাস ৪.৬ তৈরি করতে ১ ঘন্টা ৩০ মিনিট সময় লেগেছে, ১,১০,০০০ টোকেন ব্যবহার করা হয়েছে এবং মাত্র তিনবার পুনরাবৃত্তি হয়েছে।

▲ https://x.com/chatgpt21/status/2019679978162634930

CLaude-এর অফিসিয়াল ডেমো এবং প্রাথমিক ব্যবহারকারীদের প্রতিক্রিয়ায়, Opus-এর অসাধারণ ভালো পারফর্মেন্সের একটি উদাহরণ উল্লেখ করা হয়েছে। Opus 4.6 একদিনের মধ্যে স্বয়ংক্রিয়ভাবে ১৩টি সমস্যা (প্রকল্পের অমীমাংসিত সমস্যা) সমাধান করেছে এবং আরও ১২টি সমস্যা সঠিক মানব দলের সদস্যদের কাছে সঠিকভাবে বরাদ্দ করেছে।

Kimi K2.5-এর এজেন্ট ঝাঁকের মতো, Opus 4.6 ৫০ জনের একটি সংস্থার কোডবেস পরিচালনা করতে পারে। Claude Code-এ, আমরা এজেন্ট টিম গঠন করতে পারি, যেখানে একটি AI একা লড়াই করার পরিবর্তে AI-এর একটি সম্পূর্ণ দলকে ডেকে আনা হয়। এই AI গুলি কোড লেখা, পর্যালোচনা এবং পরীক্ষার জন্য দায়ী হতে পারে এবং তারা স্বায়ত্তশাসিতভাবে সহযোগিতা করতে পারে।

কিছু ব্যবহারকারী ক্লাউড কোডে এজেন্ট সোয়ার্ম পরীক্ষা করেছেন এবং উল্লেখ করেছেন যে সোয়ার্ম সক্ষম করার পরে, ওপাস ৪.৬ ২.৫ গুণ দ্রুত এবং আরও ভালো পারফর্ম করেছে।

আমাদের বর্তমান পরিস্থিতি ঠিক এই ছবির মতো; যদিও একটি পর্বত অন্যটির চেয়ে উঁচু, আমরা এই চক্র থেকে বেরিয়ে আসতে পারি না। জেমিনি সম্ভবত কয়েক মাস আগে স্পটলাইট চুরি করেছিল, ক্লডের পরবর্তী জানুয়ারিতে আসার কথা ছিল, এবং তারপর মনে হচ্ছে এটি OpenAI এর পালা, অথবা মাস্কের গ্রোকের পালা।

সৌভাগ্যবশত, এই চক্রের সময়, ব্যবহারকারী হিসেবে আমরা স্পষ্টভাবে অনুভব করতে পারি যে AI-এর ক্ষমতা ক্রমাগত উন্নত হচ্ছে।

GPT-5.3-Codex এর API এখনও খোলা হয়নি কারণ মডেলটি অত্যন্ত শক্তিশালী এবং একটি উল্লেখযোগ্য ঝুঁকি তৈরি করে। অতএব, OpenAI এখনও API কীভাবে নিরাপদে সক্ষম করা যায় তা বিবেচনা করছে।

Claude Opus 4.6 একাধিক উপায়ে ব্যবহার করা যেতে পারে, যার মধ্যে রয়েছে Claude universal chat অ্যাপ্লিকেশন, Claude Code এবং API। এই বছর তিনটি প্রধান আন্তর্জাতিক বিক্রেতা কর্তৃক প্রকাশিত প্রথম দুটি মডেল হিসেবে, এগুলি অবশ্যই চেষ্টা করার যোগ্য।

ভবিষ্যতে, আরও ভালো পরিষেবা প্রদানকারী এজেন্টদের এবং আমাদের জন্য কাজ করার জন্য তাদের সক্ষম করে তোলাই প্রধান মডেল আপডেটগুলির মূল লক্ষ্য থাকবে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো