GPT-5.2 এর প্রকৃত পরীক্ষার ফলাফল: মূল্যবৃদ্ধির ক্ষমতায় সামান্য বৃদ্ধি, জেমিনি রাশির মোকাবেলায় এটি কী সক্ষম?

জেমিনিকে ছাড়িয়ে যাওয়ার জন্য ডিজাইন করা GPT 5.2, আজ সকালে আনুষ্ঠানিকভাবে প্রকাশিত হয়েছে এবং সমস্ত ব্যবহারকারীর জন্য চালু করা হয়েছে।

আমি গত মাসে আমার ChatGPT Plus সাবস্ক্রিপশন বাতিল করে Gemini তে স্যুইচ করেছি। GPT-5.2 এর কারণে কি আমাকে এখনই এটিতে ফিরে যেতে হবে?

নেটিজেনদের দ্বারা ভাগ করা এই বাস্তব ব্যবহারকারীর অভিজ্ঞতা এবং APPSO-এর ব্যবহারিক পরীক্ষা পড়ার পরে, আপনি একটি উত্তর খুঁজে পেতে পারেন।

▲ এবার আমি অবশেষে টেবিলটি ভুল আঁকিনি।

GPT 5.2 আসলে তিনটি মডেল আপডেট করে: GPT-5.2 Instant, Thinking, এবং Pro। আপনি যদি Gemini 3.0 Pro-তে প্রতিটি প্রশ্নোত্তরের সাথে জড়িত চিন্তাশীল বিবেচনায় অভ্যস্ত হন, তাহলে আপনি দেখতে পাবেন যে ChatGPT-এর চিন্তাভাবনার গতি ধীর এবং GPT-5.2 Thinking/Pro ব্যবহার শুরু করার সময় আগের তুলনায় বেশি সময় নেয়।

সোশ্যাল মিডিয়ায় প্রাথমিক অ্যাক্সেস থাকা বেশিরভাগ ব্যবহারকারীর দ্বারাও এটিই প্রতিক্রিয়া। অন্য কথায়, GPT-5.2 প্রতিটি দিক থেকে 5.1 এর তুলনায় একটি উন্নতি, এবং GPT-5.2 Pro পেশাদার অনুমানমূলক কাজের জন্য খুবই উপযুক্ত যা সম্পূর্ণ করতে দীর্ঘ সময় লাগে; তবে, ফলাফলের জন্য অপেক্ষার সময় দীর্ঘ হয়ে যায়।

উদাহরণস্বরূপ, একজন ব্যবহারকারী শেয়ার করেছেন যে যখন তারা "HLE পরীক্ষার স্কোরের একটি চার্ট আঁকতে আমাকে সাহায্য করুন" প্রম্পটে প্রবেশ করেছিলেন, তখন GPT-5.2 Pro-এর চার্ট তৈরি করতে পুরো 24 মিনিট সময় লেগেছিল।

▲ছবির উৎস: https://x.com/emollick/status/1999185755617300796/photo/1

সৌভাগ্যবশত, সমস্ত তথ্য সঠিক ছিল, এবং চার্টের সেরা ফলাফলেও জেমিনি 3.0 প্রো দেখা গেছে।

এর কারণ হল GPT-5.2 এর জ্ঞানের মেয়াদ শেষ হওয়ার তারিখ আগস্ট ২০২৫ এ স্থানান্তরিত হয়েছে , যেখানে GPT-5.1 এর জ্ঞানের মেয়াদ শেষ হওয়ার তারিখ ছিল সেপ্টেম্বর ২০২৪, এবং গত মাসে প্রকাশিত জেমিনি ৩.০ এর জ্ঞানের মেয়াদ শেষ হওয়ার তারিখ হল ২০২৫.১।

যখন আমরা GPT-5.2 Thinking ব্যবহার করে OpenAI এর মডেল রিলিজ ইতিহাসের একটি চার্ট তৈরি করি, তখন খুব বেশি সময় লাগেনি এবং তথ্যটি বেশ নির্ভুল ছিল। সাধারণ কাজের জন্য, Thinking মডেল ব্যবহারে যে সময় লাগে তা Pro মডেলের থেকে উল্লেখযোগ্যভাবে আলাদা।

▲ প্রম্পট: সময়ের সাথে সাথে OpenAI মডেল রিলিজের একটি চার্ট গ্রাফ তৈরি করুন

"অতি-উচ্চ তীব্রতা" যুক্তি এবং সর্বশেষ বিশ্ব জ্ঞান, চিত্রের মাল্টিমোডাল বোঝাপড়া এবং যুক্তি ক্ষমতার সাথে মিলিত হয়ে, GPT 5.2 দ্রুত বৃহৎ মডেল অঙ্গনে দ্বিতীয় স্থানে উঠে এসেছে। GPT-5.2-High WebDev (ওয়েব ডেভেলপমেন্ট) প্রকল্পে দ্বিতীয় স্থান অধিকার করেছে , যেখানে GPT-5.2 ষষ্ঠ স্থান অধিকার করেছে। তুলনামূলকভাবে, Gemini 3.0 Pro তৃতীয় স্থানে রয়েছে, যেখানে Claude এখনও শীর্ষ স্থান ধরে রেখেছে।

LMArena একটি পরীক্ষামূলক ভিডিওও প্রকাশ করেছে যেখানে তারা GPT-5.2 ব্যবহার করে অত্যন্ত উচ্চ স্তরের নির্ভুলতার সাথে 3D মডেলিং কাজগুলির একটি সিরিজ সম্পন্ন করতে দেখায়। তবে, কিছু নেটিজেন নীচে মন্তব্য করেছেন, "এটি কি এখনও 2003 সালের?"

▲ভিডিও সূত্র: https://x.com/arena/status/1999189215603753445

three.js ব্যবহার করে অর্জিত এই 3D ইফেক্টের জন্য মডেলের উচ্চ মাত্রার মাল্টিমোডাল বোঝাপড়া এবং যুক্তি ক্ষমতা প্রয়োজন, সেইসাথে প্রোগ্রামিং ডেভেলপমেন্ট এবং প্রোগ্রাম ডিজাইনে অপ্টিমাইজেশন প্রয়োজন; GPT-5.2 এই 0.1 আপগ্রেডের জন্য যথেষ্ট মূল্যবান।

বর্তমানে, নেটিজেনদের দ্বারা ভাগ করা অনেক পরীক্ষা মূলত সম্পূর্ণ 3D ইঞ্জিন তৈরির উপর দৃষ্টি নিবদ্ধ করে এবং GPT-5.2 খুব ভালো পারফর্ম করে। উদাহরণস্বরূপ, GPT-5.2 থিংকিং-এর উচ্চ-কঠিন যুক্তি মোড ব্যবহার করেও পরীক্ষা করা হয়, যা একটি একক-পৃষ্ঠার ফাইলে, একটি 3D স্নোই আইস কিংডম মডেল তৈরি করে যা ইন্টারেক্টিভ নিয়ন্ত্রণ সমর্থন করে এবং 4K রেজোলিউশনে রপ্তানি করা যেতে পারে।

▲ https://x.com/skirano/status/1999182295685644366

GPT-5.2 Pro ব্যবহার করে তৈরি করা 3D টার্বাল গথিক সিটি বিল্ডিংও রয়েছে।

▲প্রম্পট শব্দ: টুইগল-ডট-অ্যাপে চলতে পারে এমন একটি দৃশ্যত আকর্ষণীয় শেডার তৈরি করুন যা এটিকে নব্য-গথিক টাওয়ারের একটি অসীম শহরের মতো করে তুলবে যা বড় ঢেউয়ের সাথে ঝড়ো সমুদ্রে আংশিকভাবে ডুবে যাবে।｜সূত্র: https://x.com/emollick/status/1999185085719887978?s=20

3D বোঝাপড়া এবং যুক্তির ক্ষমতা সম্পর্কে, আমরা জেমিনি 3.0 প্রো প্রকাশের পরে ইয়ান গুডফেলোর ব্যবহৃত প্রম্পটটিও ব্যবহার করেছি, যা একটি ছবি আপলোড করার জন্য এবং তারপর মডেলটিকে ছবির উপর ভিত্তি করে একটি সুন্দর ভক্সেল আর্ট Three.js একক-পৃষ্ঠার অ্যাপ্লিকেশন দৃশ্য তৈরি করতে বলে।

▲ যেহেতু ChatGPT ক্যানভাসের মধ্যে আমার জন্য এটি তৈরি করেনি, তাই আমি ডায়ালগ বক্সে এটি তৈরি করা কোডটি কপি করে HTML ভিউতে খুললাম, যেমনটি ডানদিকের ছবিতে দেখানো হয়েছে।

পার্থক্যটা বেশ স্পষ্ট। যদিও ChatGPT আপলোড করা ছবির বিষয়বস্তুও পড়েছে—একটি গোলাপী বই, একটি সবুজ ক্ষেত্র, একটি ধূসর ডুবন্ত রঙ এবং সাদা জল—তবে এটি যে 3D অ্যানিমেশন তৈরি করেছে তা Gemini 3.0 Pro-এর তুলনায় কিছুটা প্রাথমিক ছিল।

আমি শুধু এটুকু বলতে পারি যে আল্ট্রাম্যান এই "রেড অ্যালার্ট" জারি করা জেমিনির আসল গুণাবলী প্রদর্শন করে।

প্রোগ্রামিং দক্ষতা পরীক্ষা করার জন্য অবশ্যম্ভাবীভাবে ক্লাসিক ষড়ভুজাকার বল পদার্থবিদ্যার সিমুলেশন জড়িত। একজন ব্লগার সম্পূর্ণ আলোকিত লাল 3D বল ব্যবহার করে এই জটিলতা আরও বাড়িয়ে দিয়েছেন। এর প্রভাবটি দেখতে খুবই চমৎকার, এবং অনেক নেটিজেন জিজ্ঞাসা করছেন যে এটি কীভাবে অর্জন করা হয়েছিল; তবে, কেউ কেউ উল্লেখ করেছেন যে এই বলগুলি মাধ্যাকর্ষণ দ্বারা প্রভাবিত হয় না বলে মনে হচ্ছে।

তারপর কিছু নেটিজেন উত্তর দিলেন যে এটি স্থানের অনুকরণ করছে।

▲ভিডিও সূত্র: https://x.com/flavioAd/status/1999183432203567339

এছাড়াও একটি SVG কোড পরীক্ষা এবং একটি পেলিক্যান সাইকেল চালাচ্ছে।

▲ ছবির উৎস: https://arena.jit.dev/

কিছু নেটিজেন আরও জানিয়েছেন যে তারা GPT-5.2 ব্যবহার করে একটি বন অগ্নি সিমুলেটর তৈরি করেছেন, যা আগুন জ্বালানোর গতি, এলাকার আকার এবং পরিসর ইত্যাদি সামঞ্জস্য করতে পারে।

▲ছবির উৎস: https://x.com/1littlecoder/status/1999191170581434557?s=20

আমরা গ্রহ সংকেতের জন্য একটি ওয়েবপেজ তৈরি করেছি, যার লেআউট প্রায় এই বন আগুনের দৃশ্যায়ন ওয়েবপেজের মতোই। একমাত্র পার্থক্য হল বাম দিকে প্রদর্শিত বিষয়বস্তু বিক্ষিপ্ত তারা থেকে মহাকাশীয় বস্তুতে পরিবর্তিত হয়েছে।

▲প্রম্পট শব্দ: একটি স্যাটেলাইট সিস্টেমের একটি ইন্টারেক্টিভ HTML, CSS এবং জাভাস্ক্রিপ্ট সিমুলেশন তৈরি করুন যা গ্রাউন্ড রিসিভারগুলিতে সংকেত প্রেরণ করে। সিমুলেশনটিতে একটি স্যাটেলাইট দেখানো উচিত যা পৃথিবীকে প্রদক্ষিণ করে এবং পর্যায়ক্রমে একাধিক দ্বারা প্রাপ্ত সংকেত প্রেরণ করে।

আমরা GPT-5.2 পরীক্ষা করার জন্য Gemini 3 দিয়ে তৈরি ইনস্ট্যান্ট ক্যামেরাটিও ব্যবহার করেছি। আমরা একই প্রম্পটগুলি প্রবেশ করিয়েছি, এটিকে একটি রেট্রো ইনস্ট্যান্ট ক্যামেরা-স্টাইলের ওয়েব অ্যাপ্লিকেশন তৈরি করতে বলেছি।

▲প্রম্পট: একটি রেট্রো-স্টাইলের স্কিউওমরফিক সিঙ্গেল-পেজ ক্যামেরা অ্যাপ তৈরি করুন। পৃষ্ঠার পটভূমি কর্কবোর্ড বা গাঢ় কাঠের শস্যের উপাদান হিসাবে ডিজাইন করা উচিত। সম্পূর্ণরূপে CSS বা SVG দিয়ে আঁকা একটি স্কিউওমরফিক ইনস্ট্যান্ট ক্যামেরা মডেল নীচের বাম কোণে স্থির করা উচিত, লেন্স এলাকাটি রিয়েল-টাইমে ব্যবহারকারীর ক্যামেরা ভিউ প্রদর্শন করবে। ইন্টারঅ্যাকশন লজিকের পরিপ্রেক্ষিতে, ব্যবহারকারী যখন শাটার বোতামে ক্লিক করেন, তখন একটি শাটার সাউন্ড এফেক্ট বাজানো উচিত এবং ক্যামেরার উপরের দিক থেকে ধীরে ধীরে সাদা সীমানা সহ একটি ফটো পেপার বেরিয়ে আসা উচিত। CSS ফিল্টার ব্যবহার করে উঠতি ছবিটিকে প্রাথমিকভাবে অত্যন্ত ঝাপসা এবং কালো এবং সাদা করতে হবে, 5 সেকেন্ডের মধ্যে মসৃণভাবে একটি পরিষ্কার, পূর্ণ-রঙের অবস্থায় রূপান্তরিত করতে হবে। অবশেষে, সমস্ত উন্নত ছবি টেনে আনা উচিত, ব্যবহারকারীদের এলোমেলোভাবে সামান্য ঘূর্ণন কোণ এবং ছায়া সহ পৃষ্ঠার যেকোনো জায়গায় অবাধে স্থাপন করার অনুমতি দেয়। একটি ছবিতে ক্লিক করলে এটি উপরে রাখা উচিত, একটি বাস্তবসম্মত মুক্ত-ফর্ম ফটো কোলাজ ওয়াল তৈরি করা উচিত।

কিছুটা আশ্চর্যজনকভাবে, ChatGPT একবারে তাৎক্ষণিক ছবিও তুলতে পারে।

আমরা যখন আগে জেমিনি ৩.০ প্রো পরীক্ষা করেছিলাম, তখন এর সবচেয়ে শক্তিশালী ক্ষমতা ছিল প্রোগ্রামিং এবং এতে আমাদের অনেক প্রম্পট ইনপুট করার প্রয়োজন ছিল না। আমরা কেবল এটির একটি স্ক্রিনশট বা ভিডিও দিতে পারি এবং এটিকে এটি প্রতিলিপি করতে বলতে পারি, এবং জেমিনি এটি করতে পারে।

এবার, আমরা এটিকে একটি ভিডিওও দিয়েছি এবং এই প্রাচীন কবিতাটি তৈরি করে এমন ওয়েবপৃষ্ঠাটি প্রতিলিপি করতে বলেছি।

▲ https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

GPT-5.1 এর তুলনায়, যা আমার আপলোড করা ভিডিওগুলির রঙের স্কিম সম্পর্কে সম্পূর্ণ অজ্ঞ ছিল, এবার মনে হচ্ছে এটি কিছু শিখেছে। তবে, যেহেতু জেমিনি-জেনারেটেড ওয়েব পৃষ্ঠাগুলি তার API এর মাধ্যমে সরাসরি AI কার্যকারিতা অন্তর্ভুক্ত করতে পারে, তাই ChatGPT এখনও এই জেনারেটেড ওয়েব পৃষ্ঠাগুলিতে AI সংহত করেনি। অতএব, এখানে কবিতাগুলি কেবলমাত্র কয়েকটি হতে পারে যা ইতিমধ্যে লেখা হয়েছে।

ক্লাসিক প্রোগ্রামিং ক্ষমতা পরীক্ষা এবং কেবল একটি একক-পৃষ্ঠার HTML ফাইল তৈরি করার পাশাপাশি, কিছু ব্যবহারকারী পাইথন কোড লেখার জন্যও এটি ব্যবহার করেন।

ব্যবহারকারীর দ্বারা প্রদত্ত পরামর্শটি ছিল "একটি পাইথন কোড লিখুন যা কল্পনা করে যে কীভাবে একটি একমুখী রাস্তায় ট্র্যাফিক লাইট কাজ করে যেখানে গাড়িগুলি এলোমেলোভাবে প্রবেশ করে।"

তিনি GPT 5.2 Extended Thinking এবং Claude Opus 4.5 উভয়ই পরীক্ষা করেছিলেন এবং ফলাফল স্পষ্ট ছিল। এটা বলা নিরাপদ যে আমাদের প্রায়শই জিজ্ঞাসা করা হয় কোন প্রোগ্রামিং মডেলটি সেরা, এবং ডেভেলপারদের মধ্যে ক্লড এত জনপ্রিয় হওয়ার একটি কারণ রয়েছে।

▲ নিচে GPT-5.2 দেওয়া হল, উৎস: https://x.com/diegocabezas01/status/1999228052379754508

তাছাড়া, ক্লড মডেলের আগের সবচেয়ে বড় অসুবিধা ছিল এর উচ্চ মূল্য। ক্লড ওপাস ৪.৫ এর দাম ছিল প্রতি মিলিয়ন টোকেনের ইনপুট হিসেবে ৫ ডলার এবং আউটপুট হিসেবে ২৫ ডলার। এখন, জিপিটি-৫.২ এর দাম বেড়েছে, এবং এটি জিপিটি-৫.১ এর তুলনায় প্রায় ৪০% বেশি। জিপিটি-৫.২ প্রো এর ইনপুট হিসেবে প্রতি টোকেনের দাম ২১ ডলার এবং আউটপুট হিসেবে প্রতি টোকেনের দাম ১৬৮ ডলার।

ওপেনএআই তাদের অফিসিয়াল রিলিজ ব্লগে উল্লেখ করেছে যে জিপিটি-৫.২ তাদের ইমেজ প্রসেসিং ক্ষমতাও উন্নত করেছে।

GPT-5.2 থিংকিং হল আমাদের এখন পর্যন্ত সবচেয়ে শক্তিশালী ভিজ্যুয়াল মডেল, যা গ্রাফ রিজনিং এবং সফ্টওয়্যার ইন্টারফেস বোঝাপড়ায় ত্রুটির হার প্রায় অর্ধেক কমিয়ে এনেছে।

এটি AI ব্যবহার করে একটি মাদারবোর্ডে কিছু বক্সযুক্ত চিহ্ন যুক্ত করার একটি উদাহরণও প্রদান করে যা দেখতে ঝাপসা দেখায়; GPT-5.1 এর তুলনায়, GPT-5.2, যদিও এটি ভুলও করে, আরও বেশি এলাকা চিহ্নিত করে।

কিন্তু ন্যানো ব্যানানা প্রো সম্পর্কে কী বলা যায়? কিছু ব্যবহারকারী ন্যানো ব্যানানা প্রো ব্যবহার করে ছবি থেকে টীকা মুছে ফেলেছেন এবং তারপর নতুন টার্গেট লোকেশন বক্স যোগ করতে বলেছেন। আপনার মতে কোনটি ভালো?

▲বাম থেকে ডানে: GPT-5.1, GPT-5.2, ন্যানো ব্যানানা প্রো | ছবির উৎস: https://x.com/bcaine/status/1999212747213656072

আমার অনুভূতি হল যে ChatGPT "নিজেকে অপমান করছে" যেখানে অন্যরা শ্রেষ্ঠত্ব অর্জন করে। ন্যানো ব্যানানা এখন চিত্র-সম্পর্কিত কাজে অবিসংবাদিত নেতা, যদিও GPT-5.2-তে আরও টীকা সম্পর্কিত তথ্য রয়েছে, অনেক বাউন্ডিং বাক্স এখনও সঠিকভাবে অবস্থিত নয়।

পূর্ববর্তী প্রজন্মের GPT-5.1 এর তুলনায় প্রোগ্রামিং এবং ইমেজ প্রসেসিংয়ে উল্লেখযোগ্য উন্নতি দেখা গেছে। আপনি যদি কিছুদিন ধরে ChatGPT ব্যবহারকারী হয়ে থাকেন, তাহলে আপগ্রেডের পরে আপনি সরাসরি পার্থক্যটি অনুভব করতে পারবেন। তবে, অন্যান্য মডেলের তুলনায়, প্রোগ্রামিং এবং ইমেজ প্রসেসিংয়ের ক্ষেত্রে, এটি এখনও ন্যানো ব্যানানার প্রথম প্রকাশের সময় যে আধিপত্য অর্জন করেছিল তা অর্জন করতে পারেনি।

নান্দনিক ওয়েব ডিজাইনের ক্ষেত্রে, কিছু নেটিজেন GPT-5.2 ব্যবহার করে তৈরি কিছু ফ্রন্ট-এন্ড ওয়েব পেজ শেয়ার করেছেন। দেখা যাক এবার আবার ফ্রন্ট-এন্ড প্রোগ্রামারদের টেনে বের করে "হত্যা" করা হবে কিনা।

▲ছবির উৎস: https://x.com/secondfret/status/1999235822034547011

পূর্বে সর্বব্যাপী গ্রেডিয়েন্ট বেগুনির তুলনায়, GPT-5.2 এর নকশা স্তর প্রকৃতপক্ষে উন্নত হয়েছে। যাইহোক, ব্লগার নিজেই যেমন বলেছেন, GPT-5.2 বিশেষ করে স্ক্রিনে বর্গক্ষেত্র আঁকতে পছন্দ করে, যেখানে সর্বত্র গ্রিডের স্তর থাকে।

ডিজাইনের ক্ষমতা সম্পর্কেও একটি বিশেষ তালিকা রয়েছে। GPT-5.2 এক লাফ এগিয়েছে, GPT-5.1 থেকে লাফিয়ে তৃতীয় স্থানে উঠে এসেছে, যা আগে শীর্ষ দশের বাইরে ছিল। তবে, সর্বোচ্চ স্কোর এখনও Gemini 3.0 Pro।

▲ ছবির উৎস: https://www.designarena.ai/leaderboard

আমরা GPT-5.2 কে "উচ্চমানের" ওয়েবসাইট তৈরির জন্য কিছু প্রয়োজনীয়তাও দিয়েছিলাম, বিশেষ করে একটি AI কোম্পানির হোমপেজের জন্য। ফলাফল? GPT-5.2 সত্যিই বাক্স ব্যবহার করতে পছন্দ করে; এবং আমি আবার গ্রেডিয়েন্ট পার্পল দিয়ে শেষ করেছি।

▲প্রম্পট শব্দ: ফ্রন্ট-এন্ড ডিজাইন এবং ডেভেলপমেন্টে বিশ্বের অত্যাধুনিক উদ্ভাবনের জন্য আপনি শীর্ষ 0.1% ডিজাইনার এবং ডেভেলপার। আপনাকে AI কোম্পানির জন্য আপলোড করা ছবির স্টাইলিংয়ে {WebGL + ThreeJs} ব্যবহার করে {Dither + Shaders} দিয়ে একটি সম্পূর্ণ ল্যান্ডিং পৃষ্ঠা তৈরি করার দায়িত্ব দেওয়া হয়েছে। – মূলত ডিজাইন অংশে মনোযোগ দিন, ডেভেলপমেন্ট নয়। সমস্ত প্রয়োজনীয় ফাইল এবং লাইব্রেরি আমদানি করুন: Three.js, WebGL, GSAP, 3D ডেভেলপমেন্ট সম্পর্কিত অন্য কোনও অ্যানিমেশন লাইব্রেরি।

পরিশেষে, লেখার ক্ষেত্রে, উন্নত অভিজ্ঞতা সম্পন্ন কিছু ব্যবহারকারীর প্রতিক্রিয়া অনুসারে, GPT-5.2 কিছু দীর্ঘ উপন্যাস তৈরি সম্পূর্ণ করার ক্ষমতা অর্জন করতে শুরু করেছে।

উদাহরণস্বরূপ, যখন ChatGPT কে ৫০টি প্লট আইডিয়া তৈরি করতে বলা হয়, তখন এটি অন্যান্য মডেলের মতো শুধুমাত্র একটি অংশ তৈরি করার পরিবর্তে সবগুলো সম্পূর্ণ করে। এবং যখন ২০০ পৃষ্ঠার একটি বই লিখতে বলা হয়, তখন ChatGPT কেবল বলে না যে এটি এটি করতে পারে না; বরং, এটি আসলে চেষ্টা করে, কেবল পুরো বইয়ের কাঠামো তৈরি করার জন্য নয় বরং একটি PDF ফাইল তৈরি করার জন্যও।

নেটিজেনরা মন্তব্য করেছেন যে যদিও পৃষ্ঠাগুলি নিজেই বেশ পাতলা এবং বইটি ছোট… সর্বোপরি, বর্তমানে এটির পক্ষে এমন একটি উপন্যাস লেখা অসম্ভব যা একবারে প্রকাশিত হতে পারে, কিন্তু এটি আসলে এটি শুরু করতে পারে, ৫০টি ধারণা দেয় এবং ২০০ পৃষ্ঠার একটি বই লিখে, এটি দেখায় যে এর চিন্তাভাবনার যথেষ্ট গভীরতা রয়েছে।

GPT-5.2 এর সবচেয়ে উল্লেখযোগ্য দিক হলো এর নির্দেশাবলী খুব ভালোভাবে অনুসরণ করার ক্ষমতা… আমি যা বলি তা কেবল মূলত করে না, বরং আমি যে কাজটি বর্ণনা করেছি তা বাস্তবে সম্পন্ন করে।

GPT-5.2 এখন ধীরে ধীরে সকল ব্যবহারকারীর জন্য চালু করা হবে। আপনার ব্যবহারিক অভিজ্ঞতা কেমন?

GPT-5.2 তে আপগ্রেড করাটা আমাকে Gemini থেকে স্যুইচ করার জন্য যথেষ্ট ছিল না। যদিও এটি দেখিয়েছিল যে এটি অনেক লিডারবোর্ড ভেঙেছে, নিজস্ব এবং পাবলিক উভয় পরীক্ষায়ই ভালো ফলাফল অর্জন করেছে, প্রকৃত অভিজ্ঞতার অভাব ছিল। 3D প্রোগ্রাম জেনারেশন অংশে, কোড ত্রুটিগুলি ঘন ঘন ছিল এবং সামগ্রিক নান্দনিক শৈলীতে কোনও উল্লেখযোগ্য উন্নতি দেখা যায়নি, সবই দামের জন্য।

▲ নেটিজেনদের তীব্র মন্তব্য

জেমিনিও থামেনি, আল্ট্রাম্যানের উপর চাপ তৈরি করে চলেছে। আজ সকালে, যদিও কোনও নতুন মডেল প্রকাশ করা হয়নি, জেমিনি ডিপ রিসার্চকে পুনরায় ডিজাইন করা হয়েছে এবং এখন API এর মাধ্যমে অ্যাক্সেসযোগ্য। ভবিষ্যতের আপগ্রেডগুলি জেমিনি, গুগল সার্চ এবং নোটবুকএলএম-এর জন্যও উপলব্ধ থাকবে।

নতুন জেমিনি ডিপ রিসার্চ এজেন্ট হিউম্যান লাস্ট এক্সাম (HLE) তে সদ্য প্রকাশিত GPT-5.2 থিংকিং (45.5%) কে 46.4% স্কোর দিয়ে ছাড়িয়ে গেছে এবং গুগলের নিজস্ব ডিপসার্চকিউএ পরীক্ষা এবং ব্রাউজকম্প পরীক্ষায়ও ভালো ফলাফল অর্জন করেছে।

আল্ট্রাম্যানের রেড অ্যালার্ট সম্ভবত আরও কিছুক্ষণের জন্য জারি থাকবে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো