আল্ট্রাম্যান সবেমাত্র GPT-5.4 প্রকাশ করেছে! নেটিজেনরা মন্তব্য করেছেন: “একটি সাধারণ ‘হাই’র দাম $80!”

আল্ট্রাম্যান সবেমাত্র GPT-5.4 প্রকাশ করেছে! নেটিজেনরা মন্তব্য করেছেন: "একটি সাধারণ 'হাই'র দাম $80!"

প্রতিবার যখন আপনি একটি AI টুল খুলবেন, তখন আপনাকে সম্ভবত এক সেকেন্ডের জন্য ভাবতে হবে: এই কাজের জন্য আমার কোন মডেলটি ব্যবহার করা উচিত? কোড লেখা এক জিনিস, তথ্য অনুসন্ধান করা অন্য জিনিস, এবং আপনার কম্পিউটার পরিচালনা করার জন্য AI সাহায্যের জন্য অন্য একটি উইন্ডো খোলার প্রয়োজন।

আজকের পর, এই বিভাজনের অনুভূতি অবশেষে একটি নতুন উত্তর পেয়েছে।

এইমাত্র, OpenAI আনুষ্ঠানিকভাবে GPT-5.4 প্রকাশ করেছে, যা প্রোগ্রামিং, যুক্তি, কম্পিউটার নিয়ন্ত্রণ, ওয়েব অনুসন্ধান এবং মিলিয়ন টোকেন প্রসঙ্গকে একটি একক মডেলে একীভূত করে, ইন্টিগ্রেশনের জন্য এই ক্ষমতাগুলির কোনওটিকেই ত্যাগ না করে।

ওপেনএআই-এর সিইও স্যাম অল্টম্যানও এক্স প্ল্যাটফর্মে একটি ছোট টুইট পোস্ট করেছেন, যেখানে পাঁচটি ক্ষেত্র তুলে ধরা হয়েছে: শক্তিশালী জ্ঞানের কাজ, আরও ভালো ওয়েব অনুসন্ধান, নেটিভ কম্পিউটার নিয়ন্ত্রণ, লক্ষ লক্ষ টোকেন প্রসঙ্গের জন্য সমর্থন এবং প্রতিক্রিয়া প্রক্রিয়া চলাকালীন যেকোনো সময় হস্তক্ষেপ করার ক্ষমতা।

এই কয়েকটি শব্দ গত দুই বছরে কৃত্রিম বুদ্ধিমত্তার প্রয়োগের ক্ষেত্রে পাঁচটি গুরুত্বপূর্ণ সমস্যাকে সঠিকভাবে তুলে ধরে।

জ্ঞানের কাজ: দশের মধ্যে আটবার, কৃত্রিম বুদ্ধিমত্তা পেশাদারদের ছাড়িয়ে যায়।

জ্ঞান কাজে GPT-5.4 এর অগ্রগতি বুঝতে, প্রথমে GDPval বেঞ্চমার্কের নকশা যুক্তি বোঝা প্রয়োজন।

এটি মার্কিন জিডিপিতে সর্বাধিক অবদান রাখে এমন নয়টি শিল্পের ৪৪টি পেশাকে বিস্তৃত করে। কাজগুলি হল বাস্তব-বিশ্বের কাজ যা কর্মক্ষেত্রে প্রতিদিন ঘটে: বিনিয়োগ ব্যাংকের জন্য আর্থিক মডেল লেখা, হাসপাতালের জন্য জরুরি কক্ষের শিফটের সময়সূচী নির্ধারণ করা এবং বিক্রয় দলের জন্য উপস্থাপনা তৈরি করা।

কাজটি সম্পন্ন হওয়ার পর, শিল্পের প্রকৃত অনুশীলনকারীদের অন্ধ পরীক্ষা এবং স্কোরিংয়ের জন্য আউটপুট দেওয়া হয় যাতে দেখা যায় যে AI এর আউটপুট কত শতাংশ মানব সমকক্ষকে ছাড়িয়ে যেতে পারে।

GPT-5.4 এর উত্তর হল 83.0%, অর্থাৎ দশটির মধ্যে আটটিরও বেশি তুলনায়, শিল্প পেশাদাররা বিশ্বাস করেন যে AI এর আউটপুট তার মানব প্রতিরূপের স্তরে পৌঁছেছে বা অতিক্রম করেছে। পূর্ববর্তী প্রজন্ম, GPT-5.2, এর স্কোর ছিল 70.9%, যা প্রায় 13 শতাংশ পয়েন্টের পার্থক্য।

স্প্রেডশিট মডেলিংয়ে এই অগ্রগতি সবচেয়ে স্পষ্ট। GPT-5.4 একজন জুনিয়র ইনভেস্টমেন্ট ব্যাংকিং বিশ্লেষককে মডেলিং টাস্ক সম্পন্ন করার জন্য অনুকরণ করেছে, যার গড় স্কোর 87.3%, যেখানে GPT-5.2 এর জন্য 68.4% এবং GPT-5.3-কোডেক্সের জন্য 79.3%, প্রায় 20 শতাংশ পয়েন্টের পার্থক্য।

হার্ভির বিগল বেঞ্চ পরীক্ষার ফলাফলও সমানভাবে চিত্তাকর্ষক ছিল, GPT-5.4 স্কোর ৯১% ছিল, এবং এটি Mercor-এর APEX-Agents বেঞ্চমার্কেও প্রথম স্থান অধিকার করেছিল।

নির্ভুলতাও একটি উদ্বেগের বিষয়। পেশাদার পরিস্থিতিতে প্রবেশের ক্ষেত্রে হ্যালুসিনেশনের সমস্যা সর্বদাই কৃত্রিম বুদ্ধিমত্তার জন্য সবচেয়ে বড় বাধা হয়ে দাঁড়িয়েছে এবং প্রতিটি শতাংশ হ্রাসের অর্থ হল এটি আরও পরিস্থিতিতে নিরাপদে ব্যবহার করা যেতে পারে।

তথ্য দেখায় যে GPT-5.2 এর তুলনায়, GPT-5.4 এর একটি একক বিবৃতিতে ত্রুটির সম্ভাবনা 33% কম এবং একটি সম্পূর্ণ প্রতিক্রিয়াতে ত্রুটির সম্ভাবনা 18% কম।

প্রোগ্রামিং: একটি মডেল, সমস্ত কোড লেখা এবং পরীক্ষা কভার করা।

GPT-5.4 GPT-5.3-Codex এর প্রোগ্রামিং ক্ষমতাগুলিকে মেইনলাইনে একীভূত করে। ডেভেলপারদের জন্য, এর অর্থ হল কোড লেখার জন্য আপনাকে আর আলাদা মডেল তৈরি করতে হবে না এবং প্রোগ্রামিং ক্ষমতাগুলি কোনওভাবেই আপস করা হবে না।

SWE-Bench Pro বিশেষভাবে বাস্তব-বিশ্বের সফ্টওয়্যার ইঞ্জিনিয়ারিং কাজগুলি পরীক্ষা করার জন্য তৈরি করা হয়েছে। এটি GPT-5.4-এ 57.7%, GPT-5.3-Codex-এ 56.8% এবং GPT-5.2-এ 55.6% স্কোর করে। ইন্টিগ্রেশনের পরে, প্রোগ্রামিং স্কোর আসলে বৃদ্ধি পায়, একই সাথে কম্পিউটার নিয়ন্ত্রণের মতো সাধারণ-উদ্দেশ্য ক্ষমতার একটি সম্পূর্ণ সেটও অর্জন করে, যার ফলে কোনও স্পষ্ট দুর্বলতা খুঁজে পাওয়া প্রায় অসম্ভব হয়ে পড়ে।

এটি চেষ্টা করার পর, সুপরিচিত এআই পর্যালোচনা ব্লগার ড্যান শিপার লিখেছেন: "সাম্প্রতিক সময়ে ওপেনএআই থেকে আমরা যে সেরা পরিকল্পনা ক্ষমতা দেখেছি তা এটি। কোড পর্যালোচনাটিও খুব শক্তিশালী, এবং খরচ ওপাসের প্রায় অর্ধেক।"

তিনি দুটি নির্দিষ্ট মাত্রা উল্লেখ করেছেন। প্রথমত, দীর্ঘমেয়াদী কাজের সাফল্যের জন্য পরিকল্পনা ক্ষমতা অত্যন্ত গুরুত্বপূর্ণ, এবং GPT-5.4 কার্য ভাঙ্গন এবং ক্রমাগত অগ্রগতির ক্ষেত্রে উল্লেখযোগ্যভাবে বেশি সুসংগঠিত। দ্বিতীয়ত, ক্লড ওপাসের তুলনায়, এটির দাম প্রায় অর্ধেক; যেসব ডেভেলপারদের বৃহৎ পরিসরে API কল করতে হয়, তাদের জন্য এই পার্থক্যটি বিলের ক্ষেত্রে খুবই লক্ষণীয় হবে।

কোডেক্সে /fast মোড সক্রিয় করলে GPT-5.4 এর টোকেন জেনারেশন গতি 1.5 গুণ পর্যন্ত বৃদ্ধি পেতে পারে, যার ফলে ব্যবহারকারীরা কোডিং, পুনরাবৃত্তি এবং ডিবাগিংয়ের সময় একটি মসৃণ কর্মপ্রবাহ বজায় রাখতে পারবেন।

একই সময়ে, নতুন প্রবর্তিত পরীক্ষামূলক বৈশিষ্ট্য প্লেরাইট ইন্টারেক্টিভ GPT-5.4 এর প্রোগ্রামিং অভিজ্ঞতাকে আরও এক ধাপ এগিয়ে নিয়ে যায়।

GPT-5.4 ওয়েব বা ইলেকট্রন অ্যাপ্লিকেশন তৈরি করার সময় একটি ভিজ্যুয়াল ব্রাউজারের মাধ্যমে রিয়েল-টাইম ডিবাগিং সক্ষম করে। মডেলটি একই সাথে কোড লিখতে এবং তৈরি করা অ্যাপ্লিকেশনটি পরীক্ষা করতে পারে, একই সাথে ডেভেলপার এবং পরীক্ষক উভয়ের ভূমিকা গ্রহণ করে।

OpenAI একটি উৎকৃষ্ট উদাহরণ প্রদর্শন করেছে: শুধুমাত্র একটি হালকা প্রম্পটের সাহায্যে, GPT-5.4 একটি সম্পূর্ণ আইসোমেট্রিক থিম পার্ক সিমুলেশন গেম তৈরি করেছে, যার মধ্যে রয়েছে একটি টাইল-ভিত্তিক পথ-বিছানো এবং আকর্ষণ নির্মাণ ব্যবস্থা, AI-চালিত দর্শনার্থী নেভিগেশন এবং সারিবদ্ধ আচরণ এবং একটি বিস্তৃত স্কোর যা চারটি মেট্রিক্সে রিয়েল টাইমে গতিশীলভাবে আপডেট করা হয়: তহবিল, দর্শনার্থীর সংখ্যা, সন্তুষ্টি এবং পরিচ্ছন্নতা।

নাট্যকার ইন্টারেক্টিভ পুরো প্রক্রিয়া জুড়ে একাধিক দফা স্বয়ংক্রিয় পরীক্ষার কাজ করেছে, পথ স্থাপন, ক্যামেরা নেভিগেশন, দর্শনার্থীদের প্রতিক্রিয়া এবং UI মেট্রিক্সের সঠিকতা যাচাই করেছে। কোড লেখা থেকে শুরু করে পরীক্ষা এবং গ্রহণযোগ্যতা পর্যন্ত, মডেলটি সম্পূর্ণ প্রক্রিয়াটি স্বায়ত্তশাসিতভাবে সম্পন্ন করেছে।

ব্লগার অ্যাঞ্জেল GPT-5.4 ব্যবহার করে একটি Minecraft ক্লোনও তৈরি করেছিলেন। মডেলটি তৈরি করতে প্রায় ২৪ মিনিট সময় লেগেছিল এবং কোনও ক্র্যাশ ছাড়াই মসৃণভাবে চলেছিল। তিনি টুইট করেছেন, "Minecraft মূলত ক্র্যাক হয়ে গেছে। এখন আমাকে একটি নতুন পরীক্ষা খুঁজে বের করতে হবে।"

হোয়ার্টনের অধ্যাপক ইথান মলিকও প্রাথমিক অ্যাক্সেস পেয়েছিলেন। একই প্রম্পট ব্যবহার করে, তিনি GPT-5.4 Pro-কে Piranesi দ্বারা অনুপ্রাণিত একটি 3D দৃশ্য তৈরি করতে দিয়েছিলেন, কোনও ত্রুটি ছাড়াই, কেবল "Make it better" নির্দেশটি যোগ করেছিলেন। এরপর তিনি ফলাফলটি দুই বছর আগে GPT-4 দ্বারা তৈরি একটি সংস্করণের সাথে পাশাপাশি রেখেছিলেন এবং পার্থক্যটি তাৎক্ষণিকভাবে স্পষ্ট হয়ে ওঠে।

এখনকার চেয়ে কম্পিউটার নিয়ন্ত্রণ করা অনেক ভালো।

GPT-5.4 রিলিজের ক্ষেত্রে এটি সবচেয়ে উল্লেখযোগ্য পরিবর্তন। পূর্বে, OpenAI-এর কম্পিউটার ম্যানিপুলেশন ক্ষমতাগুলি একটি পৃথক মডিউল ছিল, যার মধ্যে মডেলের ভাষা বোঝাপড়া এবং কোড তৈরির মধ্যে একটি স্পষ্ট বিচ্ছেদ ছিল।

দুটি সিস্টেম আগে স্বাধীনভাবে পরিচালিত হত, তথ্য এদিক-ওদিক প্রেরণ করতে হত, যা স্বাভাবিকভাবেই দক্ষতা হ্রাস করত। এখন যেহেতু এই বিচ্ছেদটি চলে গেছে, GPT-5.4 কম্পিউটার নিয়ন্ত্রণ করার সময় মডেলের নিজস্ব যুক্তি ক্ষমতা ব্যবহার করে, যার ফলে রাউন্ডঅবাউট পদ্ধতির প্রয়োজন হয় না।

এটি ওপেনএআই-এর প্রথম পণ্য যা কম্পিউটার ব্যবহারের ক্ষমতাগুলিকে একটি সাধারণ মডেলে স্থানীয়ভাবে একীভূত করে, এবং আমি বিশ্বাস করি এটি এআই এজেন্টদের উপর ভবিষ্যতের আলোচনার জন্য একটি নতুন সূচনা বিন্দু হবে।
বেঞ্চমার্কের ফলাফল দেখায় যে OSWorld-যাচাইকৃত বেঞ্চমার্কগুলি ডেস্কটপ নেভিগেশন ক্ষমতা প্রদর্শন করে, ব্যবহারকারীদের স্ক্রিনশট এবং মাউস/কীবোর্ড ইন্টারঅ্যাকশন ব্যবহার করে বাস্তব অপারেটিং সিস্টেমের কাজগুলি সম্পন্ন করতে সক্ষম করে। GPT-5.4 সাফল্যের হার 75.0% অর্জন করেছে, যেখানে মানব বেসলাইনের জন্য 72.4% এবং GPT-5.2 এর জন্য 47.3% ছিল।

সংক্ষেপে, এটি কেবল মানুষের সাথেই তাল মিলিয়েছে না, বরং তাদের ছাড়িয়েও গেছে।

অনলাইন-মাইন্ড২ওয়েব বেঞ্চমার্কে, যা শুধুমাত্র স্ক্রিনশট মোড ব্যবহার করে ব্রাউজার নিয়ন্ত্রণ পরীক্ষা করে, GPT-5.4 ৯২.৮% অর্জন করেছে, যেখানে তুলনামূলক লক্ষ্য, ChatGPT Atlas, এজেন্ট মোডে ৭০.৯% অর্জন করেছে।

বাস্তব জগতের স্থাপনার উদাহরণগুলিই নিজেদের কথা বলে। মেইনস্টে প্রায় 30,000 সম্পত্তি কর পোর্টালে স্বয়ংক্রিয় ফর্ম পূরণের জন্য GPT-5.4 ব্যবহার করেছে, প্রথমবারের সাফল্যের হার 95% এবং তিনটি প্রচেষ্টার মধ্যে 100% সাফল্যের হার অর্জন করেছে, যেখানে পূর্ববর্তী অনুরূপ মডেলগুলির জন্য মাত্র 73% থেকে 79% সাফল্যের হার ছিল। সেশন সমাপ্তির গতি প্রায় তিনগুণ বৃদ্ধি পেয়েছে এবং টোকেন ব্যবহার প্রায় 70% হ্রাস পেয়েছে।

এটি চাক্ষুষ উপলব্ধি ক্ষমতার উন্নতির সাথে অবিচ্ছেদ্য। একটি কম্পিউটার নিয়ন্ত্রণ করা শেষ পর্যন্ত "স্পষ্টভাবে দেখা" – ইন্টারফেসে কী আছে, বোতামগুলি কোথায় আছে এবং ক্লিকগুলি সঠিক কিনা তা স্পষ্টভাবে দেখা।

GPT-5.4 এই স্তরে নির্দিষ্ট উন্নতি করেছে, একটি মূল চিত্র ইনপুট মোড প্রবর্তন করেছে যা সর্বোচ্চ 10.24 মিলিয়ন পিক্সেল বা 6,000 পিক্সেল পার্শ্ব দৈর্ঘ্য সহ উচ্চ-বিশ্বস্ততা চিত্র ইনপুট সমর্থন করে; মূল উচ্চ মোডের উপরের সীমাটি পূর্ববর্তী মান থেকে সর্বোচ্চ 2.56 মিলিয়ন পিক্সেল বা 2,048 পিক্সেল পার্শ্ব দৈর্ঘ্যে বৃদ্ধি করা হয়েছে।

টুল ব্যবহার এবং ওয়েব অনুসন্ধান: স্থায়িত্ব হল মূল প্রতিযোগিতামূলকতা

একটি জটিল এআই এজেন্ট সিস্টেমকে কয়েক ডজন এমসিপি টুল দ্বারা সমর্থিত করা যেতে পারে। অতীতে, পদ্ধতিটি ছিল প্রতিটি কথোপকথন শুরু হওয়ার আগে সিস্টেমে সমস্ত টুলের বিবরণ ক্র্যাম করা, টুলগুলি ব্যবহার করা হবে কিনা তা নির্বিশেষে, এবং প্রথমে টোকেনগুলি ব্যয় করা।

GPT-5.4 একটি ভিন্ন পদ্ধতি গ্রহণ করে: প্রথমত, এটি মডেলটিকে সরঞ্জামগুলির একটি সহজ তালিকা প্রদান করে (অর্থাৎ, এটি একটি সরঞ্জাম অনুসন্ধান প্রক্রিয়া প্রবর্তন করে)। যখন কোনও সরঞ্জামের আসলে প্রয়োজন হয়, তখন তার বিস্তারিত বিবরণ পুনরুদ্ধার করা হয়। একবার ব্যবহৃত সরঞ্জামগুলি সরাসরি ক্যাশে করা যেতে পারে যাতে পরের বার আবার পুনরুদ্ধার করার প্রয়োজন না হয়।

৩৬টি MCP সার্ভারের সম্পূর্ণ কনফিগারেশন সক্ষম করে ২৫০টি কাজের পরীক্ষায়, টুল সার্চ মোড একই নির্ভুলতা বজায় রেখে মোট টোকেন খরচ ৪৭% কমিয়েছে। কোনও নির্ভুলতা ছাড়াই প্রায় অর্ধেক খরচ সাশ্রয় হয়েছে।

ওয়েব অনুসন্ধানে, GPT-5.4 BrowseComp বেঞ্চমার্কে 82.7% স্কোর করেছে, যা GPT-5.2 এর 65.8% এর চেয়ে 17 শতাংশ বেশি, প্রো সংস্করণটি 89.3% এ পৌঁছেছে, যা একটি নতুন শিল্প রেকর্ড স্থাপন করেছে। Zapier-এর CEO মন্তব্য করেছেন যে GPT-5.4 অন্যান্য মডেলগুলি যেখানে হাল ছেড়ে দেয় সেখানে অনুসন্ধান চালিয়ে যায়, এটি তাদের পরীক্ষা করা সবচেয়ে স্থায়ী মডেল।

মিলিয়ন টোকেন প্রসঙ্গ: দীর্ঘ দীর্ঘ দীর্ঘ দীর্ঘ দীর্ঘ দীর্ঘ

GPT-5.4 তার API-তে ১০ লক্ষ টোকেন পর্যন্ত কনটেক্সট উইন্ডো সমর্থন করে, যার অর্থ একটি সম্পূর্ণ প্রকল্পের জন্য সমস্ত প্রাসঙ্গিক ডকুমেন্টেশন একটি একক কথোপকথনে জমা করা যেতে পারে। তবে, পরীক্ষার ফলাফলের উপর ভিত্তি করে, ১২৮K থেকে ২৭২K হল সবচেয়ে স্থিতিশীল কর্মক্ষমতা পরিসর, যা দৈনন্দিন ব্যবহারের জন্য উপযুক্ত।

নির্ভুলতা ২৫৬K এর উপরে হ্রাস পেতে শুরু করে, ব্যবহারের আগে নির্দিষ্ট কাজের জন্য যাচাইকরণের প্রয়োজন হয়। ৫১২K থেকে ১M পরিসরে স্কোর ৩৬.৬% এ নেমে আসে, যা বর্তমানে আরও পরীক্ষামূলক এবং উচ্চ নির্ভুলতার প্রয়োজন এমন উৎপাদন কাজে সরাসরি ব্যবহারের জন্য অনুপযুক্ত।

আরেকটি বাস্তবিক খরচের বিষয় হলো, ২৭২ হাজারের বেশি অনুরোধ কোটার বিপরীতে ব্যবহারের হারের দ্বিগুণ হারে গণনা করা হবে। অন্য কথায়, অত্যধিক দীর্ঘ প্রেক্ষাপট সহ একটি অনুরোধ পাঠানোর ফলে দুটি সাধারণ অনুরোধের সমান পরিমাণ কোটা খরচ হয়। এই ধরনের অনুরোধ করার আগে আপনার সত্যিই এত দীর্ঘ প্রেক্ষাপটের প্রয়োজন কিনা তা সাবধানতার সাথে বিবেচনা করা উচিত।

ARC-AGI-2 ভিজ্যুয়াল অ্যাবস্ট্রাক্ট রিজনিং বেঞ্চমার্কের ক্ষেত্রে, GPT-5.4 Pro 83.3% স্কোর করেছে, যেখানে পূর্ববর্তী প্রজন্মের GPT-5.2 Pro মাত্র 54.2% স্কোর করেছে।

উদাহরণস্বরূপ, FrontierMath Tier 4 সবচেয়ে কঠিন গাণিতিক মানদণ্ডগুলির মধ্যে একটি হিসাবে ব্যাপকভাবে স্বীকৃত, যেখানে 50টি গবেষণা-স্তরের গাণিতিক সমস্যা রয়েছে যা সমাধান করতে মানব গণিতবিদদের কয়েক সপ্তাহ সময় লাগতে পারে। GPT-5.4 Pro এই মানদণ্ডে 38.0% স্কোর করেছে, যেখানে এর পূর্বসূরীর জন্য 31.3% ছিল।

এই পরিসংখ্যানের মানদণ্ড হল: এক বছর আগে, সেরা ফলাফল ছিল o3 এর 2%, এবং বর্তমান সেরা ওপেন সোর্স মডেল হল 4.2%।

ব্লগার ডিডি টুইট করেছেন যে ২% থেকে ৩৮% পর্যন্ত উন্নীত হওয়া "বিস্ময়কর"। সরঞ্জামের সাহায্যে, হিউম্যানিটি'স লাস্ট এক্সাম GPT-5.4 Pro এর জন্য ৫৮.৭% এবং GPT-5.2 Pro এর জন্য ৫০.০% স্কোর করেছে, যা প্রায় ৯ শতাংশ পয়েন্টের পার্থক্য।

বাস্তবায়নের সময় সমন্বয়, সমাপ্তির পরে পুনর্নির্মাণ নয়।

যারা দীর্ঘ কাজ পরিচালনা করার জন্য AI ব্যবহার করেছেন তাদের সম্ভবত এই অভিজ্ঞতা হয়েছে: মডেলটি দীর্ঘ সময় ধরে কাজ করার পরে, আপনি বুঝতে পারেন যে এটি ভুল দিকে যাচ্ছে এবং আপনাকে আবার নতুন করে শুরু করতে হবে, আপনার সমস্ত সময় নষ্ট করে।

GPT-5.4 Thinking ChatGPT-তে একটি নতুন "ইন্টারপ্ট" বৈশিষ্ট্য প্রবর্তন করে: জটিল কাজগুলি মোকাবেলা করার আগে, মডেলটি একটি কর্ম পরিকল্পনার রূপরেখা উপস্থাপন করে এবং তারপর বাস্তবায়ন শুরু করে। ব্যবহারকারীরা ফলাফলের জন্য অপেক্ষা না করে এবং নতুন করে শুরু না করেই দিকটি সামঞ্জস্য করার জন্য যেকোনো সময় হস্তক্ষেপ করতে পারেন।

এই বৈশিষ্ট্যটি সংশোধন প্রক্রিয়াটিকে "সম্পূর্ণ" থেকে "প্রগতিতে" স্থানান্তরিত করে, যার ফলে একাধিক দফা সহযোগিতার প্রয়োজন এমন কাজের জন্য ব্যবহারকারীর অভিজ্ঞতায় লক্ষণীয় পরিবর্তন আসে। বৈশিষ্ট্যটি বর্তমানে chatgpt.com এবং অ্যান্ড্রয়েড অ্যাপে উপলব্ধ, শীঘ্রই একটি iOS সংস্করণ আসছে।

আজ থেকে, GPT-5.4 ChatGPT Plus, Team এবং Pro ব্যবহারকারীদের জন্য উপলব্ধ, যা ডিফল্ট চিন্তাভাবনা মডেল হিসেবে GPT-5.2 Thinking-কে প্রতিস্থাপন করবে।
GPT-5.2 থিংকিং এই বছরের ৫ জুন আনুষ্ঠানিকভাবে অবসর গ্রহণ না হওয়া পর্যন্ত বজায় থাকবে। এন্টারপ্রাইজ এবং এডু ব্যবহারকারীরা ব্যাকগ্রাউন্ডে তাদের প্রশাসকদের দ্বারা প্রাথমিক অ্যাক্সেস সক্ষম করতে পারবেন, যখন GPT-5.4 Pro প্রো এবং এন্টারপ্রাইজ প্ল্যানে উপলব্ধ।

স্ট্যান্ডার্ড API-এর দাম প্রতি মিলিয়ন টোকেনের জন্য ইনপুটের জন্য $2.50, ক্যাশেড ইনপুটের জন্য $0.25 এবং আউটপুটের জন্য $15। প্রো সংস্করণের দাম প্রতি মিলিয়ন টোকেনের জন্য $30 ইনপুটের জন্য এবং প্রতি মিলিয়ন টোকেনের জন্য $180। ব্যাচ এবং ফ্লেক্স প্রসেসিং স্ট্যান্ডার্ড মূল্যের অর্ধেক দামে দেওয়া হয়, যেখানে প্রায়োরিটি প্রসেসিং স্ট্যান্ডার্ড মূল্যের দ্বিগুণ দামে দেওয়া হয়।

অবশ্যই, শক্তিশালী যুক্তি ক্ষমতারও কিছু খারাপ দিক রয়েছে। হাইপারবোলিক সহ-প্রতিষ্ঠাতা জাস্টিন জিন X প্ল্যাটফর্মে অভিযোগ করেছিলেন যে GPT-5.4 Pro হল সেই মডেল যা তিনি "অতিরিক্ত চিন্তা" করতে সবচেয়ে বেশি পছন্দ করেছিলেন – মাত্র একটি সাধারণ "হাই" পরে এটি গুরুত্ব সহকারে যুক্তি শুরু করে, যা $80 পর্যন্ত জ্বলে ওঠে।

এটি কোনও বিচ্ছিন্ন ঘটনা নয়। অনুমান মডেলের প্রকৃতি নির্দেশ করে যে তারা যেকোনো ইনপুট প্রক্রিয়াকরণের সময় গভীর চিন্তাভাবনায় নিযুক্ত থাকে, এমনকি যদি সমস্যাটির জন্য এটির প্রয়োজন নাও হয়। দৈনন্দিন, হালকা কাজের জন্য, স্ট্যান্ডার্ড সংস্করণটি আরও উপযুক্ত পছন্দ হতে পারে; সত্যিকারের মূল্যবান পরিস্থিতির জন্য প্রো সংস্করণের অনুমান ক্ষমতা সংরক্ষণ করা আরও মূল্যবান।

গত দুই বছর ধরে, AI ক্ষমতা সম্পর্কে আলোচনা মূলত বেঞ্চমার্ক পরীক্ষার স্কোরের "বুদ্ধিমত্তা" এর উপর দৃষ্টি নিবদ্ধ করেছে, কিন্তু GPT-5.4 এর বুদ্ধিমত্তা বাস্তব-বিশ্বের কর্মপ্রবাহে নির্ভরযোগ্যভাবে দায়িত্ব গ্রহণের ক্ষমতাকে বোঝায়।

অতীতে, AI শুধুমাত্র টেক্সট আউটপুট করতে পারত, এবং জিনিসগুলি সম্পন্ন করার জন্য লোকেদের এখনও এটি ম্যানুয়ালি পরিচালনা করতে হত। এখন, মডেলটি একটি ব্রাউজার খুলতে পারে, একটি ফর্ম পূরণ করতে পারে, একটি বোতামে ক্লিক করতে পারে এবং ফলাফল নিজেই রেকর্ড করতে পারে, স্বাধীনভাবে একটি সম্পূর্ণ টাস্ক লুপ সম্পন্ন করতে পারে।

প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে দক্ষ সিস্টেম থেকে কাজ সম্পন্ন করার ক্ষেত্রে দক্ষ সিস্টেমে রূপান্তরিত হচ্ছে AI। এবং এই রূপান্তর বেশিরভাগ মানুষের প্রত্যাশার চেয়ে অনেক দ্রুত ঘটছে।

রেফারেন্স ঠিকানা সংযুক্ত:
https://openai.com/index/introducing-gpt-5-4/

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো