এইমাত্র, নতুন GPT-5.3 মডেলটি জেমিনির সাথে ধাক্কা খেয়েছে। OpenClaw: ধন্যবাদ।

এআই মডেল নামকরণের রহস্যময় জগতে, "ইনস্ট্যান্ট" এবং "লাইট" প্রত্যয়গুলি দীর্ঘদিন ধরে সস্তাতার এক অবর্ণনীয় অনুভূতি বহন করে আসছে।

এর একটা কারণ আছে। অতীতে, এই ধরণের মডেলগুলিকে সাধারণত দ্রুত কিন্তু ধীর-চিন্তাশীল, পাঠ্য সারসংক্ষেপের জন্য খুব কমই পর্যাপ্ত এবং সামান্য জটিল যুক্তিগত কাজের মুখোমুখি হলে অর্থহীন কথা বলার প্রবণতা হিসাবে বিবেচনা করা হত।

সময়ের সাথে সাথে, হালকা ওজনের মডেলগুলি প্রায় "শুধু কাজ করা" এর সমার্থক হয়ে উঠেছে।

ঠিক এখনই, OpenAI এবং Google আবার সংঘর্ষে লিপ্ত হয়েছে, তাদের নিজ নিজ লাইটওয়েট মডেল প্রকাশ করেছে এবং তাদের কঠোর শক্তি দিয়ে এই স্টেরিওটাইপটি উল্টে দেওয়ার চেষ্টা করেছে। এখানে একটি সরলীকৃত সংস্করণ দেওয়া হল:

GPT-5.3 তাৎক্ষণিক: একটি আরও "মানব" বুদ্ধিমান সহকারী যা বিভ্রমের হার উল্লেখযোগ্যভাবে হ্রাস করে, "AI স্বর" কমিয়ে দেয় এবং বিস্তারিত লেখার ক্ষমতা বাড়ায়। যোগাযোগ আরও স্বাভাবিক এবং সুনির্দিষ্ট, যা উচ্চ সামগ্রীর মানের প্রয়োজনীয়তা (লেখা, পেশাদার প্রশ্নোত্তর, উচ্চ-ঝুঁকিপূর্ণ ক্ষেত্র) সহ পরিস্থিতির জন্য উপযুক্ত করে তোলে।
জেমিনি ৩.১ ফ্ল্যাশ-লাইট: সস্তা, দ্রুত এবং দক্ষ, এটি "চিন্তার স্তর" সমন্বয়কেও সমর্থন করে, উচ্চ থ্রুপুট বজায় রাখে এবং গভীর যৌক্তিক যুক্তি প্রদান করে, এটিকে বৃহৎ-স্কেল, উচ্চ রিয়েল-টাইম ব্যাচ টাস্কের জন্য উপযুক্ত করে তোলে (কন্টেন্ট মডারেশন, UI জেনারেশন, NPC সংলাপ)।

GPT-5.3 তাৎক্ষণিক: আমি অবশেষে একজন সাধারণ মানুষের মতো চ্যাট করতে শিখেছি।

যারা ঘন ঘন ChatGPT ব্যবহার করেন তারা সম্ভবত এই হতাশার সম্মুখীন হয়েছেন: আপনি কেবল একটি ছোট প্রশ্ন জিজ্ঞাসা করেন, এবং এটি আপনাকে একটি দীর্ঘ ব্যাখ্যা দেওয়ার জন্য জোর দেয় যেমন, "একটি কৃত্রিম বুদ্ধিমত্তা হিসাবে, আমার আপনাকে মনে করিয়ে দেওয়া দরকার…"

এই ধরণের "এআই-স্টাইল" পদ্ধতি, যা সর্বদা মানুষকে কীভাবে কাজ করতে হয় তা শেখানোর চেষ্টা করে, সত্যিই বেশ বিরক্তিকর। ভাগ্যক্রমে, ওপেনএআই এবার সত্যিই মনোযোগ দিয়েছে।

নতুন প্রকাশিত GPT-5.3 Instant এই "সমস্যা" সমাধানের জন্য অনেক প্রচেষ্টা করেছে। এটি দীর্ঘ ব্যাখ্যা দেওয়ার পরিবর্তে সরাসরি উত্তর দিতে শিখেছে।

কম শব্দচয়ন হওয়ার পাশাপাশি, এটি আরও নির্ভরযোগ্যও হয়ে উঠেছে। পুরনো সংস্করণটি, ওয়েবে অনুসন্ধান করার পরে, প্রায়শই আপনাকে প্রচুর লিঙ্ক এবং অপ্রাসঙ্গিক তথ্য উপস্থাপন করবে।

উন্নত অনুসন্ধান ক্ষমতার জন্য ধন্যবাদ, GPT-5.3 Instant ওয়েবপেজের বিষয়বস্তুকে তার নিজস্ব পটভূমি জ্ঞানের সাথে সক্রিয়ভাবে একত্রিত করে, প্রথমে আপনি আসলে কী জিজ্ঞাসা করতে চান তা খুঁজে বের করার পরে একটি নির্দিষ্ট উত্তর প্রদান করে, কেবল একটি অনুসন্ধান ইঞ্জিনের কাজ আপনাকে আউটসোর্স করার পরিবর্তে।

OpenAI-এর অভ্যন্তরীণ মূল্যায়ন দেখায় যে ইন্টারনেটের সাথে সংযুক্ত থাকাকালীন হ্যালুসিনেশনের হার ২৬.৮% এবং শুধুমাত্র অভ্যন্তরীণ জ্ঞানের উপর নির্ভর করার সময় ১৯.৭% হ্রাস পেয়েছে। সরকারী প্রতিবেদনে স্বাস্থ্যসেবা, আইন এবং অর্থের মতো উচ্চ-ঝুঁকিপূর্ণ ক্ষেত্রগুলির কথা বিশেষভাবে উল্লেখ করা হয়েছে, যেখানে নতুন মডেল সতর্কতা এবং নির্ভুলতা উভয় ক্ষেত্রেই উল্লেখযোগ্য উন্নতি দেখায়।

সবচেয়ে আশ্চর্যজনক বিষয় হল এর লেখার ধরণে পরিবর্তন।

ওপেনএআই একটি কবিতা ব্যবহার করে তুলনা করে এটি ব্যাখ্যা করেছে: উভয় সংস্করণই ফিলাডেলফিয়ার একজন ডাকবাহকের অবসরের শেষ দিন বর্ণনা করে। পুরানো সংস্করণে "তার ডাকব্যাগে শহর বহন করা" এর মতো আবেগঘন বাক্যাংশের স্তূপ থাকে, যখন নতুন সংস্করণে "কাটা নীল রেলিং" এবং "যেখানে একটি কুকুর সর্বদা দরজায় অপেক্ষা করে" বর্ণনা করা হয়েছে। আবেগগুলিকে জোর করে চাপিয়ে দেওয়ার প্রয়োজন নেই; এগুলি কেবল স্বাভাবিকভাবেই প্রবাহিত হয়।

এই আপডেটের মূল লক্ষ্যগুলির মধ্যে একটি হল সুর সামঞ্জস্য করা।

"থামো। গভীর নিঃশ্বাস নাও" এর মতো বাক্যাংশ যা কথোপকথনের প্রবাহকে ব্যাহত করে, ইচ্ছাকৃতভাবে হ্রাস করা হয়েছে, যার ফলে সামগ্রিক স্টাইল আরও সরাসরি এবং অপ্রয়োজনীয় "এআই টোন" কম। ব্যবহারকারীরা এখনও তাদের পছন্দের ইন্টারঅ্যাকশন স্টাইল খুঁজে পেতে সেটিংসে উত্তরের উষ্ণতা এবং উৎসাহ কাস্টমাইজ করতে পারেন।

আজ থেকে সকল ChatGPT ব্যবহারকারীদের জন্য GPT-5.3 Instant উপলব্ধ, যার API নাম "gpt-5.3-chat-latest"। অর্থপ্রদানকারী ব্যবহারকারীরা পুরানো মডেলগুলিতে GPT-5.2 Instant ব্যবহার চালিয়ে যেতে পারেন, তবে এটি আনুষ্ঠানিকভাবে এই বছরের 3রা জুন অবসরপ্রাপ্ত হবে।

▲ বোনাস সময়

জেমিনি ৩.১ ফ্ল্যাশ-লাইট: সস্তা, দ্রুত এবং বেশ স্মার্ট।

GPT-5.3 Instant-এর সহজবোধ্য পদ্ধতির তুলনায়, Gemini 3.1 Flash-Lite সম্পূর্ণ বাস্তববাদী পদ্ধতি গ্রহণ করে, যার লক্ষ্য খুবই স্পষ্ট: দ্রুত এবং সস্তা।

মূল্যের দিক থেকে, জেমিনি ৩.১ ফ্ল্যাশ-লাইটের ইনপুট মূল্য প্রতি মিলিয়ন টোকেনের জন্য $০.২৫ এবং আউটপুট মূল্য প্রতি মিলিয়ন টোকেনের জন্য $১.৫০।

এর অর্থ কী? আপনি যদি একজন ডেভেলপার হন, তাহলে এর অর্থ হল আপনি 2 RMB-এরও কম খরচে পাঁচটি সম্পূর্ণ হ্যারি পটার বইয়ের সমতুল্য AI পড়তে পারবেন।

সস্তা জিনিস ভালো না বলে মনে করেন? এটা একটা সংকীর্ণমনা দৃষ্টিভঙ্গির পরিচয় দেয়।

আর্টিফিশিয়াল অ্যানালাইসিসের বেঞ্চমার্ক পরীক্ষা অনুসারে, পূর্ববর্তী প্রজন্মের জেমিনি ২.৫ ফ্ল্যাশের তুলনায়, ৩.১ ফ্ল্যাশ-লাইটের ফার্স্ট-ওয়ার্ড রেসপন্স টাইম (TTFT) ২.৫ গুণ দ্রুত এবং সামগ্রিক আউটপুট স্পিড ৪৫% দ্রুত। যেসব পণ্যের রিয়েল-টাইম রেসপন্স প্রয়োজন, তাদের ক্ষেত্রে এই ল্যাটেন্সি পার্থক্য ব্যবহারকারীর কাছে লক্ষণীয়ভাবে লক্ষণীয় হবে।

এর মানে হল, যখন আপনি এখনও চোখ বুলিয়ে নিচ্ছেন, তখন এর উত্তর ইতিমধ্যেই অর্ধেক জেনারেটেড হতে পারে। যেসব অ্যাপ্লিকেশনের জন্য রিয়েল-টাইম প্রতিক্রিয়া প্রয়োজন – যেমন তাৎক্ষণিক অনুবাদ, ইন-গেম NPC সংলাপ এবং তাৎক্ষণিক UI জেনারেশন – তাদের জন্য এই কম ল্যাটেন্সি অত্যন্ত গুরুত্বপূর্ণ।

এছাড়াও, জেমিনি ৩.১ ফ্ল্যাশ-লাইটের "চিন্তা" করার ক্ষমতাও রয়েছে।

এআই স্টুডিও এবং ভার্টেক্স এআই-তে, গুগল এই লাইট মডেলটিকে "চিন্তার স্তর" বিকল্প দিয়ে সজ্জিত করেছে। ডেভেলপাররা কাজের জটিলতার উপর ভিত্তি করে মডেলটি কতটা গভীরভাবে "চিন্তা" করে তা সামঞ্জস্য করতে পারেন।

সহজ, উচ্চ-থ্রুপুট কাজগুলি, যেমন ব্যাচ কন্টেন্ট অনুবাদ এবং কন্টেন্ট মডারেশন, সবচেয়ে হালকা কনফিগারেশনের মাধ্যমে দ্রুত সম্পন্ন করা যেতে পারে; যেসব কাজের জন্য নির্দেশাবলীর কঠোরভাবে মেনে চলা প্রয়োজন, যেমন ইন্টারফেস জেনারেশন বা সিমুলেশন তৈরি, মডেলটি ফলাফলগুলিকে দৃঢ় করার জন্য অনুমানের উপর আরও বেশি সময় ব্যয় করতে পারে।

"সবকিছু পাওয়ার" এই ক্ষমতা চিত্তাকর্ষক ফলাফল এনে দিয়েছে। Arena.ai-এর লিডারবোর্ডে, এটি ১৪৩২ এর Elo স্কোর এবং ৮৬.৯% এর GPQA ডায়মন্ড (স্নাতক স্তরের প্রশ্ন উত্তর) নির্ভুলতার হার অর্জন করেছে।

এটি একাডেমিক বেঞ্চমার্ক GPQA ডায়মন্ডে ৮৬.৯% এবং মাল্টিমোডাল আন্ডারস্ট্যান্ডিং MMMU প্রোতে ৭৬.৮% স্কোর করেছে। এই পরিসংখ্যানগুলি কেবল "একই মূল্য পরিসরে ভালো" নয়, বরং বৃহত্তর জেমিনি ২.৫ ফ্ল্যাশকেও ছাড়িয়ে গেছে।

মনে রাখবেন যে এখানে তুলনাটি জেমিনি 2.5 ফ্ল্যাশের সাথে করা হয়েছে, জেমিনি 3 ফ্ল্যাশের সাথে নয়, যা স্পষ্টভাবে দেখায় যে গুগল, ধূর্ত হওয়ায়, এই মডেলের উপর খুব বেশি আস্থা রাখেনি।

বর্তমানে, ফ্ল্যাশ-লাইট ৩.১ ডেভেলপারদের জন্য গুগল এআই স্টুডিও এবং জেমিনি এপিআই-এর মাধ্যমে প্রিভিউ আকারে উপলব্ধ, অন্যদিকে এন্টারপ্রাইজ ব্যবহারকারীরা ভার্টেক্স এআই-এর মাধ্যমে এটি অ্যাক্সেস করতে পারবেন। ল্যাটিটিউড, কার্টহুইল এবং হুইলিং-এর মতো প্রাথমিক অংশীদাররা উৎপাদন পরীক্ষা সম্পন্ন করেছে এবং সাধারণত বৃহৎ-স্কেল কলের অধীনে এর স্থায়িত্ব এবং নির্দেশনা সম্মতি স্বীকার করে।

আপনি যদি এই দুটি মডেল পাশাপাশি দেখেন, তাহলে দেখতে পাবেন যে "ইনস্ট্যান্ট" এবং "লাইট" তাদের সবচেয়ে উপযুক্ত জায়গা খুঁজে পাচ্ছে।

সম্প্রতি জনপ্রিয় OpenClaw-এর উদাহরণ নিন। এর মূল দৃশ্যপট হল ব্যবহারকারীদের ইমেল প্রক্রিয়াকরণ এবং সময়সূচী পরিচালনা করতে সাহায্য করা। মূলত, এটি এমন একটি এজেন্ট যার কাজগুলি স্বায়ত্তশাসিতভাবে সম্পাদন করতে হয়।

এই ধরণের পণ্যের মডেলগুলির প্রয়োজনীয়তা সাধারণ চ্যাটবটগুলির থেকে সম্পূর্ণ আলাদা: এর জন্য মডেলটিকে খুব বুদ্ধিমান হতে হবে না, তবে মডেলটিকে মানুষের মতো কথা বলতে হবে, ভুল করতে হবে না এবং উচ্চ-ফ্রিকোয়েন্সি কল সহ্য করতে সক্ষম হতে হবে।

GPT-5.3 Instant হ্যালুসিনেশনের হার উল্লেখযোগ্যভাবে হ্রাস করে, যার অর্থ এজেন্ট স্বায়ত্তশাসিতভাবে কাজ সম্পাদন করার সময় কম ভুল করে; "AI ভয়েস" হ্রাসের অর্থ হল তৈরি হওয়া ইমেল এবং নথিগুলি মানুষের পড়ার অভ্যাসের মতো আরও বেশি পড়বে।

জেমিনি ৩.১ ফ্ল্যাশ-লাইট তৃতীয়, সবচেয়ে গুরুত্বপূর্ণ প্রয়োজনীয়তাটি আরও ভালভাবে পূরণ করে। যখন এজেন্টটি ব্যাকগ্রাউন্ডে চলমান থাকে, তখন প্রায়শই এটিকে সমান্তরালভাবে প্রচুর সংখ্যক সাবটাস্ক প্রক্রিয়া করতে হয়, যা এটিকে প্রতিক্রিয়ার গতি এবং API খরচের প্রতি অত্যন্ত সংবেদনশীল করে তোলে।

ফ্ল্যাশ-লাইটের অত্যন্ত দ্রুত প্রতিক্রিয়া গতি এবং সাশ্রয়ী মূল্যের খরচ, এর "চিন্তার স্তর" যা কম্পিউটিং শক্তির নমনীয় বরাদ্দের অনুমতি দেয়, এই অত্যন্ত নমনীয় স্থাপত্যকে উচ্চ-সমকালীন স্বয়ংক্রিয় কাজের জন্য একটি আশীর্বাদ করে তোলে।

যদিও দুটি মডেলের দীর্ঘমেয়াদী স্থিতিশীলতা এখনও পর্যবেক্ষণ করা প্রয়োজন, সাধারণ দিকটি স্পষ্ট: একটি মিথস্ক্রিয়াকে আরও মানুষের মতো করে তোলার জন্য দায়ী, এবং অন্যটি গতি এবং ব্যয়-কার্যকারিতার উপর দৃষ্টি নিবদ্ধ করে। ভবিষ্যতে যেখানে প্রত্যেকেরই একটি "গলদা চিংড়ি" থাকবে, সেখানে হালকা মডেলটি আরও স্বাভাবিক এবং বাস্তবসম্মত পছন্দ হয়ে উঠবে।

রেফারেন্স ঠিকানা সংযুক্ত:

https://openai.com/index/gpt-5-3-instant/

https://gemini.google.com/u/4/app/e0bea96b8f62bd1f

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো