GPT 5.1, ভিন্ন নামে, এখন উন্মুক্ত বিটাতে রয়েছে, ব্যবহারের জন্য বিনামূল্যে, এবং বছরের শেষের গুরুত্বপূর্ণ আপডেটের যুদ্ধক্ষেত্রে প্রবেশের জন্য প্রস্তুত।

জেমিনি ৩ কোথাও দেখা যাচ্ছে না, কিন্তু GPT 5.1 ইতিমধ্যেই বাজারে আসার পথে। ৭ তারিখের শেষের দিকে, OpenRouter প্ল্যাটফর্মে একটি একেবারে নতুন বেনামী মডেল লঞ্চ করা হয়েছে। কিছু তীক্ষ্ণদৃষ্টিসম্পন্ন এবং দ্রুত-কার্যকরী নেটিজেন ইতিমধ্যেই এটি চেষ্টা করে দেখেছেন এবং বিশ্বাস করেন যে এটি ছদ্মবেশে GPT 5.1, আপাতদৃষ্টিতে Polaris Alpha নামকরণ করা হয়েছে।

বর্তমানে, API কলগুলি প্রদান করা হচ্ছে (OpenRouter সহ)। নলেজ বেসের মেয়াদ ২০২৪ সালের অক্টোবরে শেষ হবে এবং ইনফারেন্স মোড সমর্থিত নয়। সর্বাধিক প্রসঙ্গ আকার ২৫৬K, এবং প্রতি চক্রে সর্বাধিক আউটপুট ১২৮K।

ডেভেলপার তথ্য গোপন রেখেছিলেন, কিন্তু নেটিজেনদের অক্লান্ত প্রচেষ্টার জন্য ধন্যবাদ, তারা সফলভাবে সিস্টেমটিকে "জেলব্রেক" করেছে, যার ফলে পোলারিস আলফা এর অস্তিত্ব প্রকাশ পেয়েছে।

▲ ছবি X ব্যবহারকারী @ LarryAtherton1 থেকে।

এটি ঠিক সুনির্দিষ্ট প্রমাণ নয়; এটি কেবল প্রশিক্ষণের তথ্যের সমস্যা হতে পারে—অনেক মডেল মালিকানাধীন বিক্রেতাদের কাছ থেকে তথ্য আউটপুট করে। সিস্টেমে স্পষ্টভাবে উল্লেখ না করা থাকলে বা নির্দেশনামূলক টিউনিংয়ের মাধ্যমে বারবার ফিড না করা থাকলে, এই মডেলগুলি আসলে "জানে" না যে তারা কী।

যাই হোক, এখনও কোনও আনুষ্ঠানিক ঘোষণা আসেনি, তাই আপাতত এটিকে Polaris বলা যাক। APPSO একটি দ্রুত পরীক্ষাও করেছিল। যেহেতু এটি একটি API ব্যবহার করে, তাই অডিও উপকরণ প্রক্রিয়াকরণের মতো কিছু ফাংশন সাময়িকভাবে সীমিত। তা ছাড়া, Polaris-এর কর্মক্ষমতা আমাদের GPT 5.1 এর জন্য বেশ উত্তেজিত করে তোলে।

ডেস্কের কাজ: সবসময়ের মতোই মসৃণ

প্রথমত, কিছু মৌলিক, সহজ কাজ ছিল: প্রয়োজন অনুসারে ইমেল লেখা। এটি ছিল একটি ক্ষমা প্রার্থনার ইমেল, যেখানে অতিথিদের অনুষ্ঠানের পুনঃনির্ধারিত তারিখ সম্পর্কে অবহিত করা হয়েছিল। আমি বিশেষভাবে জোর দিয়েছিলাম যে সুরটি ক্ষমাপ্রার্থী এবং বন্ধুত্বপূর্ণ উভয়ই হওয়া উচিত, যাতে পোলারিস এটির অনুভূতি পেতে পারে।

এটি মোটামুটি স্ট্যান্ডার্ড, সম্পূর্ণ তথ্য, স্পষ্ট যুক্তি এবং এমন একটি সুর যা প্রকাশ্যে "মানব-যন্ত্র" বলে মনে হয় না। বরং আশ্চর্যজনক বিষয় হল, অনুসন্ধান মোড সক্ষম থাকায়, পোলারিস ক্ষমা প্রার্থনা পত্রের ফর্ম্যাটগুলি অনুসন্ধান করে এবং এর উদ্ধৃত তথ্যে এমনকি তাওবাও এনসাইক্লোপিডিয়া এন্ট্রিও অন্তর্ভুক্ত থাকে… মনে হচ্ছে পোলারিস আরও বেশি তথ্যের উৎসগুলি কভার করছে, এবং ক্রমবর্ধমানভাবে বিশেষ উৎসগুলিও।

তারপর কপিরাইটিং এর কাজটি হল সৃজনশীল ধারণার প্রয়োজন। আমি খুব অস্পষ্ট প্রম্পট দিয়েছিলাম, কেবল এটি ইন্টারনেট-সচেতন এবং Xiaohongshu-তে শেয়ার করার জন্য উপযুক্ত হতে হবে।

পোলারিস তিনটি ভিন্ন স্টাইল প্রদান করেছে, যার মধ্যে রয়েছে সম্পূর্ণ কপিরাইটিং। তারা ইভেন্টের জন্য একটি বিস্তারিত বাস্তবায়ন পরিকল্পনাও অন্তর্ভুক্ত করেছে। এটি ইতিমধ্যেই স্পষ্ট যে শব্দের একটি স্টাইল রয়েছে যা GPT গ্রুপের মতো। কিছু নেটিজেন এমনকি মিলের পরিসংখ্যানও সংকলন করেছেন – তাদের ছদ্মবেশ ক্রমশ ভেঙে পড়তে শুরু করেছে।

প্রতিটি বৃহৎ ভাষা মডেলের ভিত্তি হিসেবে টেক্সট স্টাইলই রয়ে গেছে, কারণ বর্তমানে এর সর্বাধিক প্রচলিত প্রয়োগ হল ডেস্ক ওয়ার্ক। ২০২৬ সাল দ্রুত এগিয়ে আসার সাথে সাথে, টেক্সটকে "মানব-যন্ত্র" অনুভূতি প্রদান করা ক্ষমার অযোগ্য। বর্তমানে, পোলারিসের লেখার স্টাইলে মোটামুটি সাধারণ "GPT" স্বাদ রয়েছে, যা অনেক ব্যবহারকারীর দ্বারা ভাগ করা একটি অনুভূতি।

এদিকে, চ্যাটবট, চ্যাট এবং সাহচর্যের মতো অ্যাপ্লিকেশন পরিস্থিতির জন্য, লেখার ধরণটি ব্যবহারকারীর গতির সাথে দ্রুত খাপ খাইয়ে নিতে পারে কিনা এবং নমনীয়ভাবে একটি ব্যক্তিগতকৃত সুর "শিখতে" পারে কিনা তা GPT5.1-এর জন্যও একটি চ্যালেঞ্জ হবে – 4o-এর প্রত্যাবর্তনের জন্য বিশ্বব্যাপী চাহিদা এমন কিছু যা OpenAI সম্ভবত আর অনুভব করতে চায় না।

যেহেতু আমি সরাসরি অডিও ফাইলগুলি প্রক্রিয়া করতে পারছিলাম না, তাই আমি প্রতিলিপিকৃত পডকাস্ট ট্রান্সক্রিপ্টটি আপলোড করেছিলাম এবং পোলারিসকে মূল তথ্যগুলি সংগঠিত এবং বের করতে বলেছিলাম, কথ্য অংশগুলিতে যথাযথ সমন্বয় করে। মূল বিষয় ছিল বিভিন্ন বিষয়ভিত্তিক মাত্রার উপর ভিত্তি করে একটি সুগঠিত রূপরেখা তৈরি করা, পাশাপাশি টাইমস্ট্যাম্পগুলিও সংরক্ষণ করা।

বর্তমানে ইনপুটটি ১০,০০০ অক্ষরের বেশি (একক বার্তা) দেখা যাচ্ছে। তবে, ওপেনরাউটারের প্রতিটি উইন্ডোতে মাত্র আটটি বার্তা সংরক্ষণের সীমাবদ্ধতার কারণে, অত্যন্ত দীর্ঘ ইনপুটগুলি আউটপুট স্থায়িত্বকে কিছুটা প্রভাবিত করবে। তবুও, এর স্ব-সংশোধন ক্ষমতা বেশ ভাল; এটি প্রথম রানে একটি অস্তিত্বহীন টাইমস্ট্যাম্প তৈরি করেছিল, কিন্তু পুনরায় রান করার পরে এটি সংশোধন করেছিল।

GPT 5 এর পর থেকে, ChatGPT-তে একটি একক উইন্ডোর ক্ষমতা উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে। সোশ্যাল মিডিয়া থেকে প্রাপ্ত প্রতিক্রিয়া থেকে জানা যায় যে সীমা পৌঁছানোর আগে টোকেনের সর্বোচ্চ সংখ্যা 600,000-800,000 এ পৌঁছেছে। এটি ব্যক্তিগতকৃত ব্যবহারকারীর তথ্যের জন্য একটি অত্যন্ত ইতিবাচক লক্ষণ, তবে অনিবার্যভাবে, এত দীর্ঘ প্রেক্ষাপটের সময়, মেমরি শিডিউলিং ব্যাধি এবং আউটপুট স্থিতিশীলতা হ্রাস পাবে।

এটি GPT 5.1-কে সম্পূর্ণ নতুন একটি চ্যালেঞ্জের মুখোমুখি করে: উইন্ডো ক্যাপাসিটি আরও বৃদ্ধি করার পরেও কীভাবে নমনীয় এবং নির্ভুল মেমরি শিডিউলিং বজায় রাখা যায়। ব্যবহারকারীদের জন্য, এটি একটি নির্ধারক অভিজ্ঞতা যা প্রায় তাৎক্ষণিকভাবে অনুভব করা যায়।

প্রোগ্রামিং: অত্যন্ত সহজ, অত্যন্ত মসৃণ

ওপেনরাউটার বেশ কিছু মৌলিক প্রোগ্রামিং বাস্তবায়ন এবং প্রিভিউ প্রদান করে। আমি দ্রুত এটি ব্যবহার করে পোলারিসের ছোট গেম লেখার ক্ষমতা পরীক্ষা করেছিলাম।

সবচেয়ে তাৎক্ষণিক ধারণা হলো এটি একটু বেশি সময় নেয়, প্রায় পাঁচ মিনিট। তবে, আমাকে কোনও জটিল প্রম্পট দেওয়ার দরকার নেই; কেবল "একটি স্নেক গেম কোড ডিজাইন করুন" একটি খেলার যোগ্য ছোট গেম তৈরি করার জন্য যথেষ্ট।

এটি বিভিন্ন মোড এবং সেটিংসও অফার করে এবং প্রিভিউতে গেমপ্লেটি খুব মসৃণ ছিল। আমি এটিতে একটি হ্যাক-এ-মোল গেমও চালিয়েছিলাম, যা সফলভাবে সম্পন্ন হয়েছিল।

ওয়েব ডিজাইনটিও দুর্দান্ত ছিল। আমি তৈরি করা কফি শপের কপিটি পোলারিসকে ফেরত পাঠিয়েছিলাম এবং ইভেন্টের জন্য একটি ল্যান্ডিং পৃষ্ঠা ডিজাইন করতে বলেছিলাম।

পোলারিস সম্পূর্ণ কপিটি অধ্যয়ন করেছে এবং কিছু পরিপূরক যোগ করেছে, যার ফলে একটি ভালো ভিজ্যুয়াল এফেক্ট তৈরি হয়েছে। আমি বিশেষ করে বোতামগুলির জন্য ডিজাইন করা গ্লোয়িং এফেক্টটি পছন্দ করি, যা পণ্যটির একটি "অনন্য বৈশিষ্ট্য" বলে মনে হয়, কারণ এটি অন্যান্য ব্যবহারকারীদের দ্বারা পরিচালিত পরীক্ষাগুলিতেও দেখা গেছে।

▲ ব্যবহারকারী X এর ছবি

অন্যান্য অনলাইন পরীক্ষা থেকে বিচার করলে, এর নান্দনিক পারফরম্যান্স আশাব্যঞ্জক।

▲ ছবি X ব্যবহারকারী @ HarsithLucky3 থেকে।

এই মৌলিক কাজগুলো মূলত বড় ধরনের সমস্যা ছাড়াই সম্পন্ন হয়েছে, কিন্তু সত্যি বলতে, AI প্রোগ্রামিং ক্ষেত্র বর্তমানে অত্যন্ত প্রতিযোগিতামূলক, এবং GPT-ভিত্তিক পণ্যগুলি প্রোগ্রামিংয়ে কখনও বিশেষভাবে শক্তিশালী ছিল না। GPT 5.1 বাস্তবায়নের পরে প্রোগ্রামিং কর্মক্ষমতায় উল্লেখযোগ্য অগ্রগতি আনবে কিনা তা এখনও দেখার বিষয়।

স্যাম অল্টম্যান সম্প্রতি বলেছেন যে চ্যাটজিপিটি বছরের শেষ নাগাদ একটি NSFW (প্রাপ্তবয়স্ক মোড) বাস্তবায়ন করবে, এবং মনে হচ্ছে পোলারিসে এর লক্ষণ ইতিমধ্যেই দৃশ্যমান।

যদি তাই হয়, তাহলে আরেকটি প্রমাণ আছে যে পোলারিস GPT 5.1, বিশেষ করে বিবেচনা করে যে OpenAI সম্প্রতি ছোট পরিসরে বয়স যাচাইকরণ পরিচালনা করছে। এটি কোনও পূর্ণাঙ্গ অপারেশন নয়, বরং এমন ব্যবহারকারীদের লক্ষ্য করে একটি চাপ যাদের প্রকৃত বয়স অনিশ্চিত।

প্রাপ্তবয়স্কদের জন্য এই পদ্ধতিটি অত্যন্ত বিতর্কিত, এবং এর বাস্তব বাস্তবায়ন কল্পনার মতো সহজ নয়। যাচাইকরণের পাশাপাশি, গোপনীয়তা তথ্য সনাক্তকরণ এবং সংরক্ষণের সাথে সম্পর্কিত একাধিক সমস্যা রয়েছে। সকল পক্ষের চাহিদার ভারসাম্য বজায় রাখার জন্য একটি সমাধান খুঁজে পাওয়া যায় কিনা তা এখনও দেখা বাকি, GPT 5.1 আসলে এই সমস্যাগুলি কীভাবে মোকাবেলা করে তার উপর নির্ভর করে।

বছরের শেষের দিকে আরেকটি ভয়াবহ যুদ্ধের আশঙ্কায়, জেমিনি ৩ কিছু সময়ের জন্য টিজ করা হয়েছে (যদিও এটি বারবার বিলম্বিত হয়েছে), এবং ন্যানো ব্যানানা ২ হঠাৎ করেই আবির্ভূত হয়েছে। কিমি কে২ থিংকিং-এর আগের মুক্তির কথা তো বাদই দিলাম, যা দেশীয় এবং আন্তর্জাতিকভাবে ব্যাপক মনোযোগ আকর্ষণ করেছিল, যার প্রশিক্ষণ খরচ ছিল মাত্র ৪.৬ মিলিয়ন ডলার।

ওপেনএআই-এর ব্যয় এখনও অবিশ্বাস্য, এবং এর চিত্তাকর্ষক সক্রিয় ব্যবহারকারী ভিত্তি সত্ত্বেও, লাভজনকতা এখনও অধরা। শক্তিশালী কিন্তু সস্তা চীনা মডেলগুলির একটি সিরিজের প্রতিযোগিতার মুখোমুখি হয়ে, জিপিটি ৫.১ কি প্রত্যাশা পূরণ করতে পারবে?

আমরা শীঘ্রই জানতে পারব। গুজব রটেছে যে এটি নভেম্বরের মাঝামাঝি সময়ে মুক্তি পাবে, এবং তখনই আমাদের কাছে উত্তর থাকতে পারে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো