
ভারতে এআই সামিটে সবেমাত্র সবচেয়ে বিব্রতকর মুহূর্তটি অনুভব করার পর, গুগলের সিইও সুন্দর পিচাই ঘুরে দাঁড়ালেন এবং আজ সকালে আনুষ্ঠানিকভাবে সর্বশেষ মডেল, জেমিনি ৩.১ প্রো ঘোষণা করলেন।

সময়টা ছিল অনবদ্য, অবিশ্বাস্যভাবে নির্ভুল (doge)।

▲OpenAI এবং Anthropic-এর সিইওরা ছবি তোলার সময় করমর্দন করতে অস্বীকৃতি জানান, বরং তাদের মুষ্টি উঁচিয়ে ধরেন।
যদিও গত সপ্তাহে জেমিনি ৩ ডিপ থিঙ্ক আপডেটের পর মাত্র কয়েকদিন হয়েছে, গুগল ৩.১ প্রো-এর অবস্থান খুব স্পষ্ট করে দিয়েছে – এটি এমন কাজের জন্য ডিজাইন করা হয়েছে যেখানে "একটি সহজ উত্তর যথেষ্ট নয়", জটিল সমস্যা সমাধানের জন্য একটি ভিত্তি হিসেবে কাজ করে।
প্রথাগতভাবে, একটি সংস্করণ 0.1 আপডেটের অর্থ সাধারণত ছোটখাটো পরিবর্তন করা হয়। তবে, ARC-AGI-2 বেঞ্চমার্কে, যা সম্পূর্ণ নতুন লজিক্যাল প্যাটার্ন সমাধান করার জন্য একটি মডেলের ক্ষমতা পরীক্ষা করে, 3.1 Pro 77.1% অর্জন করেছে, যা পূর্ববর্তী প্রজন্মের 3 Pro (31.1%) এর দ্বিগুণেরও বেশি, এবং অ্যানথ্রপিকের Opus 4.6 (68.8%) এবং OpenAI এর GPT-5.2 (52.9%) কে ছাড়িয়ে গেছে।

অন্যান্য ক্ষেত্রে, বৈজ্ঞানিক জ্ঞানের জন্য GPQA ডায়মন্ড স্কোর ছিল 94.3%, যেখানে বুদ্ধিমান এজেন্টদের জন্য MCP Atlas এবং BrowseComp বেঞ্চমার্ক যথাক্রমে 69.2% এবং 85.9% স্কোর করেছে।

প্রোগ্রামিং ক্ষমতার দিক থেকে, প্রতিযোগিতামূলক প্রোগ্রামিং বেঞ্চমার্ক LiveCodeBench Pro 2887 এর Elo স্কোর অর্জন করেছে, যা 3 Pro এর 2439 এবং GPT-5.2 এর 2393 কে ছাড়িয়ে গেছে। SWE-Bench Verified-এ, 3.1 Pro 80.6% স্কোর করেছে, যা মূলত Opus 4.6 এর 80.8% এর সাথে মিলে গেছে।
অবশ্যই, ৩.১ প্রো সব দিক থেকেই নিখুঁত নয়।
মাল্টিমোডাল বেঞ্চমার্ক MMMU Pro-তে, পূর্ববর্তী প্রজন্মের 3 Pro আসলে সামান্যই পারফর্ম করেছে (81.0% বনাম 80.5%); টুল সাপোর্ট সক্ষম থাকা হিউম্যানিটি'স লাস্ট এক্সাম-এ, Opus 4.6 53.1% পেয়ে প্রথম স্থান অধিকার করেছে। গুগলের টুলগুলি দীর্ঘদিন ধরে তার প্রতিযোগীদের তুলনায় কম দক্ষ বলে সমালোচিত হয়েছে, এবং এবারও এটি সমালোচকদের সম্পূর্ণরূপে চুপ করতে পারেনি।
একটি সুপরিচিত তৃতীয় পক্ষের বিশ্লেষণ সংস্থা, কৃত্রিম বিশ্লেষণ, মোটামুটি বস্তুনিষ্ঠ মূল্যায়ন দিয়েছে।

৩.১ প্রো তাদের বুদ্ধিমত্তা সূচকে প্রথম স্থান অধিকার করেছে, ওপাস ৪.৬ এর চেয়ে ৪ পয়েন্ট বেশি স্কোর করেছে; পুরো পরীক্ষায় প্রায় ৫৭ মিলিয়ন টোকেন ব্যবহার করা হয়েছে এবং পরীক্ষাটি সম্পন্ন করতে খরচ হয়েছে ওপাস ৪.৬ এর অর্ধেকেরও কম। অত্যন্ত সক্ষম এবং সাশ্রয়ী, এই সমন্বয়টি বেশ আকর্ষণীয়।
গুগল ডিপমাইন্ডের প্রধান বিজ্ঞানী জেফ ডিন একটি অ্যাপ্লিকেশনও শেয়ার করেছেন যা ৩.১ প্রো ব্যবহার করে নগর পরিকল্পনা অনুকরণ করে এবং নতুন শহর ডিজাইন করে, শুরু থেকেই একটি ইন্টারেক্টিভ প্ল্যানিং ইন্টারফেস ডেমো তৈরি করে।

গুগলের অফিসিয়াল ব্লগে আরও বেশ কিছু দৈনন্দিন অ্যাপ্লিকেশন দেখানো হয়েছে। কোড অ্যানিমেশনের ক্ষেত্রে, 3.1 প্রো সরাসরি টেক্সট প্রম্পটের উপর ভিত্তি করে গতিশীল SVG তৈরি করতে পারে। যেহেতু এটি পিক্সেলের পরিবর্তে সম্পূর্ণরূপে কোড থেকে তৈরি করা হয়, তাই এটি স্কেলিং নির্বিশেষে এর মান বজায় রাখে এবং ফাইলের আকার ঐতিহ্যবাহী ভিডিওগুলির তুলনায় উল্লেখযোগ্যভাবে ছোট।

জটিল সিস্টেমের ক্ষেত্রে, মডেলটি সরাসরি সর্বজনীনভাবে উপলব্ধ টেলিমেট্রি ডেটা স্ট্রিমগুলিতে অ্যাক্সেস করে, একটি স্পেস ইন্সট্রুমেন্ট প্যানেল তৈরি করে যা রিয়েল টাইমে আন্তর্জাতিক মহাকাশ স্টেশনের কক্ষপথ ট্র্যাক করে।

আরও আকর্ষণীয় হল দুটি সৃজনশীল ডেমো।
একটি হল একটি 3D স্টারলিং ফ্লক সিমুলেশন, যা কেবল ভিজ্যুয়াল কোড তৈরি করে না, বরং ফ্লকের অঙ্গভঙ্গি নিয়ন্ত্রণকেও সমর্থন করে এবং জেনারেটেড সঙ্গীত দিয়ে সজ্জিত যা ফ্লকের সাথে গতিশীলভাবে পরিবর্তিত হয়।

আরেকটি পদ্ধতি হল "ওয়াদারিং হাইটস" এর সাহিত্যিক পরিবেশকে একটি আধুনিক ব্যক্তিগত ওয়েবসাইটে রূপান্তর করা। কেবল গল্পের সারসংক্ষেপের পরিবর্তে, মডেলটি উপন্যাসের সামগ্রিক সুর বিশ্লেষণ করে এবং নায়কের মেজাজের সাথে মেলে এমন একটি ইন্টারফেস শৈলী ডিজাইন করে।

এছাড়াও, নেটিজেনরা অনেক চিত্তাকর্ষক উদাহরণ প্রদান করেছেন। একজন ব্যবহারকারী গুগল ৩.১ প্রো-তে "ভূত শিকারী একটি ভুতুড়ে বাড়ির মধ্য দিয়ে ভ্রমণ করছে" এর একটি গতিশীল SVG লুপ অ্যানিমেশন তৈরি করেছিলেন এবং ফলাফলটি এতটাই আশ্চর্যজনক ছিল যে ব্যবহারকারী মন্তব্য করেছিলেন, "গুগল এবার সিরিয়াস।"

কিছু নেটিজেন আরও বিশ্বাস করেন যে বীজের মাটি ভেঙে যাওয়ার, শিকড় প্রসারিত হওয়ার, কাণ্ড অঙ্কুরিত হওয়ার, পাতাগুলি ফুটে ওঠার এবং অবশেষে একটি সম্পূর্ণ গাছে পরিণত হওয়ার ইন্টারেক্টিভ অ্যানিমেশন, প্রতিটি বৃদ্ধির পর্যায় মসৃণ এবং প্রাকৃতিকভাবে পরিবর্তিত হওয়ার সাথে সাথে, এটি তাদের দেখা সেরা অনুরূপ প্রভাব।

সিংহুয়া বিশ্ববিদ্যালয়ের পদার্থবিদ্যা বিভাগের বিশেষ পুরষ্কার বিজয়ী ইয়াও শুন্যু, যিনি গত বছর অ্যানথ্রপিক থেকে গুগল ডিপমাইন্ডে চলে এসেছেন, তিনিও জেমিনিকে সমর্থন করে বলেন, "জেমিনি কেবল একজন চমৎকার মডেলই নন, বরং আরও ভালো মডেল অপ্রতিরোধ্যভাবে আসছে।"
অবশ্যই, এই সমস্ত ডেমো একসাথে একই জিনিস সম্পর্কে কথা বলছে: মডেলরা যা করতে পারে তা কেবল প্রশ্নের উত্তর দেওয়া থেকে শুরু করে পেশাদার বা সৃজনশীল কর্মপ্রবাহের একটি সম্পূর্ণ সেট সম্পন্ন করা পর্যন্ত বিস্তৃত হয়েছে।
দামের দিক থেকে, API টিয়ার্ড এবং পূর্ববর্তী প্রজন্মের 3 প্রো-এর সাথে সামঞ্জস্যপূর্ণ, তবে এটি এখনও অ্যানথ্রপিক ওপাস সিরিজের তুলনায় তুলনামূলকভাবে সস্তা।
২০০,০০০ এর কম টোকেনের জন্য, প্রতি মিলিয়ন টোকেনে ইনপুট $২ এবং আউটপুট $১২। ২০০,০০০ এর বেশি টোকেনের জন্য, ইনপুট $৪ পর্যন্ত বৃদ্ধি পায় এবং আউটপুট $১৮ হয়। প্রতি মাসে প্রথম ৫,০০০ অনুসন্ধানের জন্য অনুসন্ধান ফাংশনটি বিনামূল্যে, এবং তারপরে প্রতি ১,০০০ অনুসন্ধানের জন্য $১৪ খরচ হয়।
ডেভেলপাররা এখন এআই স্টুডিও, জেমিনি এপিআই, জেমিনি সিএলআই, গুগল অ্যান্টিগ্রাভিটি ইন্টেলিজেন্ট এজেন্ট ডেভেলপমেন্ট প্ল্যাটফর্ম এবং অ্যান্ড্রয়েড স্টুডিও ব্যবহার করতে পারবেন; এন্টারপ্রাইজ ব্যবহারকারীরা ভার্টেক্স এআই এবং জেমিনি এন্টারপ্রাইজ ব্যবহার করতে পারবেন; এবং সাধারণ ব্যবহারকারীরা জেমিনি অ্যাপ্লিকেশন এবং নোটবুকএলএম ব্যবহার করতে পারবেন, যা কেবলমাত্র প্রো এবং আল্ট্রা সাবস্ক্রিপশনের সাথে উপলব্ধ।
এটি লক্ষণীয় যে সংস্করণ 3.1 প্রো বর্তমানে কেবল একটি প্রিভিউ সংস্করণ। গুগল সম্ভবত অফিসিয়াল সংস্করণ প্রকাশের আগে ইন্টেলিজেন্ট এজেন্ট ওয়ার্কফ্লোকে আরও পরিমার্জন করবে, যা বাইরের বিশ্বকে দেখাবে যে এটি এখনও সম্পূর্ণরূপে কার্যকর হয়নি।
এই ক্ষমতা যদি ব্যক্তি পর্যায়ে প্রবেশ করে তাহলে কী হবে, তা নিয়ে কথা বলতে গেলে, OpenAI-এর সহ-প্রতিষ্ঠাতা আন্দ্রেজ কার্পাথির পোস্ট করা একটি টুইটের কথা মনে করিয়ে দেয়:
তিনি ৮ সপ্তাহের মধ্যে তার বিশ্রামকালীন হৃদস্পন্দন ৫০ থেকে ৪৫-এ নামিয়ে আনার লক্ষ্য রাখেন, জোন ২ কার্ডিওর মোট সময়কালের জন্য একটি লক্ষ্য নির্ধারণ করে, যার সাথে প্রতি সপ্তাহে একটি HIIT সেশনও যুক্ত করা হয়। তার অগ্রগতি ট্র্যাক করার জন্য, তিনি ভাইব কোডিং ব্যবহার করে একটি কাস্টম ড্যাশবোর্ড তৈরি করতে এক ঘন্টা সময় ব্যয় করেন।

প্রক্রিয়াটি প্রত্যাশার চেয়েও জটিল ছিল। ক্লডকে উডওয়ে ট্রেডমিলের ক্লাউড এপিআই রিভার্স ইঞ্জিনিয়ার করতে হয়েছিল, কাঁচা ডেটা বের করতে হয়েছিল, প্রক্রিয়াজাতকরণ এবং ফিল্টার করতে হয়েছিল এবং ওয়েব ফ্রন্ট-এন্ড ইন্টারফেস তৈরি করতে হয়েছিল। এছাড়াও কিছু বাগ ছিল যা ম্যানুয়ালি আবিষ্কার এবং ঠিক করতে হয়েছিল, যেমন মেট্রিক এবং ইম্পেরিয়াল ইউনিটের মিশ্রণ এবং ক্যালেন্ডার তারিখের অমিল।
কার্প্যাথির পর্যবেক্ষণ ছিল তীক্ষ্ণ: দুই বছর আগে এটি করতে ১০ ঘন্টা সময় লাগত, এখন এটি ১ ঘন্টা সময় নেয়। কিন্তু তিনি যে বিষয়টির প্রতি বেশি যত্নবান ছিলেন তা হল এটিতে মাত্র ১ মিনিট সময় নেওয়া উচিত ছিল।
তার মূল্যায়ন হলো, অ্যাপ স্টোর মডেলটি অপ্রচলিত হয়ে পড়ছে।
৩০০ লাইন কোড এবং সেকেন্ডে তৈরি একটি LLM লাইব্রেরি সহ একটি কাস্টম টুল আপনার অনুসন্ধান এবং ডাউনলোড করার জন্য একটি উপযুক্ত অ্যাপ হতে হবে না। তিনি একটি শিল্প সমস্যাও উল্লেখ করেছেন: ৯৯% পণ্যে এখনও নেটিভ AI CLI নেই এবং এজেন্টদের কল করা সহজ API প্রদানের পরিবর্তে এখনও মানব-পঠনযোগ্য ফ্রন্ট-এন্ড ইন্টারফেস বজায় রাখছে।
উডওয়ে ট্রেডমিল মূলত একটি সেন্সর, তবুও এটিকে বিপরীত প্রকৌশলী করার জন্য এখনও একটি এলএলএম প্রয়োজন, যা সম্পূর্ণ অপ্রয়োজনীয়।
জেফ ডিনের নগর পরিকল্পনা ডেমোর সাথে কার্প্যাথির চলমান ড্যাশবোর্ডের তুলনা করলে একই মুদ্রার দুটি দিক প্রকাশ পায়। সেই যুগ যেখানে সাধারণ মানুষ মাত্র এক ঘন্টার মধ্যে নিজেদের জন্য একটি অত্যন্ত কাস্টমাইজড টুল তৈরি করতে পারে – এআই-নেটিভ সেন্সর এবং অ্যাকচুয়েটর সমন্বিত, একটি LLM (স্থানীয় ব্যবস্থাপনা মডেল) দ্বারা পরিচালিত এবং স্বতঃস্ফূর্তভাবে অত্যন্ত কাস্টমাইজড অ্যাপ্লিকেশনে তৈরি – ইতিমধ্যেই নাগালের মধ্যে।
অফিসিয়াল ব্লগ সংযুক্ত:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
