
এইমাত্র, জেমিনি ৩ প্রো প্রিভিউ সংস্করণটি আনুষ্ঠানিকভাবে প্রকাশিত হয়েছে।
বছরের শেষে AI জগতে কখনও খবরের অভাব হয় না, তবে এই বছরটি বিশেষভাবে কোলাহলপূর্ণ। যদি অপ্রত্যাশিত কিছু না ঘটে, তবে এটি হবে ২০২৫ সালে আত্মপ্রকাশের জন্য সবচেয়ে প্রত্যাশিত বৃহৎ আকারের বিদেশী মডেল। এমনকি এটাও বলা যেতে পারে যে Gemini 3 Pro এই সময়ের একমাত্র নায়ক হয়ে উঠেছে।

গত দুই মাস ধরে, গুগল প্রায় স্যাম অল্টম্যানের মার্কেটিং কৌশল অনুসরণ করেছে। জেমিনির বিখ্যাত প্রচার কর্মকর্তা লোগান কিলপ্যাট্রিক থেকে শুরু করে সিইও পিচাই পর্যন্ত, অভ্যন্তরীণ ব্যক্তিরা জেমিনি ৩-এর প্রচারণা এবং প্রত্যাশা বাড়ানোর জন্য সোশ্যাল মিডিয়ায় ক্রমাগত রহস্যময় ভাষা ব্যবহার করে আসছেন।

মজার ব্যাপার হলো, OpenAI-এর সিইও স্যাম অল্টম্যান X প্ল্যাটফর্মে পোস্ট করেছেন: "জেমিনি 3-এর সফল উৎক্ষেপণের জন্য গুগলকে অভিনন্দন! এটি দেখতে দুর্দান্ত একটি মডেলের মতো।"
আল্ট্রাম্যানের সতর্কতামূলক গল্পের পরিপ্রেক্ষিতে, রিডলারের পদ্ধতি অত্যন্ত ঝুঁকিপূর্ণ; যদি পণ্যটি ব্যর্থ হয়, তবে এর খ্যাতি তাৎক্ষণিকভাবে ভেঙে পড়তে পারে। তবে, গুগলের স্পষ্টতই তার পণ্যের উপর অপরিসীম আস্থা রয়েছে। তাহলে, এবার জেমিনি 3 প্রো ঠিক কী দেবে?
ডেটা-সেভিং সংস্করণটি নিম্নরূপ:
- জেমিনি ৩ প্রো প্রিভিউ ভার্সনটি স্থানীয়ভাবে মাল্টিমোডাল ফরম্যাট (টেক্সট, ছবি, ভিডিও, অডিও) সমর্থন করে।
- এটি LMARaena লিডারবোর্ডে শীর্ষে ছিল এবং ইনফারেন্স, মাল্টিমোডাল এবং প্রোগ্রামিং সহ প্রধান পরীক্ষাগুলিতে নেতৃত্ব দিয়েছে।
- রেকর্ড-ব্রেকিং যুক্তি ক্ষমতা (GPQA ডায়মন্ড ৯১.৯%, MathArena Apex ২৩.৪%)
- ডিপ থিঙ্ক বর্ধিত অনুমান মোড উপলব্ধ (আগামী সপ্তাহগুলিতে আসছে)।
- ১ মিলিয়ন টোকেন কনটেক্সট উইন্ডো + ৬৪K আউটপুট
- গুগল অ্যান্টিগ্রাভিটি, একটি একেবারে নতুন এআই আইডিই, চালু করা হয়েছে। নতুন মডেলগুলিতে এখন কার্সার, গিটহাব এবং জেটব্রেইনসের মতো সরঞ্জামগুলি একীভূত করা হয়েছে।
"প্রো" নামের যোগ্য, গুগলের সবচেয়ে শক্তিশালী এআই মডেলটি গভীর রাতে প্রকাশিত হয়েছিল।
গুগলের মতে, জেমিনি ৩ প্রো এখন পর্যন্ত "সবচেয়ে বুদ্ধিমান এবং অভিযোজিত মডেল", যা বাস্তব জগতের জটিল সমস্যাগুলি সমাধানের জন্য ডিজাইন করা হয়েছে—বিশেষ করে যেগুলির জন্য উচ্চ-স্তরের যুক্তি, সৃজনশীলতা, কৌশলগত পরিকল্পনা এবং ক্রমবর্ধমান উন্নতির প্রয়োজন।
এর সাধারণ প্রয়োগের দৃশ্যপটের মধ্যে রয়েছে: স্বায়ত্তশাসিত আচরণ ক্ষমতা সম্পন্ন অ্যাপ্লিকেশন, উন্নত প্রোগ্রামিং, অতি-দীর্ঘ প্রাসঙ্গিক বোঝাপড়া, ক্রস-মডেল প্রক্রিয়াকরণ (যেমন পাঠ্য, চিত্র এবং অডিওর সংমিশ্রণ), এবং অ্যালগরিদম বিকাশ।
জেমিনি ৩ প্রো প্রিভিউ ভার্সনটি ১৫০১ স্কোর নিয়ে LMARaena লিডারবোর্ডে শীর্ষে রয়েছে, যা প্রায় সকল প্রধান AI বেঞ্চমার্কে এর পূর্বসূরীদের থেকে অনেক বেশি। আরও গুরুত্বপূর্ণ বিষয় হল, এটি কেবল ছবির বিষয়বস্তু চিনতে পারে না, বরং অন্তর্নিহিত তথ্য এবং প্রাসঙ্গিক সম্পর্কও বুঝতে পারে।

বিশেষ করে, যুক্তির দক্ষতার দিক থেকে, এটি "মানবতার শেষ পরীক্ষায় ৩৭.৫% ডক্টরেট-স্তরের যুক্তি স্কোর অর্জন করেছে, GPQA ডায়মন্ড পরীক্ষায় ৯১.৯% পেয়েছে এবং MathArena Apex-এ ২৩.৪% এর একটি নতুন শিল্প রেকর্ড স্থাপন করেছে।
মাল্টিমোডাল রিজনিং-এ, MMMU-Pro 81%, Video-MMMU 87.6% স্কোর করেছে, এবং SimpleQA Verified 72.1% এর সত্যতা নির্ভুলতা অর্জন করেছে।
এর অর্থ হল, জেমিনি ৩ প্রো বিজ্ঞান, গণিত এবং অন্যান্য ক্ষেত্রে বিভিন্ন জটিল সমস্যার নির্ভরযোগ্যভাবে উচ্চমানের উত্তর প্রদান করতে পারে এবং এর প্রতিক্রিয়াগুলি সরাসরি এবং প্রকৃত অন্তর্দৃষ্টি প্রদান করে, যা আপনাকে কেবল আপনি যা শুনতে চান তা নয়, বরং আপনার কী জানা দরকার তা বলে।
স্ট্যান্ডার্ড মোডের পাশাপাশি, জেমিনি 3 ডিপ থিঙ্ক নামে একটি উন্নত অনুমান বিকল্পও অফার করে।
এই উন্নত যুক্তি মডেলটি "মানবতার জন্য শেষ পরীক্ষা"-এ ৪১.০% স্কোর করেছে, GPQA ডায়মন্ডে ৯৩.৮% স্কোর করেছে এবং ARC-AGI-2 পরীক্ষায় ৪৫.১% এর অভূতপূর্ব স্কোর অর্জন করেছে।

তবে, এই মডেলটি এখনও নিরাপত্তা মূল্যায়নের অধীনে রয়েছে এবং আগামী সপ্তাহগুলিতে গুগল এআই আল্ট্রা গ্রাহকদের কাছে এটি চালু করা হবে বলে আশা করা হচ্ছে।
পরীক্ষার তথ্যের বাইরে, বাস্তব-বিশ্বের প্রয়োগের পরিস্থিতিতে জেমিনি 3-এর কর্মক্ষমতা আরও উল্লেখযোগ্য।
উদাহরণস্বরূপ, যদি আপনি আপনার পরিবারের হাতে লেখা রেসিপি বইটি খুঁজে পান, যেখানে আপনার দাদীর লেখা রেসিপিগুলি একাধিক ভাষায় রয়েছে, তাহলে জেমিনি 3 এই হাতে লেখা শব্দগুলি চিনতে পারে এবং সেগুলিকে একটি ভাগ করে নেওয়ার মতো রেসিপি বইতে সাজিয়ে তুলতে পারে।

অথবা যদি আপনি কোনও নতুন ক্ষেত্র শিখতে চান, তাহলে এটি একাডেমিক পেপার এবং দীর্ঘ ভিডিও লেকচার প্রক্রিয়া করতে পারে, ইন্টারেক্টিভ লার্নিং কার্ড তৈরি করতে পারে। এটি আপনার পিকলবল ম্যাচ ভিডিও বিশ্লেষণ করে লক্ষ্যবস্তু প্রশিক্ষণ পরিকল্পনা তৈরি করতে পারে।
এর কারণ হল জেমিনি শুরু থেকেই মাল্টিমোডাল বোঝাপড়ার জন্য ডিজাইন করা হয়েছিল, যা টেক্সট, ছবি, ভিডিও, অডিও এবং কোডের মতো বিভিন্ন ধরণের তথ্য একীভূত করতে সক্ষম, সাথে 1 মিলিয়ন টোকেন পর্যন্ত একটি প্রসঙ্গ উইন্ডো এবং 64K পর্যন্ত আউটপুট সমর্থন করে।
এটি উল্লেখ করার মতো যে জেমিনি 3 আনুষ্ঠানিকভাবে প্রকাশিত হয়েছিল এবং প্রথম দিনেই গুগল সার্চে সংহত করা হয়েছিল।

এটি কেবল জটিল সমস্যা এবং খনি তথ্য বোঝার জন্য সার্চ ইঞ্জিনের ক্ষমতা উল্লেখযোগ্যভাবে বৃদ্ধি করে না, বরং কোয়েরির উপর ভিত্তি করে রিয়েল টাইমে গতিশীল ভিজ্যুয়াল ইন্টারফেস, ইন্টারেক্টিভ টুল এবং সিমুলেশন সিস্টেম তৈরি করে, যেমন থ্রি-বডি ফিজিক্স সিমুলেটর বা লোন ক্যালকুলেটর।

এছাড়াও, গুগল কর্তৃক প্রকাশিত মডেল কার্ড অনুসারে, জেমিনি 3 প্রো ট্রান্সফরমারের উপর ভিত্তি করে একটি স্পার্স এক্সপার্ট হাইব্রিড মডেল (MoE) গ্রহণ করে, যা স্থানীয়ভাবে টেক্সট, ভিশন এবং অডিওর মতো মাল্টিমোডাল ইনপুটগুলিকে সমর্থন করে। এই আর্কিটেকচারের মূল সুবিধা হল যে মডেলটি প্রতিটি ইনপুট টোকেনের বিষয়বস্তুর উপর ভিত্তি করে কিছু পরামিতি সক্রিয় করার জন্য গতিশীলভাবে নির্বাচন করে, যার ফলে কম্পিউটিং রিসোর্স খরচ, পরিষেবা খরচ এবং মোট ক্ষমতার মধ্যে ভারসাম্য অর্জন করা হয়।
হার্ডওয়্যারের ক্ষেত্রে, জেমিনি ৩ প্রো প্রশিক্ষণের জন্য গুগলের স্ব-উন্নত টেনসর প্রসেসিং ইউনিট (টিপিইউ) ব্যবহার করে। সিপিইউর তুলনায়, টিপিইউ বৃহৎ ভাষা মডেলের জন্য প্রয়োজনীয় বৃহৎ-স্কেল গণনা পরিচালনা করতে দ্রুততর, এবং এর বৃহৎ ক্ষমতা এবং উচ্চ ব্যান্ডউইথ মেমরি এটিকে অতি-বৃহৎ মডেল এবং ডেটা ব্যাচ পরিচালনা করতে দেয়।
আপনি যদি একজন ডেভেলপার হন, তাহলে জেমিনি ৩ এর পরিবর্তনগুলি আরও তাৎক্ষণিক হবে।
গুগলের অফিসিয়াল ব্লগে দাবি করা হয়েছে যে জেমিনি ৩ এখন পর্যন্ত সবচেয়ে শক্তিশালী "ভিডিও কোডিং" মডেল—আপনাকে কেবল প্রাকৃতিক ভাষায় যা চান তা বর্ণনা করতে হবে এবং এটি সম্পূর্ণরূপে কার্যকরী ইন্টারেক্টিভ অ্যাপ্লিকেশন তৈরি করতে পারে।

তথ্য অনেক কিছু বলে: Elo WebDev Arena লিডারবোর্ডে ১৪৮৭ তম স্থানে রয়েছে, Terminal-Bench 2.0-এ ৫৪.২% স্কোর এবং SWE-bench Verified-এ ৭৬.২% স্কোর সহ।

গুগল একটি নতুন এআই আইডিইও চালু করেছে: গুগল অ্যান্টিগ্রাভিটি।
এই বিল্ট-ইন ইন্টেলিজেন্ট এজেন্টটি স্বয়ংক্রিয়ভাবে জটিল এন্ড-টু-এন্ড সফটওয়্যার কাজ পরিকল্পনা ও সম্পাদন করতে পারে এবং স্বয়ংক্রিয়ভাবে কোডের সঠিকতা যাচাই করতে পারে। আপনি যদি একটি ফ্লাইট ট্র্যাকিং অ্যাপ্লিকেশন তৈরি করতে চান, তাহলে এজেন্ট স্বাধীনভাবে কোড পরিকল্পনা ও লিখতে পারে, একটি ব্রাউজারের মাধ্যমে এর কর্মক্ষমতা যাচাই করতে পারে এবং এমনকি একটি সম্পাদক, টার্মিনাল এবং ব্রাউজারে একই সাথে নির্বিঘ্নে কাজ করতে পারে।
দীর্ঘমেয়াদী পরিকল্পনা ক্ষমতার দিক থেকে, জেমিনি 3 ভেন্ডিং-বেঞ্চ 2 তালিকায় প্রথম স্থানে রয়েছে।

ব্যবহারিক প্রয়োগের ক্ষেত্রে, জেমিনি এজেন্টের নতুন প্রকাশিত পরীক্ষামূলক বৈশিষ্ট্যগুলি শুরু থেকে শেষ পর্যন্ত জটিল বহু-পদক্ষেপ প্রক্রিয়া সম্পাদন করতে পারে। আপনি যদি বলেন, "আমার ইনবক্সটি সংগঠিত করুন", তবে এটি আপনার কাজগুলিকে অগ্রাধিকার দেবে এবং আপনার নিশ্চিতকরণের জন্য ইমেল উত্তরগুলি খসড়া করবে।
অথবা, আপনি বলতে পারেন, "তথ্য খুঁজুন এবং আমার জন্য একটি মাঝারি আকারের SUV বুক করুন, যার বাজেট প্রতিদিন $80 এর বেশি নয়। আমার ইমেলের তথ্য ব্যবহার করে পরের সপ্তাহে আপনার ভ্রমণের পরিকল্পনা করুন।" জেমিনি ফ্লাইটের তথ্য খুঁজে বের করবে, গাড়ি ভাড়ার বিকল্পগুলির তুলনা করবে এবং আপনার জন্য বুকিং প্রক্রিয়া প্রস্তুত করবে।
পুরো প্রক্রিয়া জুড়ে আপনি নিয়ন্ত্রণ বজায় রাখবেন এবং মিথুন রাশি গুরুত্বপূর্ণ ক্রিয়াকলাপের আগে নিশ্চিতকরণের জন্য অনুরোধ করবে।
এছাড়াও, গুগল এআই স্টুডিও এবং ভার্টেক্স এআই-তে, জেমিনি এপিআই-এর মাধ্যমে জেমিনি ৩ প্রো প্রিভিউ ব্যবহারের মূল্য ইনপুটের জন্য প্রতি মিলিয়ন টোকেনের জন্য ২ ডলার এবং আউটপুটের জন্য প্রতি মিলিয়ন টোকেনের জন্য ১২ ডলার। এটি গুগল এআই স্টুডিওতেও বিনামূল্যে ব্যবহার করা যায়, তবে এর ব্যবহারের ক্ষেত্রে সীমাবদ্ধতা রয়েছে।

জেমিনি ৩ কে কার্সার, গিটহাব, জেটব্রেইনস এবং রেপ্লিট সহ ডেভেলপমেন্ট টুল ইকোসিস্টেমের সাথে একীভূত করা হয়েছে।
পণ্য লঞ্চের সাথে সাথে, গুগল একই সাথে একাধিক অ্যাক্সেস পয়েন্ট খুলে দিয়েছে।
আজ থেকে, জেমিনি ৩ প্রিভিউ ধীরে ধীরে চালু করা হচ্ছে: সমস্ত ব্যবহারকারী এটি জেমিনি অ্যাপে ব্যবহার করতে পারবেন; গুগল এআই প্রো এবং আল্ট্রা গ্রাহকরা এটি অনুসন্ধানের এআই মোডে উপভোগ করতে পারবেন; ডেভেলপাররা জেমিনি এপিআই, গুগল অ্যান্টিগ্রাভিটি এবং জেমিনি সিএলআই এর মাধ্যমে এটি অ্যাক্সেস করতে পারবেন; এবং এন্টারপ্রাইজ ব্যবহারকারীরা ভার্টেক্স এআই এবং জেমিনি এন্টারপ্রাইজের মাধ্যমে পরিষেবাটি অ্যাক্সেস করতে পারবেন।
ChatGPT-এর প্রতিদ্বন্দ্বী এসে গেছে। বাস্তব জগতের পরীক্ষায় জেমিনি 3 কতটা প্রতিযোগিতামূলক?
অবশ্যই, প্রযুক্তি কোম্পানিগুলি সবসময় তাদের ক্ষমতাকে অতিরঞ্জিত করে, তাই আমরা কয়েকটি বিষয়ও পরীক্ষা করেছি।
প্রথম চ্যালেঞ্জ ছিল একটি সম্পূর্ণ গেম বয় হ্যান্ডহেল্ড কনসোল তৈরি করা, যেখানে টেট্রিস এবং পোকেমন রেড/ব্লু-এর মতো ক্লাসিক গেমগুলি আগে থেকে ইনস্টল করা থাকবে এবং সমস্ত নিয়ন্ত্রণ কীবোর্ড এবং টাচস্ক্রিন উভয় ইন্টারঅ্যাকশনকেই সমর্থন করবে।
সত্যি কথা বলতে, এই চাহিদার জন্য আমার খুব বেশি প্রত্যাশা নেই।
এই ধরণের কাজ, যার জন্য UI ডিজাইন, গেম লজিক এবং সাউন্ড এফেক্ট একসাথে পরিচালনা করতে হয়, এমনকি একজন পেশাদার ফ্রন্ট-এন্ড ইঞ্জিনিয়ারেরও বেশ কয়েক দিন সময় লাগত। কিন্তু জেমিনির পারফরম্যান্স অপ্রত্যাশিত ছিল: ইন্টারেক্টিভ ইন্টারফেসটি 60-70% স্কোর অর্জন করেছিল, এবং বোতামগুলি টিপলে এমনকি স্বতন্ত্র সাউন্ড এফেক্টও ছিল। একবারে তৈরি কোডের একটি অংশ হিসাবে, এটি বেশ চিত্তাকর্ষক ছিল।

এখন যেহেতু রেট্রো গেম কনসোলগুলি কাজ করছে, আসুন আমরা সবকিছু শুরু করি।

▲ macOS এর মতো একটি ওয়েব অপারেটিং সিস্টেম ডিজাইন এবং তৈরি করুন, টেক্সট এডিটর থেকে সম্পূর্ণ কার্যকরী বৈশিষ্ট্য, পাইথন এবং কোড এডিটর সহ টার্মিনাল এবং একটি গেম যা ডাইল ম্যানেজার থেকে পেইন্ট টু ভিডিও এডিটর এবং সমস্ত গুরুত্বপূর্ণ উইন্ডোজ অপারেটিং সিস্টেমে খেলা যায়। প্রি-বান্ডেলড সফটওয়্যার। এটি করার জন্য যেকোনো লাইব্রেরি ব্যবহার করুন তবে নিশ্চিত করুন যে আমি এটি একটি একক HTML ফাইলে পেস্ট করতে পারি এবং এটি Chrome এ খুলতে পারি। এটিকে আকর্ষণীয় এবং অত্যন্ত বিস্তারিত করে তোলে, এমন বিবরণ দেখায় যা কেউ আশা করেনি একটি কোড ব্লকে সম্পূর্ণ সৃজনশীল এবং সম্পূর্ণ সৌন্দর্যে পরিণত হয়।
আমি এটিকে একটি একক HTML ফাইল ব্যবহার করে একটি সম্পূর্ণ macOS সিস্টেমের প্রতিলিপি তৈরি করতে বলেছিলাম, যার মধ্যে একটি টেক্সট এডিটর, টার্মিনাল, কোড এডিটর, ফাইল ম্যানেজার, পেইন্ট এবং ভিডিও এডিটরের মতো আগে থেকে ইনস্টল করা সফ্টওয়্যার অন্তর্ভুক্ত ছিল। ফলস্বরূপ পণ্যটি নান্দনিকভাবে আনন্দদায়ক না হলেও, মূল ইন্টারেক্টিভ লজিকটি বাস্তবায়িত হয়েছে।

এর প্রোগ্রামিং ক্ষমতা ছাড়াও, আমরা এর ভিজ্যুয়াল জেনারেশন এবং যুক্তি ক্ষমতাও পরীক্ষা করেছি।
@lepadphone (X) ব্যবহারকারীর পদ্ধতি অনুসরণ করে, আমি জেমিনিকে ফ্রন্ট-এন্ড কোড ব্যবহার করে একটি বৈদ্যুতিক পাখার ভিজ্যুয়াল এফেক্ট বাস্তবায়ন করতে বলেছিলাম। আমি এটি আঁকার জন্য SVG প্রযুক্তি ব্যবহার করার পরামর্শ দিয়েছিলাম, যার মধ্যে ফ্যান ব্লেড, প্রতিরক্ষামূলক গ্রিল, বেস এবং নিয়ন্ত্রণ বোতামের মতো কাঠামোগত বিবরণ এবং ব্লেড ঘূর্ণন এবং গতি সমন্বয়ের মতো গতিশীল প্রভাব প্রয়োগ করা অন্তর্ভুক্ত ছিল। জেনারেট করা SVG-এর কেবল একটি সম্পূর্ণ কাঠামোই নয়, ফ্যান ব্লেড ঘূর্ণন অ্যানিমেশনও খুব স্বাভাবিক।
এরপর, আমি তাকে সাইকেল চালিয়ে যাওয়া একটি পেলিক্যান আঁকতে বলেছিলাম—একটি অস্বাভাবিক সমন্বয় যা AI-এর স্থানিক কল্পনাশক্তি পরীক্ষা করে। ফলাফল ছিল একটি সু-আনুপাতিক গ্রাফিক, যেখানে পেলিকানের ভঙ্গি এবং সাইকেলের দৃষ্টিভঙ্গি বেশ ভালোভাবে পরিচালনা করা হয়েছে।

▲প্রম্পট শব্দ: যতটা সম্ভব সুন্দরভাবে সাইকেল চালানোর জন্য একটি পেলিক্যানের SVG কোড তৈরি করুন
যুক্তির ক্ষমতার ক্ষেত্রে, আমি ক্লাসিক বানর-পীচ সমস্যাটি ব্যবহার করেছি। জেমিনির উত্তর কেবল সঠিক ছিল না, বরং তিনি এটি দুবার যাচাইও করেছিলেন।
পাঁচটি বানর সমুদ্র সৈকতে এক স্তূপ পীচ দেখতে পেল এবং পরের দিন সেগুলো সমানভাবে ভাগ করে নেওয়ার সিদ্ধান্ত নিল। প্রথম বানরটি পরের দিন খুব ভোরে এসে পৌঁছাল। পীচগুলো ঠিকভাবে ভাগ করতে না পেরে, একটিকে সমুদ্রে ফেলে দিল, যার ফলে পাঁচটি সমান দল তৈরি হল। বানরটি তার ভাগ নিয়ে নিল। দ্বিতীয়, তৃতীয়, চতুর্থ এবং পঞ্চম বানর একই সমস্যার সম্মুখীন হয়েছিল এবং একই পদ্ধতি ব্যবহার করে, প্রতিবার একটি করে পীচ ফেলে পাঁচটি সমান দল তৈরি করল। স্তূপে সর্বনিম্ন কত পীচ আছে?

আরও মজার বিষয় হল, আমরা "ননসেন্স সাহিত্য" বোঝার ক্ষমতাও পরীক্ষা করেছি।
এই ধরণের ছলনাময়ী শব্দচয়ের মুখোমুখি হয়ে—“যারা বোঝে তারা বুঝবে, যারা অজ্ঞ তারা অজ্ঞই থেকে যাবে; স্বর্গের গোপন কথা না বললে বোঝা যায়, কিন্তু স্বর্গের গোপন কথা প্রকাশ করা প্রকৃত বোধগম্যতা নয়”—মিথুনের দৃষ্টিভঙ্গি চতুর: প্রথমে, তিনি আপনাকে আশ্বস্ত করার জন্য এটিকে "অর্থহীন সাহিত্য" হিসেবে শ্রেণীবদ্ধ করেন; তারপর, তিনি "অস্তিত্ব এবং অনস্তিত্ব"-এর তাওবাদী ধারণা এবং "রূপ এবং শূন্যতা"-এর বৌদ্ধ ধারণার মতো অন্তর্নিহিত সাংস্কৃতিক উল্লেখগুলিতে খনন করেন; অবশেষে, তিনি একটি সরল-ভাষায় অনুবাদ প্রদান করেন। এই প্রতিক্রিয়া কেবল "এটি অর্থহীন" বলার চেয়ে অনেক বেশি পরিশীলিত।

লেখার পরীক্ষাও অন্তর্ভুক্ত ছিল।
আমরা জেমিনিকে প্রথম পুরুষের মতো "একটি বৃষ্টির ফোঁটার জীবনের একটি দিন" লিখতে বলেছিলাম, এবং সে একটি গদ্য কবিতা পরিবেশন করেছিল: মেঘের ভিড় এবং অপেক্ষা, পতনের আনন্দ এবং নদীতে মিশে যাওয়ার প্রশান্তি। লেখাটি সংবেদনশীল বিবরণে সমৃদ্ধ – কাঁপুনি স্পর্শ, নিয়ন আলোর চাক্ষুষ প্রতিফলন, গর্জনকারী বাতাসের শ্রবণযোগ্য শব্দ। আবেগগুলি প্রকৃত, এবং চিত্রকল্প সমৃদ্ধ। যদিও "চমৎকার উদাহরণ" এর মতো সূত্রগত লেখার কিছু চিহ্ন এখনও রয়েছে, এটি ইতিমধ্যেই পাসিং গ্রেড ছাড়িয়ে গেছে।
সত্যি কথা বলতে, কাগজে-কলমে থাকা স্পেসিফিকেশনগুলো বাদ দিলেও, জেমিনি ৩-এর প্রকৃত কর্মক্ষমতা অনস্বীকার্য। অল্প সময়ের মধ্যে ওপেনএআই-এর বছরের অভিজ্ঞতার সাথে তাল মিলিয়ে চলা বা এমনকি ছাড়িয়ে যাওয়ার গুগলের ক্ষমতা, কয়েকটি পূর্ণ-স্ট্যাক এআই বিক্রেতাদের মধ্যে একটি হিসেবে এর শক্তিশালী শক্তির সাথে অবিচ্ছেদ্য।
গুগলের সুবিধাগুলি সুস্পষ্ট: এর স্ব-উন্নত TPU সিরিজ প্রসেসরগুলির দ্বারা আনা কম্পিউটিং শক্তির স্বায়ত্তশাসন, বিশ্বের বৃহত্তম ডেটা সংগ্রহস্থল – অনুসন্ধান সূচক, একাডেমিক সাহিত্য এবং ইউটিউব ভিডিও লাইব্রেরি – সবই জেমিনির প্রশিক্ষণের জন্য শক্তিশালী সহায়তা প্রদান করে। এটিও ব্যাখ্যা করতে পারে যে কেন এটি রিয়েল-টাইম তথ্য, বহুভাষিক কাজ এবং ভিডিও বোঝার সময় আরও স্থিতিশীলভাবে কাজ করে।
এইমাত্র, ডিপমাইন্ডের ডেভেলপার এক্সপেরিয়েন্সের প্রধান ওমর সানসেভিয়েরো X-তে পোস্ট করেছেন যে আজ রাতের অনুষ্ঠানটি কেবল একটি "উষ্ণতা" ছিল এবং শীঘ্রই আরও বৈশিষ্ট্য প্রকাশ করা হবে। পূর্ববর্তী গুজবের সাথে মিলিত হয়ে, দীর্ঘ প্রতীক্ষিত ন্যানো ব্যানানা 2 সত্যিই খুব কাছে আসতে পারে।
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
