
ভূমিকা পর্ব অ্যান্ড্রয়েড শো উপভোগ করার পর, আসল মূল অনুষ্ঠান, গুগল আই/ও ২০২৬, আনুষ্ঠানিকভাবে শুরু হলো।
প্রত্যাশিতভাবেই, প্রায় দুই ঘণ্টাব্যাপী এই অনুষ্ঠানটির কেন্দ্রবিন্দুতে ছিল মিথুন রাশি।

ছবি | গুগল
বেসিক মডেল এবং পেরিফেরাল সক্ষমতা আপডেট করার পাশাপাশি, জেমিনিকে গুগল অ্যাপস স্যুটের সাথে আরও গভীরভাবে একীভূত করা হয়েছে এবং এমনকি iOS ও macOS-এর জন্যও কিছু আপডেট আনা হয়েছে।
দুর্ভাগ্যবশত, এ বছরের আই/ও-এর উদ্বোধনী অনুষ্ঠানে গত সপ্তাহে উন্মোচিত হওয়া গুগলবুক বা অ্যান্ড্রয়েড ১৭ কোনোটিরই উল্লেখ করা হয়নি।
আমরা একমাত্র যে হার্ডওয়্যার পণ্যটি দেখেছি, তা হলো স্যামসাংয়ের সঙ্গে যৌথভাবে তৈরি একজোড়া স্মার্ট গ্লাস।

ছবি | গুগল
সংক্ষেপে, এই আই/ও সম্মেলনে গুগলের বার্তাটি বেশ স্পষ্ট:
জেমিনির সক্ষমতা আরও শক্তিশালী হবে, এর উপস্থিতি আরও সুস্পষ্ট হবে এবং বিশ্বজুড়ে গুগলের কোটি কোটি পণ্য ব্যবহারকারীর ‘বাস্তব জীবনের’ সঙ্গে এর একীকরণ ক্রমশ আরও নিবিড় হবে।
নাটকীয়ভাবে বলতে গেলে—জেমিনি বেশিরভাগ মানুষের দৈনন্দিন কাজ দখল করে নিতে আর মাত্র একটি হিউম্যানয়েড রোবট দূরে আছে বলে মনে হচ্ছে।
অন্তর্নিহিত মডেল আপডেট
পুরো অনুষ্ঠানটির সবচেয়ে গুরুত্বপূর্ণ অংশ ছিল জেমিনির জন্য বেশ কয়েকটি অন্তর্নিহিত মডেলের হালনাগাদ।
প্রথমে, অফিসিয়াল জেমিনি ৩.৫ সংস্করণটি প্রকাশ করা হয়েছিল এবং ব্যবহারকারীরা প্রথম যে সংস্করণটি ব্যবহার করতে পারবেন তা হলো জেমিনি ৩.৫ ফ্ল্যাশ।
এটি ফ্ল্যাশ সিরিজের গতি বজায় রেখে পূর্ববর্তী ২.৫ প্রো-এর সমতুল্য সক্ষমতা একাধিক ক্ষেত্রে প্রদর্শন করে:

ছবি | গুগল
গতি এবং পারফরম্যান্সের মধ্যে ভারসাম্যের কারণে, জেমিনি ৩.৫ ফ্ল্যাশের অন্যতম সেরা প্রয়োগ হলো উল্লেখযোগ্য টোকেন ওভারহেড বাঁচিয়ে দীর্ঘমেয়াদী ও বৃহৎ পরিসরের বুদ্ধিদীপ্ত কাজ পরিচালনা করা।
এরই মধ্যে, সর্বশেষ অ্যান্টিগ্র্যাভিটি সংযোজন জেমিনি ৩.৫ ফ্ল্যাশকে আরও বিস্তৃত আউটপুট বিকল্প প্রদান করে।
ক্লাসিফিকেশন কোড চালান, অ্যাকাডেমিক পেপারের উপর ভিত্তি করে গেম তৈরি করুন, পুরোনো কোডবেস রূপান্তর করুন, 3D সিন, ইন্টারেক্টিভ ওয়েব ইন্টারফেস এবং আরও অনেক কিছু নির্মাণ করুন।

পুরোনো কোডবেসকে Next.js-এ রূপান্তর করা | গুগল
এছাড়াও, রয়েছে বৃহত্তম 'বিশ্ব মডেল', জেমিনি অমনি, যাকে গুগলের দূরদৃষ্টির বৃহত্তর প্রেক্ষাপটে বর্ণনা করতে গেলে বলতে হয়:
এটি যেকোনো ইনপুটের উপর ভিত্তি করে আপনার ইচ্ছামত যেকোনো আউটপুট দিতে পারে।
অমনি-র প্রথম মডেল পণ্যটি হলো জেমিনি অমনি ফ্ল্যাশ, যা জেমিনি অ্যাপের পাশাপাশি গুগল ফ্লো এবং ইউটিউব শর্টস-এর সাথেও সমন্বিত, যার ফলে ব্যবহারকারীরা স্বাভাবিক ভাষা ব্যবহার করে ‘সবচেয়ে বাস্তবসম্মত’ ভিডিও তৈরি করতে পারেন।

ছবি | গুগল
এরই ধারাবাহিকতায়, গুগল তার গুগল ওয়ান সাবস্ক্রিপশন মডেলেও পরিবর্তন এনেছে এবং মূল সর্বোচ্চ স্তরের এআই আল্ট্রা প্ল্যানটির সাথে মাসিক ১০০ ডলারের একটি বিকল্প যুক্ত করেছে।
এই নতুন সাবস্ক্রিপশনটিও এআই আল্ট্রা টিয়ারের অংশ এবং এতে জেমিনি ৩.৫ ফ্ল্যাশ, অ্যান্টিগ্র্যাভিটি ২.০ ও অন্যান্য নতুন ফিচারগুলোতে অগ্রাধিকারমূলক অ্যাক্সেস অন্তর্ভুক্ত রয়েছে।
অবশ্যই, প্রচলিত ২০ টেরাবাইট ক্লাউড স্টোরেজ এবং ইউটিউব প্রিমিয়াম অ্যাক্সেসও অন্তর্ভুক্ত রয়েছে, যা মূলত ডেভেলপার এবং অভিজ্ঞ ক্রিয়েটরদের লক্ষ্য করে তৈরি।

ছবি | গুগল
এদিকে, সর্বোচ্চ স্তরের এআই আল্ট্রা সাবস্ক্রিপশন, যার আসল মূল্য ছিল ২৫০ ডলার, তা কমিয়ে প্রতি মাসে মাত্র ২০০ ডলার করা হয়েছে এবং এতে এআই প্রো-এর তুলনায় ২০ গুণ পর্যন্ত ব্যবহারের ক্রেডিটসহ বিভিন্ন সুবিধা পাওয়া যাচ্ছে।
মূল্য নির্ধারণ মডেলে আরেকটি বড় পরিবর্তন হলো স্বয়ং জেমিনি অ্যাপটি।

চিত্র | গুগল আই/ও
একটি প্রেস বিজ্ঞপ্তিতে গুগল ঘোষণা করেছে যে, তারা জেমিনির দৈনিক সীমা 'কীওয়ার্ড সীমা' থেকে পরিবর্তন করে 'ব্যবহার-ভিত্তিক' করবে।
এই হিসাব থেকে দেখা যায় যে, বেশি পরিমাণে ছবি, ভিডিও এবং কোড ব্যবহৃত হয়, অন্যদিকে কম পরিমাণে টেক্সট-ভিত্তিক কাজ ব্যবহৃত হয়, যার ফলে সার্বিকভাবে কম্পিউটিং পাওয়ার বিলিং মডেলটি আরও নমনীয় হয়ে ওঠে।
প্রকৃত ব্যবসায়িক বাস্তবায়ন
ওপেনএআই এবং অ্যানথ্রোপিকের মতো কোম্পানিগুলোর থেকে ভিন্ন, গুগলের সবচেয়ে বড় সুবিধা হলো এর সত্যিই একটি পণ্য ইকোসিস্টেম রয়েছে, যা বিশ্বজুড়ে কোটি কোটি ব্যবহারকারীর কাছে সরাসরি পৌঁছাতে পারে।
পূর্বোক্ত মৌলিক মডেলগুলোর বাইরে, এবারের প্রদর্শনীতে যেমনটা দেখা গেছে, গুগলের কৌশলটি এই ‘বিমূর্ত’ এআই মডেলের সক্ষমতাগুলোকে সাধারণ মানুষের দৈনন্দিন ব্যবহৃত অ্যাপগুলোর সাথে একীভূত করার ওপর আলোকপাত করে।

ছবি | স্ল্যাশগিয়ার
এই একীকরণকে প্রধানত তিনটি ধাপে ভাগ করা যায়: প্রথাগত অনুসন্ধান ব্যবসার রূপান্তর , মোবাইল ফোন সিস্টেমের বুদ্ধিমত্তায়ন এবং ভিজ্যুয়াল ইন্টেলিজেন্সের সংমিশ্রণ ।
গুগলের মূল ব্যবসা হিসেবে ‘সার্চ ইঞ্জিন’ এই বছরের আই/ও-তে একটি সম্পূর্ণ এআই রূপান্তরের মধ্য দিয়ে গেছে, যাকে গুগল ‘এআই সার্চের নতুন যুগ’ বলে অভিহিত করছে।
এই ব্যবসায়িক পরিবর্তনের পেছনের যুক্তিটি সহজ: ২০ বছর আগের তুলনায়, যখন মানুষ সার্চ বক্সে শুধু শব্দ বা বাক্যাংশ লিখত, এখন তারা জটিল যৌগিক কমান্ড লিখতে বেশি অভ্যস্ত।

ছবি | গুগল
অন্য কথায়, গুগল প্রচলিত সার্চ বক্সকে একটি সার্বজনীন চ্যাটবক্সে পরিণত করেছে।
অনুসন্ধান করার পাশাপাশি, ব্যবহারকারীরা অ্যাপের মধ্যে যেকোনো ধরনের কন্টেন্টের জন্য অনুরোধ করতে পারেন।
এই I/O ইভেন্টের জন্য এটিও একটি গুরুত্বপূর্ণ আপডেট – এজেন্ট সক্ষমতা সহ অনুসন্ধান।
প্রথমত, এআই মোডের বেসিক মডেলটি জেমিনি ৩.৫-এ আপগ্রেড করা হবে এবং আপনার সার্চ বক্সে আপনার দেওয়া কন্টেন্ট স্বয়ংক্রিয়ভাবে সুপারিশ ও সম্পূর্ণ করা হবে, যা আপনার কীওয়ার্ডগুলোকে আরও বিস্তারিত বা ব্যাপক করে তুলবে।

ছবি | গুগল
এছাড়াও, রয়েছে একটি একেবারে নতুন জেনারেটিভ ইউআই সমাধান, যেখানে গুগল আপনার প্রশ্নের উপর ভিত্তি করে বুদ্ধিমত্তার সাথে সবচেয়ে উপযুক্ত উত্তরটি তৈরি করে।
উদাহরণস্বরূপ, স্টক ট্রেন্ড খোঁজার সময়, উত্তরগুলিতে শুধু টেক্সটই থাকে না, বরং লাইন চার্টও তৈরি হয়; ইন্টেরিয়র ডিজাইনের অনুপ্রেরণা চাইলে, উত্তরগুলি ছবি তৈরি করে…
এমনকি পদার্থবিজ্ঞানের প্রশ্ন খুঁজলেও, অ্যান্টিগ্র্যাভিটি ব্যবহার করে দ্রুত একটি ইন্টারেক্টিভ ওয়েব ডেমো তৈরি করা যায়।

ছবি | গুগল
এত বছর ধরে 'মাল্টিমোডাল সার্চ' ব্যবহার করার পর, আমরা অবশেষে 'মাল্টিমোডাল রেসপন্স'-এর যুগে প্রবেশ করেছি।
অ্যান্টিগ্র্যাভিটির সাথে গুগল সার্চের সমন্বয়ের ক্ষমতা এর চেয়েও বেশি; এটি আরও এক ধাপ এগিয়ে যেতে পারে, সার্চ বক্সে আপনার টাইপ করা তথ্যের উপর ভিত্তি করে রিয়েল টাইমে ওয়েব-ভিত্তিক ড্যাশবোর্ড বা ট্র্যাকার তৈরি করতে পারে।
সহজ ভাষায় বলতে গেলে, এর মানে হলো গুগলের সার্চ বক্স আপনার নির্দিষ্ট প্রয়োজনের জন্য সরাসরি একটি বিশেষ অ্যাপ তৈরি করে দেয়।
এই বহুমুখী সক্ষমতাটি ভীতিকর; এটি মানুষের তথ্য সংগ্রহের পদ্ধতিকেও পুরোপুরি বদলে দিতে পারে।
সর্বোপরি, আমরা বেশিরভাগ সময়ই অনুসন্ধানের ফলাফলগুলো অন্যান্য কাজে ব্যবহার করার জন্যই কিছু খুঁজি, এবং নতুন গুগল সার্চ আপনাকে সরাসরি পরবর্তী ধাপটি সম্পন্ন করতে সাহায্য করতে পারে।

ছবি | গুগল
এই 'এজেন্সি পরিষেবা'র নির্দিষ্ট পদ্ধতিটি হলো জেমিনি স্পার্ক।
সহজ কথায়, জেমিনি স্পার্ক মূলত একটি "অর্থগত বোধগম্যতা-স্বয়ংক্রিয় সম্পাদন" ফাংশন, যা গুগলের একটি ক্ল (OpenClaw)-এর অনুরূপ।
জেমিনি স্পার্ক সর্বশেষ জেমিনি ৩.৫ মডেলের উপর ভিত্তি করে তৈরি এবং এটি ২৪/৭ নিরবচ্ছিন্নভাবে কাজ করতে পারে।
তাছাড়া, যেহেতু এটি গুগল ক্লাউডে চলে, তাই এটি ক্রস-প্ল্যাটফর্ম প্রক্সি অপারেশনও সম্পাদন করতে পারে—অর্থাৎ মোবাইল ফোনে কাজ বরাদ্দ করে কম্পিউটারে তার ফলাফল গ্রহণ করতে পারে।

ছবি | গুগল
জেমিনি স্পার্ক বর্তমানে সমস্ত গুগল সুইট অ্যাপ সমর্থন করে এবং ভবিষ্যতে এমসিপি প্ল্যাটফর্মটিকে থার্ড-পার্টি অ্যাপের অভ্যন্তরীণ ফাংশনগুলির সাথে সামঞ্জস্যপূর্ণ করার জন্য প্রসারিত করবে, পাশাপাশি ব্যবহারকারীদের তাদের নিজস্ব স্কিল আপলোড করার সুযোগও দেবে।
গুগল আরও ঘোষণা করেছে যে ভবিষ্যতে জেমিনি স্পার্ককে ক্রোম এবং অ্যান্ড্রয়েড হ্যালো-তে একীভূত করা হবে, যা ব্রাউজার এবং মোবাইল ফোনে ইন্টেলিজেন্ট এজেন্টদের দ্বারা বিভিন্ন কার্যক্রম স্বয়ংক্রিয় করার ক্ষমতা নিয়ে আসবে।

অ্যান্ড্রয়েড হ্যালো | গুগল
চূড়ান্ত ধাপটি হলো ভিজ্যুয়াল ইন্টেলিজেন্সের সাথে জেমিনির একীকরণ।
এই আই/ও ইভেন্টে গুগল স্যামসাংয়ের সঙ্গে যৌথভাবে তৈরি তাদের প্রথম 'পিওর অডিও স্মার্ট গ্লাস' পণ্যটি উন্মোচন করেছে, যেটিতে যথাক্রমে জেন্টল মনস্টার এবং ওয়ারবি পার্কার ফ্রেম ব্যবহার করা হয়েছে।

ছবি | গুগল
কার্যকারিতার দিক থেকে, এই শুধু-অডিও চশমাগুলো বাজারে বিদ্যমান স্মার্ট চশমাগুলো থেকে খুব একটা আলাদা নয়। এদের প্রধান সুবিধা হলো, পূর্বে উল্লিখিত অন্যান্য জটিল সক্ষমতাগুলো ব্যবহারের জন্য এগুলো সরাসরি জেমিনির মাল্টিমোডাল ফাংশনগুলোকে কল করতে পারে।
অন্যদিকে, গুগলের সহযোগিতায় তৈরি স্ক্রিনযুক্ত স্মার্ট চশমা, এক্সরিয়ালের ‘প্রজেক্ট অরা’, এই অনুষ্ঠানে একটি আপডেট পেয়েছে।
ভূমিকা অনুসারে, প্রজেক্ট অরা XREAL-এর নিজস্ব উদ্ভাবিত X1S স্পেশিয়াল কম্পিউটিং চিপ দ্বারা সজ্জিত এবং আরামদায়ক পরিধানের জন্য এতে একটি স্প্লিট ডিজাইন ব্যবহার করা হয়েছে।
অন্য কথায়, প্রজেক্ট অরা-র চশমা অংশটি শুধুমাত্র ডিসপ্লের জন্য দায়ী; আসল প্রসেসিং চিপ, ব্যাটারি প্যাক এবং টাচপ্যাডকে একটি ডেটা কেবলের মাধ্যমে বাহ্যিক পোর্টেবল ইউনিটের সাথে সংযুক্ত করতে হয়।

ছবি | দ্য ভার্জ
দৈনন্দিন ব্যবহারিক ফাংশনগুলোর ক্ষেত্রে, প্রজেক্ট অরা গুগল ম্যাপস ইমারসিভ নেভিগেশন, জায়ান্ট স্ক্রিন/উইন্ডোড ভিডিও প্লেব্যাক, ইউটিউব ভিআর ভিডিও, ওয়েবএক্সআর থ্রিডি পেইন্টিং, ডিপি এক্সটেন্ডেড ল্যাপটপ স্ক্রিন এবং আরও অনেক কিছু সাপোর্ট করবে।

ছবি | টেকব্লগ
সামগ্রিকভাবে, অ্যান্ড্রয়েড এক্সআর হলো একটি ভিজ্যুয়াল অপারেটিং সিস্টেম যা সম্পূর্ণরূপে স্পেশিয়াল কম্পিউটিং-এর উপর ভিত্তি করে তৈরি। জেমিনির সক্ষমতার সাথে মিলিত হয়ে এটি আমাদের স্মার্ট গ্লাসের ভবিষ্যতের জন্য একটি পথনির্দেশিকা প্রদান করে।
আরও গুরুত্বপূর্ণ বিষয় হলো, যদিও অ্যান্ড্রয়েড এক্সআর এবং অ্যান্ড্রয়েড ১৭ বর্তমানে দুটি সম্পূর্ণ স্বাধীন সিস্টেম, ঠিক যেমন অ্যান্ড্রয়েড এবং ক্রোমওএস একীভূত হয়েছিল, তেমনি ভবিষ্যতে এগুলিও খুব সম্ভবত একীভূত হয়ে একটি 'ভিজ্যুয়াল ইন্টেলিজেন্স সিস্টেম'-এর মতো কিছুতে পরিণত হবে।
মিথুন রাশি কি সবকিছু দখল করে নিতে পারে?
পুরো গুগল আই/ও দেখার জন্য সারারাত জেগে থাকার পর, জেমিনি ৩.৫ এবং এর সহযোগী যন্ত্রগুলোর চমকের পাশাপাশি, কৃত্রিম বুদ্ধিমত্তা মানুষের মৌলিক আচরণে যে বিপ্লব আনছে, তা দেখে আমরা বিস্মিত না হয়ে পারিনি।
সেটা জেমিনি ৩.৫ ফ্ল্যাশ, অ্যান্টিগ্র্যাভিটি বা জেমিনি স্পার্ক যাই হোক না কেন, সবগুলোই একটি সাধারণ 'সার্চ ডায়ালগ বক্স'-এর আড়ালে লুকানো থাকে, যা অনুসন্ধানের কাজটিকে 'তথ্য সংগ্রহ' থেকে 'একটি কাজ সম্পন্ন করা'-তে রূপান্তরিত করে।

ছবি | গুগল অনুসন্ধান
ইন্টারনেট ও কৃত্রিম বুদ্ধিমত্তার ব্যবহারে এই বিবর্তনের দীর্ঘমেয়াদী প্রভাব কী হবে তা বলা কঠিন, কিন্তু এর মধ্যে আমরা অন্তত গুগলের উচ্চাকাঙ্ক্ষা দেখতে পাই।
একটি শক্তিশালী এআই মডেলকে অভূতপূর্ব কার্যকারিতার সমৃদ্ধিতে সমৃদ্ধ করা এবং এই কার্যকারিতাগুলোকে এর নেটওয়ার্ক পণ্যগুলোতে একীভূত করা, যা বিশ্বজুড়ে কোটি কোটি ব্যবহারকারীর কাছে পৌঁছায়, যার মাধ্যমে এই কোটি কোটি মানুষের কর্মদক্ষতা উন্নত করা।

এই সমস্ত নেটওয়ার্ক পণ্যগুলিতে জেমিনির একযোগে প্রবেশের একটি পার্শ্বপ্রতিক্রিয়া রয়েছে: 'প্রয়োগ' ধারণাটি ক্রমশ দুর্বল হয়ে পড়ছে।
এজেন্ট যত বেশি সক্ষম হয়, অ্যাপ্লিকেশনের মধ্যে এবং সার্চ রেজাল্ট পেজগুলোতে এর মূল্য ততই হ্রাস পায়।
বুদ্ধিমত্তার এই স্তরটি কতগুলো পুরোনো নিয়ম নতুন করে লিখবে, তার উত্তর এই মুহূর্তে কেউ দিতে পারবে না, এমনকি গুগল নিজেও না।
iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।
