
সম্পাদকের মন্তব্য: যখন AI তার নিজস্ব আকৃতি অনুসন্ধান শুরু করে, তখন এর কিছু পছন্দ অপ্রত্যাশিত হয়। স্মার্টফোনে কৃত্রিম বুদ্ধিমত্তা (AI) একটি বিশেষ বোতামের ব্যবহার শুরু করেছে, যা তাদের দীর্ঘদিনের হারিয়ে যাওয়া বিবর্তনীয় প্রবণতাকে পুনরুজ্জীবিত করে তুলেছে। চশমা, দৃষ্টিশক্তি এবং শ্রবণশক্তির প্রাকৃতিক অ্যাক্সেসের কারণে, পরবর্তী প্রজন্মের ব্যক্তিগত টার্মিনালের মতো হতে শুরু করেছে। কিছু ছোট, ফোকাসড ডিভাইস নির্দিষ্ট সময়ে অল-ইন-ওয়ান ডিভাইসের চেয়ে বেশি নির্ভরযোগ্য বলে মনে হয়। ইতিমধ্যে, স্মার্টফোনগুলিকে ডিসপোজেবল ডিভাইস দিয়ে প্রতিস্থাপনের আমূল প্রচেষ্টাগুলি ঠান্ডা সাড়া পেয়েছে। প্রযুক্তির বাস্তবায়ন কখনই কেবল ফাংশনগুলিকে একত্রিত করার বিষয় নয়; এটি মানুষের অভ্যাস, পরিস্থিতির সামঞ্জস্য এবং "ব্যবহারে সহজ" এর পুনঃসংজ্ঞা সম্পর্কেও। iFanr "AI Gadgets Chronicle" কলামটি চালু করেছে, যার লক্ষ্য হল আপনার সাথে অন্বেষণ করা যে AI কীভাবে হার্ডওয়্যার ডিজাইন পরিবর্তন করছে, মানব-কম্পিউটার মিথস্ক্রিয়াকে নতুন আকার দিচ্ছে এবং আরও গুরুত্বপূর্ণভাবে, AI কীভাবে আমাদের দৈনন্দিন জীবনে প্রবেশ করবে।
আমি প্রথমে ভেবেছিলাম Samsung Galaxy S26 সিরিজ ইতিমধ্যেই ফাঁস হয়ে গেছে, এবং লঞ্চ ইভেন্টটি কেবল একটি আনুষ্ঠানিকতা হবে। দেখা যাচ্ছে যে Samsung এবং Google এর অন্য কিছু করার পরিকল্পনা ছিল।
দুটি কোম্পানি যৌথভাবে S26-তে বৈশিষ্ট্যযুক্ত নতুন জেমিনি এআই ক্ষমতা প্রদর্শন করেছে: একটি সহজ মৌখিক আদেশের মাধ্যমে, জেমিনি আপনাকে উবারের সাথে যাত্রা শুরু করতে বা DoorDash-এ টেকআউট অর্ডার করতে সহায়তা করতে পারে।

▲ ছবির উৎস: অ্যান্ড্রয়েড সেন্ট্রাল
এই বৈশিষ্ট্যটি বর্তমানে প্রাথমিক প্রিভিউতে রয়েছে এবং শুধুমাত্র মার্কিন যুক্তরাষ্ট্র এবং দক্ষিণ কোরিয়ায় উপলব্ধ।
আপনি এটিকে গুগল এবং স্যামসাং "ডুবাও ফোন" (আরও সঠিকভাবে বলতে গেলে, ডুবাও ফোন সহকারী) এর একটি বিশ্বব্যাপী সংস্করণ তৈরি করার জন্য একসাথে কাজ করার কথা ভাবতে পারেন। গ্যালাক্সি এস২৬ সিরিজটি কেবল শুরু; এই ক্ষমতাগুলি পরে গুগল পিক্সেল ১০ ফোন এবং আরও অ্যান্ড্রয়েড ১৭ ডিভাইসে চালু করা হবে।
অনেক মোবাইল ফোন/কম্পিউটার সিস্টেম-স্তরের এআই এজেন্ট দেখা এবং ব্যবহার করার পর, এবং "ডুবাও ফোন" ব্যাপকভাবে ব্যবহার করার পর, আমি মনে করি জেমিনি এজেন্ট সম্পর্কে আলোচনা কেবল একটি "নতুন বৈশিষ্ট্য"-এর মধ্যে সীমাবদ্ধ থাকা উচিত নয়।
স্বীকার করতেই হবে, এটিই প্রথমবার নয় যে অ্যান্ড্রয়েড অপারেটিং সিস্টেমের অন্তর্নিহিত কাঠামোটি বুদ্ধিমান এজেন্টদের সাথে মানিয়ে নেওয়ার জন্য গভীরভাবে কাস্টমাইজ করা হয়েছে – OPPO, Honor এবং Huawei সহ অনেক নির্মাতা ইতিমধ্যেই যথেষ্ট প্রাথমিক প্রচেষ্টা চালিয়েছে।
কিন্তু এটি গুগল, অ্যান্ড্রয়েড অপারেটিং সিস্টেমের সম্পূর্ণ মালিক।
যদি বাইটড্যান্স, একজন "বহিরাগত" হিসেবে, একটি জাতীয় স্তরের অ্যাপের প্রতি "অসম্মানজনক" হয়ে থাকে, তাহলে এই বিষয়ে গুগলের জড়িত থাকা সম্পূর্ণ ভিন্ন।
কিন্তু অপেক্ষা করুন, প্রথমে একবার দেখে নেওয়া যাক গুগল এবং স্যামসাংয়ের এই "বিনব্যাগ ফোন" আসলে কী।
স্যামসাং "বিন বান ফোন" কেমন?
স্যামসাং এবং গুগল দ্বারা প্রদর্শিত "জেমিনি অটো টাস্ক" ক্ষমতাটি কাজগুলিকে স্বয়ংক্রিয় করার জন্য একটি ফোনের মানুষের ক্রিয়াকলাপ অনুকরণ করতে পারে। অন্তর্নিহিত পদ্ধতিটি সিস্টেম-স্তর/অ্যাপ্লিকেশন-স্তরের API-এর সাথে AI স্ক্রিন রিডিং বোঝাপড়াকে একত্রিত করে।
এটা লক্ষণীয় যে বাইটড্যান্স এবং নুবিয়া কর্তৃক যৌথভাবে তৈরি "ডুবাও ফোন", API-এর পরিবর্তে সিস্টেম-স্তরের অনুমতি এবং স্ক্রিন রিডিং ক্ষমতাগুলিকে ব্যাপকভাবে ব্যবহার করে। আপনি বলতে পারেন যে ডুবাও ফোন মূলত একটি "জোরপূর্বক" পদ্ধতি গ্রহণ করে, অ্যাপ ডেভেলপারদের সাথে আগে থেকে পরামর্শ না করেই এর কার্যকারিতা বাস্তবায়ন করে, যা জাতীয় স্তরের অ্যাপগুলিকে এটি ব্লক এবং বয়কট করার জন্য গোলাবারুদ সরবরাহ করে।
স্যামসাং এবং গুগল গ্যালাক্সি এস২৬ সিরিজে যে জেমিনি স্মার্ট এজেন্টটি প্রয়োগ করেছে তাতে উভয়ের উপাদানই একত্রিত হয়েছে। স্যামসাং কর্তৃক প্রকাশিত তথ্য অনুসারে, এটি তার অ্যাপ স্টোরের শীর্ষ ২০০টি অ্যাপকে সমর্থন করে (তবে শুধুমাত্র নির্দিষ্ট অ্যাপগুলিই ভালভাবে কাজ করার নিশ্চয়তা দেয়, যা পরে বিস্তারিতভাবে আলোচনা করা হবে) – যা ইঙ্গিত করে যে স্যামসাং এবং গুগল অন্তত এই অ্যাপ ডেভেলপারদের সাথে বেশিরভাগ ক্ষেত্রেই যোগাযোগ করেছে।

আসুন একজন Wired ম্যাগাজিন সম্পাদকের অভিজ্ঞতা দেখে নেওয়া যাক: তিনি কেবল জেমিনিকে ফোন করেছিলেন, বিমানবন্দরে যেতে চান বলে জানিয়েছিলেন, এবং জেমিনি অ্যাপ নিজেই উবার খোলার জন্য একটি "ভার্চুয়াল উইন্ডো" খুলেছিল এবং ব্যাকগ্রাউন্ডে অ্যাকশনটি সম্পাদন করা শুরু করেছিল। ব্যবহারকারীরা জেমিনির কার্যকর প্রক্রিয়াটি দেখতে যেকোনো সময় প্রবেশ করতে ক্লিক করতে পারেন।
যেহেতু এই এলাকায় বেশ কয়েকটি ভিন্ন বিমানবন্দর রয়েছে, তাই জেমিনি দ্রুত ব্যবহারকারীকে উপযুক্ত গন্তব্য নির্বাচন করার কথা মনে করিয়ে দেয়; অর্ডার দেওয়ার সময়, জেমিনি ব্যবহারকারীর সামনে ইন্টারফেসটিও ঠেলে দেয় যাতে ব্যবহারকারীর পক্ষে উপযুক্ত গাড়ি নির্বাচন করা এবং অর্থপ্রদান করা সহজ হয়।
জেমিনির "ভার্চুয়াল উইন্ডো" কে একটি স্যান্ডবক্সযুক্ত "ভার্চুয়াল মেশিন" হিসেবে বোঝা যেতে পারে, যা ব্যবহারকারীর গোপনীয়তা রক্ষার জন্য গুগল বিবেচনা করে। পূর্ববর্তী জেমিনি সিস্টেমগুলি অ্যান্ড্রয়েডে চলত, কিন্তু এই নতুন জেমিনি এজেন্টটি এই স্যান্ডবক্সের মধ্যেই কাজ করে এবং অ্যাপ্লিকেশনগুলির সাথে ইন্টারঅ্যাক্ট করার সময় ডিভাইসের অন্যান্য অংশ অ্যাক্সেস করে না।
আরও একটি বিষয়: আপনি যদি ক্লাউড কম্পিউটার/ক্লাউড ফোন ক্ষমতা সম্পন্ন স্মার্ট এজেন্ট পণ্য ব্যবহার করে থাকেন যেমন Manus, Kimi কম্পিউটার, অথবা AutoGLM, তাহলে আপনার এই জেমিনি ভার্চুয়াল মেশিনের যুক্তি সহজেই বুঝতে হবে।

▲ ছবির উৎস: 9To5Google
এটি মোটামুটি সহজ কাজ; অনেক দেশীয়ভাবে তৈরি এআই মোবাইল সহকারী এক বছর আগেই এই পরিস্থিতি আয়ত্ত করে ফেলেছে।
জেমিনির আরও বেশি আকর্ষণীয় বৈশিষ্ট্য হল এর স্ক্রিন রিডিং এবং তথ্য ক্যাপচার ক্ষমতার সাথে এর সমন্বয় যা এটি দীর্ঘদিন ধরে বিকাশ করছে।
উদাহরণস্বরূপ, যখন একজন ব্যবহারকারী এবং তার বন্ধুরা কোনও পার্টির জন্য পিৎজা অর্ডার করার কথা বলছেন, তখন ব্যবহারকারী কেবল জেমিনিকে ডেকে বলতে পারেন "অর্ডারটি ঠিক করে ফেলুন।" এরপর জেমিনি সরাসরি চ্যাটে উল্লিখিত পিৎজা দোকানগুলি, এমনকি নির্দিষ্ট ধরণের পিৎজাও উদ্ধার করতে পারেন এবং প্রত্যেকের চাহিদাগুলি সংগঠিত করতে পারেন।

এরপর, ব্যবহারকারীরা খাদ্য বিতরণ প্ল্যাটফর্ম Grubhub-এ জেমিনি অর্ডার টেকআউট করতে পারবেন। AI স্বয়ংক্রিয়ভাবে শপিং কার্টে সমস্ত খাদ্য আইটেম ব্যাকগ্রাউন্ডে যোগ করবে, যা সবেমাত্র সাজানো হয়েছে এবং তারপর নিশ্চিতকরণ এবং অর্ডার প্লেসমেন্টের জন্য ব্যবহারকারীর কাছে পৌঁছে দেবে।

কখনও কখনও, খাবার অর্ডার করা সহজ হয় না, এবং জেমিনি নিজেই অপ্রত্যাশিত পরিস্থিতি মোকাবেলা করার চেষ্টা করে এবং ব্যবহারকারীদের জন্য সমাধান প্রদান করে। একবার, যখন একটি পিৎজারিয়া পিক আওয়ারে অর্ডার করা যেতে পারে এমন বড় পিৎজার সংখ্যা সীমিত করে, তখন জেমিনি জিজ্ঞাসা করে যে সে কি পরিবর্তে দুটি মাঝারি পিৎজা অর্ডার করতে পারে?
আরেকটি উদাহরণ দেওয়া যাক: একটি বারবিকিউ পার্টিতে অংশগ্রহণকারীদের তালিকা তৈরির জন্য একটি গুগল কিপ নোট ব্যবহার করা হয়েছিল, যেখানে নিরামিষাশীদের নাম উল্লেখ করা হয়েছিল। জেমিনি পুরো পার্টির জন্য প্রয়োজনীয় মোট হট ডগ এবং বান গণনা করতে পারত, তারপর উপকরণ কিনতে পাঠাতে পারত, এবং কয়েক মিনিটের মধ্যেই সমস্ত জিনিসপত্র ডোরড্যাশ শপিং কার্টে পৌঁছে যেত।
গুগলের অ্যান্ড্রয়েড ইকোসিস্টেমের প্রেসিডেন্ট স্যামার সামাত প্রকাশ করেছেন যে জেমিনি এই প্ল্যাটফর্ম অপারেশনগুলির ধাপ এবং রুটগুলি আগে থেকে "মুখস্থ" করেনি, বরং এটি প্রকৃতপক্ষে যুক্তির ক্ষমতা ব্যবহার করে মানুষ কীভাবে স্ক্রিন দেখে এবং পরবর্তী অপারেশনটি কীভাবে সম্পাদন করে তা অনুকরণ করে। এর অর্থ হল জেমিনি ভবিষ্যতে আরও পরিস্থিতিতে তার সম্ভাবনা প্রকাশ করতে পারে।
এখানে আপনি দেখতে পাচ্ছেন যে জেমিনির প্রাথমিক মনোযোগ খাবার অর্ডার করা এবং রাইড-হেলিং পরিস্থিতির উপর, যা বসন্ত উৎসবের আগে কিয়ানওয়েনের কাজের সাথে অনেক বেশি মিল।

▲ ছবির উৎস: ওয়্যার্ড
অ্যান্ড্রয়েড অফিসিয়ালের আরেকটি "বিন বান ফোন"।
সত্যিকারের "অল-ইন-ওয়ান" ডুবাও মোবাইল অ্যাসিস্ট্যান্টের তুলনায়, যা এমনকি WeChat-এর পছন্দের (অন্তত বয়কটের আগে) খুঁজে পেতে সাহায্য করতে পারে, জেমিনির বর্তমান ক্ষমতা এখনও বেশ সীমিত, রাইড-হেলিং, খাবার ডেলিভারি এবং মুদিখানার কেনাকাটার মতো দৈনন্দিন পরিস্থিতিতে ফোকাস করে। যদিও এর অন্তর্নিহিত প্রযুক্তি আরও শক্তিশালী, প্রকৃত ব্যবহারকারীর অভিজ্ঞতা HarmonyOS-এর Xiaoyi এবং Honor-এর YOYO-এর মতো দেশীয় মোবাইল AI অ্যাসিস্ট্যান্টের থেকে খুব বেশি আলাদা নয়।
তবে, প্রবন্ধের শুরুতে যেমন উল্লেখ করা হয়েছে, গুগল সমগ্র অ্যান্ড্রয়েড ইকোসিস্টেম নিয়ন্ত্রণ করে এবং তাদের নিরঙ্কুশ প্রভাব ও নিয়ন্ত্রণ রয়েছে।
জেমিনির অটোমেশন ক্ষমতা প্রকাশের সাথে সাথে, গুগল অ্যান্ড্রয়েড সিস্টেমের অন্তর্নিহিত বিন্যাস এবং ভবিষ্যত পরিকল্পনাগুলিও বিস্তারিতভাবে প্রকাশ করেছে – দুটি দিক রয়েছে, যা সহজভাবে বলতে গেলে, "অ্যাপল" এবং "ডুবাও" উভয়ই।
প্রথমত, গুগল গত বছর "অ্যাপফাংশন" নামে একটি ফ্রেমওয়ার্ক প্রকাশ করেছে, যা ডেভেলপারদের তাদের অ্যাপ্লিকেশনের নির্দিষ্ট ফাংশন এবং বৈশিষ্ট্যগুলির জন্য এন্ট্রি পয়েন্টগুলি প্রকাশ করার অনুমতি দেয় যাতে AI সহকারীরা তাদের কল করতে পারে।
গুগল অ্যাপফাংশনকে অ্যান্ড্রয়েডের "মডেল কনটেক্সট প্রোটোকল" (এমসিপি) এর সাথে তুলনা করে, যা সহজভাবে একটি সংলাপ মান হিসাবে বোঝা যায় যা তৃতীয় পক্ষের অ্যাপ এবং এআই মডেলগুলিকে সংযুক্ত করতে সহায়তা করে।

এই কাঠামোটি অ্যাপলের অ্যাপ ইন্টেন্টের অনুরূপ। অ্যাপলের দৃষ্টিভঙ্গিতে, ব্যবহারকারীরা ফাংশন অর্জনের জন্য বিভিন্ন অ্যাপ পরিচালনা করতে সিরি ব্যবহার করতে পারেন এবং অন্তর্নিহিত বাস্তবায়ন অ্যাপ ইন্টেন্টের মাধ্যমে হয় – পরবর্তী প্রজন্মের সিরির বিলম্বিত আগমনের কারণে, অ্যাপ ইন্টেন্টগুলি একটি ভালো অভিজ্ঞতা প্রদানের জন্য যথেষ্ট।
গুগলের অ্যাপফাংশনের ক্ষেত্রেও একই কথা প্রযোজ্য।
উদাহরণস্বরূপ, একজন ব্যবহারকারী হয়তো বন্ধুর ইমেলে একটি রেসিপি খুঁজে বের করার এবং প্রাসঙ্গিক উপাদানগুলিকে একটি শপিং লিস্টে যোগ করার নির্দেশ দিতে পারেন। কমান্ড পাওয়ার পর, AI প্রথমে ইমেল অ্যাপে "অনুসন্ধান" ফাংশন ব্যবহার করে প্রাসঙ্গিক বিষয়বস্তু পুনরুদ্ধার এবং বের করে আনে এবং তারপর নোটস অ্যাপে "শপিং লিস্ট" ফাংশন ব্যবহার করে ডেটা পূরণ এবং সংগঠিত করে।
Samsung Galaxy S26 এবং One UI 8.5 সিস্টেমে ইতিমধ্যেই কিছু AppFunction বৈশিষ্ট্য প্রয়োগ করা হয়েছে। উদাহরণস্বরূপ, ব্যবহারকারীরা জেমিনিকে তাদের অ্যালবামে নির্দিষ্ট ছবি খুঁজে বের করার এবং SMS এর মাধ্যমে বন্ধুদের কাছে পাঠানোর নির্দেশ দিতে পারেন।
এটা মনে রাখা গুরুত্বপূর্ণ যে পুরো প্রক্রিয়া জুড়ে, জেমিনিকে ফটো এবং বার্তা অ্যাপ খুলতে হবে না, এমনকি জেমিনি অ্যাপটি ছেড়েও যেতে হবে না। পরিবর্তে, এটি অ্যাপফাংশন ব্যবহার করে সংশ্লিষ্ট এন্ট্রি পয়েন্টগুলি পুনরুদ্ধার করে এবং জেমিনির মধ্যে ক্রিয়াকলাপগুলি সম্পাদন করে, যা এটিকে আরও দক্ষ করে তোলে।
মূলত, AppFunctions-এর উপর ভিত্তি করে বাস্তবায়নটি পুরানো API পাথের মতো একই যুক্তি অনুসরণ করে। এটি একটি পূর্ব-পরিকল্পিত সমাধান।

তবে, সব অ্যাপ সঠিকভাবে অভিযোজিত হয় না। চিন্তার কিছু নেই, গুগলের আরেকটি সমাধান আছে।
গতকাল অ্যান্ড্রয়েড ডেভেলপার ব্লগে প্রকাশিত একটি নিবন্ধে, গুগল স্পষ্টভাবে জানিয়েছে যে কোম্পানিটি একটি UI অটোমেশন ফ্রেমওয়ার্কও তৈরি করছে যা AI সহকারী এবং তৃতীয় পক্ষের অ্যাপ্লিকেশনগুলিকে মানুষের অনুকরণ করতে এবং সরাসরি অ্যাপটি খুলতে এবং ধাপে ধাপে ক্রিয়াকলাপ সম্পাদন করতে সক্ষম করবে।

—এটি "ডুবাও ফোন" এর নকল।
তবে, গুগলের দাবি সত্ত্বেও যে ভবিষ্যতে UI অটোমেশন প্রকৃত "ভারী উত্তোলন" গ্রহণ করবে, এই Galaxy 26 সিরিজে, UI অটোমেশন কেবল একটি "প্রাথমিক পূর্বরূপ সংস্করণ"।

▲ ডুবাও মোবাইল ফোন আমাকে শ্যাম্পুর দাম খুঁজে পেতে এবং তুলনা করতে সাহায্য করেছে।
যদি AppFunctions অ্যাপ ডেভেলপারদের অতিরিক্ত অভিযোজনের কাজ করতে বাধ্য করে, তাহলে UI অটোমেশন ফ্রেমওয়ার্কগুলি সমস্ত কাজ AI এজেন্টের উপর ছেড়ে দেয়, কোনও অতিরিক্ত অভিযোজনের প্রয়োজন হয় না। যাইহোক, কার্যকারিতা AI এজেন্টের ক্ষমতার উপর অনেকাংশে নির্ভর করে এবং এর সুবিধা হল এটি লাইভ হওয়ার সাথে সাথে বিপুল সংখ্যক অ্যাপ্লিকেশন কভার করার ক্ষমতা।
আপনি এখন দেখতে পাচ্ছেন, গুগলের অ্যান্ড্রয়েড জেমিনি ইন্টেলিজেন্ট এজেন্ট প্রকল্পে, অ্যাপফাংশন এবং ইউআই অটোমেশন দুটি পরিপূরক পথ: স্ট্যান্ডার্ডাইজড এবং ট্রেসযোগ্য ইন্টারফেসের মাধ্যমে সর্বাধিক সামঞ্জস্য নিশ্চিত করা, একই সাথে স্ক্রিন রিডার ইন্টারঅ্যাকশন মোডের ভিত্তি স্থাপন করা যা সত্যিকার অর্থে ভবিষ্যতের প্রতিনিধিত্ব করে।
গুগল আরও জানিয়েছে যে এটি কেবল জেমিনির জন্য একচেটিয়া বৈশিষ্ট্য নয়, বরং অ্যান্ড্রয়েড সিস্টেমের একটি বৈশিষ্ট্য।
এর অর্থ হল ভবিষ্যতে, ফোন প্রস্তুতকারকের তৈরি AI সহকারী হোক বা ChatGPT-এর মতো তৃতীয় পক্ষের অ্যাপ্লিকেশন, তারা কাজ সম্পাদনের জন্য AppFunctions-কে কল করতে পারবে অথবা স্বয়ংক্রিয় ক্রিয়াকলাপ সম্পাদনের জন্য ফোনের UI "বোঝা" পারবে।
এটা উল্লেখ করার মতো যে যদিও Samsung Galaxy S26 এর চীনা সংস্করণে Gemini উপলব্ধ নয়, তবুও Bixby সহকারী এখনও টেকআউট অর্ডার করা, রাইডের জন্য অনুরোধ করা এবং ই-কমার্স প্ল্যাটফর্মে দাম তুলনা করার মতো কাজ করতে পারে। আমরা যুক্তিসঙ্গতভাবে অনুমান করতে পারি যে Samsung Gemini কে প্রতিস্থাপন করার জন্য চীনে একটি মডেল সরবরাহকারীও খুঁজে পেয়েছে। এই বড় এবং ছোট কোম্পানিগুলির মধ্যে কোনটি জড়িত তা সম্ভবত গত এক বছরে মোবাইল স্মার্ট এজেন্টগুলিতে কে বেশি অসাধারণ ফলাফল অর্জন করেছে তার উপর নির্ভর করে।

এআই স্মার্টফোনের পথটি কেবল একক প্রচেষ্টা হবে না।
গত বছর, "ডুবাও ফোন" একটি অসাধারণ আত্মপ্রকাশ করেছিল, কিন্তু দুর্ভাগ্যবশত অকালে বন্ধ করে দেওয়া হয়েছিল। যদিও গভীরভাবে দুঃখজনক, এটি আমাদের বিবেচনা করতেও প্ররোচিত করে: এআই অটোমেশন মডেল কি এআই ফোনের জন্য আদর্শ মডেল?
এই প্রশ্নের উত্তর অন্তত তিন থেকে পাঁচ বছর পর্যন্ত পাওয়া যাবে না। অন্তত, ডুবাও ফোন একা কাজ করছে না; অ্যান্ড্রয়েড সিস্টেমের মালিক গুগলও এই পথ বেছে নিয়েছে এবং তাদের প্রভাব অনেক বেশি।

বিদেশে বিনব্যাগ ফোন জনপ্রিয় হওয়ার পর, কিছু নেটিজেন কল্পনা করতে শুরু করেছিলেন যে গুগল যদি পিক্সেল এবং অ্যান্ড্রয়েড ফোনে এই প্রযুক্তি প্রচার করে, তাহলে সম্ভাবনাগুলি অনেক বিস্তৃত হবে।
যদিও আমার মনে হয় গুগলের কাছে "এআই ফোন" প্রশ্নের খুব স্পষ্ট উত্তর নেই, তবুও মনে হচ্ছে তাদের কাছে এআই, সিস্টেম এবং হার্ডওয়্যার আছে, এবং তারা প্রতিটি দিক চেষ্টা করছে, এই আশায় যে তাদের মধ্যে একটি কাজ করবে।
কিন্তু অন্তত গুগল অ্যান্ড্রয়েডের জন্য "সিস্টেম-লেভেল অটোমেশন" এর একটি ভালো উদাহরণ স্থাপন করেছে, এবং ভবিষ্যতে অনেক নতুন ফোনের "স্টিমড বান ফোন" হওয়ার সম্ভাবনা রয়েছে।
এই তরঙ্গ কেবল অ্যান্ড্রয়েড ক্যাম্পের মধ্যেই সীমাবদ্ধ নাও থাকতে পারে। ভুলে যাবেন না, অ্যাপল গুগলের সাথে অংশীদারিত্ব করেছে, এবং জেমিনি সিরির জন্য প্রযুক্তিগত সহায়তা হয়ে উঠবে। এবং অ্যাপ ইন্টেন্ট এবং অ্যাপ ফাংশনগুলি খুব একই রকম…

▲ এআই সিরি প্রদর্শন
আরও একটু সামনের দিকে তাকালে: জেমিনি বুদ্ধিমান এজেন্টরা কেবল এআই স্মার্টফোনের মধ্যেই সীমাবদ্ধ নয়। স্যামার সামাত কল্পনা করেন যে ভবিষ্যতে, স্মার্ট চশমা, এআই দুল, এমনকি গাড়িও, যতক্ষণ তাদের জেমিনি থাকে, জটিল কাজ সম্পাদনের জন্য এটি ব্যবহার করতে পারে – অবশ্যই, এই ধরনের পরিস্থিতি এখনও বাস্তবায়িত হতে অনেক দূরে।
তবে, গুগল কেবল প্রযুক্তিগত স্তরে এআই অটোমেশন সফলভাবে বাস্তবায়ন করেছে। একটি আদর্শ প্রতিষ্ঠার অর্থ এই নয় যে সমস্যাগুলি অদৃশ্য হয়ে গেছে। ডুবাও ফোনগুলির মুখোমুখি বিভিন্ন দ্বন্দ্বগুলি এমন চ্যালেঞ্জ হয়ে উঠবে যা পরবর্তীকালে প্রবেশকারীদের অনিবার্যভাবে মুখোমুখি হবে।
প্রথমত, গোপনীয়তা এবং নিরাপত্তা সংক্রান্ত উদ্বেগ রয়েছে। গুগলের দৃষ্টিভঙ্গি উচ্চাভিলাষী; ভবিষ্যতে, মোবাইল অ্যাপ অ্যাক্সেস এবং পরিচালনা করার ক্ষমতা জেমিনি ছাড়িয়েও প্রসারিত হবে। কিছু তৃতীয় পক্ষের AI অ্যাপ্লিকেশন ব্যবহারকারীর ডেটার মূল অংশে আরও গভীরভাবে প্রবেশ করতে সক্ষম হবে এবং যদি ছদ্মবেশে দূষিত অ্যাপ্লিকেশনগুলি এই ইন্টারফেসগুলিকে কাজে লাগায়, তবে এটি আরও বেশি ক্ষতির কারণ হতে পারে।

▲ ছবির উৎস: 9To5Google
আরও তীব্র দ্বন্দ্ব হল মোবাইল ফোন হার্ডওয়্যার নির্মাতারা, মডেল/বুদ্ধিমান এজেন্ট ক্ষমতা প্রদানকারী এবং বৃহৎ প্ল্যাটফর্ম অ্যাপ্লিকেশনগুলির মধ্যে AI যুগের নতুন "প্রবেশ বিন্দু"-এর জন্য লড়াই। এটি ছিল মূল Doubao ফোনের জন্য সবচেয়ে কঠিন বাধা অতিক্রম করা।
সর্বোপরি, জেমিনি ব্যবহার করে যাত্রা শুরু করার অর্থ হতে পারে যে ব্যবহারকারীরা আর উবারের সদস্যপদ প্রচার এবং বিজ্ঞাপনের সুপারিশ দেখতে পাবেন না, এমনকি ব্র্যান্ডের আনুগত্যও হারাতে পারেন, যা অ্যাপ পরিষেবা প্রদানকারী/বিজ্ঞাপন শিল্পের রাজস্বের সরাসরি ক্ষতি করবে।
চীনের ইন্টারনেট/এআই জায়ান্ট আছে, এবং বিদেশেও একই অবস্থা। মেটা এবং অ্যামাজনের মতো দীর্ঘদিনের প্রতিদ্বন্দ্বীদের শক্তিশালী প্ল্যাটফর্ম এবং ইকোসিস্টেম রয়েছে, এবং তারা গুগলের কাছে মুখ খুলতে এবং জেমিনিকে সবকিছু স্বয়ংক্রিয় করার অনুমতি দিতে ইচ্ছুক নাও হতে পারে। গোপনীয়তা, নিরাপত্তা বা প্ল্যাটফর্মের নিয়মের কথা উল্লেখ করে, প্রবেশের ক্ষেত্রে বিধিনিষেধ এবং উচ্চতর বাধা অনিবার্যভাবে তৈরি হবে এবং প্রতিযোগিতা তীব্রতর হবে।
গুগল, অন্তত, ভবিষ্যতের ব্যাপারে খুবই আত্মবিশ্বাসী। স্যামার সামাত বিশ্বাস করেন যে কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি ইতিমধ্যেই অগ্রগতির পথে, এবং এর বিরুদ্ধে লড়াই করার জন্য তাদের মস্তিষ্ককে তাড়া করার পরিবর্তে, ডেভেলপারদের এটি গ্রহণ করার জন্য একটি উপযুক্ত উপায় সম্পর্কে চিন্তা করা উচিত।
নতুন এবং পুরাতনদের মধ্যে সংঘর্ষ অনিবার্য, এবং চূড়ান্ত বিজয়ী হবে সেই খেলোয়াড়রা যারা সাহসের সাথে পরিবর্তনের প্রাক্কালে তাড়া করে।
তথ্যসূত্র:
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
