অ্যাপল সিরিকে এআই মডেল বাছাই করার সুযোগ দিচ্ছে, কিন্তু এর মধ্যে কেবল একটিই আমার কাছে যুক্তিযুক্ত মনে হয়।

WWDC 2024-এ অ্যাপল আমাদের একটি আরও স্মার্ট ও সক্ষম সিরির প্রতিশ্রুতি দিয়েছিল। তাদের উপস্থাপনাটি ছিল আকর্ষণীয়: এমন এক সিরি যা আপনার ব্যক্তিগত প্রেক্ষাপট বোঝে, আপনার মেসেজ ও ইমেল ঘেঁটে দেখে, আপনার অ্যাপের ভেতরে বিভিন্ন কাজ করে এবং ধীরে ধীরে একটি সত্যিকারের সহকারীতে পরিণত হয়।

দুই বছর পরেও, সেই স্বপ্নটা স্বপ্নই রয়ে গেছে। কিন্তু এমন একটি বিষয় আছে যা অ্যাপলের অ্যাসিস্ট্যান্টের গতিপথ বদলে দিতে পারে। প্রতিবেদন অনুযায়ী, সিরি আর কোনো একটিমাত্র এআই মস্তিষ্কের ওপর নির্ভরশীল নয় । অ্যাপল এটিকে নমনীয় করে তৈরি করছে, যা যেকোনো বাহ্যিক মডেলে অনুরোধ পাঠিয়ে কাজটি সবচেয়ে ভালোভাবে সম্পন্ন করতে পারবে।

এতে আমার মনে একটি প্রশ্ন জাগে। সিরি যদি যেকোনো এআই ব্যবহার করতে পারে, তাহলে তার কোনটি ব্যবহার করা উচিত? বর্তমানে, ডিফল্ট এক্সটার্নাল মডেলটি হলো চ্যাটজিপিটি (ChatGPT)। কিন্তু আমি বলব যে জেমিনি (Gemini) হলো আরও যৌক্তিক পছন্দ, এবং তার কারণ নিচে দেওয়া হলো।

সিরি একটি সার্চ ইঞ্জিন

একবার ভেবে দেখুন, আপনি দৈনন্দিন জীবনে আসলে কীভাবে সিরি ব্যবহার করেন। আপনি দিনের আবহাওয়ার খবর জানতে চান। আপনার কাছাকাছি খাবারের দোকানের খোঁজ করেন। ওয়েবে বিভিন্ন জিনিস খুঁজে দেখতে বলেন। সিরি ব্যবহারের একটি উল্লেখযোগ্য অংশই হলো সার্চ বা সার্চের মতো প্রশ্ন জিজ্ঞাসা করা, এবং এই পৃথিবীতে গুগলের চেয়ে ভালো সার্চ আর কোনো কোম্পানি করে না।

গুগল কয়েক দশক ধরে সবচেয়ে শক্তিশালী সার্চ ইঞ্জিন তৈরি করেছে, এবং সেই দক্ষতা এখন সরাসরি জেমিনিতে প্রতিফলিত হচ্ছে। আপনি যখন জেমিনিকে কিছু জিজ্ঞাসা করেন , তখন এটি শুধু একটি ল্যাঙ্গুয়েজ মডেল থেকেই তথ্য নেয় না। এটি গুগলের রিয়েল-টাইম ওয়েব ইনডেক্স, গুগল ম্যাপস, গুগল শপিং এবং আরও অনেক কিছু থেকে ডেটা সংগ্রহ করে।

সিরির অনুসন্ধান ক্ষমতাকে শক্তিশালী করতে এটি ব্যবহার করা হলে তা এমন এক নতুন উচ্চতায় পৌঁছাবে, যার সাথে অন্য কোনো এলএলএম প্রদানকারী প্রতিষ্ঠান পাল্লা দিতে পারবে না।

অ্যাপল ব্যক্তিগত বুদ্ধিমত্তার প্রতিশ্রুতি দিয়েছিল, কিন্তু জেমিনি তা বাস্তবায়ন করছে।

অ্যাপলের WWDC 2024 ঘোষণার অন্যতম প্রধান আলোচ্য বিষয় ছিল ব্যক্তিগত বুদ্ধিমত্তা। অ্যাপল দেখিয়েছে যে সিরি আপনার বিভিন্ন অ্যাপ থেকে প্রাসঙ্গিক তথ্য তুলে ধরে এবং “আমার মায়ের ফ্লাইট কখন নামবে?” বা “নিউ ইয়র্ক থেকে আনা স্টেসির গোলাপী কোট পরা ছবিগুলো দেখাও”-এর মতো প্রশ্নের উত্তর দেয়।

ডেমো সংস্করণে এটি সত্যিই চিত্তাকর্ষক ছিল। কিন্তু, আমি যদি একে কালো টি-শার্ট পরা আমার একটি ছবি দেখাতে বলি, তবে এটি ওয়েব থেকে কালো টি-শার্ট পরা বিভিন্ন মানুষের এলোমেলো ছবি দেখায়। আমি একটুও বাড়িয়ে বলছি না যখন বলি যে সিরির ব্যক্তিগত বুদ্ধিমত্তার ফিচারটি একটি বিরাট ব্যর্থতা।

এরই মধ্যে, জেমিনি নীরবে তাদের নিজস্ব পার্সোনাল ইন্টেলিজেন্স ফিচারটি চালু করেছে। এটি আপনার জিমেইল, ক্যালেন্ডার, গুগল ফটো, ড্রাইভ এবং আরও অনেক কিছু ব্যবহার করে আপনার ব্যক্তিগত ডেটা বিশ্লেষণ করে জীবনের প্রেক্ষাপট-নির্ভর জটিল প্রশ্নের উত্তর দেয়। এটি নিখুঁত নয়, তবে অন্তত কাজ করছে।

অ্যাপল ভবিষ্যতের সিরি সক্ষমতা হিসেবে যা প্রদর্শন করছিল, এটি প্রায় হুবহু তাই, পার্থক্য শুধু এই যে , জেমিনি এটি আজই করছে । অ্যাপল যদি ব্যবহারকারীদের কাছে এই ফিচারগুলো দ্রুত পৌঁছে দিতে চায়, তবে জেমিনিই হতে পারে তাদের প্রয়োজনীয় সংক্ষিপ্ত পথটি।

জেমিনি ইতিমধ্যেই সিরি যা প্রতিশ্রুতি দিয়েছিল তা করে।

অ্যাপল ইন্টেলিজেন্স সিস্টেম অ্যাপ জুড়ে একটি কম্প্যাক্ট ও সক্ষম এআই মডেল স্থাপন করে, যা গোপনীয়তার জন্য অন-ডিভাইস প্রসেসিং এবং আরও চাহিদাপূর্ণ কাজের জন্য ক্লাউড-ভিত্তিক কম্পিউটিংয়ের সমন্বয় ঘটায়। অন-ডিভাইস প্রসেসিং এবং গোপনীয়তার এই দিকগুলোই অ্যাপলকে প্রতিযোগীদের থেকে আলাদা করে। কিন্তু এখন এটি একা নয়।

জেমিনি ন্যানো ইতিমধ্যেই পিক্সেল এবং স্যামসাং গ্যালাক্সি ডিভাইসগুলিতে এই কাজটি করছে। এটি ইন্টারনেট সংযোগ ছাড়াই অফলাইন সামারাইজেশন, স্মার্ট রিপ্লাই এবং কনটেক্সচুয়াল ফিচারগুলো পরিচালনা করে। পিক্সেল ৯ এবং এর পরবর্তী মডেলগুলিতে, জেমিনি ন্যানো মাল্টিমোডাল এবং সরাসরি ডিভাইসেই ছবি, টেক্সট ও ভাষা প্রসেস করতে পারে।

অ্যাপল এমন কিছুর দিকেই এগোচ্ছে যা গুগল ইতিমধ্যেই বাজারে এনেছে। নতুন করে সবকিছু উদ্ভাবন না করে, ডিভাইসে সিরি ফিচারের ভিত্তি হিসেবে জেমিনির বিদ্যমান ন্যানো ডেপ্লয়মেন্ট ব্যবহার করলে অ্যাপলের অনেক ঝামেলা ও অর্থ সাশ্রয় হবে।

মিথুন রাশির সৃজনশীল সরঞ্জামগুলো পরিপূর্ণ।

এখান থেকেই ব্যাপারটা সত্যিই উত্তেজনাপূর্ণ হয়ে ওঠে। জেমিনি শুধু একটি টেক্সট মডেল নয়। এর সাথে একটি সম্পূর্ণ সৃজনশীল ইকোসিস্টেম রয়েছে, যা অ্যাপল কাজে লাগাতে পারে।

Veo 1080p পর্যন্ত রেজোলিউশনে সিনেম্যাটিক স্টাইলে এবং এক মিনিটের বেশি দৈর্ঘ্যের ক্লিপ তৈরি করতে পারে । Google DeepMind-এর Lyria মিউজিক এবং অডিও তৈরির কাজ করে। ছবির জন্য, Nano Banana (গুগলের ছবি তৈরির পরিষেবা) সম্প্রতি একটি বড় আপগ্রেড পেয়েছে, যার ফলে টেক্সট রেন্ডারিং, সাবজেক্টের সামঞ্জস্য এবং যেকোনো অ্যাস্পেক্ট রেশিওর সাপোর্ট উন্নত হয়েছে।

অ্যাপল সম্প্রতি তাদের নিজস্ব ক্রিয়েটর স্টুডিও চালু করেছে , যা একটি নির্দিষ্ট মাসিক সাবস্ক্রিপশনের বিনিময়ে ব্যবহারকারীদের সৃজনশীল টুল ব্যবহারের সুযোগ দেয়। কোম্পানিটি যদি অ্যাডোবির মতো প্রতিষ্ঠানের সাথে প্রতিযোগিতা করার ব্যাপারে আন্তরিক হয়, তবে তাদের জেনারেটিভ সক্ষমতা প্রদান করতে হবে। মজার ব্যাপার হলো, জেমিনির মধ্যে ইতিমধ্যেই সেই সমস্ত সক্ষমতা রয়েছে, এবং এটিকে অ্যাপলের ক্রিয়েটিভ স্যুটের সাথে একীভূত করা একটি অত্যন্ত যৌক্তিক পদক্ষেপ হবে।

অংশীদারিত্বটি ইতিমধ্যেই বিদ্যমান আছে।

এই বিষয়টি নিয়ে যথেষ্ট আলোচনা হয় না। জানা যায়, সাফারি ব্রাউজারে ডিফল্ট সার্চ ইঞ্জিন হিসেবে থাকার জন্য গুগল প্রতি বছর অ্যাপলকে প্রায় ২০ বিলিয়ন ডলার প্রদান করে। প্রযুক্তি জগতের ইতিহাসে এটি অন্যতম মূল্যবান একটি ডিস্ট্রিবিউশন চুক্তি। অ্যাপল ও গুগলের মধ্যকার সম্পর্কটি গভীর, দীর্ঘস্থায়ী এবং উভয় কোম্পানির জন্যই আর্থিকভাবে অত্যন্ত বিশাল।

সেই সম্পর্ককে “গুগল সাফারি সার্চকে শক্তি জোগায়” থেকে “জেমিনি সিরির এআই ফিচারগুলোকে শক্তি জোগায়”-এ প্রসারিত করাটা কোনো নাটকীয় পরিবর্তন নয়। এটি এমন একটি অংশীদারিত্বের স্বাভাবিক বিবর্তন, যা আপনার আইফোনে ব্রাউজার খোলার সময়কার অর্ধেক কাজ পরিচালনা করে।

তাহলে আমি কোন মডেলটিই বেছে নেব?

দীর্ঘ প্রেক্ষাপট পাঠ এবং সূক্ষ্ম যুক্তির জন্য ক্লড চমৎকার। চ্যাটজিপিটি-র একটি বিশাল ইকোসিস্টেম এবং শক্তিশালী কোডিং ও এজেন্ট টুলিং রয়েছে। ব্যবহারকারী-নির্বাচিত বিশেষজ্ঞ হিসেবে উভয়ই দারুণ কাজ করে। আমি নিজে আমার কম্পিউটারে ক্লড ব্যবহার করি।

কিন্তু সিরির নেপথ্যের ডিফল্ট ইঞ্জিন হিসেবে? এগুলো সঠিক পছন্দ নয়। জেমিনি মোবাইলের ওএস পর্যায়ে কাজ করে, সার্চ ও ব্যক্তিগত প্রেক্ষাপট বোঝে, ডিভাইসের ভেতরেই ন্যানো ফর্ম ফ্যাক্টরে বিদ্যমান, এবং যেকোনো প্রযুক্তি কোম্পানির সাথে অ্যাপলের সবচেয়ে গুরুত্বপূর্ণ বাণিজ্যিক সম্পর্কের কেন্দ্রে রয়েছে।

সব উপাদানই প্রস্তুত আছে। জেমিনি একটি আরও বুদ্ধিমান সিরিকে শক্তি জোগাতে পারবে কি না, তা প্রশ্ন নয়। প্রশ্ন হলো, গুগল এবং অ্যাপল একটি পারস্পরিক লাভজনক চুক্তিতে পৌঁছাতে পারবে কি না। আর গুজব যদি সত্যি হয়, তবে পরিস্থিতি হয়তো ইতিমধ্যেই সেই দিকেই এগোচ্ছে।