WWDC 2024-এ অ্যাপল আমাদের একটি আরও স্মার্ট ও সক্ষম সিরির প্রতিশ্রুতি দিয়েছিল। তাদের উপস্থাপনাটি ছিল আকর্ষণীয়: এমন এক সিরি যা আপনার ব্যক্তিগত প্রেক্ষাপট বোঝে, আপনার মেসেজ ও ইমেল ঘেঁটে দেখে, আপনার অ্যাপের ভেতরে বিভিন্ন কাজ করে এবং ধীরে ধীরে একটি সত্যিকারের সহকারীতে পরিণত হয়।
দুই বছর পরেও, সেই স্বপ্নটা স্বপ্নই রয়ে গেছে। কিন্তু এমন একটি বিষয় আছে যা অ্যাপলের অ্যাসিস্ট্যান্টের গতিপথ বদলে দিতে পারে। প্রতিবেদন অনুযায়ী, সিরি আর কোনো একটিমাত্র এআই মস্তিষ্কের ওপর নির্ভরশীল নয় । অ্যাপল এটিকে নমনীয় করে তৈরি করছে, যা যেকোনো বাহ্যিক মডেলে অনুরোধ পাঠিয়ে কাজটি সবচেয়ে ভালোভাবে সম্পন্ন করতে পারবে।
এতে আমার মনে একটি প্রশ্ন জাগে। সিরি যদি যেকোনো এআই ব্যবহার করতে পারে, তাহলে তার কোনটি ব্যবহার করা উচিত? বর্তমানে, ডিফল্ট এক্সটার্নাল মডেলটি হলো চ্যাটজিপিটি (ChatGPT)। কিন্তু আমি বলব যে জেমিনি (Gemini) হলো আরও যৌক্তিক পছন্দ, এবং তার কারণ নিচে দেওয়া হলো।
সিরি একটি সার্চ ইঞ্জিন
একবার ভেবে দেখুন, আপনি দৈনন্দিন জীবনে আসলে কীভাবে সিরি ব্যবহার করেন। আপনি দিনের আবহাওয়ার খবর জানতে চান। আপনার কাছাকাছি খাবারের দোকানের খোঁজ করেন। ওয়েবে বিভিন্ন জিনিস খুঁজে দেখতে বলেন। সিরি ব্যবহারের একটি উল্লেখযোগ্য অংশই হলো সার্চ বা সার্চের মতো প্রশ্ন জিজ্ঞাসা করা, এবং এই পৃথিবীতে গুগলের চেয়ে ভালো সার্চ আর কোনো কোম্পানি করে না।
গুগল কয়েক দশক ধরে সবচেয়ে শক্তিশালী সার্চ ইঞ্জিন তৈরি করেছে, এবং সেই দক্ষতা এখন সরাসরি জেমিনিতে প্রতিফলিত হচ্ছে। আপনি যখন জেমিনিকে কিছু জিজ্ঞাসা করেন , তখন এটি শুধু একটি ল্যাঙ্গুয়েজ মডেল থেকেই তথ্য নেয় না। এটি গুগলের রিয়েল-টাইম ওয়েব ইনডেক্স, গুগল ম্যাপস, গুগল শপিং এবং আরও অনেক কিছু থেকে ডেটা সংগ্রহ করে।
সিরির অনুসন্ধান ক্ষমতাকে শক্তিশালী করতে এটি ব্যবহার করা হলে তা এমন এক নতুন উচ্চতায় পৌঁছাবে, যার সাথে অন্য কোনো এলএলএম প্রদানকারী প্রতিষ্ঠান পাল্লা দিতে পারবে না।
অ্যাপল ব্যক্তিগত বুদ্ধিমত্তার প্রতিশ্রুতি দিয়েছিল, কিন্তু জেমিনি তা বাস্তবায়ন করছে।
অ্যাপলের WWDC 2024 ঘোষণার অন্যতম প্রধান আলোচ্য বিষয় ছিল ব্যক্তিগত বুদ্ধিমত্তা। অ্যাপল দেখিয়েছে যে সিরি আপনার বিভিন্ন অ্যাপ থেকে প্রাসঙ্গিক তথ্য তুলে ধরে এবং “আমার মায়ের ফ্লাইট কখন নামবে?” বা “নিউ ইয়র্ক থেকে আনা স্টেসির গোলাপী কোট পরা ছবিগুলো দেখাও”-এর মতো প্রশ্নের উত্তর দেয়।
ডেমো সংস্করণে এটি সত্যিই চিত্তাকর্ষক ছিল। কিন্তু, আমি যদি একে কালো টি-শার্ট পরা আমার একটি ছবি দেখাতে বলি, তবে এটি ওয়েব থেকে কালো টি-শার্ট পরা বিভিন্ন মানুষের এলোমেলো ছবি দেখায়। আমি একটুও বাড়িয়ে বলছি না যখন বলি যে সিরির ব্যক্তিগত বুদ্ধিমত্তার ফিচারটি একটি বিরাট ব্যর্থতা।
এরই মধ্যে, জেমিনি নীরবে তাদের নিজস্ব পার্সোনাল ইন্টেলিজেন্স ফিচারটি চালু করেছে। এটি আপনার জিমেইল, ক্যালেন্ডার, গুগল ফটো, ড্রাইভ এবং আরও অনেক কিছু ব্যবহার করে আপনার ব্যক্তিগত ডেটা বিশ্লেষণ করে জীবনের প্রেক্ষাপট-নির্ভর জটিল প্রশ্নের উত্তর দেয়। এটি নিখুঁত নয়, তবে অন্তত কাজ করছে।
অ্যাপল ভবিষ্যতের সিরি সক্ষমতা হিসেবে যা প্রদর্শন করছিল, এটি প্রায় হুবহু তাই, পার্থক্য শুধু এই যে , জেমিনি এটি আজই করছে । অ্যাপল যদি ব্যবহারকারীদের কাছে এই ফিচারগুলো দ্রুত পৌঁছে দিতে চায়, তবে জেমিনিই হতে পারে তাদের প্রয়োজনীয় সংক্ষিপ্ত পথটি।
জেমিনি ইতিমধ্যেই সিরি যা প্রতিশ্রুতি দিয়েছিল তা করে।
অ্যাপল ইন্টেলিজেন্স সিস্টেম অ্যাপ জুড়ে একটি কম্প্যাক্ট ও সক্ষম এআই মডেল স্থাপন করে, যা গোপনীয়তার জন্য অন-ডিভাইস প্রসেসিং এবং আরও চাহিদাপূর্ণ কাজের জন্য ক্লাউড-ভিত্তিক কম্পিউটিংয়ের সমন্বয় ঘটায়। অন-ডিভাইস প্রসেসিং এবং গোপনীয়তার এই দিকগুলোই অ্যাপলকে প্রতিযোগীদের থেকে আলাদা করে। কিন্তু এখন এটি একা নয়।
জেমিনি ন্যানো ইতিমধ্যেই পিক্সেল এবং স্যামসাং গ্যালাক্সি ডিভাইসগুলিতে এই কাজটি করছে। এটি ইন্টারনেট সংযোগ ছাড়াই অফলাইন সামারাইজেশন, স্মার্ট রিপ্লাই এবং কনটেক্সচুয়াল ফিচারগুলো পরিচালনা করে। পিক্সেল ৯ এবং এর পরবর্তী মডেলগুলিতে, জেমিনি ন্যানো মাল্টিমোডাল এবং সরাসরি ডিভাইসেই ছবি, টেক্সট ও ভাষা প্রসেস করতে পারে।
অ্যাপল এমন কিছুর দিকেই এগোচ্ছে যা গুগল ইতিমধ্যেই বাজারে এনেছে। নতুন করে সবকিছু উদ্ভাবন না করে, ডিভাইসে সিরি ফিচারের ভিত্তি হিসেবে জেমিনির বিদ্যমান ন্যানো ডেপ্লয়মেন্ট ব্যবহার করলে অ্যাপলের অনেক ঝামেলা ও অর্থ সাশ্রয় হবে।
মিথুন রাশির সৃজনশীল সরঞ্জামগুলো পরিপূর্ণ।
এখান থেকেই ব্যাপারটা সত্যিই উত্তেজনাপূর্ণ হয়ে ওঠে। জেমিনি শুধু একটি টেক্সট মডেল নয়। এর সাথে একটি সম্পূর্ণ সৃজনশীল ইকোসিস্টেম রয়েছে, যা অ্যাপল কাজে লাগাতে পারে।
Veo 1080p পর্যন্ত রেজোলিউশনে সিনেম্যাটিক স্টাইলে এবং এক মিনিটের বেশি দৈর্ঘ্যের ক্লিপ তৈরি করতে পারে । Google DeepMind-এর Lyria মিউজিক এবং অডিও তৈরির কাজ করে। ছবির জন্য, Nano Banana (গুগলের ছবি তৈরির পরিষেবা) সম্প্রতি একটি বড় আপগ্রেড পেয়েছে, যার ফলে টেক্সট রেন্ডারিং, সাবজেক্টের সামঞ্জস্য এবং যেকোনো অ্যাস্পেক্ট রেশিওর সাপোর্ট উন্নত হয়েছে।
অ্যাপল সম্প্রতি তাদের নিজস্ব ক্রিয়েটর স্টুডিও চালু করেছে , যা একটি নির্দিষ্ট মাসিক সাবস্ক্রিপশনের বিনিময়ে ব্যবহারকারীদের সৃজনশীল টুল ব্যবহারের সুযোগ দেয়। কোম্পানিটি যদি অ্যাডোবির মতো প্রতিষ্ঠানের সাথে প্রতিযোগিতা করার ব্যাপারে আন্তরিক হয়, তবে তাদের জেনারেটিভ সক্ষমতা প্রদান করতে হবে। মজার ব্যাপার হলো, জেমিনির মধ্যে ইতিমধ্যেই সেই সমস্ত সক্ষমতা রয়েছে, এবং এটিকে অ্যাপলের ক্রিয়েটিভ স্যুটের সাথে একীভূত করা একটি অত্যন্ত যৌক্তিক পদক্ষেপ হবে।
অংশীদারিত্বটি ইতিমধ্যেই বিদ্যমান আছে।
এই বিষয়টি নিয়ে যথেষ্ট আলোচনা হয় না। জানা যায়, সাফারি ব্রাউজারে ডিফল্ট সার্চ ইঞ্জিন হিসেবে থাকার জন্য গুগল প্রতি বছর অ্যাপলকে প্রায় ২০ বিলিয়ন ডলার প্রদান করে। প্রযুক্তি জগতের ইতিহাসে এটি অন্যতম মূল্যবান একটি ডিস্ট্রিবিউশন চুক্তি। অ্যাপল ও গুগলের মধ্যকার সম্পর্কটি গভীর, দীর্ঘস্থায়ী এবং উভয় কোম্পানির জন্যই আর্থিকভাবে অত্যন্ত বিশাল।
সেই সম্পর্ককে “গুগল সাফারি সার্চকে শক্তি জোগায়” থেকে “জেমিনি সিরির এআই ফিচারগুলোকে শক্তি জোগায়”-এ প্রসারিত করাটা কোনো নাটকীয় পরিবর্তন নয়। এটি এমন একটি অংশীদারিত্বের স্বাভাবিক বিবর্তন, যা আপনার আইফোনে ব্রাউজার খোলার সময়কার অর্ধেক কাজ পরিচালনা করে।
তাহলে আমি কোন মডেলটিই বেছে নেব?
দীর্ঘ প্রেক্ষাপট পাঠ এবং সূক্ষ্ম যুক্তির জন্য ক্লড চমৎকার। চ্যাটজিপিটি-র একটি বিশাল ইকোসিস্টেম এবং শক্তিশালী কোডিং ও এজেন্ট টুলিং রয়েছে। ব্যবহারকারী-নির্বাচিত বিশেষজ্ঞ হিসেবে উভয়ই দারুণ কাজ করে। আমি নিজে আমার কম্পিউটারে ক্লড ব্যবহার করি।
কিন্তু সিরির নেপথ্যের ডিফল্ট ইঞ্জিন হিসেবে? এগুলো সঠিক পছন্দ নয়। জেমিনি মোবাইলের ওএস পর্যায়ে কাজ করে, সার্চ ও ব্যক্তিগত প্রেক্ষাপট বোঝে, ডিভাইসের ভেতরেই ন্যানো ফর্ম ফ্যাক্টরে বিদ্যমান, এবং যেকোনো প্রযুক্তি কোম্পানির সাথে অ্যাপলের সবচেয়ে গুরুত্বপূর্ণ বাণিজ্যিক সম্পর্কের কেন্দ্রে রয়েছে।
সব উপাদানই প্রস্তুত আছে। জেমিনি একটি আরও বুদ্ধিমান সিরিকে শক্তি জোগাতে পারবে কি না, তা প্রশ্ন নয়। প্রশ্ন হলো, গুগল এবং অ্যাপল একটি পারস্পরিক লাভজনক চুক্তিতে পৌঁছাতে পারবে কি না। আর গুজব যদি সত্যি হয়, তবে পরিস্থিতি হয়তো ইতিমধ্যেই সেই দিকেই এগোচ্ছে।
