আইফোনের এআই ভবিষ্যত আরও অনেক আকর্ষণীয় হয়ে উঠেছে

Apple iPhone 15 Pro Max এর ক্যামেরা মডিউল।
Apple iPhone 15 Pro Max Andy Boxall/ Digital Trends

খুব বেশি দিন আগে, অ্যাপলের গুজব ছিল যে Apple GPT নামক কিছুতে অভ্যন্তরীণভাবে কাজ করছে, একটি চ্যাটবট যা কোম্পানির নিজস্ব AI মডেলের উপর ভিত্তি করে ওপেনএআই-এর চ্যাটজিপিটি যা করে তা অনুকরণ করার লক্ষ্যে। এর পরের মাসগুলিতে, আমরা দেখেছি যে Google Pixels এবং Samsung এর Galaxy S24 ফোন থেকে শুরু করে Nothing Phone 2a-এর মতো একটি আপস্টার্ট পর্যন্ত সব জায়গায় জেনারেটিভ AI পণ্যগুলি দেখা যাচ্ছে৷

ইতিমধ্যে, অ্যাপল থেকে আমরা যা পেয়েছি তা ছিল অস্পষ্ট, কিন্তু সাহসী দাবি। অ্যাপলের সিইও টিম কুক বিনিয়োগকারীদের বলেছেন যে অ্যাপলের জেনারেটিভ এআই পুশ এই বছরের শেষের দিকে আসার সময় "নতুন স্থল" তৈরি করবে। যাইহোক, দেখা যাচ্ছে যে অ্যাপল সেই স্বপ্নগুলি বাস্তবায়নের জন্য গুগলের সাহায্যের হাত পাবে। অথবা হয়তো ওপেনএআই উদ্ধার করতে আসবে।

ব্লুমবার্গের মতে, অ্যাপল আইফোনের জন্য জেমিনি এআই মডেলের লাইসেন্স দেওয়ার জন্য গুগলের সাথে আলোচনা করছে বলে জানা গেছে। এটি স্যামসাং গ্যালাক্সি S24 সিরিজের ফোনগুলির জন্য একই কৌশল অনুসরণ করে বলে মনে হচ্ছে, যা ডিভাইসে Google এর জেমিনি ন্যানো মডেল চালাতে পারে, যখন আরও শক্তিশালী সংস্করণ ক্লাউডে উপলব্ধ।

চুক্তির শর্তাদি এখনও চূড়ান্ত করা হয়নি, কারণ আলোচনা খুব বেশি প্রবাহিত বলে জানা গেছে। তবে, অ্যাপল ওপেনএআইয়ের সাথেও আলোচনায় রয়েছে বলে জানা গেছে। মনে রাখার জন্য, OpenAI-এর ফাউন্ডেশন টেক, যেমন GPT-4 মডেল এবং Dall-E, বর্তমানে মাইক্রোসফটের পণ্যের স্যুট জুড়ে এবং ChatGPT Plus- এর মতো স্বতন্ত্র অ্যাপ এবং পরিষেবার মাধ্যমে উপলব্ধ। এটি অ্যাপলের এআই উচ্চাকাঙ্ক্ষার একটি আকর্ষণীয় বিকাশ – এবং এটি আমাকে সমানভাবে উত্তেজিত এবং চিন্তিত করেছে।

অ্যাপলের এআই যাত্রা (এখন পর্যন্ত)

কিভাবে আপনার Android.based ডিভাইসে Gemini ব্যবহার করবেন।
ডিজিটাল ট্রেন্ডস

2023 সালের শেষ মাসে, খুব ধুমধাম ছাড়াই,অ্যাপল তার মালিকানাধীন সিলিকনে কাজ করার জন্য ডিজাইন করা MLX গ্রুপের অধীনে মডেল লাইব্রেরি এবং ফ্রেমওয়ার্কের একটি সিরিজ চালু করেছে । এই পদক্ষেপটি ম্যাক সিরিজে জেনারেটিভ এআই সক্ষমতা প্রবর্তন করার জন্য প্রস্তুত, যা কোয়ালকমের স্ন্যাপড্রাগন এক্স এলিট প্ল্যাটফর্মের সাথে সাদৃশ্যপূর্ণ।

এই বছরের শুরুতে, অ্যাপলের গবেষণা বিভাগ Keyframer নামে একটি জেনারেটিভ AI টুলের উপর একটি গবেষণাপত্র উন্মোচন করেছে — যা ব্যবহারকারীদের অ্যানিমেটেড সামগ্রী তৈরি করতে সক্ষম করে। এটি মৌলিকভাবে OpenAI থেকে GPT-4 মডেলের উপর ভিত্তি করে তৈরি, তবুও এটি স্থির চিত্র প্রক্রিয়াকরণের জন্য ভেক্টর গ্রাফিক্সকে অন্তর্ভুক্ত করে।

তদুপরি, অ্যাপলের বিশেষজ্ঞরা একটি AI টুলের বর্ণনা দিয়ে একটি গবেষণা পত্রও পুশ করেছেন যা সাধারণ মৌখিক নির্দেশের মাধ্যমে চিত্র সম্পাদনাকে সহজতর করে। এই বৈশিষ্ট্যটি কোয়ালকমের সর্বশেষ প্রিমিয়ার স্ন্যাপড্রাগন চিপ দ্বারা ব্যবহৃত ভয়েস-সহায়তা মিডিয়া সম্পাদনা টুলকিটের সাথে সাদৃশ্য বহন করে।

একটি আইফোনে ChatGPT অ্যাপ চলছে।
জো মারিং / ডিজিটাল ট্রেন্ডস

ব্লুমবার্গের পরবর্তী একটি প্রতিবেদনে হাইলাইট করা হয়েছে যে অ্যাপল 2024 সালের মধ্যে এই টুলগুলিকে ডেভেলপারদের কাছে অ্যাক্সেসযোগ্য করে তোলার মহান লক্ষ্য নিয়ে জেনারেটিভ AI কার্যকারিতা পরীক্ষা করার জন্য দায়ী তার ডেডিকেটেড টিমকে বাড়িয়েছে।

এটা গুজব যে অ্যাপল এর জেনারেটিভ AI কার্যকারিতার উদ্বোধনী ব্যাচ iOS 18 এর সাথে আত্মপ্রকাশ করবে, যা জুনের প্রকাশের জন্য সারিবদ্ধ। কিন্তু ব্লুমবার্গের সাম্প্রতিক প্রতিবেদন অনুসারে, এই বৈশিষ্ট্যগুলি নেটিভ অন-ডিভাইস সিস্টেমের দিকে তৈরি এবং প্রকৃতপক্ষে ক্লাউড-সংযুক্ত, যেমন চ্যাটজিপিটি, জেমিনি বা পারপ্লেক্সিটি দ্বারা সরবরাহ করা হয় এমন জেনারেটিভ এআই সুবিধা নয়।

সেপ্টেম্বরে, তথ্য প্রকাশ করেছে যে অ্যাপল সিরিকে উন্নত করার লক্ষ্যে "ফাউন্ডেশন মডেল" তৈরি করছে। এই উদ্যোগটি মিথুন কীভাবে গুগল অ্যাসিস্ট্যান্টকে এগিয়ে নিয়ে যাচ্ছে তার অনুরূপ।

মিথুন আইফোনে কী করতে পারে?

অ্যান্ড্রয়েডে গুগল জেমিনি অ্যাপ কাজ করছে।
গুগল

এখন, স্থানীয়ভাবে চালানোর সময় এবং ইন্টারনেটের সাথে সংযুক্ত থাকার সময় জেমিনি একটি ফোনে প্রচুর ক্ষমতা নিয়ে আসে৷ যখন ডিভাইসে প্রয়োগ করা হয়, যেমনটি Google Pixel 8 Pro এর ক্ষেত্রে হয়, এটি ফোন অফলাইনে থাকা অবস্থায়ও রেকর্ডার অ্যাপে কথোপকথনের সংক্ষিপ্ত বিবরণ দিতে পারে।

যারা Gboard কীবোর্ড অ্যাপ চালাচ্ছেন তাদের জন্য, জেমিনি ন্যানো হোয়াটসঅ্যাপের মতো অ্যাপ থেকে শুরু করে টেবিলে স্মার্ট রিপ্লাই এনেছে। সংক্ষেপে, এটি আপনার কথোপকথন পড়ে এবং সেই অনুযায়ী প্রেক্ষাপটের উপর ভিত্তি করে উত্তরের পরামর্শ দেয়। অন-ডিভাইস AI অফলাইন অনুবাদগুলিও যোগ করে, এমন একটি বৈশিষ্ট্য যা ইতিমধ্যেই জেমিনি-প্রস্তুত Samsung Galaxy S24 সিরিজের ফোনগুলিতে পাঠানো হচ্ছে।

এই মুহূর্তে, একটি ফোনে জেমিনি অ্যাপ ইনস্টল করা থাকলে, এটি নিম্নলিখিত কাজগুলি সম্পন্ন করতে পারে।

  • গুগল অ্যাসিস্ট্যান্ট বা চ্যাটজিপিটির মতোই, আপনি মিথুনের সাথে স্বাভাবিক ভাষার কথোপকথনে নিযুক্ত হতে পারেন এবং লেখালেখি, ধারণা নিয়ে আসা এবং আরও অনেক কিছুতে সহায়তা পেতে পারেন।
  • ওয়ার্কস্পেস এক্সটেনশন সক্রিয় করার পরে আপনার ইমেল বা ফাইলগুলির তথ্য দ্রুত সংক্ষিপ্ত করুন। তথ্য তালিকা, চার্ট এবং টেবিলের মত বিন্যাসে সংক্ষিপ্ত করা যেতে পারে।
  • একটি la OpenAI এর Dall-E ইঞ্জিন প্রম্পট করে টেক্সট ব্যবহার করে ছবি তৈরি করুন।
  • নতুন উপায়ে আপনার ক্যামেরা ব্যবহার করে সাহায্য পান। জেমিনি অ্যাপে, একটি দৃশ্যের দিকে ক্যামেরা নির্দেশ করুন এবং ফ্রেমে থাকা বস্তু সম্পর্কে তথ্যের জন্য AI-কে জিজ্ঞাসা করুন।
  • আপনার স্ক্রিনে কী আছে তা বুঝুন। কাজটি সম্পন্ন করতে একটি "Hey Google" কমান্ড দিয়ে মিথুনকে ডেকে পাঠান। উদাহরণস্বরূপ, এটি আপনি বর্তমানে যে নিবন্ধটি পড়ছেন তার সংক্ষিপ্ত বিবরণ দিতে পারে।
  • ভ্রমণের পরিকল্পনা করতে এবং এমনকি কাস্টমাইজড রুটিন তৈরি করতে Google Maps এবং Google Flights ব্যবহার করুন।

অ্যাপল-গুগল এআই চুক্তি কীভাবে কার্যকর হতে পারে

Nothing Phone 2a-তে Perplexity chatbot এর সাথে কথা বলা।
নাদিম সারোয়ার/ডিজিটাল ট্রেন্ডস

উপরে উল্লিখিত হিসাবে, স্যামসাং তার ফ্ল্যাগশিপ ফোনগুলিতে জেমিনি ন্যানো এআই মডেল চালানোর জন্য গুগলের সাথে ঘনিষ্ঠভাবে কাজ করেছে। তবে মিথুন শুধুমাত্র ফ্ল্যাগশিপগুলিতে সীমাবদ্ধ নয়। এই বছরের ফেব্রুয়ারিতে, MediaTek ঘোষণা করেছে যে তার মধ্য-রেঞ্জের ডাইমেনসিটি 8300 সিলিকন এখন ফ্ল্যাগশিপ ডাইমেনসিটি 9300- এর পাশাপাশি Google Gemini-এর জন্য অপ্টিমাইজ করা হয়েছে।

অ্যাপলের জন্য অনুরূপ কিছু করা খুব একটা ঝামেলার বিষয় নয়। যদি একটি অন-ডিভাইস লাইসেন্সিং ডিল প্যান আউট না হয়, তবে আবেদনের রুট সবসময় থাকে। আপাতত, অ্যাপল কী কৌশল প্রয়োগ করে তা স্পষ্ট নয়, ধরে নিচ্ছি যে চুক্তিটি প্রথম স্থানে যায়।

বড় প্রশ্ন হল যে মিথুন লাইসেন্সিং চুক্তি অর্থপূর্ণভাবে ব্যবহারকারীরা তাদের আইফোনগুলির সাথে কীভাবে যোগাযোগ করে তা পরিবর্তন করবে কিনা। এবং আরও গুরুত্বপূর্ণ, মিথুন কি সিরির জন্য কোনো পরিবর্তন আনবে? এটিকে স্পষ্টভাবে বলতে গেলে, গুগল অ্যাসিস্ট্যান্টের সাথে ধরা পড়ার আগে সিরির এখনও অনেক জায়গা রয়েছে।

একটি আইফোনে সিরি।
নাদিম সারোয়ার/ডিজিটাল ট্রেন্ডস

কিন্তু তারপরে, এমনকি গুগল ঠিক বুঝতে পারেনি কোথায় মিথুনের অস্তিত্ব রয়েছে বা সম্পূর্ণরূপে গুগল সহকারীকে প্রতিস্থাপন করে। এই মুহুর্তে, আপনি যখন একটি Android ফোনে Gemini ইনস্টল করেন , তখন এটি Google Assistant-কে প্রতিস্থাপন করে। বা, অন্তত, এটি করার চেষ্টা করে।

কল করা, অ্যালার্ম সেট করা, মেসেজ পাঠানো, স্মার্ট হোম ডিভাইসগুলি নিয়ন্ত্রণ করা এবং ক্যালেন্ডার এন্ট্রি তৈরির মতো বিস্তৃত জাগতিক কিন্তু অর্থপূর্ণ কাজের জন্য আপনার ফোন এখনও Google অ্যাসিস্ট্যান্টের উপর নির্ভর করে। একইভাবে, নেভিগেশন, জিবোর্ডে ভয়েস টাইপিং এবং অ্যান্ড্রয়েড অটোর জন্য, গুগল অ্যাসিস্ট্যান্ট এখনও বিশ্বস্ত এআই, জেমিনি নয়।

তাছাড়া, গুগল অ্যাসিস্ট্যান্ট এখনও স্মার্ট ডিসপ্লে এবং Wear OS স্মার্টওয়াচগুলিতে AI সঙ্গী। অ্যাপল হার্ডওয়্যার ইকোসিস্টেম জুড়ে তার সফ্টওয়্যারকে কতটা দৃঢ়ভাবে অন্তর্ভূক্ত করে তা বিবেচনা করে, বিশেষ করে আইফোন এবং অ্যাপল ওয়াচের মধ্যে, একটি বিস্ময়কর পদ্ধতি যেখানে জেমিনি, গুগল অ্যাসিস্ট্যান্ট, এবং/অথবা সিরির কাঁধে শুধুমাত্র দায়িত্বের একটি অংশ একটি বিভ্রান্তি তৈরি করতে চলেছে। গড় ব্যবহারকারী.

বিকল্পভাবে, অ্যাপল গুগলের সাথে ঘনিষ্ঠভাবে কাজ করতে পারে এবং একচেটিয়া ইন্টিগ্রেশন তৈরি করতে পারে, জেমিনিকে অ্যাপলের ইকোসিস্টেম বৈশিষ্ট্য যেমন সিরি, মেইল, নোটস, সাফারি, ক্যালেন্ডার, স্বাস্থ্য এবং আরও অনেক কিছুর সাথে সংযুক্ত করে। যাইহোক, জেমিনি ডেটা স্টোরেজ নীতিগুলির বর্তমান অবস্থার পরিপ্রেক্ষিতে, আমরা এত শক্ত সিস্টেম-স্তরের একীকরণের জন্য আমাদের দম আটকে রাখছি না।

অ্যাপলের জন্য মিথুন রাশির ঝুঁকি

অ্যান্ড্রয়েডে গুগল জেমিনি অ্যাপ।
নাদিম সারোয়ার/ডিজিটাল ট্রেন্ডস

অবশ্যই, অ্যাপল স্মার্টফোনে জেনারেটিভ এআই-এর প্রথম তরঙ্গ মিস করেছে, এবং যদি রিপোর্টগুলি বিশ্বাস করা হয়, কোম্পানিটি উন্মত্তভাবে ধরার জন্য কাজ করছে। কিন্তু একটি জেমিনি লাইসেন্সিং চুক্তির অর্থ হল আমরা হয়তো "Ajax" প্রকল্পের অধীনে জেনারেটিভ এআই ডেভেলপমেন্টের সাথে অ্যাপলের নিজস্ব কাজ দেখতে পাব না। অথবা হয়ত আমরা এটিকে শুধুমাত্র পাতলা আকারে দেখতে পাব যখন মিথুন আইফোনে AI ভারী উত্তোলন করে।

কিন্তু মিথুন তার দোষ ছাড়া নয়। বিপরীতে, এটি অন্য যেকোন মূলধারার জেনারেটিভ এআই টুলের চেয়ে বেশি আশ্চর্যজনকভাবে বিভ্রান্ত হয়েছে। কয়েক সপ্তাহ আগে, মিথুন ব্যবহারকারীরা লক্ষ্য করেছেন যে এটি ব্যাপকভাবে ভুল ছবি তৈরি করছে, বিশেষ করে ত্বকের টোন, জাতিগততা এবং ঐতিহাসিক নির্ভুলতাকে ভুলভাবে পরিচালনা করছে।

বিতর্কটি এমন মাত্রায় বেড়েছে যে গুগল মিথুনের জন্য টেক্সট-টু-ইমেজ তৈরিতে বিরতি দিয়েছে। "স্পষ্ট করে বলতে গেলে, এটি সম্পূর্ণরূপে অগ্রহণযোগ্য, এবং আমরা এটি ভুল করেছি," Google CEO সুন্দর পিচাই একটি অভ্যন্তরীণ মেমোতে লিখেছেন, যা NPR দ্বারা রিপোর্ট করা হয়েছিল।

Google Gemini AI লোগো।
গুগল

আটলান্টিক জুড়ে, জেমিনি আরেকটি বিতর্কে জড়িয়ে পড়ে যখন ভারতের প্রধানমন্ত্রী নরেন্দ্র সম্পর্কে তার মন্তব্য অবমাননাকর বলে বিবেচিত হয় এবং সোশ্যাল মিডিয়ায় ভাইরাল হয়। ভারতের কেন্দ্রীয় মন্ত্রী রাজীব চন্দ্রশেখর ( এনডিটিভির মাধ্যমে) সতর্ক করে দিয়েছিলেন, “তাহলে শুধু বলতে গেলে '… দুঃখিত, এটি পরীক্ষা করা হয়নি' আইন মেনে চলার আমাদের প্রত্যাশার সাথে সামঞ্জস্যপূর্ণ নয়।

বিতর্কটি আবারও এআই নিয়ন্ত্রণকে বিতর্কের মধ্যে ফেলে দেয় এবং প্রধান এআই প্লেয়ারদের জন্য একটি পরামর্শও জারি করা হয়েছিল, যাতে জেমিনির মতো সরঞ্জামগুলি প্রকাশ্যে প্রকাশের আগে তাদের সুস্পষ্ট অনুমোদন পেতে হয়।

অ্যাপলের মতো সরকারী বিধি-বিধানের সাথে এটিকে সুরক্ষিত রাখে এমন একটি সংস্থার জন্য, বিশ্বব্যাপী কয়েক মিলিয়ন ডিভাইসের জন্য জেমিনিকে লাইসেন্স দেওয়া কোনও ছোট ঝুঁকি নয়। বিশেষ করে যখন Google নিজেই সতর্ক করে যে "মিথুন ভুল করবে" এবং বলে যে আপনার সর্বদা ভুলত্রুটির জন্য দুবার পরীক্ষা করা উচিত।