কৃত্রিম বুদ্ধিমত্তা (AI) এখন সর্বত্র। ChatGPT-এর মতো অ্যাপ্লিকেশনগুলি তাদের অগ্রগতির জন্য প্রায় প্রতিদিনই খবরে থাকে, যখন Claude-এর মতো অন্যরা কভার লেটার তৈরি করা থেকে শুরু করে (স্বীকৃতভাবে খারাপ) উপন্যাস লেখা পর্যন্ত সবকিছু করতে ব্যবহৃত হচ্ছে। গুগল জেমিনি হল সেই AI অঙ্গনে Google-এর সর্বশেষ যাত্রা, বিভিন্ন উপায়ে Google সহকারীকে প্রতিস্থাপন করে — এবং এটি ফোনের Google Pixel লাইনের মতো অসংখ্য মোবাইল ডিভাইসে একত্রিত হয়েছে।
মিথুন কী এবং এটি কী করতে পারে তা বোঝা কঠিন বলে মনে হতে পারে, তবে এটি আপনার ভাবার চেয়ে সহজ। এটি প্রতিদিনের নির্দিষ্ট কাজগুলিকে ব্যাপকভাবে সরল করতে পারে এবং আপনাকে এমন প্রশ্নের উত্তর খুঁজে পেতে সাহায্য করতে পারে যা আপনি জানতেন না, সমস্ত কিছু পৃষ্ঠা এবং নিবন্ধগুলির পৃষ্ঠাগুলি না পড়ে৷ শুধু মিথুনের ব্যবহার শুরু করতেই নয়, এটিকে আপনার জন্য কার্যকর করার জন্য আপনার যা জানা দরকার তা এখানে রয়েছে৷
গুগল মিথুন কি?

আপনি কি আগে কখনো Google Assistant ব্যবহার করেছেন? যদি হ্যাঁ, তাহলে আপনার অন্তত একটি উচ্চ-স্তরের উপলব্ধি আছে যা শেষ পর্যন্ত গুগল মিথুনের দিকে নিয়ে গেছে। অ্যাসিস্ট্যান্ট ছিল গুগলের স্মার্ট হোম সিস্টেমের অংশ, এবং তারপরে এটি ফোনেরও একটি অবিচ্ছেদ্য অংশ হয়ে ওঠে — তবে এটিতে সর্বদা নির্দিষ্ট কার্যকারিতার অভাব ছিল এবং কখনও "সত্য" এআই বলে মনে হয়নি।
মিথুন হল গুগল অ্যাসিস্ট্যান্টের বিবর্তন। এটিকে একটি মাল্টিমডাল এআই মডেল বলা হয়, যার অর্থ এটি একাধিক উত্স থেকে ডেটা প্রক্রিয়া করতে পারে এবং প্রেক্ষাপটে সেই সমস্ত তথ্য "বুঝতে" পারে৷ এটি চিত্রগুলিকে চিনতে পারে, রেকর্ডিংগুলি শুনতে পারে এবং লিখিত তথ্য পড়তে পারে এবং সহজে বোঝার উপায়ে সেগুলির একটি ব্রেকডাউন প্রদান করতে পারে।
2023 সালে কোম্পানির বার্ষিক ডেভেলপার কনফারেন্স Google I/O-এ মিথুনের প্রথম ফিসফিস আবির্ভূত হয়েছিল। এটি মূলত কোডনেম টাইটান (শনির চাঁদের প্রসঙ্গে) দিয়ে গিয়েছিল, কিন্তু শেষ পর্যন্ত মিথুনে পরিবর্তিত হয়েছিল। মিথুন উভয়ই একটি নক্ষত্রমণ্ডল এবং "যমজ" এর জন্য ল্যাটিন শব্দ, যা বিশেষভাবে উপযুক্ত বলে প্রমাণিত হয়েছে কারণ AI Google-এ দুটি পৃথক দলের কাজ থেকে বেড়েছে: DeepMind এবং Google Brain৷
AI 2023 সালের ডিসেম্বরে লঞ্চ হয়েছিল এবং তারপর থেকে শুধুমাত্র বেড়েছে এবং আরও উন্নত হয়েছে। অন্যান্য Google প্রকল্প, যেমন বার্ড এবং ডুয়েট এআই, এখন সামগ্রিক জেমিনি ছাতার অধীনে পড়েছে। ভাষার মডেলটি এখন অনেক ফোন, ল্যাপটপ এবং আরও অনেক কিছুতে একীভূত হয়ে গেছে এবং কিছু নির্দিষ্ট অ্যাপের সাথে এমনভাবে কাজ করতে সক্ষম যেভাবে অন্য কয়েকজন মিলে যেতে পারে।
অতি সাম্প্রতিক সংস্করণ, জেমিনি 2.5 প্রো, এখন সমস্ত জেমিনি ব্যবহারকারীদের জন্য উপলব্ধ এবং আপনার জিজ্ঞাসা করা প্রশ্নগুলি সম্পর্কে "চিন্তা" করতে এবং আরও ব্যাপক, লক্ষ্যযুক্ত উত্তর প্রদান করতে সক্ষম৷
মিথুন কিভাবে গুগল সহকারী থেকে আলাদা?

Google Gemini হল একটি সম্পূর্ণ বৈশিষ্ট্যযুক্ত কৃত্রিম বুদ্ধিমত্তা যার অনেক বেশি ক্ষমতা রয়েছে, যেখানে Google Assistant হল সীমিত প্রক্রিয়াকরণ ক্ষমতা সহ রুটিনের একটি সেট৷ গুগল অ্যাসিস্ট্যান্ট একটি নির্দিষ্ট সংখ্যক ফাংশন সম্পাদন করতে পারে, কিন্তু উত্তরগুলি অনুসন্ধান করতে বা জেমিনি যেভাবে করতে পারে সেইভাবে প্রশ্নগুলি প্রক্রিয়া করতে সক্ষম নয়৷
প্রধান পার্থক্য এতে ফুটে ওঠে: মিথুন একটি কৃত্রিম বুদ্ধিমত্তা, যদিও গুগল সহকারী নয়।
মিথুন কি করতে পারে?

মিথুন কী করতে পারে না তা জিজ্ঞাসা করা সহজ হতে পারে। এটি একটি সহজ: এটি এমন কাজগুলি সম্পাদন করতে পারে না যার জন্য শারীরিকতার প্রয়োজন হয়, অন্তত এখনও নয়। এটি ভবিষ্যতে খুব বেশি দূরে নাও হতে পারে, যদিও, যেহেতু জেমিনি রোবোটিক্স (গুগলের আরেকটি বিভাগ) গ্রাহক-গ্রেডের রোবোটিক সহকারীর উপর কাজ করছে যা আপনার কাপড় ভাঁজ করা, আপনার বাড়ি পরিষ্কার করা এবং এমনকি বাস্কেটবল খেলার মতো কাজ করতে পারে।
আসলে, মিথুন এই জিনিসগুলি করতে পারে না বলাটা একেবারেই সঠিক নয়৷ এটি কীভাবে বোঝার ক্ষমতার চেয়ে বেশি – এটির কেবল একটি ইন্টারফেসের প্রয়োজন যা এটি করতে দেয়। আমরা প্রায়শই দ্য জেটসনের রোজির সাথে সাদৃশ্যপূর্ণ AI নিয়ে রসিকতা করি, কিন্তু সত্য হল যে আমরা অনেক লোকের উপলব্ধি করার চেয়ে অনেক কাছাকাছি।
মিথুনের বাকি ক্ষমতার জন্য, এটি আপনি যা চান তার উপর নির্ভর করে।
ভিডিও নির্মাণ
আপনি যদি Google One AI প্রিমিয়াম (একটি অর্থপ্রদানের অ্যাক্সেস স্তর যা আরও উন্নত কার্যকারিতা প্রদান করে) সাবস্ক্রাইব করেন তবে আপনি কয়েকটি লাইনের পাঠ্য ইনপুটের উপর ভিত্তি করে ভিডিও তৈরি করতে Google এর Veo 2 টুল ব্যবহার করতে পারেন।

বর্তমানে, Veo 2 720p রেজোলিউশনে আট-সেকেন্ডের ক্লিপ তৈরি করতে পারে। গুগলের মতে, Veo 2 "সিনেমাটোগ্রাফির অনন্য ভাষা বোঝে।" আপনি 4K পর্যন্ত রেজোলিউশন এবং মিনিটের দৈর্ঘ্য সহ নির্দিষ্ট ফোকাল দৈর্ঘ্য, প্রভাব এবং আরও অনেক কিছুর জন্য অনুরোধ করতে পারেন। এর থেকেও বেশি, Veo 2 এর প্রতিযোগীদের তুলনায় কম হ্যালুসিনেশন আছে। এর মানে আপনার কাছে অনেক বেশি আঙুল দিয়ে কম অক্ষর দেখা যাবে।
তথ্য প্রক্রিয়াকরণ
গুগল জেমিনি একই সাথে 30,000 লাইন পর্যন্ত কোড বা প্রায় 1,500 পৃষ্ঠার পাঠ্য পরীক্ষা করতে পারে। এটিকে একটি উপন্যাস খাওয়ান এবং এটি প্লটের সংক্ষিপ্তসার, থিম, আলোচনার প্রশ্ন এবং আরও অনেক কিছু বের করতে পারে। এটি কোডের ত্রুটি সনাক্ত করতে এবং সমস্যা সমাধানে প্রোগ্রামারদের সহায়তা করতে পারে।
আপনি যদি জেমিনিকে একটি পডকাস্ট বা একটি অডিও রেকর্ডিং খাওয়ান, এটি আপনার জন্য শুনতে এবং নির্দিষ্ট প্রশ্নের উত্তর দিতে এবং টাইমস্ট্যাম্প প্রদান করতে পারে। Gemini এমনকি Gmail এর মতো অন্যান্য Google অ্যাপের সাথে একীভূত হতে এবং আপনার ইনবক্সের তথ্যের উপর ভিত্তি করে ভ্রমণ যাত্রাপথ তৈরি করতে সক্ষম।
আমি আরও কয়েক ডজন উদাহরণ প্রদান করতে পারি। যখন এটি মিথুনের কথা আসে, আপনি এটিকে আমরা এখানে তালিকাভুক্ত করার চেয়ে বিস্তৃত বিভিন্ন উপায়ে ব্যবহার করতে পারেন।
ছবি তৈরি
মিথুন একটি পাঠ্য বিবরণ থেকেও ছবি তৈরি করতে পারে। এটি Imagen 3 ব্যবহার করে, যা Google তার "এখনও পর্যন্ত সর্বোচ্চ মানের পাঠ্য-টু-ইমেজ মডেল" হিসাবে বর্ণনা করে । আপনি এটিকে ছবিতে কী অন্তর্ভুক্ত করতে চান, আপনি যে স্টাইলটি ব্যবহার করতে চান এবং অন্য কোনো প্রাসঙ্গিক বিশদ বিবরণ তা বলুন৷ এটি পুরানো-বিদ্যালয়ের কার্টুন থেকে ফটোরিয়েলিস্টিক ল্যান্ডস্কেপ পর্যন্ত যেকোনো কিছু তৈরি করতে পারে।
একবার এটি চিত্রটি ছিটকে গেলে, এটি দেখতে কেমন হওয়া উচিত তার জন্য আপনার দৃষ্টিভঙ্গির সাথে আরও ঘনিষ্ঠভাবে অনুরূপ করতে আপনি এটিকে পরিমার্জন করতে পারেন।
গবেষণা
মিথুনের সবচেয়ে শক্তিশালী দক্ষতা হল এর গভীর গবেষণা করার ক্ষমতা । আপনি যে উত্তরগুলি খুঁজছেন তা খুঁজে পেতে এটি কয়েক মিনিটের মধ্যে রিয়েল-টাইমে শত শত বিভিন্ন উত্সের মাধ্যমে দেখতে পারে৷ উদাহরণস্বরূপ, আপনি সৈকত গ্লাস খোঁজার জন্য বিশ্বজুড়ে সেরা অবস্থানগুলি খুঁজে পেতে মিথুনকে বলতে পারেন৷ এটি তারপরে অবস্থানগুলি খুঁজে পেতে এবং আপনাকে সেগুলি সুপারিশ করার জন্য ভ্রমণ ব্লগ থেকে শুরু করে Google মানচিত্রে ব্যবহারকারীর পর্যালোচনা পর্যন্ত সবকিছু দেখতে পারে৷ এর পরে, আপনি এই অবস্থানগুলির যে কোনও একটিতে ফ্লাইট কেনার সেরা সময় খুঁজে পেতে এটিকে জিজ্ঞাসা করতে পারেন।

ডিপ রিসার্চ আপনাকে ম্যানুয়াল অনুসন্ধানের ঘন্টা বাঁচাতে পারে এবং যেহেতু এটি কোথা থেকে তথ্য টানে তার জন্য উত্স সরবরাহ করে, আপনি সঠিকতা যাচাই করতে দুবার-চেক করতে পারেন। মিথুনের সঠিক প্রতিক্রিয়া নিশ্চিত করার জন্য Google অনেক কাজ করেছে, কিন্তু তথ্যকে অভিহিত মূল্যে নেওয়ার পরিবর্তে নিজেরাই প্রমাণ করা সর্বদা ভাল।
মিথুন লাইভ
এমনকি আপনি Gemini Live এর মাধ্যমে মিথুনের সাথে কথোপকথন করতে পারেন। এটি আপনাকে আপনার প্রশ্নটি টাইপ না করে সরাসরি মিথুনের সাথে কথা বলতে দেয় এবং এটি এমনভাবে প্রতিক্রিয়া জানাবে যা স্বাভাবিক মনে হয়। এমনকি আপনি একটি ফলো-আপ প্রশ্ন জিজ্ঞাসা করতে একটি বাক্যের মধ্য দিয়ে মিথুনকে বাধা দিতে পারেন। এটা প্রায় একজন প্রকৃত ব্যক্তির সাথে চ্যাট করার মত।
যেতে যেতে ব্যবহারের জন্য জেমিনি লাইভ দুর্দান্ত, বিশেষ করে যদি আপনি ব্লুটুথ হেডফোন ব্যবহার করেন এবং চলার সময় তথ্য পাওয়ার চেষ্টা করেন। মিথুন রিয়েল-টাইম ভিডিও প্রক্রিয়া করতে পারে, রাস্তায় হাঁটার সময় আপনি কী দেখছেন সে সম্পর্কে আপনাকে উত্তর দেয়।
কোন ডিভাইসগুলি মিথুন ব্যবহার করতে পারে?

Google Gemini বর্তমানে Android এবং iOS ডিভাইসের জন্য একটি অ্যাপ হিসেবে উপলব্ধ। আপনি এটি ডাউনলোড করতে পারেন এবং নিজের জন্য এর বৈশিষ্ট্যগুলি ব্যবহার করে দেখতে পারেন এবং Google One সাবস্ক্রিপশন প্ল্যানের এক মাসের বিনামূল্যের ট্রায়ালও রয়েছে৷ এই বছরের শেষের দিকে, গুগল স্মার্ট হোম স্পিকার, টিভি এবং আরও অনেক কিছু সহ বেশিরভাগ ডিভাইসে জেমিনি দিয়ে গুগল অ্যাসিস্ট্যান্ট প্রতিস্থাপন করার পরিকল্পনা করেছে।
তবে, সমস্ত ডিভাইস পরিবর্তন দেখতে পাবে না। একটি ডিভাইস অবশ্যই অ্যান্ড্রয়েড 10 বা উচ্চতর চালাতে হবে এবং মিথুনকে সমর্থন করার জন্য 2GB-এর বেশি RAM আছে৷ যদিও বেশিরভাগ আধুনিক ডিভাইস অসুবিধা ছাড়াই অ্যাপটি চালাবে, কিছু পুরানো অ্যান্ড্রয়েড গ্যাজেট কাজ নাও করতে পারে।
জেমিনি এমনকি স্যামসাং ডিভাইসগুলির সাথে কাজ করে এবং এটির প্রয়োজন হতে পারে এমন তথ্যের জন্য নেটিভ স্যামসাং অ্যাপগুলিতে ট্যাপ করবে৷
মিথুনের সেটিংস কীভাবে পরিবর্তন করবেন
এর বর্তমান অবস্থায়, মিথুন আপনাকে পরিবর্তন করার অনুমতি দেবে এমন খুব বেশি সেটিংস নেই। এখানে আপনি কিভাবে এটি পরিবর্তন করতে পারেন.
gemini.google.com থেকে, স্ক্রিনের উপরের-বাম কোণে তিনটি বারে ক্লিক করুন এবং সেটিংস নির্বাচন করুন। এখান থেকে, আপনি সংরক্ষিত তথ্য , অ্যাপস, আপনার সর্বজনীন লিঙ্কগুলি নির্বাচন করতে পারেন বা ডার্ক মোডের জন্য একটি স্লাইডার টগল করতে পারেন৷
সংরক্ষিত তথ্য আপনাকে মিথুন রাশিকে নিজের জন্য নির্দিষ্ট তথ্য প্রদান করতে দেয়, যেমন খাদ্যতালিকাগত পছন্দ, প্রতিক্রিয়ার পছন্দের শৈলী এবং আরও অনেক কিছু।
অ্যাপগুলি স্ব-ব্যাখ্যামূলক। এটি একটি সিরিজ স্লাইডার যা আপনাকে Gemini কে Google Workspace, YouTube এবং অন্যান্য অ্যাপ্লিকেশনের সাথে লিঙ্ক করতে দেয়।
আপনার সর্বজনীন লিঙ্কগুলি হল চ্যাট যা আপনি অন্যদের সাথে ভাগ করতে বেছে নিয়েছেন৷ আপনি কার সাথে চ্যাট ভাগ করেছেন তা দেখতে পারেন এবং এটি মুছে ফেলতে পারেন বা এই পৃষ্ঠা থেকে অ্যাক্সেস প্রত্যাহার করতে পারেন৷
কোনটি ভাল: সিরি বা মিথুন?
মিথুন রাশি ভালো। হ্যান্ডস-ডাউন।
সম্পূর্ণরূপে প্রযুক্তিগত দৃষ্টিকোণ থেকে, জেমিনি সিরি যা করার স্বপ্ন দেখতে পারে তার চেয়ে অনেক বেশি। অ্যাপল যখন অ্যাপল ইন্টেলিজেন্সের সাথে তার ভয়েস সহকারীর নতুন এবং উন্নত সংস্করণ রোল আউট করে তখন সিরির উন্নতির আশা থাকলেও, কোম্পানি ইতিমধ্যে সেই ফ্রন্টে সময়সূচী থেকে অনেক পিছিয়ে রয়েছে।
জেমিনি বর্তমানে যা করতে সক্ষম তার কাছাকাছি যেকোন জায়গায় যেতে সিরিকে অনেক ক্যাচ-আপ খেলতে হবে এবং জেমিনীর মাথার শুরু সিরির ব্যবধানটি একটি পাতলা করার সম্ভাবনা তৈরি করে। আপনি যদি একজন আইফোন ব্যবহারকারী হন এবং সিরির আরও ভাল হওয়ার জন্য অপেক্ষা করবেন বা জেমিনি বেছে নেবেন কিনা তা নিয়ে বিতর্ক করছেন, শুধু এগিয়ে যান এবং iOS জেমিনি অ্যাপ ডাউনলোড করুন। এই সময়ের মধ্যে আপনি এটির থেকে অনেক বেশি ব্যবহার পাবেন এবং নতুন সংস্করণটি কখনও কমে গেলে আপনি সর্বদা সিরিতে ফিরে যেতে পারেন।