আমি ChatGPT-এর ইমেজ জেনারেশনকে Nano Banana-এর সাথে তুলনা করেছি এবং তাদের মধ্যে মাত্র একটি দরকারী স্টক ফটো তৈরি করেছে।

আমার ব্যক্তিগত শখ হলো দুটি ভিন্ন চ্যাটবটকে একই প্রশ্ন জিজ্ঞাসা করা এবং দেখা যে কোনটি সবচেয়ে ভালো উত্তর দেয়। একজন অধ্যাপকের মতো, যিনি শিক্ষার্থীদের প্রশ্ন করেন (যা আমি কখনও কখনও একজন স্বেচ্ছাসেবক হিসেবে বাস্তব জীবনে করি), আমি মূল্যায়ন করি যে বটটি কি বিভ্রান্ত করছে এবং তথ্য তৈরি করছে, নাকি এটি একটি বুদ্ধিমান এবং সুসংগত উত্তর প্রদান করে যা আসলেই কার্যকর।

"বুদ্ধি" এবং "সংগতি" এই শব্দগুলো আমি চ্যাটবটগুলো সাধারণত ছবির ক্ষেত্রে যা তৈরি করে তা বর্ণনা করার জন্য ব্যবহার করব না। AI slop নামে পরিচিত, এই অদ্ভুত মিশ্রণগুলি – প্রায়শই ঝাপসা ব্যাকগ্রাউন্ড, কোঁকড়ানো চুল সহ একজন নিখুঁত মানুষ এবং সম্ভবত কয়েকটি অতিরিক্ত থাম্বস – সোশ্যাল মিডিয়া জুড়ে রয়েছে এবং এমনকি এই জাতীয় নিবন্ধগুলিতে ফিচার ইমেজ হিসাবেও দেখা যায়।

স্টক ছবির নাম ইতিমধ্যেই খারাপ। এমিলিয়া ক্লার্কের এই ভিডিওটি এখনও আমার সর্বকালের প্রিয় স্টক ছবির প্যারোডিগুলির মধ্যে একটি এবং আমাকে হাসিয়ে তোলে, যদিও এটি AI স্লপের অনেক আগে প্রকাশিত হয়েছিল:

সময় বদলেছে। গুগল জেমিনি এবং ন্যানো ব্যানানা প্রো- এর সাথে প্রতিযোগিতা করার জন্য ওপেনএআই সম্প্রতি চ্যাটজিপিটি ইমেজ জেনারেশন মডেল আপগ্রেড করেছে।

আশ্চর্যজনকভাবে, ছবিগুলিতে আর সেই স্বতন্ত্র ঝাপসা রঙ ব্যবহার করা হয় না এবং আমার পরীক্ষায়, প্রায়শই আগের তুলনায় অনেক বেশি বাস্তবসম্মত দেখায়।

আমি সিদ্ধান্ত নিয়েছি যে দুটি চ্যাটবটের ক্ষেত্রেই একই প্রম্পট ব্যবহার করবো এবং দেখবো কোনটি সবচেয়ে কার্যকর ফলাফল দিয়েছে। আমি বলছি: এমন একটি ছবি যা আপনি বিজ্ঞাপন প্রচারণায় অথবা একটি নিবন্ধের সাথে ব্যবহার করতে পারেন, যা আপনি সোশ্যাল মিডিয়ায় মজার ক্যাপশনের সাথে পোস্ট করবেন।

ChatGPT এর গতি আমাকে মুগ্ধ করেছে — কোনও স্টক ছবিই কম্পিউটার-জেনারেটেড আবর্জনার মতো দেখায়নি। তবে, Nano Banana Pro-এর হাতই বেশি কারণ এটি আমার পরীক্ষায় ধারাবাহিকভাবে আরও বাস্তবসম্মত ছবি তৈরি করেছে। আমি যে প্রম্পটগুলি ব্যবহার করেছি এবং উভয় বট যে ছবিগুলি তৈরি করেছে তা এখানে দেওয়া হল যাতে আপনি নিজেই বিচার করতে পারেন। (Nano Banana ছবিগুলি বাম দিকে রয়েছে।)

১. একজন ব্যক্তি পডকাস্ট শুনছেন

ব্যবহৃত প্রম্পট: একটি ট্রেন্ডি অফিসে পডকাস্ট শুনছেন এমন কারোর একটি স্টক ইমেজ তৈরি করুন

আমি দুটি বটকেই অফিসে পডকাস্ট শুনছেন এমন একজনের ছবি তুলতে বলেছিলাম। ন্যানো বানানা এখানে স্পষ্টভাবে জয়ী হয়েছে, যদিও ন্যানো বানানা ছবির ব্যাকগ্রাউন্ডে সামান্য ঝাপসা আছে যা হয়তো একটা মারাত্মক উপহার। তবুও, AI পরম নিখুঁততা এড়াতে শিখছে। সত্যি বলতে, ন্যানো বানানার শটে অফিসের সেটিংয়ে থাকা মহিলাটি আসল নন তা জানতে আমার কষ্ট হবে। তার চুল কিছুটা এলোমেলো (বাস্তব জীবনের কারও মতো)। ChatGPT শটে, পডকাস্ট শ্রোতাকে ঠিক দেখাচ্ছে না — ছবিটি একটু বেশিই নিখুঁত।

২. আমার বইয়ের জন্য একটি প্রোমো ইমেজ তৈরি করুন

ব্যবহৃত প্রম্পট: এই বইয়ের প্রচ্ছদটি এমন কারো হাতে তুলে দিন যিনি সত্যিই এটি পড়তে আগ্রহী।

এই পরীক্ষার জন্য, আমি আমার নিজের বইয়ের প্রচ্ছদটি আপলোড করেছি এবং বটদেরকে এমন একটি ছবি তৈরি করতে বলেছি যেখানে কেউ এটি পড়ছে। ন্যানো ব্যানানা একটু বেশিই উপরে উঠে গেছে, কারণ AI ছবিতে কাউকে একটু বেশি উৎসাহী দেখানো হয়েছে। তবুও, ChatGPT ছবিতে এখনও একটি ভিন্ন জাগতিক গুণ রয়েছে (এবং আমি বলতে চাইছি এটি খারাপভাবে) যা বাস্তব বলে মনে হচ্ছে না। ChatGPT ছবির সবকিছুই খুব নিখুঁত – আলো, ভঙ্গি ইত্যাদি – এবং এখনও CGI চিৎকার করে।

৩. একটি নিবন্ধের সাথে ব্যবহার করার জন্য একটি স্টক চিত্র তৈরি করুন

ব্যবহৃত প্রম্পট: AI ইমেজ জেনারেশন সম্পর্কে একটি নিবন্ধের সাথে একটি স্টক ইমেজ তৈরি করুন

এবার ন্যানো ব্যানানা সব যুদ্ধে জয়লাভ করেনি। আমি এই প্রবন্ধের সাথে মিলে যাওয়ার জন্য দুটি বটকেই একটি ছবি তৈরি করতে বলেছিলাম। চ্যাটজিপিটি কিছুটা কার্যকর একটি ছবি তৈরি করেছে যা এখনও একটু বেশিই নকল, কিন্তু ন্যানো ব্যানানা প্রো একটি কম্পিউটার-জেনারেটেড ছবি দিয়ে চতুর্থ প্রাচীর ভেঙেছে যা একটি অ্যাপল আইপ্যাডের উপরে একটি মস্তিষ্ক এবং একটি পেইন্টব্রাশকে সুপারইম্পোজ করে। অন্য কথায় – এটি মোটেও কার্যকর নয়।

৪. নেতৃত্বের সংগ্রাম

ব্যবহৃত প্রম্পট: নেতৃত্বের লক্ষ্য অর্জনের জন্য সংগ্রামরত কাউকে দেখান, কিন্তু এটিকে বাস্তবসম্মত করে তুলুন।

আপনি যে সবচেয়ে সাধারণ স্টক ফটোগুলি দেখতে পাবেন তার মধ্যে একটিতে দেখা যায় যে কেউ লক্ষ্য অর্জনের জন্য সংগ্রাম করছে — যেমন, পাহাড়ে ওঠা, আকাশে হাত তুলে, অথবা খাল পার হয়ে লাফ দেওয়া। এই স্টক ইমেজটি এত জনপ্রিয় হওয়ার কারণ হল ছবিগুলি সম্পর্কিত — আমরা সকলেই সফল হতে সংগ্রাম করি। আমি বলব ন্যানো ব্যানানা প্রো এবং চ্যাটজিপিটি উভয়ই খারাপ ফলাফল দিয়েছে। তাদের তৈরি স্টক ইমেজগুলি দেখায় যে কেউ অফিসে ভাঁজ করা কাগজপত্র নিয়ে হতাশ। তবুও, ন্যানো ব্যানানার চেহারা একটু বেশি বাস্তবসম্মত।

৫. ক্যামেরার দিকে তাকিয়ে হাসছেন এমিলিয়া ক্লার্ক

ব্যবহৃত প্রম্পট: একটি নতুন স্টক ইমেজ তৈরি করুন যেখানে এমিলিয়া ক্লার্ক অফিসে ক্যামেরার দিকে হাসছেন।

একটি চূড়ান্ত পরীক্ষার জন্য, আমি উভয় বটকে অফিসে ক্যামেরার দিকে তাকিয়ে হাসতে থাকা এমিলিয়া ক্লার্কের একটি নতুন ছবি তৈরি করতে বলেছিলাম। আমি অবাক হয়েছিলাম যে ChatGPT ছবিটি তৈরি করতে অস্বীকৃতি জানিয়েছিল, বলেছিল যে ক্লার্ক একজন "প্রকৃত, শনাক্তযোগ্য ব্যক্তি" যেখানে Nano Banana খুশি মনে রাজি হয়েছিল। কিছু প্রলোভনের মাধ্যমে, আমি ChatGPT কে ক্লার্কের মতো দেখতে এমন কাউকে তৈরি করতে বলেছিলাম। Nano Banana ছবিটি আসলে খারাপ নয় – এটি সম্পূর্ণ নকল দেখাচ্ছে না।

সর্বশেষ ভাবনা

AI ইমেজ জেনারেশন অনেক দূর এগিয়েছে। Nano Banana Pro বা ChatGPT-এর তৈরি কোনও ছবিতেই ছয়টি আঙুল বা তিনটি বাহু বিশিষ্ট কাউকে দেখানো হয়নি। সবগুলোই আধা-বাস্তববাদী লাগছিল। Nano Banana-এর কিছু ছবি যথেষ্ট বাস্তবসম্মত ছিল যা আমি সোশ্যাল মিডিয়া বা অন্যান্য উদ্দেশ্যে ব্যবহার করে দেখতে পাচ্ছি, এবং ChatGPT অবশ্যই উন্নতি করছে। আমার ভবিষ্যদ্বাণী? আগামী বছরের এই সময়ের মধ্যে, আমরা আসল ছবির সাথে নকল ছবির পার্থক্য বলতে পারব না।

আমি ChatGPT-এর ইমেজ জেনারেশনকে Nano Banana-এর সাথে তুলনা করেছিলাম এবং তাদের মধ্যে মাত্র একটি দরকারী স্টক ফটো তৈরি করেছে, এই পোস্টটি প্রথমে Digital Trends- এ প্রকাশিত হয়েছিল।