দ্য ইনফরমেশন আজ একচেটিয়াভাবে একটি স্মারকলিপি প্রকাশ করেছে যা অল্টম্যান গত মাসে ওপেনএআই-তে অভ্যন্তরীণভাবে পাঠিয়েছিলেন, যেখানে অল্টম্যান বলেছিলেন যে এআই ক্ষেত্রে গুগলের সর্বশেষ উন্নয়ন কোম্পানির জন্য কিছু অস্থায়ী অর্থনৈতিক প্রতিবন্ধকতা আনতে পারে।
এখন মনে হচ্ছে এটি কেবল সম্ভাব্য প্রতিরোধের বিষয় নয়, বরং চাপ ইতিমধ্যেই অনুভূত হচ্ছে। ইন্টারনেট যুগের অবিসংবাদিত নেতা গুগল স্পষ্টতই ওপেনএআইকে সিংহাসনচ্যুত করতে এবং এআই যুগে এক নম্বর অবস্থান ধরে রাখতে চায়।
জেমিনি ৩.০ প্রোকে ঘিরে গুঞ্জন এখনও কমেনি, এবং মহাবিশ্বের "সবচেয়ে শক্তিশালী" ইমেজ মডেল, ন্যানো ব্যানানা প্রো, ইতিমধ্যেই একটি নতুন এবং আকর্ষণীয় ডিজাইনের সাথে উপস্থাপিত হয়েছে।
প্রথম প্রজন্মের সংস্করণটি অসাধারণ আত্মপ্রকাশের পর মাত্র তিন মাসেরও কম সময় হয়েছে।
এই আপডেটটি বৃহত্তর ধারাবাহিকতা বজায় রাখে এবং জেমিনি 3.0 প্রো-এর সাথে বিশ্ব জ্ঞানকে সিঙ্ক্রোনাইজ করে, মাল্টিমোডাল বোঝাপড়া এবং যুক্তি ক্ষমতা উল্লেখযোগ্যভাবে উন্নত করে।

অতীতের ডেস্কটপ মূর্তিগুলি এখন কেবল "মজার বস্তু" হয়ে উঠেছে। ন্যানো ব্যানানা প্রো-এর আপগ্রেডের দিকটি আরও স্পষ্ট, যা একটি উৎপাদনশীলতা সরঞ্জামের কাছাকাছি চলে এসেছে। ব্যবহারকারীরা এটি ব্যবহার করে বিভিন্ন জটিল ভিজ্যুয়াল এফেক্ট তৈরি এবং সম্পাদনা করে, নির্ভুল এবং মার্জিতভাবে সাজানো ইনফোগ্রাফিক্স তৈরি করে।
ন্যানো ব্যানানা প্রো-এর ক্ষমতা সম্পূর্ণরূপে কাজে লাগানোর জন্য আমরা বেশ কিছু জনপ্রিয় অনলাইন বৈশিষ্ট্য এবং গুগলের অফিসিয়াল ব্যবহারকারী নির্দেশিকা অন্বেষণ করেছি।
নিবন্ধগুলিকে স্টাইলাইজড ইনফোগ্রাফিক্সে রূপান্তর করুন
দীর্ঘ লেখা রেন্ডার করার উন্নত ক্ষমতার জন্য ধন্যবাদ, জনপ্রিয় অনলাইন পরীক্ষাগুলি এখন সকল ধরণের ইনফোগ্রাফিক্স তৈরি করে, যার মধ্যে রয়েছে জ্ঞানের ঘন ব্যাখ্যা, ব্ল্যাকবোর্ড বা দেয়াল জুড়ে ক্লাসিক কবিতা, অথবা গণিত সমস্যার সমাধান ইত্যাদি।
উদাহরণস্বরূপ, নিম্নলিখিত প্রোগ্রামটি আমাদের ইনপুট করা টেক্সটকে একটি ম্যাগাজিনের বিষয়বস্তুতে রূপান্তর করে।

▲ছবির উৎস:
কিছু নেটিজেন এমনকি তাকে একটি মার্কডাউন ডকুমেন্ট বা পিডিএফ পাঠিয়েছিলেন এবং ন্যানো ব্যানানা প্রোকে এটিকে একটি ইনফোগ্রাফিকে রূপান্তর করতে বলেছিলেন, যার ফলে একটি ব্যবহারকারী-বান্ধব এবং নির্ভুল ছবি তৈরি হয়।
মন্তব্যের অংশে মানুষ বলছে, চিত্রকরদের যুগ কি শেষ হয়ে আসছে?

▲ছবির উৎস: X@tobi | প্রম্পট: এই মার্কডাউন ট্রান্সক্রিপ্টটিকে একটি ইনফোগ্রাফিকে রূপান্তর করুন
যেহেতু ন্যানো ব্যানানা প্রো এখন গুগল সার্চ ব্যবহার করতে পারে এবং এর যুক্তি এবং বোধগম্যতা ব্যাপকভাবে উন্নত করেছে, তাই এটি কঠোর প্রয়োজনীয়তা ছাড়াই ইনফোগ্রাফিক্স তৈরি করতে পারে। আপনি কেবল এটি বলতে পারেন যে ইনফোগ্রাফিকের মূল থিম কী হওয়া উচিত এবং এটি প্রম্পটের কাঠামো সম্পর্কে খুব বেশি চিন্তা না করেই কাজ করবে।

▲ প্রম্পট: ২০২৬ সালে চীনের ছুটির সময়সূচীর একটি ইনফোগ্রাফিক তৈরি করুন, সম্পূর্ণ চীনা ভাষায়, ৪K মানের, ১৬:৯ অনুপাতের।
উদাহরণস্বরূপ, যখন আমরা তাকে আগামী বছরের ছুটির তথ্য তৈরি করতে বলেছিলাম, তখন আমি দেখেছি যে জেমিনিতে আমি যে প্রতিক্রিয়া পেয়েছি তাতে গুগল অনুসন্ধান ফলাফল ব্যবহার করে প্রাপ্ত তথ্য স্পষ্টভাবে দেখানো হয়েছে, যেমন একাধিক অফিসিয়াল ঘোষণা ওয়েব পৃষ্ঠার লিঙ্ক।
এছাড়াও অনেক আকর্ষণীয় ইনফোগ্রাফিক পরীক্ষা রয়েছে, এবং নেটিজেনদের কাছ থেকে আসা প্রম্পটগুলি বেশ সহজ, মূলত কেবল "xx এর জন্য একটি ইনফোগ্রাফিক তৈরি করতে আমাকে সাহায্য করুন"।
একটি ব্যস্ত শহরের মজার ইনফোগ্রাফিক, যেখানে দেখা যাচ্ছে প্রাণীরা ব্যস্ত শহরে কাজ করতে যাচ্ছে এবং তাদের বিভিন্ন কাজের সাথে পরিচয় করিয়ে দিচ্ছে।

▲ছবির উৎস: X@unsoldwill|সূত্র: ব্যস্ত শহরে কাজ করতে যাওয়া প্রাণীদের একটি মজার ব্যস্ত শহরের ইনফোগ্রাফিক তৈরি করুন যেখানে বিভিন্ন কাজ দেখানো হবে।
স্টিফেন বেস্টির স্টাইলে একটি দ্বি-স্তরের নিউরাল নেটওয়ার্ক ডায়াগ্রাম।

▲ ছবির উৎস: X@jon_barron | প্রম্পট: স্টিফেন বিস্টির স্টাইলে একটি দ্বি-স্তরের নিউরাল নেটওয়ার্কের একটি চিত্র তৈরি করুন
এই নেটিজেন ছবিটি গুগলের ভিও ৩.১-তেও পাঠিয়েছেন, যাতে এটি অ্যানিমেটেড হয়ে যায়।

জটিল নথিগুলিকে পরিষ্কার, স্ক্যানযোগ্য হোয়াইটবোর্ড-স্টাইলের ইনফোগ্রাফিক্সে রূপান্তর করুন।

▲ছবির উৎস:
চমৎকার কমিক স্ট্রিপ তৈরি করুন
দীর্ঘ টেক্সট রেন্ডারিং এবং দৃঢ় ধারাবাহিকতা রক্ষণাবেক্ষণের সমন্বয়ের মাধ্যমে, ন্যানো ব্যানানা প্রো কমিক স্ট্রিপ তৈরির জন্য উপযুক্ত, প্রচুর টেক্সট সহ ইনফোগ্রাফিক রেন্ডারিং ছাড়া। এছাড়াও, এটি এখন একটি অনুরোধে একাধিক ছবি তৈরি করতে সহায়তা করে।
একজন নেটিজেন কেবল একটি ছবি আপলোড করে "এই ছবির উপর ভিত্তি করে একটি মাল্টি-প্যানেল কমিক তৈরি করুন এবং আঁকুন" প্রম্পটে প্রবেশ করেন এবং পূর্বে লিখিত গল্প সহ বেশ কয়েকটি কমিক পান। তিনি পরবর্তী প্লটগুলিও আপডেট করে চলেছেন।

▲ ছবির উৎস: X@DeryaTR_ | প্রম্পট: এই ছবির উপর ভিত্তি করে একটি মাল্টি-প্যানেল কমিক তৈরি করুন এবং আঁকুন।
একটি প্রম্পটও আছে যেখানে বলা হয়েছে যে, একজন নির্দিষ্ট ব্যক্তির জীবনী নিয়ে কয়েক পৃষ্ঠার কমিক্স তৈরি করতে হবে। এরপর ন্যানো ব্যানানা প্রো ওয়েব সার্চ ব্যবহার করে সেই ব্যক্তির সম্পর্কে তথ্য উদ্ধার করতে পারে, তার এক্স অ্যাকাউন্ট খুঁজে পেতে পারে এবং সেই এক্স অ্যাকাউন্টের পোস্ট করা কন্টেন্টের উপর ভিত্তি করে কমিক্স তৈরি করতে পারে।

▲ছবির উৎস: X@skirano (Pietro Schirano) | প্রম্পট: Pietro Schirano-এর জীবনী নিয়ে কয়েকটি পৃষ্ঠার কমিক তৈরি করুন
যদি আপনারও পাবলিক সোশ্যাল মিডিয়া প্ল্যাটফর্ম থাকে, তাহলে আপনি গত সপ্তাহের আপনার জীবনের একটি কমিক স্ট্রিপ তৈরি করার জন্য ন্যানো কলা ব্যবহার করার চেষ্টা করতে পারেন।
আমরা ন্যানো ব্যানানা প্রো ব্যবহার করে মাস্ক এবং আল্ট্রাম্যানের জীবনের একটি কার্টুন তৈরি করার চেষ্টা করেছি। জেমিনি ওয়েব সংস্করণে, এটি আমাদের একসাথে তিনটি ছবি দিয়েছে এবং কার্টুনের বিষয়বস্তু দেখায় যে এটির সত্যিই কিছু বিশ্ব জ্ঞান রয়েছে।

▲ প্রম্পট: ইলন মাস্ক এবং স্যাম অল্টম্যানের জীবন নিয়ে বেশ কয়েকটি লাইভ-অ্যাকশন কার্টুন ছবি তৈরি করুন, সবই চীনা ভাষায়।
পূর্ববর্তী প্রজন্মের ন্যানো ব্যানানার সামঞ্জস্যপূর্ণ বৈশিষ্ট্যগুলির ক্ষেত্রে, বর্তমান প্রো সংস্করণটিও ঠিক একই রকম কাজ করে। উদাহরণস্বরূপ, এটি একটি ম্যানেকুইনকে বিভিন্ন পোশাকে সাজাতে পারে, একই সাথে ম্যানেকুইন এবং পোশাক উভয়ের জন্য একই চেহারা বজায় রাখতে পারে; এটি বিভিন্ন পেরিফেরালগুলিতে লোগোও স্থাপন করতে পারে; অথবা এটি বিদ্যমান পণ্যের চিত্রগুলিতে ছোট উপাদানগুলি প্রতিস্থাপন করতে পারে – ন্যানো ব্যানানা প্রো এই সমস্ত জিনিস খুব ভালভাবে করে।
গুগল এআই স্টুডিওর অফিসিয়াল কেস স্টাডিতে ইনফোগ্রাফিক জেনারেশন এবং কমিক বই তৈরির বেশ কয়েকটি উদাহরণও রয়েছে, যা ন্যানো ব্যানানা প্রো মডেল ব্যবহার করে একাধিক প্রকল্প তৈরি করে।

▲অভিজ্ঞতার লিঙ্ক: https://aistudio.google.com/apps?source=showcase&showcaseTag=nano-banana
একটি বৈশিষ্ট্য আমাদেরকে কেবল একটি নিবন্ধের লিঙ্ক আপলোড করে চারটি ভিন্ন ইনফোগ্রাফিক শৈলী তৈরি করতে দেয়: একটি মজাদার, ন্যূনতম, অন্ধকার প্রযুক্তি এবং আধুনিক সম্পাদকীয় শৈলী। আরেকটি বৈশিষ্ট্য আমাদেরকে কেবল একটি অস্পষ্ট ধারণা বা থিম প্রদান করে সম্পূর্ণ ভিন্ন একটি ইনফোগ্রাফিক তৈরি করতে দেয়।

▲প্রকল্প পরিচিতি ডেমো
গুগল এআই স্টুডিও 4K ওয়ালপেপার তৈরি, বাস্তবসম্মত আর্কেড গেম অভিজ্ঞতা প্রদান এবং ব্র্যান্ড ব্যবহারের জন্য তৈরি বিভিন্ন লোগো স্টিকার এবং গ্যাজেট সরবরাহের জন্য প্রস্তুত প্রকল্পগুলি অফার করে।
![]()
▲তুষারে গোল্ডেন গেট ব্রিজ (4K ওয়ালপেপার)
আমরা "ইনফিনিট হিরোস" মিনি-প্রজেক্ট ব্যবহার করে মাস্ক এবং আল্ট্রাম্যানের একটি কমিক স্ট্রিপ তৈরি করেছি। কমিক স্ট্রিপটি দেখার সময়, আমরা কমিকের পরবর্তী অংশের বিষয়বস্তু নির্ধারণের জন্য প্লটের দিকও বেছে নিতে পারি।

▲ ডাউনলোডের পর তৈরি করা কমিকটি একটি পিডিএফ ফাইল।
তবে, ন্যানো ব্যানানা প্রো মডেলের API বর্তমানে বিনামূল্যে ব্যবহারের জন্য নয়, তাই এআই স্টুডিওর ছয়টি প্রকল্পের জন্য ব্যবহারের আগে একটি পেমেন্ট পদ্ধতি লিঙ্ক করা প্রয়োজন।
তবে, এই সমস্ত প্রকল্পগুলি সোর্স কোড প্রদান করে, যা আমাদেরকে সেগুলি পরিবর্তন করার সুযোগ দেয়। অন্তর্নিহিত কোড পরীক্ষা করে, আমরা সহগামী প্রম্পটগুলিও দেখতে পারি।

আমরা একটি প্রকল্প থেকে প্রম্পটটি বের করেছি, অর্থাৎ, একটি লিঙ্ক প্রবেশ করালে চার ধরণের ইনফোগ্রাফিক্স তৈরি হয়।
প্রথমে, আমরা ওয়েবপেজ লিঙ্কগুলির বিষয়বস্তু সংক্ষিপ্ত করার জন্য নিম্নলিখিত কীওয়ার্ডগুলি ব্যবহার করতে পারি, ${url} কে বিশ্লেষণ করার জন্য প্রয়োজনীয় প্রকৃত নিবন্ধ লিঙ্ক দিয়ে প্রতিস্থাপন করতে পারি। ${language} কে সরাসরি চীনা ভাষায় উপস্থাপন করার জন্য চীনা দিয়ে প্রতিস্থাপন করা যেতে পারে।
আপনি একজন বিশেষজ্ঞ তথ্য ডিজাইনার। আপনার লক্ষ্য হল একটি ওয়েব পৃষ্ঠা থেকে প্রয়োজনীয় কাঠামো বের করে একটি স্পষ্ট, শিক্ষামূলক ইনফোগ্রাফিক তৈরি করা।
এই URL-এ কন্টেন্ট বিশ্লেষণ করুন: ${url}
লক্ষ্য ভাষা: ${language}।
${language} ভাষায় ভিজ্যুয়াল উপস্থাপনার জন্য বিশেষভাবে ডিজাইন করা একটি কাঠামোগত ব্রেকডাউন প্রদান করুন:
১. তথ্যবহুল শিরোনাম: মূল বিষয় ৫ বা তার কম শব্দে (${language} ভাষায়)।
২. মূল পদক্ষেপ: ৩ থেকে ৫টি সবচেয়ে গুরুত্বপূর্ণ স্বতন্ত্র পয়েন্ট, ধাপ, বা তথ্য (${language} তে)। এগুলি হবে ছবির প্রধান অংশ।
৩. সহায়ক তথ্য: যেকোনো নির্দিষ্ট সংখ্যা, শতাংশ, অথবা খুব ছোট উদ্ধৃতি যা বিশ্বাসযোগ্যতা যোগ করে।
৪. ভিজ্যুয়াল রূপক ধারণা: এই বিষয়বস্তুর সাথে সবচেয়ে উপযুক্ত একটি সহজ ভিজ্যুয়াল ধারণার পরামর্শ দিন (যেমন, "মাইলফলক সহ একটি রোডম্যাপ", "একটি ফানেল", "তিনটি বিপরীত স্তম্ভ", "একটি বৃত্তাকার ফ্লোচার্ট")।
আউটপুট সংক্ষিপ্ত রাখুন এবং ইনফোগ্রাফিকে কী থাকা উচিত তার উপর সম্পূর্ণ মনোযোগ দিন। নিশ্চিত করুন যে সমস্ত কন্টেন্ট ${language} ভাষায় রয়েছে।
প্রবন্ধের এই সারাংশটি পাওয়ার পর, আমরা ছবি তৈরি শুরু করতে পারি।
এই কাঠামোগত বিষয়বস্তু পরিকল্পনার উপর ভিত্তি করে একটি পেশাদার, উচ্চ-মানের শিক্ষামূলক ইনফোগ্রাফিক তৈরি করুন:
${structuralSummary}
ভিজ্যুয়াল ডিজাইনের নিয়ম:
– ${স্টাইল গাইডলাইনস}
– ভাষা: ইনফোগ্রাফিকের মধ্যে লেখাটি অবশ্যই ${language} তে লিখতে হবে।
– লেআউট: উপরের পরিকল্পনা থেকে "ভিজ্যুয়াল মেটাফোর আইডিয়া" অনুসরণ করতে হবে, যদি তা প্রদান করা হয়।
– টাইপোগ্রাফি: পরিষ্কার, উচ্চ-পঠনযোগ্য সান-সেরিফ ফন্ট। "ইনফোগ্রাফিক শিরোনাম" অবশ্যই উপরে স্পষ্টভাবে প্রদর্শিত হবে।
– বিষয়বস্তু: ছবিতে “KEY TAKEAWAYS” থেকে আসল লেখাটি ব্যবহার করুন। Lorem Ipsum এর মতো প্লেসহোল্ডার লেখা ব্যবহার করবেন না।
– লক্ষ্য: ছবিটি অবশ্যই তথ্যবহুল এবং একটি স্বতন্ত্র গ্রাফিক হিসেবে পাঠযোগ্য হতে হবে।
ইমেজ-জেনারেটেড প্রম্পটগুলি তুলনামূলকভাবে সহজ। আমরা ${structuralSummary} অংশটি পূর্ববর্তী নিবন্ধের লিঙ্ক থেকে বিশ্লেষণের ফলাফল দিয়ে প্রতিস্থাপন করি; তারপর, ${styleGuidelines} নির্বাচনের জন্য, আমরা অফিসিয়াল প্রকল্পে উল্লিখিত চারটি শৈলীর যেকোনো একটি বেছে নিতে পারি।
মজাদার এবং খেলাধুলাপূর্ণ স্টাইল: স্টাইল নির্দেশিকা = স্টাইল: মজাদার, খেলাধুলাপূর্ণ, প্রাণবন্ত 2D ভেক্টর চিত্র। উজ্জ্বল রঙ, গোলাকার আকার এবং একটি বন্ধুত্বপূর্ণ সুর ব্যবহার করুন।
পরিষ্কার মিনিমালিস্ট: স্টাইল গাইডলাইন = স্টাইল: অতি-মিনিমালিস্ট। প্রচুর সাদা স্থান, পাতলা রেখা, সীমিত রঙের প্যালেট (সর্বোচ্চ ১-২টি অ্যাকসেন্ট রঙ)। খুবই পরিশীলিত এবং বাতাসযুক্ত।
ডার্ক মোড টেক: স্টাইল নির্দেশিকা = স্টাইল: ডার্ক মোড টেকনিক্যাল নান্দনিকতা। ডেটা পয়েন্টের জন্য উজ্জ্বল, উজ্জ্বল অ্যাকসেন্ট রঙ (সায়ান, লাইম সবুজ) সহ গাঢ় স্লেট/কালো ব্যাকগ্রাউন্ড।
আধুনিক সম্পাদকীয়: স্টাইল গাইডলাইন = স্টাইল: আধুনিক, সমতল ভেক্টর চিত্রণ শৈলী। পরিষ্কার, পেশাদার এবং সম্পাদকীয় (একটি উচ্চমানের প্রযুক্তিগত ম্যাগাজিনের মতো)। সুসংগত, পরিপক্ক রঙের প্যালেট।
এই পদ্ধতি অনুসরণ করে, আমরা ন্যানো ব্যানানা প্রো দ্বারা প্রকাশিত নিবন্ধটি জেমিনিকে পাঠিয়েছি এবং নিম্নলিখিত ইনফোগ্রাফিক্স পেয়েছি।

অফিসিয়াল হস্তক্ষেপ: অসম্পাদিত ছবি তৈরির ৭টি টিপস।
পূর্বে লিখিত প্রম্পট প্রদানের পাশাপাশি, Google ন্যানো ব্যানানা প্রো ব্যবহারের জন্য একটি বিস্তারিত নির্দেশিকা প্রদানের জন্যও ব্যাপক প্রচেষ্টা চালিয়েছে। এটি আংশিকভাবে ব্যবহারকারীদের মডেলটির কার্যকারিতা সম্পর্কে অজ্ঞতার কারণে ভুল বোঝাবুঝি রোধ করার জন্য, এবং আংশিকভাবে কারণ গুগল সত্যিকার অর্থে আশা করে যে ন্যানো ব্যানানা প্রো কেবল একটি মজাদার, খেলার যোগ্য চিত্র মডেলই হবে না বরং ব্যবহারকারীর উৎপাদনশীলতাও উল্লেখযোগ্যভাবে উন্নত করবে।
কিউ শব্দের গুরুত্ব তাদের ভূমিকার মধ্যে নিহিত; মডেলের নিজস্ব ক্ষমতা ছাড়াও, সুনির্দিষ্ট নিয়ন্ত্রণের প্রয়োজন এমন বিষয়বস্তুর জন্য, এগুলি পরবর্তী সবচেয়ে গুরুত্বপূর্ণ বিষয়। গুগল পুনর্ব্যক্ত করে যে একটি ভাল কিউ শব্দের থিম, রচনা, ক্রিয়া, অবস্থান, শৈলী এবং সম্পাদকীয় নির্দেশাবলী স্পষ্টভাবে অন্তর্ভুক্ত করা উচিত।
ছবির মূল বিষয়বস্তু সংক্ষিপ্ত ভাষায় বর্ণনা করুন। উদাহরণস্বরূপ, ছবিতে ব্যক্তি বা বস্তুটি কী তা নির্দিষ্ট করুন। রচনার দিক থেকে, মডেলকে বলুন ছবিটি কীভাবে ফ্রেম করা হয়েছে। এটি কি ক্লোজ-আপ, ওয়াইড-অ্যাঙ্গেল শট, লো-অ্যাঙ্গেল শট, নাকি পোর্ট্রেট শট ইত্যাদি।

▲উদাহরণস্বরূপ: সূর্যাস্তের সময় রোদে ভেজা লনে ছোট্ট জাদুকরের টুপি পরা একটি তুলতুলে ক্যালিকো বিড়াল তার জাদু প্রদর্শন করছে; কম কোণে তোলা ছবি, ফটোরিয়ালিস্টিক স্টাইল।
এরপর, ক্রিয়াটি বর্ণনা করুন: ছবির মূল বিষয়বস্তুর সাথে কী ঘটছে এবং এটি কোথায় ঘটছে? নির্দিষ্ট দৃশ্যটি বর্ণনা করুন। অবশেষে, বিভিন্ন সামগ্রিক নান্দনিক শৈলী বেছে নিয়ে পছন্দসই ফটোগ্রাফিক শৈলী নির্ধারণ করুন, যেমন 3D অ্যানিমেশন, ফিল্ম নোয়ার, জলরঙের চিত্রকর্ম, ফটোরিয়ালিজম, 1990 এর দশকের পণ্য ফটোগ্রাফি ইত্যাদি।
যদি আরও নিয়ন্ত্রণযোগ্য ছবির মান চান, তাহলে গুগল আরও উল্লেখ করেছে যে ক্যামেরা, আলো এবং ফর্ম্যাটিং এর মতো বিশদ আরও উন্নত করা যেতে পারে এবং প্রম্পটের বিষয়বস্তু আরও পরিমার্জিত করা যেতে পারে।
উদাহরণস্বরূপ, বর্তমান ন্যানো ব্যানানা প্রো কাস্টম কম্পোজিশন এবং অ্যাসপেক্ট রেশিও সমর্থন করে, যা আমাদেরকে 9:16 উল্লম্ব পোস্টার বা 21:9 সিনেমাটিক ওয়াইডস্ক্রিনের মতো বিকল্পগুলির মধ্যে একটি বেছে নেওয়ার সুযোগ দেয়।
এছাড়াও, ফটোগ্রাফি এবং আলোর বিবরণ সম্পর্কে, গুগলের রেফারেন্স টিপস হল একজন সিনেমাটোগ্রাফারের মতো শুটিং পরিচালনা করা, যতটা সম্ভব পেশাদার পরিভাষা ব্যবহার করা, যেমন "লো-অ্যাঙ্গেল শুটিং, শ্যালো ডেপথ অফ ফিল্ড (f/1.8), গোল্ডেন আওয়ার ব্যাকলাইটিং, লম্বা ছায়া তৈরি করা, সিনেমাটিক কালার গ্রেডিং, নরম নীল-সবুজ টোন ব্যবহার করা"; এবং এই জাতীয় অন্যান্য টিপস।

▲উদাহরণ: সূর্যাস্তের সময় একটি ছোট জাদুকরের টুপি পরা একটি তুলতুলে ক্যালিকো বিড়াল রোদে ভেজা লনে তার মন্ত্র ছুঁড়েছে। লো-অ্যাঙ্গেল শট, অগভীর ক্ষেত্রের গভীরতা (f/1.8), সোনালী ঘন্টার ব্যাকলাইটিং দীর্ঘ ছায়া তৈরি করে, নরম নীল-সবুজ টোন সহ সিনেমাটিক রঙের গ্রেডিং। ফটোরিয়ালিজম। 21:9 সিনেমাটিক ওয়াইডস্ক্রিন। "ক্যাট কাস্টস আ স্পেল" শিরোনামটি উপরে সুন্দর রংধনু ফন্টে প্রদর্শিত হচ্ছে।
টেক্সট প্রসেসিং কাজগুলি করার সময়, প্রদত্ত টেক্সটের বিষয়বস্তু এবং প্রদর্শনের অবস্থান স্পষ্টভাবে উল্লেখ করা প্রয়োজন, সেইসাথে ব্যবহৃত ফন্টও। ইনফোগ্রাফিক্স এবং চার্টের জন্য, প্রম্পটগুলি মডেলটিকে নির্ভুলতার প্রয়োজনীয়তাগুলি স্পষ্টভাবে জানাতে হবে এবং আপনার ইনপুটটি সঠিক কিনা তা নিশ্চিত করা উচিত।
যখন একাধিক ছবি উল্লেখ করা হয় এবং ছবি সম্পাদনা করা হয়, তখন প্রতিটি ছবির উদ্দেশ্য এবং সম্পাদনা করার প্রয়োজন এমন নির্দিষ্ট ক্ষেত্রগুলি সম্পর্কে মডেলকে স্পষ্টভাবে অবহিত করা প্রয়োজন।
প্রম্পট ওয়ার্ড সূত্র আয়ত্ত করা কেবল শুরু; পরবর্তী ধাপ হল ন্যানো ব্যানানা প্রো-এর নির্দিষ্ট প্রয়োগের পরিস্থিতির জন্য কিছু সরকারী সুপারিশ অন্বেষণ করা।
১. AI-কে অর্থহীন অঙ্কনের পরিবর্তে সত্যিকার অর্থে "লেখার" সুযোগ দিন। পূর্বে, AI অঙ্কনের জন্য সবচেয়ে বড় চ্যালেঞ্জ ছিল টেক্সট; আউটপুট প্রায়শই বিকৃত অক্ষর ছিল। নতুন মডেলটি টেক্সট রেন্ডারিংয়ে উল্লেখযোগ্য উন্নতি করেছে। আমরা সরাসরি পোস্টার শিরোনাম, জটিল চার্ট, অথবা বিস্তারিত মডেল বর্ণনা তৈরি করতে বলতে পারি।

▲ প্রম্পট: চীনা ভাষায় ঐতিহ্যবাহী বেইজিং-স্টাইলের দৌঝি (গাঁজানো মুগ ডালের রস) কীভাবে তৈরি করতে হয় তা দেখানো একটি ইনফোগ্রাফিক তৈরি করুন।
২. এটি পদার্থবিদ্যা এবং ইতিহাস বোঝে। জেমিনি ৩ এর যুক্তি ক্ষমতার উপর ভিত্তি করে, এই মডেলটি বিশ্ব সম্পর্কে আরও সমৃদ্ধ জ্ঞানের অধিকারী, এবং ঐতিহাসিক তথ্যের সাথে সামঞ্জস্যপূর্ণ যুক্তিসঙ্গতভাবে কঠোর চিত্র বা দৃশ্যকল্প তৈরি করতে পারে।
৩. ১৪টি ছবি পর্যন্ত সমর্থন করে! সুপার ফিউশন প্রযুক্তি। এটি সম্ভবত নতুন মডেলের সবচেয়ে শক্তিশালী বৈশিষ্ট্যগুলির মধ্যে একটি। এটি আমাদের ৬ থেকে ১৪টি সম্পূর্ণ সম্পর্কহীন ছবি ইনপুট করার অনুমতি দেয় (প্ল্যাটফর্মের উপর নির্ভর করে সঠিক সংখ্যাটি পরিবর্তিত হতে পারে), এবং AI-কে সম্পূর্ণ নতুন ছবি তৈরি করতে তাদের একত্রিত করতে দেয়।
মাল্টি-ইমেজ ইনপুট ফাংশন ব্যবহার করে, আমরা বিভিন্ন দৃশ্যে একই চরিত্রের মুখের বৈশিষ্ট্য এবং বৈশিষ্ট্যের ধারাবাহিকতা বজায় রাখতে পারি, এমনকি গ্রুপ পোর্ট্রেটেও মিল বজায় রাখতে পারি। এটি কমিক স্ট্রিপ বা স্টোরিবোর্ড তৈরির জন্য খুবই উপযুক্ত।

▲ প্রম্পট: এই ছবিগুলিকে একটি সঠিকভাবে সাজানো 16:9 মুভি ছবিতে একত্রিত করুন এবং মডেলের শরীরের স্কার্টটি ছবিতে থাকা স্কার্টটি দিয়ে প্রতিস্থাপন করুন।
৪. আকার সঠিকভাবে সামঞ্জস্য করুন। বিভিন্ন আকৃতির অনুপাত নিয়ে পরীক্ষা করুন এবং বিভিন্ন পণ্যে ১K, ২K, অথবা ৪K রেজোলিউশনে স্পষ্ট ভিজ্যুয়াল তৈরি করুন।
৫. "পয়েন্ট-এন্ড-শুট" নিয়ন্ত্রণের মাধ্যমে নির্ভুল চিত্র সম্পাদনা। গুগল এটিকে স্টুডিও-স্তরের সম্পাদনা নিয়ন্ত্রণ বলে, যা আরও পেশাদার ফলাফল অর্জন করে।
৬. ব্র্যান্ড ডিজাইন পাওয়ারহাউস: স্বয়ংক্রিয় চিত্র স্থাপন। ডিজাইনারদের জন্য, মূল ন্যানো কলার তুলনায়, এর ধারাবাহিকতা উল্লেখযোগ্যভাবে উন্নত। ব্র্যান্ডগুলি 3D বস্তুর উপর AI-এর সাথে সম্পর্কিত লোগো, প্যাটার্ন বা শিল্পকর্ম স্থাপন করতে পারে এবং স্থাপন করা লোগোটি স্বয়ংক্রিয়ভাবে মূল চিত্রের প্রাকৃতিক আলো এবং টেক্সচারের সাথে মেলে সামঞ্জস্য করবে।
৭. নির্বিঘ্নে আন্তঃভাষা অনুবাদ : এটি কেবল ছবি তৈরির একটি হাতিয়ার নয়, বরং এটি তাদের মধ্যে থাকা লেখাটিকে সরাসরি "অনুবাদ" করতে পারে।

▲ প্রম্পট: তিনটি হলুদ এবং নীল ক্যানের সমস্ত ইংরেজি লেখা কোরিয়ান ভাষায় অনুবাদ করুন, বাকিগুলো অপরিবর্তিত রাখুন।
যদিও ন্যানো ব্যানানা প্রো শক্তিশালী, তবুও অফিসিয়াল ডকুমেন্টেশনে কিছু বর্তমান সীমাবদ্ধতাও স্পষ্টভাবে তালিকাভুক্ত করা হয়েছে, যা ব্যবহারকারীদের সচেতন থাকা উচিত। প্রধান সমস্যা হল কিছু খুব ছোট টেক্সট রেন্ডারিং এবং জটিল বানানের ফলে কখনও কখনও ত্রুটি দেখা দিতে পারে।
উপরন্তু, যদি আপনি এটি ডেটা চার্ট বা ইনফোগ্রাফিক্স তৈরি করতে ব্যবহার করেন, তাহলে এটি আপনাকে সর্বদা ডেটা ম্যানুয়ালি যাচাই করার কথাও মনে করিয়ে দেয়। যদিও AI-এর যুক্তি আছে, এটি মাঝে মাঝে সরাসরি অর্থহীন কথা বলতে পারে; সর্বোপরি, আমরা সকলেই প্রত্যক্ষ করেছি যে AI-এর বিভ্রম কতটা গুরুতর হতে পারে।
অবশেষে, কিছু অত্যন্ত জটিল আলোর পরিবর্তন বা চিত্র সংমিশ্রণ সম্পাদন করার সময়, উৎপন্ন চিত্রগুলি মাঝে মাঝে অপ্রাকৃতিক শিল্পকর্ম দেখাতে পারে।

মডেলটি বর্তমানে জেমিনি অ্যাপ এবং জেমিন ওয়েব সংস্করণে উপলব্ধ , তবে শুধুমাত্র এআই স্টুডিও এবং ভার্টেক্স প্ল্যাটফর্মে একটি পেইড এপিআই ব্যবহার করে এটি ব্যবহার করা যেতে পারে।
আমরা এমন প্ল্যাটফর্মগুলির একটি তালিকাও তৈরি করেছি যা পেইড সাবস্ক্রিপশন বা জটিল নেটওয়ার্ক সেটিংস ছাড়াই তাৎক্ষণিকভাবে ব্যবহার করা যেতে পারে।
- HailuoAI (দেশীয় সংস্করণ: hailuoai.com; আন্তর্জাতিক সংস্করণ: hailuoai.video)
- ফ্লোউইথ (flowith.io, flowtith.net)
- PixVerse (চীনা সংস্করণ pai.video, আন্তর্জাতিক সংস্করণ pixverse.ai)
- youmind.com (শুধুমাত্র এক সপ্তাহের জন্য বিনামূল্যে, ব্যবহারের জন্য নিবন্ধন করুন)
- lovart.ai সম্পর্কে
- অনুসরণ
- higgsfield.ai/image/nano_banana_2 (বিনামূল্যে ব্যবহারকারীরা প্রতি মাসে ১০টি ক্রেডিট পাবেন; প্রতিটি ন্যানো ব্যানানা প্রো ছবির জন্য দুটি ক্রেডিট খরচ হবে)

যদি আপনার আগ্রহ থাকে, তাহলে উপরের সূত্রটি চেষ্টা করে দেখতে দ্বিধা করবেন না। মন্তব্য বিভাগে খেলার জন্য যেকোনো নতুন এবং আকর্ষণীয় উপায় আমরা স্বাগত জানাই।
অবশেষে, এখানে একটি ছোট্ট চমক: আল্ট্রাম্যান, এলন মাস্ক, এনভিডিয়ার সিইও জেনসেন হুয়াং এবং মার্ক জুকারবার্গ সকলেই আমাদের ফিউচার সোসাইটিতে এসেছিলেন দ্য বিটলসের একই আইকনিক অ্যালবামের কভার ছবির "ছবি তোলা" করতে। আপনি কি নিশ্চিত যে আপনি এই সপ্তাহান্তে APPSO AIDONE ইভেন্টটি দেখতে চান না?

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

