
আজকের জন্য আপনার OOTD পরিচয় করিয়ে দেওয়ার জন্য আপনার কাছে 30 সেকেন্ড সময় আছে।
অ্যাপলের সিইও টিম কুক, যিনি সাধারণত ভদ্র স্বভাবের এবং কেবল সাধারণ পোশাক পরেন, তিনি তার "ব্যক্তিগত আইডি ভিডিও"-তে একটি বড় আকারের ডাউন জ্যাকেট এবং হীরা খচিত ব্রেস পরেছিলেন এবং ক্যামেরার জন্য সবচেয়ে কঠিন গ্যাংস্টা পোজ দিয়েছিলেন।
সবচেয়ে বুদ্ধিমত্তার ব্যাপার ছিল যে সে টেক্সাস ইন্সট্রুমেন্টস থেকে এমনভাবে ক্যালকুলেটর বের করেছিল যেন সে বন্দুক আঁকছে।
▲ভিডিও সূত্র: https://x.com/ReflctWillie/status/1997819640874205685
অনেক দর্শক ভিডিওটি দেখে মুগ্ধ হয়েছিলেন, কারণ এক শটের ভিডিওটি অবিশ্বাস্যভাবে সন্তোষজনক এবং দেখা বন্ধ করা অসম্ভব বলে মনে করেছিলেন। ভিডিও নির্মাতা হলিউড-স্তরের ক্যামেরাওয়ার্ক ব্যবহার করেছেন অযৌক্তিক কন্টেন্টে। পরিশীলিত স্টাইল এবং হাস্যরসাত্মক কন্টেন্ট এই AI ভিডিওটিকে AI কন্টেন্টের সাথে সম্পর্কিত সস্তাতা প্রদর্শন করতে বাধা দিয়েছে, যা দ্রুত সোশ্যাল মিডিয়ায় হিট করে তুলেছে।
তৎক্ষণাৎ, মাস্কের সংস্করণটি উপস্থিত হল।
▲ ভিডিও সূত্র: https://x.com/VibeMarketer_/status/1999227084250448083
লেখক সাবধানতার সাথে একটি সম্পূর্ণ প্রযোজনা প্রক্রিয়াটি উপস্থাপন করেছেন, কন্টাক্ট শিট ব্যবহার করে অভিন্ন ব্যাকগ্রাউন্ড, মুখের ভাব এবং পোশাক সহ 6টি ছবির একটি সেট তৈরি করতে প্ররোচনা দিয়েছেন, কিন্তু ভিন্ন ভঙ্গিতে।
▲ ৩×২ ফিল্ম প্রিন্ট প্রুফ
"প্রিন্ট" শব্দটি মূলত চলচ্চিত্রের যুগে ফটোগ্রাফিতে ব্যবহৃত থাম্বনেইল-স্টাইলের ছবির সূচক পৃষ্ঠাকে বোঝাত। ন্যানো ব্যানানা প্রো-তে এই ধারণাটি প্রয়োগ করার অর্থ হল এর ধারাবাহিকতা ক্ষমতাগুলিকে সম্পূর্ণরূপে ব্যবহার করে বিভিন্ন স্টাইল এবং কোণ সহ ভিডিও স্ক্রিনশটগুলির একটি সিরিজ তৈরি করা এবং তারপরে ভিডিও তৈরি করতে প্রথম এবং শেষ ফ্রেম ব্যবহার করা।
ন্যানো ব্যানানা প্রো একবারে নয়টি বা তার বেশি কীফ্রেম ব্যবহার করে সম্পূর্ণ প্রমাণ তৈরি করতে পারে, প্রতিটি ফ্রেম চরিত্র, বিশদ এবং বর্ণনায় চমৎকার ধারাবাহিকতা বজায় রাখে। আলাদাভাবে তৈরি করা হলেও, ন্যানো ব্যানানা প্রো আপলোড করা রেফারেন্স চিত্রের উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে বিষয়বস্তু পূরণ করতে পারে, যা বর্ণনার ধারাবাহিকতা নিশ্চিত করে।

▲ প্রথম এবং শেষ ফ্রেম ভিডিও জেনারেশন, প্রম্পট: এক-শট চিত্রগ্রহণ, ক্যামেরাটি মসৃণ এবং ধীরে ধীরে চলে, ব্যক্তির চশমার উপর ফোকাস করে, এবং সর্বদা বিষয়কে ফ্রেমের মধ্যে রাখে। বিষয়ের নড়াচড়া ন্যূনতম এবং সতর্ক।
একবার আমাদের কাছে ছবিগুলো হয়ে গেলে, আমরা প্রথম এবং শেষ ফ্রেমগুলিকে রূপান্তর করে একটি ভিডিওতে একত্রিত করতে পারি। কেলিং, ভিও ৩.১, হাইলুও এবং ক্যাপকাটের মতো ভিডিও জেনারেশন মডেল এবং সরঞ্জামগুলি সহজেই এটি করতে পারে।
এটা লক্ষণীয় যে Sora 2 বর্তমানে আসল মুখের ছবি আপলোড করা সমর্থন করে না, এবং Musk-এর Grok Imagine শুধুমাত্র প্রথম ফ্রেমকে ভিডিওতে রূপান্তর করা সমর্থন করে। সামগ্রিকভাবে, আমরা এখনও এই কাজটি সম্পন্ন করার জন্য Google Veo 3.1, CapCut-এর "Jimeng" বৈশিষ্ট্য, অথবা Kuaishou Keling ব্যবহার করার পরামর্শ দিচ্ছি।

▲ছবিটি ভিডিও কনভার্টারে বড় করা হয়েছে, ডিফল্ট কন্টেন্ট, কারণ অস্পষ্ট।
এই ভিডিও ব্লগারের দেওয়া নির্দেশিকায়, তিনি এটি সম্পন্ন করার জন্য ন্যানো ব্যানানা প্রো এবং করিং ব্যবহার করেছেন, এবং এটি এমন একটি সম্পূর্ণ সরঞ্জাম তৈরি করেছে যা আমাদের বিভিন্ন অক্ষর অবাধে প্রতিস্থাপন করতে দেয়।
▲ ভিডিও সূত্র: https://x.com/ReflctWillie/status/1998720751806066916
তার ভাগ করা কর্মপ্রবাহ অনুসারে, যেহেতু এই ভিডিওটি মূলত কুকের মতোই, তাই এতে কেবল তিনটি ইনপুট ছবি পরিবর্তন করা এবং কিছু ছোটখাটো সমন্বয় করা প্রয়োজন। উদাহরণস্বরূপ, তিনি তার পকেট থেকে যা বের করেন তা হল একটি গেম বয় গেম কনসোল, এবং আরও কিছু উপাদান রয়েছে যা চরিত্রটির সাথে আরও ভালভাবে মানানসই: কুকের একটি সোনার দাঁত রয়েছে যার মধ্যে অ্যাপলের স্টক কোড AAPL এমবেড করা আছে, এবং ফেডারেল রিজার্ভ চেয়ারম্যান পাওয়েল FED লোগো সহ একটি সোনার আংটি পরেছেন।
▲প্রকল্পের ঠিকানা: https://github.com/shrimbly/node-banana
তিনি বর্তমানে সুপরিচিত ওপেন-সোর্স প্ল্যাটফর্ম GitHub-এ এই প্রকল্পটি হোস্ট করেছেন। আপনি যদি নিজে নিজে পরীক্ষা-নিরীক্ষা করতে চান, তাহলে আপনি আপনার স্থানীয় মেশিনে প্রকল্পটি ডাউনলোড করতে পারেন, আপনার নিজস্ব Gemini API প্রবেশ করতে পারেন এবং সরাসরি এই প্রক্রিয়াটি প্রয়োগ করতে পারেন।
আমরা এই স্বয়ংক্রিয় প্রকল্পটিও চেষ্টা করেছি এবং বেশ কয়েকটি ছবি তৈরি করেছি। জেমিনি ওয়েবসাইট বা অ্যাপের মধ্যে ছবি তৈরি করার তুলনায়, এটি অবশ্যই অনেক বেশি সুবিধাজনক। আমাদের বারবার ছবি আপলোড করার প্রয়োজন নেই; পরিবর্তে, আমরা সরাসরি আমাদের প্রয়োজনীয় ছবিগুলি নির্বাচন করতে পারি এবং প্রম্পটগুলি পরিবর্তন করতে পারি, পুরো প্রক্রিয়াটিকে সহজতর করে।


তবে, যদি আপনার API না থাকে তাহলে ঠিক আছে। নীচে আমাদের বিস্তারিত ধাপগুলি অনুসরণ করুন, এবং আপনি জেমিনি ওয়েব সংস্করণ ব্যবহার করে একই কাজ করতে পারেন।
নিজের একটা ছবি, তোমার পছন্দের ট্রেন্ডি পোশাক, আর দারুন চশমা খুঁজে বের করো। উদাহরণ হিসেবে লিন দাইয়ুকে ধরা যাক, ব্যতিক্রমী প্রতিভা, একাকী স্বভাব এবং বিষণ্ণ মেজাজের একজন মহিলা, এবং দেখি তার OOTD (দিনের সেরা পোশাক) ফ্যাশন শ্যুট কেমন হবে।
এখানে আমরা ন্যানো ব্যানানা প্রো ব্যবহার করে সরাসরি লিন দাইয়ুর একটি ছবি তৈরি করেছি।

▲প্রম্পট শব্দ: বিষয়: ড্রিম অফ দ্য রেড চেম্বার থেকে লিন দাইয়ুর একটি অতি-বাস্তববাদী উচ্চ-ফ্যাশনের প্রতিকৃতি। তার ভঙ্গুর, বিষণ্ণ সৌন্দর্য, ফ্যাকাশে ত্বক এবং তার স্বাক্ষর "বোনা ভ্রু" (কিছুটা ভ্রুকুটি)। তাকে স্বতন্ত্রভাবে দুঃখিত এবং বুদ্ধিদীপ্ত দেখাচ্ছে। পোশাক: সূক্ষ্ম, উচ্চমানের ঐতিহ্যবাহী কিং রাজবংশের পোশাক (হানফু স্টাইল) পরা। ফ্যাব্রিকটি স্তরযুক্ত স্বচ্ছ সিল্ক এবং অর্গানজা ফ্যাকাশে বাঁশ-সবুজ এবং চাঁদ-সাদা রঙে। ঝরে পড়া পাপড়ির জটিল সূচিকর্ম। তিনি একটি জেড হেয়ারপিন পরেন। সেটিং: একটি আধুনিক, ন্যূনতম পেশাদার ফটোগ্রাফি স্টুডিওর ভিতরে। একটি শক্ত গাঢ় ধূসর বা টেক্সচার্ড ক্যানভাস ব্যাকড্রপ। আলো এবং ক্যামেরা: সিনেমাটিক স্টুডিও আলো, তার গালের হাড় এবং মেজাজকে আরও জোরদার করার জন্য রেমব্র্যান্ড আলো। সফটবক্স আলো, তীক্ষ্ণ ফোকাস, হ্যাসেলব্লাড X2D-তে শট করা হয়েছে, 85 মিমি লেন্স। ক্ষেত্রের গভীর গভীরতা। স্টাইল: ভোগ চায়না সম্পাদকীয়, অলৌকিক, মার্জিত, দুঃখজনক, প্রাচ্য নান্দনিকতা, অ্যাভান্ট-গার্ড ফ্যাশন ফটোগ্রাফি, অতি-বিশদ টেক্সচার। ১৬:৯, ৪ হাজার।
চরিত্রের ছবি পাওয়ার পর, চশমা এবং জ্যাকেটের ছবি ঐচ্ছিক। আপলোড না করা হলে, ন্যানো ব্যানানা প্রো স্বয়ংক্রিয়ভাবে সংশ্লিষ্ট ট্রেন্ডি জ্যাকেট এবং চশমা তৈরি করবে।

আমরা অনলাইনে তার পরার জন্য একটি ট্রেন্ডি জ্যাকেট খুঁজে পেয়েছি, এবং তারপর ডিফল্ট প্রম্পটে কিছু চুলের স্টাইল নিয়ন্ত্রণ, মেকআপ এবং এই সাধারণ জিনিসগুলিকে অবজ্ঞাপূর্ণ অভিব্যক্তি যুক্ত করেছি।
ডিফল্ট প্রম্পট শব্দ: আমাকে একটি হাই ফ্যাশন ফটোশুটের ছবি দেখান যেখানে মডেলটি বড় জ্যাকেট এবং চশমা পরে আছে। ছবিটিতে বিষয়বস্তুর পুরো শরীরের ছবি দেখানো উচিত। মডেলটি ক্যামেরার পাশ দিয়ে কিছুটা বিরক্তিকর ভাব এবং ভ্রু উঁচু করে তাকিয়ে আছে। তাদের এক হাত উঁচু করে দুটি আঙুল চশমার পাশে টোকা দিচ্ছে।
ছবিটি নিচু কোণ থেকে তোলা হয়েছে, বিষয়বস্তুর দিকে তাকানো।
ছবিটি ফুজি ভেলভিয়া ফিল্মে তোলা হয়েছে ৫৫ মিমি প্রাইম লেন্সে, যার একটি হার্ড ফ্ল্যাশ রয়েছে। আলো বিষয়ের উপর কেন্দ্রীভূত এবং ফ্রেমের প্রান্তের দিকে সামান্য ম্লান হয়ে যায়। ছবিটি অতিরিক্ত উন্মুক্ত, উল্লেখযোগ্য ফিল্ম গ্রেন দেখাচ্ছে এবং অতিরিক্ত স্যাচুরেটেড। ত্বক চকচকে (প্রায় তৈলাক্ত) দেখাচ্ছে এবং চশমার ফ্রেমে কঠোর সাদা প্রতিফলন রয়েছে।

পরবর্তী ধাপ হল একটি তথাকথিত যোগাযোগ পত্র তৈরি করা। আমরা আগে যে জ্যাকেট এবং চশমাটি পেয়েছি তার ছবি ইনপুট করে এবং তারপর নিম্নলিখিত প্রম্পটগুলি ইনপুট করে, আমরা ধারাবাহিক চরিত্রের শট সহ একটি বহু-কোণ স্টোরিবোর্ড পেতে পারি।
তাৎক্ষণিক শব্দ:
ইনপুট ইমেজ বিশ্লেষণ করুন এবং নীরবে ফ্যাশন-সমালোচনামূলক সমস্ত বিবরণ তালিকাভুক্ত করুন: বিষয়(গুলি), সঠিক পোশাকের টুকরো, উপকরণ, রঙ, টেক্সচার, আনুষাঙ্গিক, চুল, মেকআপ, শরীরের অনুপাত, পরিবেশ, সেট জ্যামিতি, আলোর দিকনির্দেশনা এবং ছায়ার গুণমান।
সমস্ত পোশাক, স্টাইলিং, চুল, মেকআপ, আলো, পরিবেশ এবং রঙের গ্রেড সমস্ত ফ্রেমে ১০০% অপরিবর্তিত রাখতে হবে।
কিছু যোগ বা অপসারণ করবেন না।
উপকরণ বা রঙের পুনর্ব্যাখ্যা করবেন না।
কোন যুক্তি উপস্থাপন করবেন না।আপনার দৃশ্যমান আউটপুটটি অবশ্যই হবে:
একটি 2×3 কন্টাক্ট শিটের ছবি (6টি ফ্রেম)।
তারপর প্রতিটি ফ্রেমের জন্য একটি কীফ্রেম ব্রেকডাউন।
প্রতিটি ফ্রেমকে অবশ্যই ক্যামেরার নাটকীয় নড়াচড়ার পর একটি বিশ্রাম বিন্দুর প্রতিনিধিত্ব করতে হবে — শুধুমাত্র ক্যামেরার চূড়ান্ত অবস্থান এবং বিষয়বস্তু কী করছে তা বর্ণনা করতে হবে, কখনও গতি নিজেই বর্ণনা করতে হবে না।
ছয়টি ফ্রেম অবশ্যই স্থানিকভাবে গতিশীল, অ-রৈখিক এবং দৃশ্যত স্বতন্ত্র হতে হবে।
প্রয়োজনীয় ৬-ফ্রেম শট লিস্ট
১. হাই-ফ্যাশন বিউটি পোর্ট্রেট (ক্লোজ, এডিটোরিয়াল, ইনটিমেট)ক্যামেরাটি বিষয়বস্তুর মুখের খুব কাছে, চোখের স্তরের সামান্য উপরে বা সামান্য নীচে অবস্থিত, একটি মার্জিত অফসেট কোণ ব্যবহার করে যা হাড়ের গঠন উন্নত করে এবং নেকলাইনের কাছে মূল পোশাকের উপাদানগুলিকে হাইলাইট করে। ক্ষেত্রের অগভীর গভীরতা, ত্রুটিহীন টেক্সচার রেন্ডারিং এবং একটি ভাস্কর্যপূর্ণ ফ্যাশন-ফরোয়ার্ড রচনা।
2. হাই-এঙ্গেল থ্রি-কোয়ার্টার ফ্রেম
ক্যামেরাটি মাথার উপরে কিন্তু কেন্দ্রের বাইরে অবস্থিত, একটি তির্যক নিম্নমুখী কোণ থেকে বিষয়বস্তু ক্যাপচার করছে।
এই ফ্রেমটি শক্তিশালী আকৃতির বিমূর্ততা তৈরি করবে এবং উপর থেকে পোশাকের বিবরণ প্রকাশ করবে।৩. লো-অ্যাঙ্গেল তির্যক পূর্ণ-বডি ফ্রেম
ক্যামেরাটি মাটিতে নিচু করে রাখা হয়েছে এবং বিষয়ের দিকে তির্যকভাবে কোণ করা হয়েছে।
এটি সিলুয়েটকে দীর্ঘায়িত করে, জুতার উপর জোর দেয় এবং ফ্রেম ১ এবং ২ থেকে আলাদা একটি নাটকীয় দৃষ্টিভঙ্গি তৈরি করে।৪. সাইড-অন কম্প্রেশন ফ্রেম (লম্বা লেন্স)
ক্যামেরাটি বিষয়ের একপাশে অনেক দূরে স্থাপন করা হয়েছে, স্থান সংকুচিত করার জন্য একটি শক্ত ফোকাল দৈর্ঘ্য ব্যবহার করা হয়েছে।
বিষয়টি পরিষ্কার প্রোফাইলে বা কাছাকাছি প্রোফাইলে প্রদর্শিত হয়, পোশাকের কাঠামোকে চ্যাপ্টা, সম্পাদকীয় পদ্ধতিতে দেখানো হয়।৫. অপ্রত্যাশিত উচ্চতা থেকে ঘনিষ্ঠ প্রতিকৃতি
ক্যামেরাটি বিষয়ের মুখের (অথবা উপরের ধড়ের) খুব কাছে অবস্থিত, কিন্তু চোখের স্তরের সামান্য উপরে বা নীচে।
কোণটি ফ্যাশন-সম্পাদকীয় মনে হওয়া উচিত, প্রচলিত নয় – অফসেট, মার্জিত এবং অভিব্যক্তিপূর্ণ।৬. একটি অ-স্বজ্ঞাত কোণ থেকে চরম বিস্তারিত ফ্রেম
ক্যামেরাটি পোশাকের বিশদ, আনুষাঙ্গিক জিনিসপত্র বা টেক্সচারের খুব কাছাকাছি অবস্থিত, কিন্তু একটি অস্বাভাবিক স্থানিক দিক থেকে (যেমন, নীচে থেকে, পিছন থেকে, একটি গলার লাইনের পাশ থেকে)।
এটি অবশ্যই একটি আকর্ষণীয়, বিমূর্ত, সম্পাদকীয় বিস্তারিত কাঠামো হবে।ধারাবাহিকতা এবং প্রযুক্তিগত প্রয়োজনীয়তা
প্রতিটি ফ্রেমে নিখুঁত পোশাকের বিশ্বস্ততা বজায় রাখুন: সঠিক পোশাকের ধরণ, সিলুয়েট, উপাদান, রঙ, টেক্সচার, সেলাই, আনুষাঙ্গিক, ক্লোজার, গয়না, জুতা, চুল এবং মেকআপ।
পরিবেশ, টেক্সচার এবং আলো অবশ্যই সামঞ্জস্যপূর্ণ থাকতে হবে।
ফোকাল দৈর্ঘ্যের সাথে ক্ষেত্রের গভীরতা স্বাভাবিকভাবেই পরিবর্তিত হয় (দূরবর্তী শটের জন্য গভীর, ঘনিষ্ঠ/বিস্তারিত শটের জন্য অগভীর)।
ফটোরিয়াল টেক্সচার এবং শারীরিকভাবে প্রশংসনীয় আলোর আচরণ প্রয়োজন।
ফ্রেমগুলিকে একই দৃশ্যের মধ্যে বিভিন্ন ক্যামেরা প্লেসমেন্টের মতো মনে হতে হবে, ভিন্ন দৃশ্য নয়।
সকল কীফ্রেমের আকৃতির অনুপাত ঠিক একই হতে হবে এবং ঠিক ৬টি কীফ্রেম আউটপুট হতে হবে। সকল কীফ্রেমে সঠিক ভিজ্যুয়াল স্টাইল বজায় রাখুন, যেখানে ছবিটি ফুজি ভেলভিয়া ফিল্মে একটি হার্ড ফ্ল্যাশ দিয়ে তোলা হয়, আলো বিষয়ের উপর কেন্দ্রীভূত হয় এবং ফ্রেমের প্রান্তের দিকে সামান্য ম্লান হয়ে যায়। ছবিটি অতিরিক্ত উন্মুক্ত হয়ে উল্লেখযোগ্য ফিল্ম গ্রেন দেখায় এবং অতিরিক্ত স্যাচুরেটেড। ত্বক চকচকে (প্রায় তৈলাক্ত) দেখায় এবং চশমার ফ্রেমে কঠোর সাদা প্রতিফলন দেখা যায়।
আউটপুট ফরম্যাট
ক) ২×৩ কন্টাক্ট শিটের ছবি (বাধ্যতামূলক)
ছয়-বর্গাকার ছবির গ্রিড পাওয়ার পর, এই ছয়টি ছবি ক্রমানুসারে বের করার জন্য আমাদের নিম্নলিখিত প্রম্পটগুলি ব্যবহার করতে হবে।
তাৎক্ষণিক শব্দ: ছয়টি ছবির গ্রিড পর্যালোচনা করুন। আমি চাই আপনি ছবির প্রথম/দ্বিতীয় সারির প্রথম/দ্বিতীয়/তৃতীয় কলামে ছবিটি আলাদা করে আপস্কেল করুন। মডেলের ভঙ্গি বা কোনও বিবরণ পরিবর্তন করবেন না। ছয়টি ছবির গ্রিড থেকে শুধুমাত্র একক ছবিটি আউটপুট করুন।






ন্যানো ব্যানানা প্রো আসলে সরাসরি নয়টি গ্রিডের ছবি তৈরি করতে সক্ষম, কিন্তু একটি নির্দিষ্ট 3:2 অনুপাত বজায় রাখার জন্য, একটি ছয়-গ্রিড লেআউট সমস্ত ছবিকে আরও ভালভাবে আলাদা করতে পারে। এখানে, আমরা সমস্ত ছবির জন্য 16:9 আকার এবং 4K গুণমান ব্যবহার করি।
এই ৬টি ছবির সাহায্যে, আমরা আমাদের সৃজনশীলতাকে আরও বেশি কীফ্রেম ছবি তৈরি করতে পারি, যেমন কুককে তার সোনার দাঁত দেখাতে বলা অথবা পকেট থেকে একটি পুরানো ডিভাইস বের করা, ঠিক যেমনটি মূল ভিডিওতে ছিল।
উদাহরণস্বরূপ, আমরা অনলাইনে একটি ব্রেসলেটের ছবি পেয়েছি এবং লিন দাইয়ুকে তার বড় সোনার ঘড়ির পরিবর্তে তার জেড ব্রেসলেট দেখাতে বলেছি।

▲ছবি ৭|ইনপুট: ছবি ৩+ছবি ৫+জেড ব্রেসলেটের ছবি, এবং তাৎক্ষণিক শব্দ: আমাকে মডেলের একটি প্রশস্ত কোণের ক্লোজ আপ দেখান। মডেলটি তার সামনে একটি কব্জি উল্লম্বভাবে ধরে আছে, বিপরীত হাতটি তার পোশাকের বিশাল হাতাটি আলতো করে টেনে নামিয়ে দিচ্ছে যাতে একটি স্বচ্ছ পান্না জেড চুড়ি প্রদর্শিত হয়। যে হাতটি হাতাটি টেনে নামিয়ে দিচ্ছে তার হাতের শেষ দুটি অঙ্কে সামনের দিকে খোদাই করা একটি পতিত ফুলের পাপড়ির মতো আকৃতির একটি রূপালী ফ্যাশন আংটি রয়েছে।
আপনি যদি এই রাস্তার গ্যাংস্টার স্টাইলটি বজায় রাখতে চান, তাহলে আপনি সরাসরি ডিফল্ট প্রম্পট ব্যবহার করে একটি বড় সোনার ঘড়ির ছবি খুঁজে পেতে পারেন এবং তারপরে নিম্নলিখিত বিষয়বস্তুটি প্রবেশ করতে পারেন।
ডিফল্ট প্রম্পট শব্দ: আমাকে মডেলের একটি ওয়াইড অ্যাঙ্গেল ক্লোজ আপ দেখান। মডেল তার সামনে একটি কব্জি উল্লম্বভাবে ধরে আছেন, বিপরীত হাতটি ঘড়িটি প্রদর্শনের জন্য হুডির হাতাটি টেনে নামিয়ে দিচ্ছেন। যে হাতটি হাতাটি টেনে নামিয়ে দিচ্ছেন তার হাতের শেষ দুটি সংখ্যায় একটি দুই আঙুলের আংটি রয়েছে যার সামনের দিকে 'LOVE' অক্ষর খোদাই করা আছে।
এছাড়াও, জুতাগুলিকে সূচিকর্ম সহ ট্রেন্ডি হাই-টপসে পরিবর্তন করা হয়েছিল, যেখানে সাটিন এবং ফুলের সূচিকর্ম ছিল যা প্রাচীন সূচিকর্ম করা জুতাগুলির কথা মনে করিয়ে দেয়, একটি পুরু, দানাদার কালো রাবারের সোল সহ।

▲ছবি ৮|ছবি ৭ + ছবি ৩ + জুতার ছবি, তাৎক্ষণিক শব্দ লিখুন: মডেলটি দাঁড়িয়ে আছে, তার ডান পা তার সামনে প্রসারিত, যা দেখায় যে তিনি রেফারেন্স ছবিতে জুতা পরে আছেন, তার একটি ওয়াইড অ্যাঙ্গেল ওয়ার্ম আই ভিউ দেখান। সেটিংটি নিখুঁতভাবে বজায় রাখুন, মডেলের হাতে আঙুলের আংটিটি অন্তর্ভুক্ত করুন এবং জুতার বিশদটি হাইলাইট করার জন্য তার পাটি পাশের দিকে সামান্য কোণে রাখুন।
অবশেষে, সে তার পকেট থেকে জিনসেং পুষ্টিকর বড়ির একটি বাক্স বের করে। এটি ছিল একটি সাইবারপাঙ্ক মেয়ে যে তার জীবন টিকিয়ে রাখার জন্য ওষুধের উপর নির্ভর করত।

▲চিত্র ৯|চিত্র ৭ + চিত্র ৮ + ঔষধের বাক্সের একটি ছবি লিখুন। প্রম্পট: মডেলের হুডির ক্যাঙ্গারু থলির পাশে পৌঁছানোর এবং আংশিকভাবে ঔষধের বাক্সটি দেখানোর টাইট শট।
এখানে, আপনাকে কেবল "বড়ির বাক্স দেখানো" পরিবর্তন করতে হবে, "দেখানোর" পরে থাকা জিনিসপত্রগুলি পকেট থেকে বের করতে চান এমন জিনিসপত্র দিয়ে প্রতিস্থাপন করতে হবে।
সমস্ত কীফ্রেম ছবি পাওয়ার পর, আমাদের পরবর্তী পদক্ষেপ হল সেগুলিকে একত্রিত করে একটি দুর্দান্ত, এক-শট-সুদর্শন ভিডিও তৈরি করা। ছবিগুলিকে ভিডিওতে রূপান্তর করলে কিউ-এর প্রয়োজনীয়তা সম্পূর্ণরূপে দূর হয় না। মূল ভিডিওর মতো একই ছন্দ এবং নিয়ন্ত্রণ অর্জনের জন্য, কিউ-এর সংখ্যা কমাতে মসৃণ নড়াচড়া এবং ন্যূনতম মডেল নড়াচড়া ব্যবহার করা অত্যন্ত গুরুত্বপূর্ণ।
ব্লগার উল্লেখ করেছেন যে আপনি "জুম করার সময় ক্যামেরাটি ধীরে ধীরে এবং মসৃণভাবে চশমার চারপাশে ঘোরে। বিষয়বস্তু প্রায় গতিহীন, এবং নড়াচড়া অত্যন্ত শান্ত এবং ইচ্ছাকৃত।" এর মতো প্রম্পটগুলি প্রবেশ করতে পারেন।
উদাহরণস্বরূপ, চিত্র ৮ এবং চিত্র ৯ এর মধ্যে পরিবর্তনের সময়, আমরা প্রম্পটগুলিতে "পা ধীরে ধীরে নীচে নেমে আসে এবং ক্যামেরা উল্লম্বভাবে উঠে যায়" লেখাটি যুক্ত করেছি।

▲Google Veo 3.1 তৈরি | প্রম্পট: ক্যামেরা মুভমেন্ট (উল্লম্ব স্ক্যান):
একটানা, নিরবচ্ছিন্ন উল্লম্ব ক্রেন শট উপরের দিকে এগিয়ে যাচ্ছে। ক্যামেরাটি নিচু করে শুরু হয়, সূচিকর্ম করা হাই-টপ স্নিকার্সের উপর শক্তভাবে ফোকাস করে, তারপর মসৃণভাবে উপরের দিকে কাত হয়ে ধূসর কার্গো প্যান্টের টেক্সচার বরাবর গ্লাইড করে। ক্যামেরাটি কোমরের স্তরে ওঠার সাথে সাথে এটি সবুজ সাটিন জ্যাকেটের দিকে ঠেলে দেয় (ডলি ইন)।
বিষয় ক্রিয়া (প্রবাহ):
শুরু: ক্যামেরা উপরের দিকে উঠার সাথে সাথে বিষয়ের পা (জুতা দেখানো হচ্ছে) ধীরে ধীরে একটি স্থায়ী অবস্থানে নেমে আসে।
রূপান্তর: ব্যক্তি আত্মবিশ্বাসের সাথে দাঁড়িয়ে আছে। প্রজাপতির আংটি পরা হাতটি স্বাভাবিকভাবেই পকেটে চলে যায়।
শেষ: হাতটি একটি হলুদ এবং সাদা ঔষধের বাক্স বের করে ("রেনশেন ইয়াংরং ওয়ান")। ফোকাসটি বাক্সের লেখার উপর তীব্রভাবে ঠেলে দেয়।
বায়ুমণ্ডল এবং ধারাবাহিকতা:
হাই-ফ্যাশন স্ট্রিটওয়্যারের নান্দনিকতা। নীল স্টুডিও ব্যাকগ্রাউন্ড সহ হার্ড ফ্ল্যাশ লাইটিং। সবুজ সুকাজান জ্যাকেট সূচিকর্ম এবং জেড চুড়ির কঠোর ধারাবাহিকতা বজায় রাখুন। রূপান্তরটি তরল-মসৃণ, একক, পরিকল্পিত ক্যামেরার পদক্ষেপের মতো মনে হচ্ছে।
তুমি হয়তো ভাবছো কেন প্রম্পটগুলো ধীরে ধীরে এগিয়ে যেতে বলা হয়েছিল, অথচ শেষ প্রিভিউ ভিডিওটি আসলেই পরিষ্কার এবং স্পষ্ট দেখাচ্ছে। আসলে, কারণ এই ভিডিও ব্লগার অন্য একটি টুল ব্যবহার করেছেন। আজকাল AI ভিডিও ব্লগারদের সৃজনশীলতা এবং ক্ষমতার প্রশংসা করতেই হবে; তাদের কেবল দুর্দান্ত ধারণাই নেই, তারা দরকারী টুলও তৈরি করে।

▲ঠিকানা: https://easypeasyease.vercel.app/, এই টুলটি একাধিক ভিডিও একসাথে সেলাই করতে পারে, ইজিং কার্ভ প্রয়োগ করতে পারে এবং অডিও যোগ করতে পারে; এটি বর্তমানে বিনামূল্যে ব্যবহার করা যায়।
EasyPeaseEase টুলের সাহায্যে, আমাদের ভিডিওগুলিকে 0.5s থেকে 6s এর মধ্যে সংকুচিত করা যেতে পারে। ভিডিও জেনারেশন মডেলগুলির মাধ্যমে পূর্বে প্রাপ্ত ধীর গতিটি ইজিং কার্ভ দ্বারা মসৃণ করা হয়, যা ভিডিওর ত্বরণ বা হ্রাস প্রক্রিয়াটিকে শুরু থেকে শেষ পর্যন্ত মসৃণ এবং আরও প্রাকৃতিক করে তোলে এবং বাস্তব জগতের ভৌত প্রভাবগুলিকে আরও ভালভাবে অনুকরণ করে। ফলস্বরূপ, ত্বরিত ভিডিওটি একটি শক্ত অভিন্ন গতির পরিবর্তে আরও প্রাণবন্ত এবং টেক্সচারযুক্ত দেখায়।
অবশেষে, এই সমস্ত ভিডিও একসাথে সেলাই করে, আমরা আজকের জন্য লিন দাইয়ুর OOTD ভিডিও উপস্থাপনাটি পেয়েছি।
প্রথম এবং শেষ ফ্রেমগুলিকে ভিডিওতে রূপান্তর করার প্রম্পটটি সহায়ক। যদি আপনি ঘন ঘন কার্ড আঁকতে হয় বলে চিন্তিত হন, তাহলে কেবল প্রথম এবং শেষ ফ্রেমের ছবি আপলোড করে জেমিনিকে জিজ্ঞাসা করা একটি খুব কার্যকর পদ্ধতি।

কন্টাক্ট শিট প্রম্পট আসলে ন্যানো ব্যানানা প্রো-এর একটি খুবই আকর্ষণীয় বৈশিষ্ট্য। প্রথমে, এটি ন্যানো ব্যানানা প্রো-এর শক্তিশালী ইমেজ জেনারেশন এবং বিশ্ব জ্ঞান বোঝার ক্ষমতা ব্যবহার করে নয়টি বর্গাকার ভিডিও কীফ্রেমের গ্রিড তৈরি করে, এবং তারপর সংশ্লিষ্ট কীফ্রেমগুলিকে সারি সারি এবং কলাম অনুসারে বের করে।
▲ভিডিও সূত্র: https://x.com/techhalla/status/1996650389228355819
অবশেষে, আসুন ন্যানো ব্যানানা প্রো ব্যবহারের আনুষ্ঠানিক উপায়গুলি সংক্ষেপে বলি।
- ai.studio: গুগলের অফিসিয়াল এআই স্টুডিও। এর জন্য একটি পেমেন্ট পদ্ধতি লিঙ্ক করতে হবে এবং ব্যবহারকারীরা ড্রপডাউন মেনুর মাধ্যমে বিভিন্ন রেজোলিউশন এবং ছবির আকার নির্বাচন করতে পারবেন। এটি ব্যবহারের জন্য কোনও প্রম্পট এবং চার্জের প্রয়োজন হয় না।
- gemini.google.com: জেমিনি ওয়েব ভার্সন এবং মোবাইল অ্যাপ, ছবি তৈরির জন্য বিনামূল্যে, কতবার ব্যবহার করা যাবে তার একটি সীমা রয়েছে। সীমায় পৌঁছানোর পর, এটি স্বয়ংক্রিয়ভাবে ন্যানো ব্যানানা মডেল ব্যবহার করবে। এর সবচেয়ে বড় বৈশিষ্ট্য হল আপনি আর তৈরি করা ছবির আকৃতির অনুপাত নিয়ন্ত্রণ করতে পারবেন না।
- flow.google: গুগলের ভিডিও জেনারেশন প্ল্যাটফর্ম, যা আপনাকে ক্রেডিট খরচ না করেই ছবি তৈরি করতে দেয়; এটি বিনামূল্যে।
প্রবন্ধে উল্লিখিত ভিডিওটি এই লিঙ্কে ক্লিক করে দেখা যাবে: https://mp.weixin.qq.com/s/s_EIYB0qqcWv29zMM1g-7Q
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।







