
সত্যি কথা বলতে, কৃত্রিম বুদ্ধিমত্তা (এআই) দ্বারা তৈরি ইমেজ টুলগুলি কখনও কখনও প্রেম-ঘৃণার সম্পর্ক তৈরি করে।
যখন তুমি প্রথমবার এটি সম্পর্কে জানবে (প্রথমবার যখন এটি তৈরি হবে), তখন তুমি ভাববে এটি অসাধারণ, প্রতিটি দিক থেকে নিখুঁত; কিন্তু একবার তুমি এটিকে আরও বিকশিত করতে চাইলে (এটিকে চিত্রের একটি সিরিজে পরিণত করতে, এটিকে একটি কর্মপ্রবাহে বাস্তবায়ন করতে), এটি "বল ফেলে দিতে" শুরু করে এবং গাছের রহস্যের মধ্যে পড়ে যায়।
"শুধু দেখতে পাওয়া যায়, লড়াই করতে পারে না" এই অবস্থায় এটিকে কাজে ব্যবহার করা অবিশ্বাস্যরকম বিব্রতকর হয়ে পড়ে। তবে, ন্যানো বানানার মতো সরঞ্জামের আবির্ভাবের সাথে সাথে, অবশেষে পরিস্থিতির পরিবর্তন হতে শুরু করে, যা প্রকাশ করে যে কৃত্রিম বুদ্ধিমত্তা (এআই) আরও সুনির্দিষ্টভাবে নিয়ন্ত্রণ করা যেতে পারে।
এখন, অবশেষে, দেশীয় AI স্থান দখল করছে এবং আরও পথ প্রশস্ত করছে। Vidu Q2-এর নতুন চালু হওয়া টেক্সট-টু-ইমেজ, রেফারেন্স-টু-ইমেজ এবং ইমেজ এডিটিং ফাংশনগুলি এই পথ অনুসরণ করে: এটিকে "ভালো দেখাতে" পরে, এটি "স্থিতিশীলতার" উপর ফোকাস করতে শুরু করে।

এবার, Vidu Q2 তার সমস্ত দক্ষতার বিষয়গুলিকে "ধারাবাহিকতা"-এর উপর কেন্দ্রীভূত করেছে। এর অর্থ কী? এর অর্থ হল "চরিত্রের ভাঙ্গন," "পণ্যের বিকৃতি" এবং "শৈলীতে হঠাৎ পরিবর্তন"-এর মতো দীর্ঘস্থায়ী সমস্যাগুলি সম্পূর্ণরূপে দূর করা।
সহজ কথায়, এটি কেবল সোশ্যাল মিডিয়ায় আপনার দক্ষতা প্রদর্শন করার সুযোগ নয়; এটি আপনাকে একটি ব্যবহারিক সৃজনশীল কর্মপ্রবাহ দেওয়ার বিষয়ে যা আপনি "শুরু থেকে শেষ পর্যন্ত" ব্যবহার করতে পারেন।

সর্বশেষ AA র্যাঙ্কিংয়ে, Vidu Q2-এর ইমেজ এডিটিং ক্ষমতা, যা প্রথমবারের মতো চালু হয়েছে, এমনকি OpenAI-এর GPT-5-কেও ছাড়িয়ে গেছে । সবচেয়ে প্রশংসনীয় বিষয় হল, মাত্র দুই বছরেরও বেশি সময় ধরে প্রতিষ্ঠিত একটি স্টার্টআপ হিসেবে, এটি গুগল এবং বাইটড্যান্সের মতো জায়ান্টদের পাশাপাশি শীর্ষ তিনের মধ্যে স্থান করে তার প্রযুক্তিগত দক্ষতা প্রমাণ করেছে, Nana Banana Pro-এর সাথে তাল মিলিয়েছে এবং "চিন্তামুক্ত" এর সারমর্মকে সত্যিকার অর্থে ধারণ করেছে।

ভিডু এক মাসব্যাপী "বিনামূল্যে উপহার প্যাকেজ"ও অফার করছে, যার মাধ্যমে সকলের জন্য এই ডিলগুলি উপভোগ করার দরজা খুলে দেওয়া হচ্ছে। এখন থেকে ৩১শে ডিসেম্বর পর্যন্ত, ভিডু সদস্যরা "বিনামূল্যে" কাঁচা ছবি ব্যবহার করতে পারবেন, তা সে রেফারেন্স ছবি, টেক্সট-ভিত্তিক ছবি, অথবা ছবি সম্পাদনা যাই হোক না কেন – তারা যা খুশি তৈরি করতে পারবেন। স্ট্যান্ডার্ড এবং পেশাদার সদস্যরাও প্রতি মাসে ৩০০টি বিনামূল্যে ছবি পান, অন্যদিকে ফ্ল্যাগশিপ সংস্করণটি সীমাহীন বিনামূল্যে কাঁচা ছবি অফার করে।
আজ, আসুন এই "সীমাহীন রিফিল" সুযোগটি কাজে লাগিয়ে Vidu Q2 এর raw ইমেজ ফাংশনটিকে কঠোর পরীক্ষায় ফেলি এবং দেখি এটি সত্যিই আমাদের চুলের রেখা সংরক্ষণ করতে পারে কিনা।
একটি ছবি দিয়ে শুরু করুন; বাকিটা আপনার কল্পনার উপর নির্ভর করে।
এআই টুলগুলির মধ্যে, ভিডু ছিল প্রথম যারা "একক চিত্রের চারপাশে ক্রমাগত রেফারেন্স তৈরি" কে মূল ক্ষমতা হিসাবে পরিমার্জন করেছিল। এটি সর্বাধিক সংখ্যক ইনপুট চিত্র সমর্থন করে এবং চীনের মধ্যে বহু-প্যারামিটার চিত্র তৈরিতে সর্বোচ্চ ধারাবাহিকতা রাখে ।
সাম্প্রতিক Vidu Q2 আপডেটে, এই ক্ষমতাটি আরও একটি বড় পদক্ষেপ নেওয়া হয়েছে: এটি কেবল আরও জটিল বহু-রেফারেন্স সমন্বয় সমর্থন করে না, বরং কাঁচা ছবি তৈরির জন্য থ্রেশহোল্ডকেও উল্লেখযোগ্যভাবে কমিয়ে দেয়। ডিজাইনার, পরিচালক এবং এমনকি সাধারণ ব্যবহারকারীরা যারা তৈরি করতে পছন্দ করেন তারা তাদের নিজস্ব উপায়ে বিষয় চিত্র এবং পরিবেশগত রেফারেন্স সরবরাহ করতে পারেন এবং মডেলটি এক ক্লিকে ক্রিয়া, অবস্থান, বিন্যাস, টেক্সচার, আলো, রঙ ইত্যাদি প্রতিলিপি করতে পারে, স্বয়ংক্রিয়ভাবে "প্রয়োজনীয় রেফারেন্স চিত্রের সাথে সারিবদ্ধ হয় এবং চরিত্রটি অপরিবর্তিত থাকে"।
মাল্টি-প্যারামিটার র ছবি
মাল্টি-প্যারামিটার র-ই ইমেজ দৃশ্যপটে, আমরা ভিডু কিউ২-তে যে র-ই ইমেজগুলি প্রদান করি তা বাস্তব কর্মপ্রবাহের খুব কাছাকাছি: একটি হল সাম্প্রতিক জাতীয় গেমসের "শীর্ষ-স্তরের" দাওয়ান চিকেন, এবং অন্যটি হল দৃশ্যের পরিবেশ যা আমরা তৈরি করতে আশা করি, সূর্যাস্তের সময় বুন্ড দেখার প্ল্যাটফর্ম।
তারপর আমি একটি ছোট প্রম্পট লিখে বাকিটা তার উপর ছেড়ে দিলাম।

যখন ফলাফল বের হলো, আমি কেবল বললাম "সম্মান!"
এটি এমন সরল পদ্ধতি নয় যা কেবল বিষয়বস্তু কেটে ফেলে এবং এটিকে পেস্ট করে; এটি আসলে দৃশ্যের মধ্যে আলো এবং ছায়াগুলিকে "পুনরায় গণনা" করে। বিষয়বস্তুর আলো এবং ছায়ার দিক পরিবেশের সাথে সামঞ্জস্যপূর্ণ হয় এবং এর গতিবিধি কমান্ড অনুসারে সঠিকভাবে পরিবর্তিত হয়।
আমি এটি একটি গাড়িতেও মুদ্রণ করেছিলাম, এবং এটি গাড়ির বডিতে প্রতিফলনের রঙগুলি নিখুঁতভাবে গণনা করেছিল।

আরও গুরুত্বপূর্ণ বিষয় হল, অনেক ছবি বিভিন্ন কম্পোজিশন এবং পোজ একাধিকবার তৈরি করার সময় উচ্চ মাত্রার ধারাবাহিকতা বজায় রাখে, যেমন দা ওয়ান মুরগির বুকের প্যাটার্ন এবং তার মাথায় রঙিন চিরুনি। এটি এমন কিছু যা প্রায়শই ঐতিহ্যবাহী চিত্র তৈরির প্রক্রিয়ায় অর্জন করা কঠিন যা দ্রুত প্যারামিটার টিউনিংয়ের উপর নির্ভর করে।
এটা সত্যিই অসাধারণ। অতীতে, ব্র্যান্ডগুলি বিভিন্ন পরিস্থিতিতে পোস্টারে একটি আইপি চরিত্র স্থাপন করতে, তাদের ছবিগুলিকে মডেল, রেন্ডার এবং সম্পাদনা করতে হত। এখন? এটি কয়েক সেকেন্ডের মধ্যে করা যেতে পারে, এবং সেই "অসঙ্গতি" সম্পূর্ণরূপে অদৃশ্য হয়ে গেছে।
স্থানিক ধারাবাহিকতা
আরও চিত্তাকর্ষক বিষয় হল বিদুর স্থানিক সম্পর্ক বোঝার ক্ষমতা। যখন আমি "দাওয়ান মুরগিদের নিষিদ্ধ শহরের খোদাই করা রেলিং দিয়ে বুনতে" বললাম, তখন বিদু অন্যান্য এআই-এর মতো রেলিং দিয়ে ক্লিপ করেনি, অথবা দৃশ্যটিকে একটি ভৌতিক সিনেমায় রূপান্তরিত করেনি।
এটি আসলে পরিবেশগত মানচিত্রের উপর ভিত্তি করে নিষিদ্ধ শহরের স্থানিক কাঠামো "কল্পনা" করেছিল, যা দা ওয়ান মুরগিকে করিডোরের জায়গায় স্বাভাবিকভাবে হাঁটার সুযোগ করে দিয়েছিল।

আসুন AI চরিত্রের রেফারেন্স জটিল মার্শাল আর্ট মুভ দিয়ে অসুবিধা বাড়াই।
অতীতে, AI চরিত্রগুলি আপনার ডিজাইন করা জটিল নড়াচড়াগুলি সঠিকভাবে পুনরুত্পাদন করতে পারত না; হয় নড়াচড়াগুলি বিকৃত করা হয়েছিল, অথবা যুদ্ধের সময় চরিত্রটি সম্পূর্ণ ভিন্ন দেখাচ্ছিল। এখন, Vidu Q2 এর রেফারেন্স চিত্রগুলির সাহায্যে, AI নির্মাতাদের জন্য এই সমস্যাটি সমাধান করা হয়েছে। আপনি একটি ক্লিকেই নড়াচড়াগুলি প্রতিলিপি করতে পারেন, যার ফলে আপনার AI নায়ক বিভিন্ন ধরণের দক্ষতা অর্জন করতে পারবেন।
নিচের উদাহরণে, দুই অ্যানিমে নায়ক চিত্র ১-এ যুদ্ধের ভঙ্গিগুলি সঠিকভাবে পুনঃনির্মাণ করেছেন, একই সাথে তাদের পোশাক, মুখের বিবরণ এবং স্থানিক সম্পর্কের ক্ষেত্রে উচ্চ মাত্রার ধারাবাহিকতা বজায় রেখেছেন।

"স্থান" সম্পর্কে এই বোধগম্যতা রেফারেন্স ছবিগুলিকে কেবল ব্যাকগ্রাউন্ড হিসেবে আটকানো ছাড়াও আরও বেশি কিছু করতে সাহায্য করে; তারা সত্যিকার অর্থে স্টোরিবোর্ডিং এবং শট বিন্যাস পরিবেশন করতে সক্ষম হয়ে ওঠে ।
স্থান সম্পর্কে এই ধারণাটি সাম্প্রতিক জনপ্রিয় "Zootopia 2" এর মতো সিনেমার স্টোরিবোর্ড বা গ্রুপ পোস্টার তৈরির জন্য অবিশ্বাস্যভাবে কার্যকর।

উদাহরণস্বরূপ, নিচের ক্ষেত্রে, একই ছবি বিভিন্ন ক্যামেরার সংকেতের সাথে মিলিত হয়ে একজন ফুটবল খেলোয়াড়ের বল লাথি মারার ক্লোজ-আপ, লং শট এবং ক্লোজ-আপ তৈরি করতে পারে এবং তারপর ইমেজ-টু-ভিডিও রূপান্তরের মাধ্যমে এগুলিকে একটি সম্পূর্ণ ন্যারেটিভ শটে রূপান্তর করতে পারে। ছোট নাটক, অ্যানিমেশন এবং চলচ্চিত্র নির্মাণের জন্য, এটি একটি একক দৃশ্যের জন্য একাধিক শট বা বিস্তৃত স্টোরিবোর্ডিংয়ের প্রয়োজনীয়তা দূর করে, এটিকে সত্যিকার অর্থে একটি দক্ষ উৎপাদনশীলতা সরঞ্জাম করে তোলে।

তারপর, Vidu Q2 এর ইমেজ-টু-ভিডিও ফাংশন ব্যবহার করে, ফুটবল মাঠে বলের জন্য প্রতিদ্বন্দ্বিতাকারী দুই খেলোয়াড়ের একটি হাইলাইট ভিডিও আউটপুট করুন:
স্টাইলের ধারাবাহিকতার দিক থেকে, ঐতিহ্যবাহী এআই টেক্সট-টু-ইমেজ জেনারেশন ফাংশনগুলির কল্পনাশক্তি দুর্দান্ত কিন্তু প্রায়শই দুর্বল ধারাবাহিকতা থাকে, অসঙ্গতিপূর্ণ স্টাইল এবং চরিত্রের মিশ্রণ সাধারণ ঘটনা। বিপরীতে, Vidu Q2 কেবল শত শত অ্যানিমে স্টাইলকেই সমর্থন করে না, বরং জেনারেট করা ক্রমাগত একাধিক ছবিতে স্টাইলের ধারাবাহিকতা এবং গল্পের সমন্বয়ও বজায় রাখে।
উদাহরণস্বরূপ, Vidu Q2 টেক্সট এডিটর মাত্র কয়েকটি বাক্য থেকে একটি চার-প্যানেল কমিক তৈরি করতে পারে। এটি কেবল শৈলী এবং চরিত্রগুলির মধ্যে ধারাবাহিকতা বজায় রাখে না এবং বিবরণ স্থিতিশীল রাখে না, তবে এটি মাত্র কয়েকটি বাক্যে একটি সম্পূর্ণ গল্পও বলতে পারে:

এই ঘটনাগুলি প্রমাণ করে যে রেফারেন্স চিত্রগুলিতে ভিদুর আপগ্রেডগুলি কেবল "ছবিটিকে রেফারেন্স চিত্রের মতো দেখানোর" বাইরেও যায়। পরিবর্তে, এটি তার নকশায় "বিষয় সামঞ্জস্য" এবং "স্থানিক বোধগম্যতা" অন্তর্ভুক্ত করে । একদিকে, এটি নির্ভরযোগ্যভাবে বিভিন্ন কোণ থেকে, বিভিন্ন বায়ুমণ্ডলে, শৈলীতে এবং বিভিন্ন আলোকসজ্জার পরিস্থিতিতে একজন ব্যক্তির সম্পূর্ণ চিত্র তৈরি করতে পারে, যা সমস্ত রেফারেন্স চিত্রের উপর ভিত্তি করে। অন্যদিকে, এটি পরিবেশগত চিত্রগুলিকে কেবল পটভূমির টেক্সচার হিসাবে নয় বরং বাস্তব স্থান হিসাবে বিবেচনা করে।
শুধু খেলনা নয়, এটি একটি আসল "যুদ্ধের অস্ত্র"।
যদি রেফারেন্স ইমেজটি "প্রথম ছবিটি কীভাবে সিদ্ধান্ত নেবেন" এই সমস্যার সমাধান করে, তাহলে Vidu Q2-তে নতুন চালু হওয়া ইমেজ এডিটিং সত্যিই এই ছবিটিকে দৈনন্দিন কর্মপ্রবাহের সাথে একীভূত করে, আরও পরিশীলিত ইমেজ নিয়ন্ত্রণ সক্ষম করে এবং প্রকৃত বাণিজ্যিক পরিস্থিতির চাহিদা পূরণ করে।
এই ক্ষেত্রে ভিদুর অবস্থান খুবই সহজ: এটি 90% সাধারণ চিত্র সম্পাদনা পরিস্থিতি কভার করে – উপাদান যোগ করা, উপাদান অপসারণ করা, পটভূমি পরিবর্তন করা, রঙ পরিবর্তন করা, আলো সামঞ্জস্য করা, জুম করা এবং আকৃতির অনুপাত পরিবর্তন করা – সবকিছুই প্রাকৃতিক ভাষা ব্যবহার করে করা যেতে পারে , একই সাথে ক্রমাগত পরিবর্তন প্রক্রিয়া জুড়ে বিষয়বস্তুর ধারাবাহিকতা বজায় রাখা যায়।
প্রতিস্থাপন এবং আংশিক সম্পাদনার পরীক্ষায়, আমি ট্রেন স্টেশনের একটি বিজ্ঞাপন মাস্ক দিয়ে প্রতিস্থাপন করার চেষ্টা করেছি। আগে, চোখ বন্ধ না হওয়া পর্যন্ত আমাকে ছবিটি কেটে ফেলতে হত, কিন্তু এখন এটি মাত্র কয়েক সেকেন্ড সময় নেয় এবং আমি এক ক্লিকেই সরাসরি এটি প্রতিলিপি করতে পারি।

ভবিষ্যতে, যখন আপনি একটি জনপ্রিয় বিজ্ঞাপন বা কভার দেখতে পাবেন, তখন আপনি সহজেই এক ক্লিকেই এটিকে প্রচুর পরিমাণে প্রতিলিপি করতে পারবেন, 4K তে আউটপুট করতে পারবেন এবং সরাসরি আপলোড করতে পারবেন। বিজ্ঞাপন এবং সোশ্যাল মিডিয়া কন্টেন্ট তৈরি করা এর চেয়ে সহজ আর কিছু হতে পারে না।
একইভাবে, নিম্নলিখিত ক্ষেত্রে, তিনজন মেয়ের সাথে ওয়াইনের গ্লাস যুক্ত করার প্রয়োজনীয়তা ছিল—Q2 কেবল প্রয়োজনীয়তা পূরণ করেনি বরং ওয়াইনের গ্লাসে আলোর প্রতিসরণ বিবেচনা করে তিনজন মেয়ের হাতের বিবরণও পরিমার্জিত করেছে।

ছবি সম্পাদনা সত্যিই একটি "ব্যবহারিক" দক্ষতা, বিশেষ করে ই-কমার্স বা সোশ্যাল মিডিয়া মার্কেটিংয়ের মতো পরিস্থিতিতে। অনেক পণ্যের ছবিতে প্রাথমিকভাবে কেবল একটি সাধারণ লাইন অঙ্কন থাকে: ডিজাইনার একটি স্কেচ প্রদান করেন, অন্যদিকে অপারেশন টিমের একটি প্রধান চিত্রের প্রয়োজন হয় যা তাৎক্ষণিকভাবে আপলোড করা যেতে পারে।
এখানেই ইমেজ এডিটররা সত্যিকার অর্থে উজ্জ্বল হতে পারে। আমরা স্কেচিং, রঙ করা এবং উপাদান প্রতিস্থাপনের সম্পূর্ণ অনুশীলন পরিচালনা করার জন্য ভিডু ব্যবহার করেছি। প্রথমে, আমরা আসবাবপত্রের লাইন অঙ্কন তৈরি করেছি, এবং তারপর প্রম্পটে উপকরণ এবং শৈলী উল্লেখ করে একটি একক ক্লিকের মাধ্যমে সরাসরি একটি রেফারেন্স চিত্র হিসাবে ব্যবহার করেছি।

ভিডু ম্যাটেরিয়াল রেন্ডারিং ব্যবহার করে এক ধাপে অত্যন্ত বিস্তারিত এবং নির্ভুল বাস্তব-জগতের ছবি তৈরি করে। তারপর, এক ক্লিকেই, এটি পুনরায় ব্যবহার করা যেতে পারে, বিভিন্ন গৃহসজ্জার স্টাইলে সোফাটি সহ প্রম্পট সহ প্রদর্শন করা যেতে পারে।

একই পণ্যের উপাদান পরিবর্তন করাও সহজেই সম্ভব।

এটা দেখা যায় যে Vidu Q2 এর ছবি সম্পাদনা ক্ষমতা আসলে "মাল্টি-প্যারামিটার র ইমেজ যুগের অন্তর্নিহিত ক্ষমতা" বাস্তবে প্রয়োগ করছে: ছবিতে কে বিষয়বস্তু তা চিহ্নিত করা, তাকে/তাকে/তাকে লক করা, এবং তারপরে আপনাকে এর চারপাশের সবকিছু সহজ ভাষায় যোগ, মুছে ফেলা এবং পরিবর্তন করার অনুমতি দেওয়া, এমনকি একাধিক ছবি এবং একটি ভিডিওতেও।
এটা অনেকটা ম্যানুয়াল গাড়ি চালানোর সময় বিভিন্ন ধরণের প্যারামিটার সামঞ্জস্য করার মতো, কিন্তু এখন ভিডু আপনাকে একটি স্বায়ত্তশাসিত ড্রাইভিং সিস্টেম দেয়। আপনাকে কেবল সৃজনশীল দিকগুলিতে মনোনিবেশ করতে হবে এবং এটি অন্যান্য সমস্ত ক্লান্তিকর কাজের যত্ন নেয়।
এর মধ্যে আরেকটি খুব কার্যকরী ক্ষমতাও রয়েছে: মূল বিষয় সংরক্ষণ করা। আমরা উপরের Q2 কাঁচা ছবি/রেফারেন্স কাঁচা ছবি/ছবিটিকে প্রধান বিষয় হিসেবে সম্পাদনা করার পরে এক ক্লিকে সংরক্ষণ করতে পারি, "এই আইপিটি চরিত্রের লাইব্রেরিতে যোগ করে"। পরবর্তীকালে, মূল বিষয়টিকে সরাসরি ভিদুর রেফারেন্স কাঁচা ভিডিওতে কল করা যেতে পারে।

এরপর, আপনি ব্যাকগ্রাউন্ড পরিবর্তন করুন, অ্যাকশন পরিবর্তন করুন, অথবা তাকে নতুন দৃশ্যে রাখুন, যতক্ষণ আপনি এই চরিত্র বা আইপি নির্বাচন করবেন, মডেলটি চরিত্রের ধারাবাহিকতা কঠোরভাবে বজায় রাখবে এবং এমন কোনও পরিস্থিতি থাকবে না যেখানে পরবর্তী সেকেন্ডে তৈরি নায়ক আগের সেকেন্ডের থেকে আলাদা হবে।
কাঁচা ছবি রেফারেন্স করুন – মূল বিষয় সংরক্ষণ করুন – কাঁচা ভিডিও রেফারেন্স করুন। ভিডু অনুপ্রেরণা থেকে সমাপ্ত পণ্য পর্যন্ত কর্মপ্রবাহকে সহজতর করেছে , বিভিন্ন প্ল্যাটফর্মের মধ্যে স্যুইচ করার প্রয়োজনীয়তা দূর করেছে। এটি ছোট নাটক, অ্যানিমেশন, বিজ্ঞাপন এবং ই-কমার্স পেশাদারদের জন্য একটি আশীর্বাদ। API এখন উপলব্ধ।
এআই এরিনায়, "ব্যঘাত" ভুলে যান, "কাজ সম্পন্ন করার" উপর মনোযোগ দিন।
স্রষ্টাদের জন্য, অতীতে AI এর সাথে কাজ করার অভিজ্ঞতা কেমন ছিল? এটি সম্ভবত একটি তিক্ত-মিষ্টি অভিজ্ঞতা ছিল: এক সেকেন্ড আপনাকে একটি আশ্চর্যজনক চিত্র দেয়, পরের সেকেন্ড আপনাকে পরবর্তী দশ ঘন্টার জন্য মানসিকভাবে ভেঙে ফেলে কারণ আপনি সেই চেহারাটি পুনরায় তৈরি করতে পারবেন না।
কৃত্রিম বুদ্ধিমত্তা-চালিত সৃজনশীল সরঞ্জামের বিবর্তনের এই সন্ধিক্ষণে, আমরা দুটি স্বতন্ত্র পণ্য দর্শন লক্ষ্য করেছি।
মিডজার্নির মতো পণ্যগুলি একটি শক্তিশালী "ইঞ্জিন" এর মতো যা কেবল হার্ডকোর গীকরাই আয়ত্ত করতে পারে, তাদের জটিল পরামিতি এবং মন্ত্রের মতো প্রম্পট দিয়ে, একটি একক চিত্রের নান্দনিক সীমাকে চরমে ঠেলে দেওয়ার চেষ্টা করে।
এটা দারুন, এটা গীকি, কিন্তু এটা অবিশ্বাস্যরকম যন্ত্রণাদায়কও।
অন্যদিকে, ভিডু কিউ২ আরও বাস্তবসম্মত, এমনকি আপাতদৃষ্টিতে "বিরক্তিকর" পথ বেছে নিয়েছে – এমন একটি "ব্যাপক পরিমাণে উৎপাদিত গাড়ি" তৈরি করার জন্য যা যে কেউ চালাতে পারে। এটি আর এলোমেলো চমক তৈরির উপর মনোযোগ দেয় না, বরং স্থিতিশীলতাকে অগ্রাধিকার দেয়।

এই ধরণের "নির্বোধ" কর্মপ্রবাহ যা আপনার জন্য সমস্ত পদক্ষেপকে অন্তর্ভুক্ত করে তা হল আসল উৎপাদনশীলতা। সর্বোপরি, যেসব দল ক্রমাগত ক্লায়েন্টদের দ্বারা খসড়া সংশোধন করার জন্য এবং অপারেশন টিমগুলি দ্বারা চালু করার জন্য চাপের সম্মুখীন হচ্ছে, তাদের জন্য হঠাৎ অনুপ্রেরণার "এলোমেলো"তার চেয়ে বিতরণযোগ্য "নিশ্চিততা" অনেক বেশি গুরুত্বপূর্ণ।
সম্ভবত কিছু চরম শিল্প শৈলী অন্বেষণে, এটি সেই প্যারামিটার-চালিত সরঞ্জামগুলির মতো বন্য এবং মুক্ত নাও হতে পারে, এবং যেহেতু এটি খুব বেশি স্থিতিশীলতার পিছনে ছুটছে, তাই এতে "অপ্রত্যাশিত বিস্ময়" এর কিছু অনুপ্রেরণার অভাব রয়েছে।
কিন্তু গাছা মেকানিক্স দ্বারা যন্ত্রণাপ্রাপ্ত নির্মাতাদের জন্য, ভিডু কিউ২ দীর্ঘদিনের হারিয়ে যাওয়া নিরাপত্তার অনুভূতি প্রদান করে।
যখন ইন্ডাস্ট্রি AGI-এর বিশাল আখ্যান নিয়ে কথা বলছে, তখন বিদু মাথা নিচু করে আপনার জন্য অবাস্তব স্বপ্ন তৈরি করা বন্ধ করে দেয়; এটি আপনার কাজের জন্য একটি শক্ত ভিত্তি তৈরি করতে সাহায্য করে।
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
