সিড্যান্স ২.০ এর বাস্তব-বিশ্ব পরীক্ষা: বিদেশীরা নিবন্ধন করতে আগ্রহী – এটি চীনা এআই ভিডিওর “কালো মিথ” মুহূর্ত।

"চীনের সিড্যান্স ২.০ সবচেয়ে উন্নত প্রযুক্তিতে পরিণত হবে।"

"এটা কৃত্রিম বুদ্ধিমত্তা, আমরা ধ্বংসের মুখে।"

▲X-তে, বেশ কয়েকজন AI ভিডিও নির্মাতা বলেছেন যে Seedance 2.0 অসাধারণভাবে ভালো পারফর্ম করেছে।

গত কয়েকদিন ধরে, Seedance 2.0 দ্বারা তৈরি AI ভিডিওগুলি Douyin, WeChat ভিডিও চ্যানেল এবং X এর মতো বিদেশী সোশ্যাল মিডিয়া প্ল্যাটফর্মগুলিতে দাবানলের মতো ছড়িয়ে পড়ছে।

বিদেশী নেটিজেনরা জিমেং-এ নিবন্ধন করার জন্য +86 নম্বর খুঁজছেন এমন অস্বাভাবিক ঘটনা ছাড়াও, বিপুল সংখ্যক নেটিজেন গাইড খুঁজছেন এমন থ্রেড পোস্ট করছেন এবং সেই এআই ভিডিওগুলির মন্তব্য বিভাগে, সবাই টিউটোরিয়াল চাইছেন। আরও চরম, কেউ কেউ দাবি করছেন যে জিমেং পয়েন্ট পুনরায় বিক্রি করে মাত্র দুই দিনে $8,000 এরও বেশি আয় করেছেন।

▲অনেক বিদেশী নেটিজেন গেমটি অ্যাক্সেস করার জন্য সম্ভাব্য সকল উপায়ে চেষ্টা করে একটি ট্রায়াল কোডের জন্য অনুরোধ পোস্ট করছেন।

সিড্যান্স ২.০ আসলে কী ধরণের এআই ভিডিও তৈরি করতে পারে?

"Effortlessly Replicating Life's Segmentation Techniques" এর প্রথম পর্বে লিফট থেকে বের হওয়া থেকে করিডোরে ক্যামেরার জটিল নড়াচড়া দেখানো হয়েছে; এতে ভিসারাল মার্শাল আর্ট অ্যাকশন সহ একটি স্ব-নির্মিত ব্লকবাস্টারও রয়েছে; বিভিন্ন টিভি বিজ্ঞাপন এবং প্রচারমূলক ভিডিওতে লিকুইড গ্লাসের প্রভাব দেখানো হয়; এমনকি এটি স্ট্যান্ড-আপ কমেডি এবং স্কিটও পরিবেশন করতে পারে, এবং এবার, স্প্রিং ফেস্টিভ্যাল গালার পরিচালক দায়িত্বে আছেন…

▲ বাইটড্যান্সের স্ব-উন্নত ভিডিও জেনারেশন মডেল সিড্যান্স ২.০ দ্বারা তৈরি। সূত্র: X@qhgy / Douyin@虚妄

সহজ ভিডিও ধারাবাহিকতা থেকে শুরু করে জটিল এবং চ্যালেঞ্জিং ক্যামেরার গতিবিধি, সেইসাথে শক্তিশালী সৃজনশীল টেমপ্লেট ফাংশন, আরও নির্ভুল এবং বাস্তবসম্মত শব্দ এবং ভিডিও সামগ্রীর সাথে মিলে যাওয়া সঙ্গীত, সিড্যান্স ২.০ এআই ভিডিওগুলির সম্মুখীন হতে পারে এমন প্রায় সমস্ত সমস্যার সমাধান করেছে।

APPSO স্বপ্নে সর্বশেষ Seedance 2.0 মডেলটিও পরীক্ষা করেছে, এবং এটি কেবল বলা যেতে পারে যে নেটিজেনদের প্রতিক্রিয়াগুলি আসল ছিল। প্রকৃতপক্ষে ভাল ইঙ্গিত এবং কার্ড ড্রয়ের জন্য অনুরোধ করা হয়েছিল, কিন্তু তৈরি করা প্রতিটি AI ভিডিও অত্যন্ত বাস্তবসম্মত ছিল।

▲ জিমেং এআই অফিসিয়াল ওয়েবসাইট: https://jimeng.jianying.com/ai-tool/generate

বর্তমানে, জিমেং-এর অফিসিয়াল ওয়েবসাইটে, লগ ইন করার পরে, আপনি বাইটড্যান্সের স্ব-উন্নত ভিডিও জেনারেশন মডেল সিড্যান্স 2.0 ব্যবহার করার জন্য ভিডিও জেনারেশন নির্বাচন করতে পারেন।

এবার, আমরা আসলে AI কে একটি সিনেমা বানাতে নির্দেশ দিচ্ছি।

Seedance 2.0 মডেলটি নির্বাচন করার পরে এবং অল-ইন-ওয়ান রেফারেন্স মোড ব্যবহার করার পরে, আমদানি করা যেতে পারে এমন ফাইলগুলি দেখেই আপনি বুঝতে পারবেন যে এই আপগ্রেডটি সহজ নয়।

বাইটড্যান্সের ভিডিও জেনারেশন মডেল, সিড্যান্স ২.০, বেশিরভাগ মডেলের ইনপুট সীমাবদ্ধতা সম্পূর্ণরূপে ভেঙে দেয়। পূর্ববর্তী টেক্সট + প্রথম ফ্রেম অথবা প্রথম এবং শেষ ফ্রেমগুলি এখন পুরানো। সিড্যান্স ২.০ তৈরির যুক্তিটিকে স্ক্র্যাচ থেকে পুনর্নির্মাণ করেছে, চারটি পদ্ধতির বিনামূল্যে সমন্বয়কে সমর্থন করে: ছবি, ভিডিও, অডিও এবং পাঠ্য।

একটি একক ছবি একটি দৃশ্যের শিল্পশৈলী সংজ্ঞায়িত করতে পারে অথবা একটি ভিডিওর জন্য একটি কীফ্রেম হিসেবে কাজ করতে পারে; একটি ছোট ভিডিও সরাসরি একটি চরিত্রের গতিবিধি এবং বিভিন্ন জটিল ক্যামেরার কোণের প্রতিলিপি তৈরি করতে পারে; কয়েক সেকেন্ডের অডিও সরাসরি ছন্দ এবং পরিবেশ নির্ধারণ করতে পারে; এবং পরিশেষে, একটি সংকেত শব্দ আমাদের সমস্ত কল্পনাকে সংযুক্ত করতে পারে।

▲বাইটড্যান্সের স্ব-উন্নত ভিডিও জেনারেশন মডেল সিড্যান্স ২.০ ১২টি ফাইল, ৯টি ছবি এবং ৩টি ভিডিও এবং অডিও ফাইল সমর্থন করে, মোট ভিডিও/অডিও দৈর্ঘ্য ১৫ সেকেন্ডের বেশি নয়; জেনারেশন সময়কাল ৪ থেকে ১৫ সেকেন্ডের মধ্যে নির্বাচন করা যেতে পারে, বিভিন্ন সময়কাল বিভিন্ন পয়েন্ট গ্রহণ করে।

ব্যবহারও খুবই সহজ। Seedance 2.0 বর্তমানে "First and Last Frames" এবং "All-in-One Reference" বিকল্পগুলিকে সমর্থন করে, কিন্তু বুদ্ধিমান মাল্টি-ফ্রেম এবং বিষয় রেফারেন্স মোডগুলি এখনও সমর্থিত নয়। সাধারণত, আমাদের কেবল "All-in-One Reference" এবং "Seedance 2.0" মডেলটি নির্বাচন করতে হবে এবং তারপরে সমস্ত উপকরণ আপলোড করতে হবে। অফিসিয়াল ওয়েবসাইটটি শুরুতে চূড়ান্ত ভিডিওতে সর্বাধিক প্রভাব ফেলতে পারে এমন উপকরণগুলি রাখার পরামর্শ দেয়।

▲ আপনি বিভিন্ন উৎস ফাইল নির্বাচন করতে ইনপুট বক্সের নীচে @ বোতামে ক্লিক করতে পারেন।

এরপর, প্রম্পট ইনপুট বাক্সে, @ চিহ্নটি ব্যবহার করে সংশ্লিষ্ট উপাদানটি সরাসরি কল করুন, এটিকে একটি যুক্তিসঙ্গত প্রম্পটে একত্রিত করুন, এবং তারপর এটি "স্বপ্ন তৈরি করুন" পর্যন্ত অপেক্ষা করুন। "এই ক্রিয়া/পরিবেশ/ক্যামেরা গতিবিধি/সাউন্ডট্র্যাক/…" কীভাবে বর্ণনা করবেন তা নিয়ে আমাদের আর মাথা ঘোরানোর দরকার নেই, আমাদের কেবল এটি @ এ ক্লিক করে মডেলটিকে নির্দেশ করতে হবে।

যদি মাল্টিমোডাল ইনপুট "কিভাবে বলবে" সমস্যার সমাধান করে, তাহলে মডেলের অভ্যন্তরীণ রেফারেন্সিং ক্ষমতা "কি বলবে" সমস্যার সমাধান করে। শক্তিশালী গভীর ভিডিও রেফারেন্সিং ক্ষমতা সহ, আমরা AI ভিডিওও তৈরি করেছি যা অন্যান্য মডেল অর্জন করতে পারে না।

দশের বিপরীতে এক, আঠারোটি মার্শাল আর্ট দক্ষতা সরাসরি অনুলিপি করা হয়েছে

আগে, যদি আমরা চাইতাম যে AI কোনও সিনেমার কোনও বিখ্যাত দৃশ্য অনুকরণ করুক, তাহলে আমাদের প্রম্পটে "সারাউন্ড শট" এবং "কুইক সুইচ" এর মতো পেশাদার শব্দ লিখতে হত। নির্দিষ্ট মার্শাল আর্ট মুভের ক্ষেত্রে, আমাদের মার্শাল আর্ট প্রশিক্ষক হতে হত, প্রম্পটে প্রতিটি মুভ কীভাবে সম্পাদন করতে হবে তা স্পষ্টভাবে লিখে রাখতে হত, এবং তারপরেও, ফলাফল সবসময় সঠিক হত না।

এখন আপনি সরাসরি রেফারেন্স কন্টেন্ট আপলোড করতে পারবেন, এবং AI কেবল দৃশ্যের সামগ্রিক স্টাইল বুঝতে এবং চরিত্রগুলির বিশদ বিবরণ ক্যাপচার করতে পারবে না, বরং ক্যামেরার ভাষা, নড়াচড়ার ছন্দ এবং এমনকি সৃজনশীল বিশেষ প্রভাবগুলিও চিনতে পারবে এবং তারপরে সেগুলি সঠিকভাবে প্রতিলিপি করতে পারবে।

▲ @Video 1-এ থাকা দুজন ব্যক্তির পরিবর্তে @Image 1-এ থাকা দুটি রোবট ব্যবহার করুন, দৃশ্যটি @Image 1-এর মতোই রাখুন। @Video 1-এ ক্যামেরার গতিবিধি এবং রূপান্তর উল্লেখ করে, চূড়ান্ত পর্যায়ের নান্দনিকতা এবং উন্নত ভিজ্যুয়াল প্রভাবের জন্য দুই ব্যক্তির মার্শাল আর্ট মুভমেন্টের সাথে মিল রাখতে ক্যামেরা অ্যাঙ্গেল ব্যবহার করুন।

এখানে আমরা Seedance 2.0 ব্যবহারকারী ম্যানুয়াল থেকে একটি 10-সেকেন্ডের লড়াইয়ের দৃশ্য ব্যবহার করেছি, এবং তারপর মডেলটিকে ভিডিওতে দুটি চরিত্রের গতিবিধি আমাদের আপলোড করা দুটি রোবটে অনুলিপি করতে বলেছি।

চূড়ান্ত ফলাফলটি ভিডিওর গতিবিধির নিখুঁত প্রতিলিপি তৈরি করেছে, যার ফলে ইউনিসোক এবং বোস্টন ডায়নামিক্স একটি রোমাঞ্চকর প্রতিযোগিতায় অংশ নিতে পেরেছে। এটি কিছুদিন আগে ওয়েইবো নাইট ইভেন্টে রোবটের পারফরম্যান্সের চেয়ে কম চিত্তাকর্ষক নয়।

▲আপলোড করা ভিডিও এবং ছবি, এবং ব্যবহৃত প্রম্পট

শেষ এআই মুভমেন্টগুলি পূর্ববর্তী মডেলের সমস্যাগুলি সম্পূর্ণরূপে সমাধান করেছে, যেখানে হাঁটা ভাসমান এবং লড়াই করা অলস নুডলসের মতো দেখাচ্ছিল। বর্তমান সিড্যান্স ২.০ হল এমন একটি মডেল যা পদার্থবিদ্যা, মাধ্যাকর্ষণ এবং জড়তা বোঝে, মসৃণ এবং আরও প্রাকৃতিক নড়াচড়ার পরিবর্তন সহ , এবং আর সেই অদ্ভুত "এআই অনুভূতি" নেই।

সেটের সবচেয়ে কঠিন ছবিগুলো এখন রেফারেন্স আপলোড করে সহজেই ধারণ করা যাবে।

চরিত্রের বিবরণ এবং গতিবিধি বিশ্বস্ততার সাথে পুনরুত্পাদন করার পাশাপাশি, Seedance 2.0 ক্যামেরার গতিবিধির প্রতিলিপি তৈরি করতেও সক্ষম। পূর্বে কঠিন সিনেমাটিক ক্যামেরার কাজ এবং সৃজনশীল বিশেষ প্রভাবগুলি এখন কেবল একটি রেফারেন্স ভিডিও আপলোড করে সঠিকভাবে প্রতিলিপি করা যেতে পারে।

▲@Video 1-এ ক্যামেরার গতিবিধি উল্লেখ করুন, এই ভিডিওটি @Image 1 ব্যবহার করে প্রতিলিপি করা হয়েছে।

আমরা একটি অ্যাপল F1 রেস কারের একটি ক্লিপ এবং একটি Xiaomi SU7 Ultra এর একটি ছবি আপলোড করেছি। Seedance 2.0 আমার উদ্দেশ্যটি পুরোপুরি বুঝতে পেরেছিল, ছবিটিকে F1 রেসের উদ্বোধনের মতো একটি আকাশচুম্বী শটে রূপান্তরিত করেছিল, তারপর একটি ফলো শটে SU7 Ultra এর উপর ফোকাস করেছিল, সবই এক ধারাবাহিক টেক। এটিকে ব্লকবাস্টার বললে অত্যুক্তি হবে না।

নির্বিঘ্নে, একটানা শট তৈরির এই ক্ষমতা উচ্চমানের নৃত্য ভিডিও তৈরির জন্য বিশেষভাবে উপযুক্ত । আমরা ব্যবহারকারীর ম্যানুয়ালটিতে একটি ১৫ সেকেন্ডের নৃত্য ভিডিও পেয়েছি এবং একটি সুন্দর সেলফি আপলোড করেছি। মাত্র এক প্রজন্মের সাথে, কোনও বিশেষ বৈশিষ্ট্য ছাড়াই, আমরা নিখুঁত সময়োপযোগী সঙ্গীত এবং প্রাকৃতিক ক্যামেরা মুভমেন্ট সহ একটি একক নৃত্য ভিডিও পেয়েছি।

▲ @Video 1-এর মেয়েটিকে @Image 1-এর মেয়েটিকে মঙ্গোলিয়ান পোশাক পরিহিত দিয়ে প্রতিস্থাপন করুন। দৃশ্যটি একটি সুন্দর মঞ্চে। @Video 1-এর ক্যামেরার গতিবিধি এবং রূপান্তর প্রভাবগুলি উল্লেখ করে, চূড়ান্ত পর্যায়ের নান্দনিকতা অর্জন করতে এবং দৃশ্যমান প্রভাব উন্নত করতে চরিত্রের গতিবিধির সাথে মিল রাখতে ক্যামেরাটি ব্যবহার করুন।

গত বছর যখন গুগলের ভিও ৩ ভিডিও মডেলটি জনপ্রিয় হয়ে ওঠে, তখন প্রথম-ব্যক্তির দৃষ্টিভঙ্গি গল্প বলা একটি জনপ্রিয় ট্রেন্ড ছিল। এখন, সিড্যান্স ২.০ এর সাথে, অসংখ্য জনপ্রিয় বৈশিষ্ট্য রয়েছে। এই ধরণের ভিডিও, যা গেমের দৃষ্টিভঙ্গি, ভিজ্যুয়াল এবং চরিত্রের ধারাবাহিকতাকে একত্রিত করে, ব্ল্যাক মিথ থেকে সান উকংকে জীবন্ত করে তোলার মতো।

▲চরিত্রটির পিছনের দৃশ্য @ছবি ১-এ, সামনের দৃশ্য @ছবি ২-এ এবং মুখের বিবরণ @ছবি ৩-এ উল্লেখ করা হয়েছে। চরিত্রটি "ব্ল্যাক মিথ: উকং" গেমে প্রবেশ করে এবং এরলাং শেন ইয়াং জিয়ানের সাথে লড়াই করে। দৃশ্য, অ্যাকশন, স্পেশাল এফেক্ট এবং সঙ্গীত এবং শব্দ প্রভাব @ভিডিও ১-এ উল্লেখ করা যেতে পারে।

আরও মজার বিষয় হলো, আমরা এখানে অডিও রেফারেন্সও ব্যবহার করেছি। আমরা একটি ভিডিও আপলোড করতে পারি, এবং সিড্যান্স ২.০ ভিডিওর সঙ্গীতের ছন্দ এবং মেজাজের উপর ভিত্তি করে ভিজ্যুয়াল তৈরি নিয়ন্ত্রণ করবে। হিট গানের উচ্চারণ ক্যামেরা কাটের সাথে মিলে যায়, এবং স্ট্রিংগুলির ক্রিসেন্ডো অ্যাকশনের ত্বরণের সাথে মিলে যায়।

এটিই প্রথমবারের মতো যখন ভিডিও জেনারেশন মডেলে শব্দ অন্তর্ভুক্ত করা হয়েছে, যা একটি পৃথক পোস্ট-প্রোডাকশন ব্যাকগ্রাউন্ড মিউজিক থেকে AI ভিডিও স্টোরিটেলিং-এর একটি গুরুত্বপূর্ণ অংশে রূপান্তরিত হয়েছে।

এটি এমন কিছু যা দেখার জন্য অধীর আগ্রহে অপেক্ষা করতে হবে; চীনা নববর্ষ উদযাপনের জন্য বাড়ি ফিরে আসার একটি নাটকীয় দৃশ্য মুহূর্তের মধ্যেই ফুটে উঠতে পারে।

রেফারেন্স ক্ষমতার সবচেয়ে বড় মূল্য হল ব্যবহারিক সৃজনশীল সমস্যা সমাধান করা, এবং রেফারেন্স ক্ষমতার উল্লেখযোগ্য বৃদ্ধি মৌলিক মডেলিং ক্ষমতার উন্নতির জন্য দায়ী

আমরা Seedance 2.0-কে একটি প্রথম ফ্রেম ইমেজ এবং কিছু প্রম্পট দেওয়ার চেষ্টা করেছি যা সাধারণত অন্যান্য ভিডিও জেনারেশন মডেলগুলিতে ব্যবহৃত হয়, এবং ফলাফল প্রত্যাশানুযায়ীই ছিল।

▲ছবি ১-এ ক্যামেরাটি যুবকটির পিছনে পিছনে চলছে। নববর্ষের আগের রাতে গ্রামের রাস্তার দৃশ্যপটে, যেখানে মৃদু রাস্তার আলো জ্বলছে, কেবল বাতাসের শব্দ এবং তুষারপাতের মধ্য দিয়ে টেনে নিয়ে যাওয়ার জন্য স্যুটকেসের চাকার "গর্জন" শোনা যাচ্ছে। হাঁটতে হাঁটতে সে খুব ক্লান্ত হয়ে পড়েছিল, তাই সে তার হিমায়িত হাত ঘষতে থামল এবং সাদা নিঃশ্বাসের একটি ফোঁটা (ক্লোজ-আপ) ছাড়ল। তার চোখ "অবশেষে পৌঁছেছি" এর ক্লান্তি এবং বাড়ি ফিরে আসার আতঙ্ক প্রকাশ করছিল।
সে এক কোণে ঘুরে দাঁড়ালো, আর ক্যামেরা তার পিছু পিছু এলো। দূরে, লাল স্তবক দিয়ে সাজানো একটা বড় লোহার গেট দেখা গেল, যার ফাটল দিয়ে সোনালী আলো জ্বলছে। ঠিক সেই মুহূর্তে, দূরে বিক্ষিপ্তভাবে আতশবাজির শব্দ হতে শুরু করল। সে তার গতি ত্বরান্বিত করল এবং ভারী লোহার গেটটি ঠেলে খুলে দিল।
যে মুহূর্তে সে দরজাটা ঠেলে খুলল, ক্যামেরাটা তার কাঁধের উপর দিয়ে উঠোনে ঢুকল। উঠোনটা লাল লণ্ঠনে ভরে গেল। একটা বেড়া কুকুর উত্তেজিতভাবে এগিয়ে এলো, আর তারপর রান্নাঘরের পর্দাটা তুলে দেখা গেল, তার মা একটা বাষ্পীভূত বাঁশের স্টিমার নিয়ে যাচ্ছেন; বাষ্প মুহূর্তেই লেন্সের ধারগুলো ঝাপসা করে দিল। লণ্ঠন ঝুলানো তার বাবা ঘুরে তাকে দেখতে পেলেন, এক মুহূর্তের জন্য থেমে; সিঁড়িতে দাঁড়িয়ে তিনি শান্ত থাকার ভান করলেন: "আরে? তুমি এখনই এখানে কেন আসছো? আমরা কি পাঁচটা বাজে বলিনি?" তার মা স্টিমার নামিয়ে দৌড়ে এসে তার উপর থেকে তুষার ঝেড়ে দিলেন: "বুড়ো, তুমি অনেক কথা বলছো! —তুমি ঠান্ডা হচ্ছো না? ভেতরে এসো, সদ্য রান্না করা শুয়োরের মাংসের নাকল আছে!"
ক্যামেরা আর তার পিছনের দিকে না গিয়ে, তার সামনের দিকে ঘুরে তার অভিব্যক্তি ধারণ করল। তার মুখ, যা জমে শক্ত হয়ে গিয়েছিল, উঠোনের উষ্ণতা এবং আলোয় আলোকিত হয়ে উঠল, এবং তার চোখ দিয়ে জল গড়িয়ে পড়ল, কিন্তু সে হাসল।

প্রাথমিক দৃশ্য যেখানে স্যুটকেস এবং হ্যান্ডব্যাগটি সম্পূর্ণরূপে উপেক্ষা করা হয়েছে তা বাদ দিয়ে, পুরো প্রক্রিয়াটি একটি ধারাবাহিক শটে চিত্রায়িত করা হয়েছিল এবং চরিত্রগুলির মুখের ভাব এবং নড়াচড়াও সুনিয়ন্ত্রিত ছিল। আমরা কেবল একটি প্রতিকৃতি ভিডিও থেকে একটি স্ক্রিনশট আপলোড করেছি এবং সিড্যান্স 2.0 কে এর ব্যাক ভিউ ব্যবহার করতে বলেছি, এবং এটি সরাসরি চীনা নববর্ষে বাড়ি ফিরে যাওয়ার বিষয়ে একটি সুন্দর-সুদর্শন শর্ট ফিল্ম তৈরি করতে সক্ষম হয়েছে।

প্রচুর পরিমাণে প্রম্পট ছাড়াই, Seedance 2.0 এর সৃজনশীলতা এবং গল্প সমাপ্তির ক্ষমতা আরও উন্নত করা হয়েছে । আমরা কেবল লা লা ল্যান্ডের একটি স্টাইলাইজড ছবি আপলোড করেছি এবং প্রম্পটটি প্রবেশ করিয়েছি: "@image 1 এর উপর ভিত্তি করে একটি আনন্দদায়ক মিউজিক্যাল ভিডিও তৈরি করুন"।

Seedance 2.0 মনে হচ্ছে এটি সক্রিয়ভাবে তীব্রতা বৃদ্ধি করে। এই নাচের ভিডিওটির জটিলতা শীতকালীন অলিম্পিকে জোড়া ফিগার স্কেটিং প্রতিযোগিতায় আমি যা দেখেছিলাম তার মতোই। আমার প্রম্পটে কোনও রেফারেন্স ভিডিও বা নির্দিষ্ট গতিবিধির নির্দেশাবলী অন্তর্ভুক্ত ছিল না; এটি কেবল একটি দুর্দান্ত গান এবং নাচের ভিডিও তৈরির জন্য মডেলের নিজস্ব সৃজনশীল প্রজন্মের ক্ষমতার উপর নির্ভর করেছিল।

কিছু নেটিজেন তাদের সৃজনশীলতা ব্যবহার করে লিগ অফ লেজেন্ডস: ব্যাটল অফ দ্য টুইন সিটিস-এর দ্বিতীয় সিজনের চরিত্রগুলিকে ব্যবহার করে ৩৮ সেকেন্ডের একটি ছোট ভিডিও তৈরি করেছেন।

▲বাইটড্যান্সের স্ব-উন্নত ভিডিও জেনারেশন মডেল সিড্যান্স ২.০ দ্বারা তৈরি, উৎস: X@NACHOS2D_

এআই ভিডিওতে কালো মিথের মুহূর্ত

বাইটড্যান্সের ভিডিও জেনারেশন মডেল সিড্যান্স ২.০-এর অসাধারণ সাফল্য আমাকে এমন অনুভূতি দিয়েছে যেন আমি আবার বসন্ত উৎসবে ফিরে এসেছি যখন সোরা চালু হয়েছিল। শুধুমাত্র এবারই, ভিডিও মডেলটি কেন্দ্রবিন্দুতে আসছে চীন থেকে।

এটি অভিজ্ঞতা লাভের পর, ব্ল্যাক মিথের প্রযোজক ফেং জি, মধ্যরাতে সরাসরি বলেছিলেন, "AIGC ভিডিও প্রজন্মের শৈশব আনুষ্ঠানিকভাবে শেষ হয়ে গেছে।" পূর্ববর্তী পরীক্ষাটি পড়ার পরে, আপনি দেখতে পাবেন যে এটি আসলেই একটি মোটামুটি বস্তুনিষ্ঠ মূল্যায়ন।

এক অর্থে, সিড্যান্স ২.০ কে এআই ভিডিওর জন্য "ব্ল্যাক মিথ" মুহূর্ত হিসেবে বিবেচনা করা যেতে পারে । "ব্ল্যাক মিথ: উকং" যেমন প্রমাণ করেছে যে চীন এএএ গেম তৈরি করতে পারে, তেমনি সিড্যান্স ২.০ এখন এআই ভিডিও ক্ষেত্রে বিশ্বব্যাপী স্বীকৃতি অর্জন করেছে।

যদি গত বছরের সোরা ২ এআই ভিডিওর ক্ষেত্রে "চাঁদে অবতরণ" মুহূর্ত ছিল, তাহলে আজকের সিড্যান্স ২.০ আপনার দোরগোড়ায় একটি মহাকাশযান নিয়ে আসার এবং আপনাকে চাবি দেওয়ার মতো, যার ফলে আপনি বাজারে "পৃথিবীর সবচেয়ে শক্তিশালী" জিনিসটি সহজেই পেতে পারেন।

সিড্যান্স ২.০ কোনও মিথ তৈরি করেনি; এটি কেবল একটি দৃঢ় বিবর্তনের প্রতিনিধিত্ব করে। এটি ভিডিও তৈরির ক্ষেত্রে প্রবেশের বাধা কমিয়েছে এবং একই সাথে নিয়ন্ত্রণের সীমাও বাড়িয়েছে। এই মুহুর্তে, আমাদের দূর ভবিষ্যতের বিষয়ে অতিরিক্ত আশাবাদী হওয়া উচিত নয়, বরং আরও ভালো গল্প বলার জন্য এই ক্রমবর্ধমান পরিশীলিত সরঞ্জামগুলিকে কীভাবে কাজে লাগানো যায় তা বিবেচনা করার জন্য এটিকে একটি সূচনা বিন্দু হিসাবে ব্যবহার করা উচিত।

সিড্যান্স ২.০ এর "সর্বত্র" এবং "প্রবেশে কম বাধা" হল এর সবচেয়ে মূল্যবান বৈশিষ্ট্য।

"কিল দ্য গেম"-এর এটাই সম্ভবত সেরা ব্যাখ্যা—এটা গেমটি শেষ করেনি, বরং আরও বড় একটি নতুন গেম শুরু করেছে। যখন প্রযুক্তি আর বাধা থাকবে না, তখন আসল প্রতিযোগিতা আবার তার মূলে ফিরে আসবে: যারা ভালো গল্প বলতে পারে এবং একটি অনন্য নান্দনিকতা রাখে তারা অভূতপূর্ব সুবিধা পাবে।

▲চলচ্চিত্র এবং টেলিভিশনের উপর AI-এর প্রভাব অন্বেষণকারী একটি ম্যাককিনসির প্রতিবেদনে উল্লেখ করা হয়েছে যে AI বিষয়বস্তু পাঁচ বছরের মধ্যে $60 বিলিয়ন কন্টেন্ট ইকোসিস্টেম বাজারকে পুনর্বণ্টন করতে পারে | লিঙ্ক: https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/what-ai-could-mean-for-film-and-tv-production-and-the-industrys-future#/

ছোট স্টুডিও এবং স্বাধীন নির্মাতাদের উচ্চমানের কন্টেন্ট তৈরির সুযোগ ক্রমশ বাড়ছে এবং ৬০ বিলিয়ন ডলারের এআই কন্টেন্ট শিল্পের মূল্য পুনর্বণ্টন করা হবে। পেশাদার এবং অপেশাদারদের মধ্যে সীমানা ধীরে ধীরে ঝাপসা হয়ে আসছে, এবং আমরা নিজেদেরকে "এআই কী করতে পারে" এর পরিবর্তে "আমাদের কী করা উচিত" জিজ্ঞাসা করতে শুরু করছি।

এবার সিড্যান্সের শক্তিশালী পারফরম্যান্স আমাদের দেখিয়েছে যে এর সোরা ২-এর চেয়েও শক্তিশালী অডিও এবং ভিডিও প্রভাব রয়েছে। বাস্তব জগতের ভৌত আইন হোক বা চরিত্রগুলির সূক্ষ্ম আবেগ এবং জটিল গতিবিধি, সিড্যান্স ২.০ কে বর্তমানে সেরা মডেল বলা যেতে পারে।

কিন্তু যখন AI ভিডিওগুলি এত বাস্তবসম্মত হয়ে ওঠে, তখন Seedance মনে হয় Sora-এর মতো একই সমস্যাগুলি এড়াতে পারে না। বাস্তবতা হল Seedance 2.0-এর বিটা টেস্টিং অবিশ্বাস্যভাবে জনপ্রিয়, অনেক বিদেশী নির্মাতারা অ্যাক্সেস কোডের অভাব সম্পর্কে অভিযোগ করেছেন। তবে, যেহেতু উৎপন্ন প্রভাবগুলি এত বাস্তবসম্মত, এটি ইতিমধ্যেই "AI ভিডিও জাল" সম্পর্কে যথেষ্ট নীতিগত আলোচনার জন্ম দিয়েছে।

এই বছর AI-এর বিবর্তন বিভ্রান্তিকর, এবং Seedance 2.0-এর জনপ্রিয়তা অবশ্যই জিমেং-এর প্রত্যাশাকে ছাড়িয়ে গেছে। জিমেং দ্রুত এই বিতর্কগুলির জবাব দেন।

৯ তারিখে অনলাইনে খবরটি ভাইরাল হওয়ার দিন, জিমেং-এর অপারেশন টিম ক্রিয়েটর কমিউনিটিতে একটি অফিসিয়াল নোটিশ প্রকাশ করে, যেখানে রিয়েল-পারসন ফেসিয়াল ডেটা এবং ভিডিও জেনারেশনের ব্যবহারে সাময়িক নিষেধাজ্ঞা ঘোষণা করা হয় । বর্তমানে, অনলাইনে প্রচারিত কিছু রিয়েল-পারসন কেস প্রাথমিক বিটা পরীক্ষার সময় তৈরি করা হয়েছিল।

▲JiMeng AI APP-এর মধ্যে "চেহারা" ফাংশন ব্যবহারকারীদের AI অবতার তৈরি করার পরে লাইভ-অ্যাকশন ভিডিও তৈরি করতে দেয়।

তবে, যদি কোনও প্রকৃত ব্যক্তি ক্যামেরার সামনে উপস্থিত হতে চান, তাহলে তারা জিমেং এআই অ্যাপের মধ্যে "ক্যামেরায় উপস্থিত" ফাংশনটি ব্যবহার করে প্রকৃত ব্যক্তি যাচাইকরণ প্রক্রিয়াটি সম্পন্ন করতে পারেন এবং তারপরে এআই-জেনারেটেড প্রকৃত ব্যক্তির ভিডিওটি উপভোগ করতে পারেন।

একটি হাতিয়ার যত বেশি শক্তিশালী, তার ব্যবহারের সীমানা তত স্পষ্ট হওয়া দরকার। কিন্তু এখন, নিখুঁত উত্তর খুঁজে বের করার আগে, আমরা যা করতে পারি তা হল প্রথমে এই হাতিয়ারটি দিয়ে আমরা কী করতে চাই তা বের করা: জীবন রেকর্ড করা, সৃজনশীলতা প্রকাশ করা, নাকি গল্প বলা?

যদি এডওয়ার্ড ইয়াং "ইয়ি ইয়ি" তে বলেছিলেন যে "চলচ্চিত্রের আবিষ্কার আমাদের জীবনকে তিনগুণ বৃদ্ধি করেছে," তাহলে এআই-উত্পাদিত চলচ্চিত্রের আবিষ্কার জীবনের পুনর্গঠনের সূচনার মতো। আমরা আর কেবল সম্প্রসারণেই সন্তুষ্ট নই; প্রত্যেকেই তাদের নিজস্ব গল্পের চিত্রনাট্যকার হতে পারে, অসীম আখ্যানে অন্য ধরণের জীবন অন্বেষণ করতে পারে।

সিড্যান্স ২.০ এই সবকিছুকে আরও কাছে আনতে শুরু করেছে, এবং এটি কেবল ২০২৬ সালের শুরু।

*এই প্রবন্ধের ভিডিও অংশটি WeChat প্রবন্ধ লিঙ্কের মাধ্যমে প্রিভিউ করা যাবে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো