কৃত্রিম বুদ্ধিমত্তা এত দ্রুত অগ্রসর হচ্ছে যে বেশির ভাগ AI সহচররা ছবি তৈরি করতে, চ্যাটবট হিসাবে ব্যবহার করতে বা আপনার জন্য গভীর গবেষণা সম্পূর্ণ করতে সক্ষম। যাইহোক, অনেক AI সহচর এখন আপনাকে ভিডিও তৈরি করার অনুমতি দিচ্ছে, তা সরাসরি AI এর মাধ্যমে হোক বা বহিরাগত বোন সফ্টওয়্যারের মাধ্যমে।
AI ভিডিও জেনারেশনের জন্য অনেকগুলি ভিন্ন বিকল্পের সাথে, আমি সেই সবগুলিকে একই প্রম্পট প্রদান করে এবং কোন ভিডিওটি সেরা বের হয় তা দেখে আমি কিছু জনপ্রিয় বিকল্প পরীক্ষা করার সিদ্ধান্ত নিয়েছি। এর মধ্যে রয়েছে Sora পরীক্ষা করা যা Microsoft Copilot- এ ভিডিও তৈরির ক্ষমতা দেয় এবং ChatGPT- এর মালিক OpenAI দ্বারা তৈরি। আমি Grok এবং Google Gemini ব্যবহার করে দেখতে নিশ্চিত ছিলাম।
প্রম্পটের পরিপ্রেক্ষিতে, আমি ঠিক একই প্রম্পটের সাথে সমস্ত কৃত্রিম বুদ্ধিমত্তা সফ্টওয়্যার সরবরাহ করার বিষয়ে নিশ্চিত ছিলাম। ভিডিওটি কতটা বাস্তবসম্মত হবে তা দেখার জন্য আমি নিশ্চিত ছিলাম যে ভিডিওটিতে মানুষ থাকতে চাই, আমি একটি ফোরগ্রাউন্ড এবং একটি পটভূমি চেয়েছিলাম যাতে ভিডিওটিতে কিছু গভীরতা থাকতে পারে।
আমি ভিডিওটির বিষয় তরঙ্গ করার জন্য বলেছিলাম যাতে আমরা দেখতে পারি যে কৃত্রিম বুদ্ধিমত্তার ভিডিও জেনারেটরগুলি হাত এবং আঙ্গুলগুলি কতটা ভালভাবে তৈরি করতে পারে। এআই হ্যালুসিনেশন নামক কিছুর মুখোমুখি হতে পারে যেখানে ভিডিওগুলি অতিরিক্ত বিষয় নিয়ে শেষ হয়।
এখানে আমি কৃত্রিম বুদ্ধিমত্তার সঙ্গীদের দিয়েছিলাম সঠিক প্রম্পট:
একটি ল্যাপটপ ব্যবহার করে একজন ব্যক্তির একটি ভিডিও তৈরি করুন, তিনি একটি অফিসের পরিবেশে আছেন এবং তার পিছনে লোকজন আছে। তারপরে তিনি ক্যামেরার দিকে তাকায় এবং তার মুখে হাসি নিয়ে এটির দিকে দোলা দেয়। প্রথমে মেজাজ টানটান থাকলেও পরে ক্যামেরার দিকে তাকিয়ে হাসলে একটু বেশি রিল্যাক্স হয়ে যায়।
পারফরম্যান্সের ক্রম অনুসারে উপরের প্রম্পট থেকে ফলাফলগুলি এখানে রয়েছে:
3. সোরা (ChatGPT এবং Microsoft Copilot)
সোরা হল OpenAI এর ভিডিও জেনারেশন টুল। যদিও ChatGPT নিজে ভিডিও তৈরি করতে পারে না, কাজটি সম্পন্ন করার জন্য এটি আপনাকে সোরাতে ফরওয়ার্ড করবে। মাইক্রোসফ্ট কপিলট আপনাকে এর ইন্টারফেসের মধ্যে ভিডিও তৈরি করতে দেয় তবে এটি সোরা দ্বারা চালিত হয়। Sora ব্যবহার করার জন্য, তা সরাসরি প্ল্যাটফর্মে হোক বা Microsoft Copilot এর মাধ্যমে, আপনার একটি প্রিমিয়াম সাবস্ক্রিপশন থাকতে হবে যা আপনাকে তাদের যেকোনো একটির জন্য মাসে $19.99 ফেরত দেবে।
আমি সরাসরি সোরাতে এই ভিডিওটি তৈরি করেছি এবং ফলাফল নিয়ে আমি বেশ হতাশ ছিলাম। ভিডিওটি আশ্চর্যজনক মানের এবং ফোকাসের মধ্যে বিষয় এবং ব্যাকগ্রাউন্ড ফোকাসের বাইরে থাকায় খুব বাস্তবসম্মত দেখায় তবে কী চলছে তা এখনও পরিষ্কার।
যাইহোক, সেটিং এবং ভাইব সঠিক থাকলেও, বিষয়টি আসলে আমি যা অনুরোধ করেছি তা করে না যার অর্থ এটি সম্পূর্ণরূপে চিহ্নটি মিস করেছে। এর পাশাপাশি, ভিডিওর শুরুতে বিষয়বস্তুটি আসলে তার ল্যাপটপের স্ক্রীনের দিকে তাকাচ্ছে বলে মনে হচ্ছে না কিন্তু এটি অতীতের দিকে তাকিয়ে আছে।
এই ভিডিওটি কতটা উচ্চ মানের হওয়া সত্ত্বেও, প্রম্পটটি অনুসরণ করা হয়নি তা বিবেচনা করে এটিকে এখানে মুকুট প্রদান করা কঠিন।
2. গ্রোক
Grok ভিডিও বিচার করার আগে, লক্ষণীয় কিছু হল যে Grok হল একমাত্র AI ভিডিও জেনারেশন টুল যা বিনামূল্যে ব্যবহারের জন্য উপলব্ধ। ভিডিও তৈরি করার জন্য আপনার একটি অ্যাকাউন্টের প্রয়োজন হলে, এটি একটি অর্থপ্রদানের সদস্যতা হতে হবে না।
ভিডিওটি খুব ভালোভাবে প্রম্পট অনুসরণ করেছে, যার প্রেক্ষাপট এবং ভাইব পরিষ্কারভাবে অফিসের পরিবেশে রয়েছে। বিষয় ক্যামেরা এবং তরঙ্গের দিকে দেখায় এবং সঠিক পরিমাণে আঙ্গুল আছে কিন্তু আপনি খুব সংক্ষিপ্তভাবে সেগুলিকে দেখতে পাবেন। একটি বিষয় লক্ষণীয় যে আমি মনে করি এটি বেশ পরিষ্কার যে ভিডিওটি একটি অদ্ভুত স্মুথিং ফিল্টারের জন্য তৈরি করা হয়েছে যা ভিডিওটির উপরে রাখা হয়েছে।
এই ভিডিওটি আমার তৈরি করা সেরা না হওয়া সত্ত্বেও, এটিই একমাত্র ভিডিও যা আমি বিনামূল্যে তৈরি করতে পেরেছিলাম৷ সর্বোপরি এটি একমাত্র আমি বিনামূল্যে তৈরি করতে পারি, এটি এখনও একটি বিকল্পের চেয়ে ভাল ছিল – সোরা – কারণ এটি আসলে প্রম্পট অনুসরণ করে।
1. Veo 3 (গুগল মিথুন)
Google Gemini-এর সাথে একটি ভিডিও তৈরি করার জন্য, আপনাকে Veo 3 অ্যাক্সেস করতে হবে। এক মাসের বিনামূল্যের ট্রায়াল উপলব্ধ সহ Veo 3 ব্যবহার করার জন্য আপনাকে অর্থপ্রদান করতে হবে, কিন্তু গ্রাহকদের অর্থপ্রদানের জন্য আপনাকে $19.99 ফেরত দিতে হবে। আপনি একবার অর্থপ্রদানকারী গ্রাহক হয়ে গেলে, তারপরে আপনি আপনার জন্য ভিডিও তৈরি করতে জেমিনিকে বলতে পারেন৷
Veo 3 দ্বারা তৈরি করা ভিডিওটি এখানে খুব স্পষ্টভাবে উপরে ছিল। ভিডিওটি অত্যন্ত উচ্চ মানের ছিল যার পটভূমি ফোকাসের বাইরে ছিল এবং বিষয় স্পষ্টভাবে ফ্রেম এবং ফোকাসে ছিল। তার ল্যাপটপ ব্যবহার করার সময় তাকে খুব উত্তেজনাপূর্ণ এবং ফোকাস করার সাথে সাথে প্রম্পটের উপর ভিত্তি করে ভাইব এবং সেটিং স্পট ছিল কিন্তু ক্যামেরার দিকে তাকালে হাসিমুখে এবং খুশি দেখায়।
তিনি যখন ক্যামেরার দিকে ঢেউ তোলেন, তখন হাত এবং আঙ্গুলগুলোকে খুব বাস্তবসম্মত দেখায়, কোনো সমস্যা বা হ্যালুসিনেশন ছাড়াই। এই ক্লিপটি সরাসরি একটি বিপণন ভিডিও বা টিভিতে একটি বিজ্ঞাপনের ক্লিপ হতে পারে, ধন্যবাদ এটি কতটা বাস্তবসম্মত ছিল এবং এটি কতটা ভালভাবে প্রম্পট এবং নির্দেশনা অনুসরণ করেছিল৷
Veo 3কে এখানে মুকুট নিতে হবে, কোন সমস্যা ছাড়াই সেরা, পরিষ্কার ভিডিও সহ। যাইহোক, Grok এখনও একটি দুর্দান্ত ভিডিও তৈরি করেছে এবং যারা AI টুলের জন্য অর্থপ্রদান করতে চান না তাদের জন্য এটি একটি দুর্দান্ত বিকল্প তৈরি করে সম্পূর্ণ বিনামূল্যে।