এখন, যখনই কোনো কোম্পানি একটি ভিডিও মডেল প্রকাশ করে, সেটিকে অনিবার্যভাবে সিড্যান্স ২.০-এর সঙ্গে তুলনা করা হয়।
গুগল, যা সম্প্রতি তুলনামূলকভাবে নীরব ছিল, ভিডিও তৈরির জগতে নিজের সিংহাসন পুনরুদ্ধারের জন্য নীরবে একটি বড় পদক্ষেপের প্রস্তুতি নিচ্ছে বলে মনে হচ্ছে।
আজ ভোরবেলা, একজন নেটিজেন ভুলবশত মিথুন রাশিতে একটি একেবারে নতুন ভিডিও তৈরির মডেল চালু করে ফেলেছেন – অমনি (সর্বগুণসম্পন্ন)।
জেমিনি চ্যাট পেজে সরাসরি প্রদর্শিত হয়, "জেমিনি অমনি দিয়ে তৈরি করুন এবং আমাদের একেবারে নতুন ভিডিও তৈরির মডেলটি সম্পর্কে জানুন। আপনার ভিডিও রিমিক্স করুন, সরাসরি চ্যাটে সম্পাদনা করুন, প্রচুর টেমপ্লেট ব্যবহার করে দেখুন এবং আরও অনেক কিছু।"

▲মিথুন রাশির অপ্রত্যাশিত অ্যাক্সেস পাওয়ার স্ক্রিনশট
তবে, এই নেটিজেন জানিয়েছেন যে, তিনি যখন জেমিনি অ্যাপটি পুনরায় খোলেন, তখন শুধু অমনি ফিচারটিই চলে যায়নি, বরং জেমিনি ইন্টারফেসটিও পুরোনো সংস্করণে ফিরে গিয়েছিল।
এখন পর্যন্ত ফাঁস হওয়া প্রাথমিক পরীক্ষার ফলাফলের ভিত্তিতে, জেমিনি অমনি নির্দিষ্ট কিছু পরিস্থিতিতে বেশ ভালো পারফর্ম করে, যা একসময় ইমেজ জেনারেশনে ন্যানো ব্যানানার আধিপত্যের কথা মনে করিয়ে দেয়।
প্রকাশিত দুটি টেস্ট কেসে দেখা গেছে, ন্যানো ব্যানানা যেমন টেক্সট রেন্ডারিংয়ের সমস্যার সমাধান করে, ঠিক তেমনি জেমিনি অমনিও পূর্ববর্তী এআই ভিডিও জেনারেশনের দুটি বড় প্রতিবন্ধকতা— টেক্সটের সামঞ্জস্য এবং মানুষের খাওয়ার শারীরিক যুক্তি— সমাধান করে।
▲ ভিডিও উৎস: X@chetaslua|প্রম্পট শব্দ: একজন অধ্যাপক একটি প্রচলিত ব্ল্যাকবোর্ডে ত্রিকোণমিতিক অভেদসমূহের একটি গাণিতিক প্রমাণ লিখছেন এবং সমীকরণটির কোন ধাপে তিনি বর্তমানে আছেন তা ব্যাখ্যা করছেন।
এই ১০-সেকেন্ডের ভিডিওটিতে ব্ল্যাকবোর্ডে জটিল গাণিতিক সমীকরণ লেখার একটি চ্যালেঞ্জ রয়েছে এবং এতে একটিই নির্দেশনা দেওয়া আছে: "একজন অধ্যাপক একটি প্রচলিত ব্ল্যাকবোর্ডে একটি ত্রিকোণমিতিক অভেদের গাণিতিক প্রমাণ লেখেন এবং সমীকরণটিতে তিনি বর্তমানে যে ধাপগুলো অনুসরণ করছেন তা ব্যাখ্যা করেন।"
যদিও ফুটেজটিতে এআই দ্বারা তৈরি কিছু ছোটখাটো ত্রুটি এখনও চোখে পড়ে, পুরো ভিডিওটি ব্ল্যাকবোর্ডের 'টেক্সট' কন্টেন্টকে নিখুঁতভাবে সামলেছে, যা অতীতে অনেক ভিডিও মডেলে একটি বড় বাগ ছিল। এছাড়াও, ভিডিওটির সামগ্রিক বাস্তবতাও বেশ জোরালো।
নেটিজেনরা ভিডিওটিকে 'অত্যন্ত উদ্ভট' বলে প্রতিক্রিয়া জানিয়েছেন এবং এআই সুপার-ক্রিয়েশন ব্লগার @Azed_ai ভিডিওটির নিচে মন্তব্য করেছেন, "যদি এটাই আসল আউটপুট হয়, তাহলে লেখার সামঞ্জস্য সত্যিই অবিশ্বাস্য।"

▲ ভিডিও ফাইলের লিঙ্ক: https://gemini.google.com/share/7d5dc678c80a
কিছু নেটিজেন ভিডিওটির উৎস নিয়ে প্রশ্ন তুলেছেন এবং তাদের মতে এটি হয়তো জেমিনি অমনি তৈরি করেনি, কারণ যে ব্লগার খবরটি প্রথম প্রকাশ করেন, তিনি সরাসরি জেমিনির একটি অফিশিয়াল লিঙ্ক পোস্ট করেছিলেন।
আমরা একই প্রম্পটগুলো দিয়ে সিড্যান্স ২.০ পরীক্ষা করে দেখেছি, এবং এর ভিজ্যুয়ালগুলোর বাস্তবতা প্রশংসনীয় ছিল। তবে, ব্ল্যাকবোর্ডে লেখা বিষয়বস্তুর সাথে ত্রিকোণমিতিক অভেদগুলোর তেমন কোনো সম্পর্ক আছে বলে মনে হয়নি, এবং ব্ল্যাকবোর্ডে লেখাগুলো প্রদর্শিত হওয়ার ক্ষেত্রেও কিছু সমস্যা ছিল।
▲সিড্যান্স ২.০ দ্বারা তৈরি
ফাঁস হওয়া আরেকটি ভিডিও হলো "উইল স্মিথের স্প্যাগেটি খাওয়ার" প্রতি একটি শ্রদ্ধাঞ্জলি, এবং এই টেস্ট কেসটি প্রায় সকল ভিডিও জেনারেশন মডেলের জন্য অন্যতম অপরিহার্য প্রম্পটে পরিণত হয়েছে।
▲ উৎস: Reddit@Zacatac_391|প্রম্পট শব্দ: আপনি কি সমুদ্রের ধারে একটি অভিজাত রেস্তোরাঁর বাইরের ডেক সিটিং-এ একটি টেবিলে বসে থাকা দুজন পুরুষের একটি দৃশ্য তৈরি করতে পারেন? তারা একটি গোলাকার টেবিলে বসে আছেন, যেটিতে একটি সুন্দর সাদা টেবিল ক্লথ পাতা আছে এবং সাথে রয়েছে সব জমকালো সরঞ্জাম—চামচ, কাঁটাচামচ ও ছুরি, সুন্দর ন্যাপকিন এবং টেবিলের মাঝখানের সজ্জা। একজন পুরুষ হলেন পঞ্চাশোর্ধ একজন পরিণত আফ্রিকান-আমেরিকান, যার ছোট দাড়ি ও আত্মবিশ্বাসী ভঙ্গিমা এবং তিনি একটি মানানসই, অভিজাত স্যুট পরে আছেন। অন্যজন তার বন্ধু, দুজনেই এক প্লেট স্প্যাগেটি খাওয়ার জন্য টেবিলের দিকে এগিয়ে আসছেন। শুরুতে পুরুষেরা টেবিলের কাছে এসে সংক্ষিপ্ত সৌজন্য বিনিময় করেন এবং খাওয়ার ফাঁকে ফাঁকে কথা বলতে বলতে শান্তভাবে স্প্যাগেটি খেতে শুরু করেন।
যে পরীক্ষক আগেভাগে অ্যাক্সেস পেয়েছিলেন, তিনি বলেছেন যে যখন তিনি পরীক্ষাটিতে "উইল স্মিথ স্প্যাগেটি" টাইপ করার চেষ্টা করেন, তখন গুগলের কন্টেন্ট তৈরির সুরক্ষাবলয়ের কারণে তিনি সীমাবদ্ধ হয়ে পড়েন, তাই তিনি এমন একজনের বর্ণনা দেন যিনি দেখতে অনেকটাই উইল স্মিথের মতো।
জেমিনি অমনি দ্বারা তৈরি ভিডিওটি গুগলের নিজস্ব ভিডিও তৈরির মডেল, ভিও ৩.১-এর চেয়ে উন্নত এবং শব্দ ও ছবির মানের দিক থেকে একজন আসল মানুষের মতো দেখায়।
তবে, কিছু নেটিজেন লক্ষ্য করেছেন যে, তাঁরা যখন দাঁড়িয়ে ছিলেন তখন প্লেটে কোনো পাস্তা ছিল না, কিন্তু বসার পর তা দেখা যায়। এরপর, যখন তাঁরা খাচ্ছিলেন, তখন একটুও খাওয়ার আগেই পাস্তাটি উধাও হয়ে যায়।
আমরা এই প্রম্পট সেটটি প্রসেস করার জন্য সিড্যান্সও ব্যবহার করেছি, এবং যখন আমরা এটি খেলাম, তখন ফলাফলটি জেমিনি অমনির চেয়ে অনেক বেশি স্বাভাবিক ছিল।
▲ সিড্যান্স ২.০ দ্বারা তৈরি | প্রম্পট: আপনি কি কল্পনা করতে পারেন, দুজন পুরুষ একটি অভিজাত সমুদ্রতীরবর্তী রেস্তোরাঁর বাইরের টেবিলে বসে খাচ্ছেন? তাঁরা একটি গোল টেবিলের চারপাশে বসে আছেন, যা একটি ধবধবে সাদা টেবিলক্লথ দিয়ে ঢাকা। টেবিলটি চামচ, কাঁটাচামচ, ছুরি, সুন্দর ন্যাপকিন এবং মাঝখানে একটি সজ্জাসহ চমৎকার সব কাটলারি দিয়ে সাজানো। তাঁদের মধ্যে একজন নিখুঁতভাবে পোশাক পরেছেন: পঞ্চাশোর্ধ একজন পরিণত ও শান্ত আফ্রিকান আমেরিকান পুরুষ, যাঁর ছোট দাড়ি, একটি মানানসই স্যুট পরা এবং যাঁর মধ্যে থেকে আত্মবিশ্বাস ঠিকরে বেরোচ্ছে। অন্যজন তাঁর বন্ধু; দুজনই এক প্লেট পাস্তা উপভোগ করতে টেবিলে এসেছেন। প্রথমে তাঁরা শান্তভাবে পাস্তা খাওয়ার আগে কিছু সাধারণ সৌজন্য বিনিময় করেন এবং মাঝে মাঝে হালকা কথাবার্তায় অংশ নেন।
রেডিটে একজন ব্যবহারকারী প্রশ্ন করেছিলেন যে তিনি সর্বশেষ ভিডিও জেনারেশন মডেলটি ব্যবহার করেছেন কিনা। পরীক্ষক জানান যে, তার ব্যবহার করা সেরা মডেলটি ছিল ক্লিঙ ৩.০।
একজন নেটিজেন উত্তর দিয়েছেন যে সিড্যান্স ২.০, ক্লিঙ ৩.০-এর চেয়ে অনেক ভালো, তাই জেমিনি অমনি-র পারফরম্যান্স আমার কাছে আশ্চর্যজনক নয় (আমি নিজে সিড্যান্স ২.০ ব্যবহার করেছি)।
অন্যদিকে, কিছু নেটিজেন মনে করেন যে জেমিনি অমনি, সিড্যান্স ২.০-এর চেয়ে ভালো পারফর্ম করে।

▲ এক্স-এর অনেক নেটিজেন এই পর্দাফাঁস করা ভিডিওগুলো শেয়ার করে বলেছেন, এগুলো সিড্যান্স-এর চেয়েও বেশি কার্যকর ছিল।
আরও আশ্চর্যের বিষয় হলো, গুগল এবার শুধু ভিডিও তৈরির কার্যকারিতাই চালু করেনি, বরং জেমিনি অমনি ভিডিও সম্পাদনার বৈশিষ্ট্যও সমর্থন করে।
উদাহরণস্বরূপ, আপনি মূল ভিডিওর পাস্তার পরিবর্তে টম ইয়ামের মতো দেখতে এক বাটি থাই-ধাঁচের স্যুপ রাখতে পারেন।

এটি দিয়ে আগে থেকে তৈরি করা ওয়াটারমার্কযুক্ত সোরা ভিডিওগুলো থেকে ওয়াটারমার্ক মুছে ফেলাও যায়।


▲ভিডিও সূত্র: X@Waguri_Kaoruko8
পরীক্ষার ফলাফলের ভিত্তিতে, জেমিনি অমনি মূল সোরা ভিডিওর সাথে মৌলিক সামঞ্জস্য বজায় রেখে, ভিডিওটি থেকে ক্রমাগত চলমান সোরা ওয়াটারমার্কটি সফলভাবে অপসারণ করেছে।
কিছু নেটিজেন অ্যানিমেটেড ভিডিও তৈরিতে জেমিনি অমনি-র পারফরম্যান্সও পরীক্ষা করেছেন।
মূল ন্যানো ব্যানানার মতো, যা মূলত ছবি সম্পাদনার উপর মনোযোগ দিত এবং ব্যবহারকারীদের বিভিন্ন ডেস্কটপ ফিগারিন তৈরি করার সুযোগ দিত, অনেকেই মনে করেন যে জেমিনি অমনিও একই পথ অনুসরণ করবে। যদিও এর ভিডিও তৈরির ক্ষমতা দুর্বল, তবে এর ভিডিও সম্পাদনার ক্ষমতা আরও শক্তিশালী হবে। ধারণা করা হচ্ছে যে, জেমিনি অমনি ৩-এর ভিডিও তৈরির ক্ষমতা এখন পর্যন্ত সেরা হবে।
প্রকাশিত ইন্টারফেসটিতে ব্যবহারের একটি স্ক্রিনশটও ছিল। ডেটা থেকে দেখা যায় যে, মাত্র দুটি ভিডিও—একটি গণিতের হোয়াইটবোর্ড এবং নুডলস খাওয়ার একটি ভিডিও—তৈরি করতেই ব্যবহারকারীর দৈনিক এআই প্রো সাবস্ক্রিপশন সীমার ৮৬% ব্যবহৃত হয়ে গেছে। ব্যবহারকারী উল্লেখ করেছেন যে, তিনি সেদিন শুধু কিছু জেমিনি ফ্ল্যাশ ব্যবহার করেছিলেন।

এআই ভিডিও নিঃসন্দেহে এখনও একটি অত্যন্ত ব্যয়বহুল ব্যবসা, কিন্তু এর ফলাফল যথেষ্ট ভালো হলে এর জন্য অর্থ প্রদানে ইচ্ছুক লোকের অভাব হবে না।
সম্প্রতি অনলাইনে কিছু এআই ভিডিও ভাইরাল হয়েছে, যেগুলোতে গত বছর ভাইরাল হওয়া এআই ভিডিওগুলোর তুলনায় দীর্ঘতর সময়কাল, আরও বাস্তবসম্মত দৃশ্য, সংলাপ, অভিনয় দক্ষতা এবং গল্প বলার ধরণ রয়েছে।
ভিডিও তৈরির প্ল্যাটফর্ম রানওয়ের টেকনিক্যাল আর্টিস্ট মার্কো স্লাভনিক, এক্স-এ রানওয়ে ব্যবহার করে তৈরি পায়রার একটি ভিডিও পোস্ট করেন। রানওয়েতে সিড্যান্স ২.০ মডেল ব্যবহার করা যায় এবং ভিডিওটি দ্রুত লক্ষ লক্ষ ভিউ অর্জন করে।
কিছু নেটিজেন বলেছেন যে ৪৭-সেকেন্ডের ভিডিওটিতে কৃত্রিম বুদ্ধিমত্তা বা অস্বাভাবিক নড়াচড়ার কোনো চিহ্ন দেখা যায়নি, যা থেকে বোঝা যায় যে ডিজনি অ্যানিমেশনকে হয়তো সত্যিই সতর্ক হতে হবে।
▲ ভিডিওর উৎস: X@Markoslavnic
ওয়েইবোতে ট্রেন্ডিং হওয়া আরেকটি বিষয় ছিল "গণহারে নির্মিত এবং ক্র্যাশ করা এআই স্বল্পদৈর্ঘ্য চলচ্চিত্র", যা বাইরের ওয়েবসাইটগুলিতে পুনরায় পোস্ট করার পর ১২ মিলিয়ন ভিউ অর্জন করে।
এই ভিডিওটি যিনি শেয়ার করেছেন, তিনি হলেন পিজে এইস, যিনি জেনারেটিভ এআই ভিডিও ও বিজ্ঞাপনের ক্ষেত্রে একজন নির্মাতা এবং একটি এআই বিজ্ঞাপন সংস্থার প্রতিষ্ঠাতা। তিনি সরাসরি বলেছেন,
সাম্প্রতিক বছরগুলোতে দেখা সেরা স্বল্পদৈর্ঘ্য চলচ্চিত্রগুলোর মধ্যে এটি অন্যতম।
শীঘ্রই আমরা একে আর 'এআই মুভি' বলব না, বরং শুধু একটি সিনেমা বলব।
▲ ভিডিওর উৎস: X@PJaccetturo
মূল ভিডিওটির বিলিবিলি কমেন্ট সেকশনে কিছু নেটিজেন উল্লেখ করেছেন যে, ভিডিওটি খুব জনপ্রিয় হয়েছিল এবং শুধু যে বিদেশ থেকে পিজে এইস তাকে চাকরির প্রস্তাব দিতে চেয়েছিলেন তাই নয়, গুয়াংঝৌ-এর এআই+ ক্রিয়েটিভ টিমও তার দিকে সহযোগিতার হাত বাড়িয়ে দিয়েছিল।
ভিডিওটির প্রশংসাও ছিল প্রচুর: "এটা যদি একটা ট্রেলার হতো, আমি সিনেমা হলে যেতাম," "একটি প্রথম শ্রেণীর কাজ; এর রঙ, বিন্যাস এবং কাহিনী সবই অনবদ্য। কিছুটা ছোট হওয়া ছাড়া, 'লাভ, ডেথ অ্যান্ড রোবটস'-এর যেকোনো সিজনে এটি বেমানান মনে হবে না," "কয়েক বছর আগে, এটি তৈরি করতে একটি শীর্ষস্থানীয় দলের কয়েক মাস এবং লক্ষ লক্ষ টাকা লাগত"…

▲ ভিডিওর উৎস: [এআই-এর মৌলিক স্বল্পদৈর্ঘ্য চলচ্চিত্র "জম্বি ক্লিনার" – রিমাস্টারড সংস্করণ, ঘরোয়া "ভালোবাসা, মৃত্যু ও রোবট"!] https://www.bilibili.com/video/BV1FFRQB2Eqw/
আগের মাসিক চলচ্চিত্র সুপারিশগুলোর মতোই, নেটিজেনরা এখন 'এই মাসের অবশ্য দ্রষ্টব্য চারটি এআই স্বল্পদৈর্ঘ্য চলচ্চিত্র'-এর একটি তালিকা তৈরি করছেন।

এআই-এর ত্রুটিপূর্ণ কাজ হিসেবে সমালোচিত বিষয়বস্তু বাদ দিলে, উৎপাদিত বিষয়বস্তুর মান উন্নত হওয়ার সাথে সাথে এআই ভিডিওর মূলধারার মাধ্যম হয়ে ওঠার প্রবণতা অনিবার্য।
গুগলের জেমিনি অমনি উন্মোচন আগামী সপ্তাহে অনুষ্ঠিতব্য গুগল আই/ও সম্মেলনের জন্য উন্মাদনা তৈরির একটি উপায় হতে পারে। যদি এই বছরের সম্মেলনে জেমিনি অমনি উপলব্ধ করা হয়, তবে এটি এআই ভিডিও তৈরির ক্ষেত্রে একটি নতুন যুগের সূচনা করবে।
iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।








