গুগল ভিডিও তৈরির জগতে প্রবেশ করে পুরো চিত্রটাই পাল্টে দিয়েছে এবং সবার হাতে এমন একটি শক্তিশালী কন্টেন্ট তৈরির টুল তুলে দিয়েছে, যার জন্য ক্যামেরা বা এডিটিং-এর কোনো পূর্ব অভিজ্ঞতা প্রয়োজন নেই।
গুগল আই/ও ২০২৬- এ ঘোষিত জেমিনি অমনি হলো কোম্পানিটির এখন পর্যন্ত সবচেয়ে উচ্চাভিলাষী এআই মডেল। এটি শুধু টেক্সট থেকেই ভিডিও তৈরি করে না, বরং স্কেচ, ভয়েস নোট, ফোনের নড়বড়ে ফুটেজ, আপনার কুকুরের ছবির মতো যেকোনো কিছু থেকেও একটি পরিমার্জিত ও সুসংহত ভিডিও তৈরি করতে পারে।
গুগলের নিজস্ব ট্যাগলাইন? “যেকোনো ইনপুট থেকে যেকোনো কিছু তৈরি করুন।” সাহসী, এবং অন্তত এই একবারের জন্য হলেও, পুরোপুরি অন্তঃসারশূন্য নয়।
তাহলে আসলে কী ওমনিকে অন্যান্য এআই ভিডিও জেনারেটর থেকে আলাদা করে?
এখন পর্যন্ত, এআই ভিডিও জেনারেটরগুলো মূলত খণ্ডিত ছিল। কিছু জেনারেটর ভিজ্যুয়ালের ক্ষেত্রে দুর্দান্ত হলেও অডিও নিয়ে হিমশিম খেত, আবার অন্যগুলো বিভিন্ন এডিটের মধ্যে চরিত্র বা পরিবেশের সামঞ্জস্য বজায় রাখতে পারত না। ধারাবাহিকতা এবং কথোপকথনের মাধ্যমে জেমিনি অমনি ঠিক এই শূন্যস্থানটিই পূরণ করার প্রতিশ্রুতি দেয়।
যেহেতু এই টুলটি আপনাকে জেমিনিতে পাঠানো ভয়েস-ভিত্তিক ইনপুটের মাধ্যমে ভিডিও সম্পাদনা বা তৈরি করার সুযোগ দেয়, তাই এটি সর্বদা পূর্ববর্তী নির্দেশনাগুলো মনে রাখে, যা বাস্তবে বিভিন্ন দৃশ্যে চরিত্র এবং গল্পকে সামঞ্জস্যপূর্ণ রাখতে সাহায্য করে।
এটা অনেকটা আপনার ভিডিও এডিটরের সাথে কথা বলার মতো এবং অনেক বেশি সৃজনশীল স্বাধীনতা নিয়ে ভিডিও এডিট করিয়ে নেওয়ার মতো। পুরো ফুটেজটি নষ্ট না করেই, অমনি আলো, গতি এবং পরিবেশের মতো পদার্থবিদ্যা-সচেতন খুঁটিনাটি বিষয়গুলোও সমন্বয় করতে পারে। এটি এমনকি মাধ্যাকর্ষণ এবং তরল গতিবিদ্যাও বোঝে।
আসলে কারা প্রবেশাধিকার পায়, এবং এর পেছনের রহস্যটা কী?
জেমিনি অমনি ফ্ল্যাশ এখন চালু হচ্ছে। ইউটিউব শর্টস ব্যবহারকারীরা এটি সম্পূর্ণ বিনামূল্যে পাবেন, কিন্তু বাস্তবে এটি কীভাবে কাজ করে তা আমি এখনও জানতে পারিনি। জেমিনি অ্যাপ এবং গুগল ফ্লো-এর জন্য আপনার একটি এআই প্লাস , প্রো বা আল্ট্রা সাবস্ক্রিপশন লাগবে, যার মূল্য প্রতি মাসে $৭.৯৯ থেকে শুরু। এন্টারপ্রাইজ এপিআই অ্যাক্সেস আগামী কয়েক সপ্তাহের মধ্যে আসবে।
Omni Flash-এর মাধ্যমে তৈরি প্রতিটি ভিডিওতে অদৃশ্যভাবে SynthID ওয়াটারমার্ক যুক্ত হয়। এর অপব্যবহার রোধ করার জন্য তা যথেষ্ট কিনা, সেটি একটি আলাদা এবং অনেক দীর্ঘ আলোচনার বিষয়। আপাতত, গুগল নির্মাতাদের হাতে একটি সত্যিই শক্তিশালী টুল তুলে দিয়েছে, এবং আমার মনে হচ্ছে যে কন্টেন্টের জগৎ খুব শীঘ্রই বেশ সরব হতে চলেছে।
গত দুই বছর ধরে গুগল জেনারেটিভ ভিডিওর ক্ষেত্রে পিছিয়ে ছিল। Veo সক্ষম হলেও এর কার্যকারিতা ছিল না; এটি ছিল একটি টেক্সট-টু-ভিডিও টুল, এমন এক বিশ্বে যেখানে ততদিনে পূর্ণাঙ্গ ক্রিয়েটিভ পাইপলাইনের ব্যবহার শুরু হয়ে গিয়েছিল। Gemini Omni হলো সেই ভুলের সংশোধন: একটি সমন্বিত মডেল যা সম্পূর্ণ ওয়ার্কফ্লো পরিচালনা করে।