ওপেনএআই ফেব্রুয়ারি থেকে তার পরবর্তী প্রজন্মের ভিডিও জেনারেটর মডেল সোরা প্রকাশ করার প্রতিশ্রুতি দিচ্ছে। সোমবার, সংস্থাটি অবশেষে তার "12 দিনের OpenAI" ইভেন্টের অংশ হিসাবে এটির একটি কার্যকরী সংস্করণ বাদ দিয়েছে ।
"এটি আমাদের AGI রোডম্যাপের একটি গুরুত্বপূর্ণ অংশ," OpenAI CEO স্যাম অল্টম্যান কোম্পানির লাইভ স্ট্রিমের সময় বলেছিলেন৷
ওপেনএআই টিমের মতে, সোরা সোমবার বিকেল থেকে মার্কিন যুক্তরাষ্ট্রে এবং সারা বিশ্বের প্লাস এবং প্রো গ্রাহকদের জন্য উপলব্ধ করা হবে।
YouTuber Marquis Brownlee ভিডিও জেনারেটরে তাড়াতাড়ি অ্যাক্সেস পেয়েছিলেন এবং সোমবার সকালে তার চ্যানেলে একটি সংক্ষিপ্ত পর্যালোচনা প্রকাশ করেছেন বলে জানা গেছে। সোরা GPT-4-এর উপরে তৈরি করা হয়নি বলে মনে হচ্ছে, কার্যত OpenAI-এর অন্যান্য জেনারেটিভ টুলগুলির সমস্তই। মডেলটি স্ট্যান্ডার্ড ChatGPT ওয়েবসাইটের মাধ্যমে পাওয়া যায় না, কিন্তু পরিবর্তে Sora.com এর মাধ্যমে (যা এখনও এই পোস্টের প্রকাশনা হিসাবে লাইভ নয়)।
মডেলটি টেক্সট প্রম্পট বা রেফারেন্স ইমেজ থেকে 480p থেকে 1080p দৈর্ঘ্যের 5 থেকে 20 সেকেন্ডের রেজোলিউশনে ভিডিও তৈরি করতে সক্ষম। এটি বিদ্যমান ভিডিও ক্লিপগুলি সম্পাদনা এবং প্রসারিত করতেও সক্ষম। চ্যাটজিপিটি প্লাস গ্রাহকরা প্রতি মাসে 720p পর্যন্ত 50টি ক্লিপ জেনারেশন পর্যন্ত এবং উচ্চ রেজোলিউশনে কম ভিডিও, প্রতিটি পাঁচ সেকেন্ডের জন্য অনুমোদিত হবে। প্রো ব্যবহারকারীদের 20 সেকেন্ড পর্যন্ত সমস্ত রেজোলিউশন এবং সময়সীমাতে সীমাহীন প্রজন্মের অনুমতি দেওয়া হবে। সম্পাদনা সরঞ্জাম ছাড়াও, সোরা একটি "স্টোরিবোর্ড" বৈশিষ্ট্যও অফার করে যা নির্মাতাদের একটি একক সিনেমাটিক দৃশ্যে একাধিক প্রম্পট একত্রিত করতে সক্ষম করবে।
ব্রাউনলি নোট করেছেন যে মডেলটির একটি 1080p ক্লিপ তৈরি করতে "কয়েক মিনিট" প্রয়োজন, কিন্তু নোট "এটিও, যেমন, এখন, যখন প্রায় কেউ এটি ব্যবহার করে না৷ আমি একধরনের আশ্চর্য হই যে এটি যে কারো ব্যবহারের জন্য উন্মুক্ত হলে কতটা সময় লাগবে।” ব্রাউনলি আরও উল্লেখ করেছেন যে মডেলটির সঠিকভাবে পা এবং তাদের নড়াচড়া তৈরিতে উল্লেখযোগ্য অসুবিধা রয়েছে, সামনের এবং পিছনের পা অস্বাভাবিক এবং বোধগম্য উপায়ে অবস্থান পরিবর্তন করে।
আপনার জন্য আমাদের ছুটির উপহার: সোরা এখানে। https://t.co/JQKGgLAy6E pic.twitter.com/0c0DLl6Udf
— OpenAI (@OpenAI) ডিসেম্বর 9, 2024
Grok 2 এর বিপরীতে, Sora তার ব্যবহারকারীরা যা তৈরি করতে পারে তা সীমিত করবে এবং স্পষ্টভাবে কপিরাইটযুক্ত বিষয়, 18 বছরের কম বয়সী ব্যক্তিদের এবং সহিংসতা বা "স্পষ্ট থিম" ধারণকারী কিছু তৈরি করতে বাধা দেবে।
AI শিল্পে ওপেনএআই-এর শীর্ষস্থানীয় অবস্থান সত্ত্বেও, সোরা তার বিকাশের সময় বিলম্বের কারণে বিপর্যস্ত হয়েছে, যা রানওয়ের জেন-৩ আলফা , কুয়াইশোউ টেকনোলজির ক্লিং এবং মেটা-এর মুভি জেন মডেলের মতো প্রতিযোগীদের এটিকে বাজারে ছাড়তে সক্ষম করেছে। সোরা সম্প্রতি (তবে সংক্ষিপ্তভাবে) বিটা পরীক্ষকদের একটি গ্রুপ দ্বারা প্রকাশ্যে ফাঁস হয়েছিল, যারা মডেলের ক্ষমতাকে "আর্ট ওয়াশিং" করার জন্য কোম্পানিকে অভিযুক্ত করেছিল ।