
ক্লড স্কিলস সম্প্রতি সোশ্যাল মিডিয়ায় ভাইরাল হয়েছে। এটি এআইকে কেবল চ্যাট থেকে দক্ষ কর্মীতে রূপান্তরিত করে। পেশাদার দক্ষতাগুলিকে মডিউলে প্যাকেজ করে, ব্যবহারকারীরা কেবল একটি স্ল্যাশ (/) দিয়ে সংশ্লিষ্ট দক্ষতা নির্বাচন করতে পারেন।
ডেটা বিশ্লেষণ করতে চান? /ডেটাঅ্যানালিস্ট। কোড লিখতে চান? /কোডিং এক্সপার্ট। এআই এখন আর আমরা কী চাই তা অনুমান করার জন্য একটি ব্ল্যাক বক্স নয়, বরং এটি একটি অন-ডিমান্ড টুলবক্সে পরিণত হয়েছে। এই মডুলার পদ্ধতিটি এখন এআই ভিডিও জেনারেশনের ক্ষেত্রেও এসেছে।
ভিদুর নতুন চালু হওয়া থিম কমিউনিটি আটটি বিভাগ – ক্যামেরা মুভমেন্ট, স্পেশাল এফেক্টস, পরিবেশ, পারফরম্যান্স, কম্পোজিশন, ন্যারেটিভ, স্টাইল, দৃশ্য এবং মুভ – কে একটি "থিম লাইব্রেরিতে" অন্তর্ভুক্ত করে। এই থিমগুলি অ্যাক্সেস করার জন্য আমরা ইনপুট বক্সে কেবল একটি "@" যোগ করতে পারি।

▲রেফারেন্স ভিডিওতে, @ টাইপ করলে স্বয়ংক্রিয়ভাবে একটি নির্বাচন বাক্স আসবে, যার মাধ্যমে আপনি সরাসরি আপনার প্রয়োজনীয় বিষয় খুঁজে পেতে পারবেন।
ক্যামেরা জুম ইন করতে চান? @CameraLibrary. সাইবারপাঙ্ক ভাইব চান? @AtmosphereLibrary. পার্টিকেল এফেক্ট চান? @EffectsLibrary.
আমরা এগুলিকে Claude Skills: @Camera + @Atmosphere + @Effects + Character Images এর মতো স্তরগুলিতেও ব্যবহার করতে পারি, যেখানে পরিচালক, চিত্রগ্রাহক, VFX শিল্পী এবং শিল্প পরিচালকের কাজ একসাথে পরিচালনা করা যায়।

আগে মানুষ বলত, AI হলিউড অভিনেতাদের চাকরি কেড়ে নেবে। এখন, ভিদু সরাসরি প্রতিটি স্রষ্টাকে একটি AI হলিউড স্টুডিও প্রদান করেছে। অভিনেতা, পরিচালক এবং চিত্রগ্রাহকরা সবাই AI; আমাদের কেবল তাদের ট্যাগ করতে হবে।
এটি বিশ্বের প্রথম এআই-চালিত ভিডিও কমিউনিটি, এমন একটি কমিউনিটি যা শেয়ারিং, ট্রেডিং এবং মিথস্ক্রিয়ার সুযোগ করে দেয়।

এটি এখানে উপভোগ করুন: https://www.vidu.cn | Vidu API: http://platform.vidu.cn/
APPSO যত তাড়াতাড়ি সম্ভব Vidu থিম কমিউনিটির পরীক্ষার যোগ্যতা অর্জন করেছে এবং 8টি থিম প্রকারের সবকটি চেষ্টা করেছে। দেখা যাক এটি বাস্তবে কেমন পারফর্ম করে।
আমরা সবার জন্য একটি বোনাসও প্রস্তুত করেছি: vidu.cn এ লগ ইন করুন, আমন্ত্রণ কোডটি লিখুন: APPSON , এবং নিবন্ধনের পরে আপনি 500 পয়েন্ট পাবেন। আসুন এবং এটি উপভোগ করুন!
কৃত্রিম বুদ্ধিমত্তা অবশেষে "অভিনয়" করতে শিখেছে।
ঐতিহ্যবাহী এআই ভিডিওগুলিতে, দৃশ্যমানতার বর্ণনা দেওয়া সবচেয়ে কঠিন দিক। এমনকি কিছু অতিরিক্ত বিশেষণ যোগ করলেও এআই সহজেই বিভ্রম তৈরি করতে পারে। বিশেষ করে মুখের ভাবের কঠোরতা এআই ভিডিওগুলির একটি প্রধান দুর্বলতা।
বিদুর প্রধান সম্প্রদায়ের পারফরম্যান্স এবং ইমোটিকন লাইব্রেরি এই জটিল আবেগগত বর্ণনা এবং অ্যাকশন ডিজাইনগুলিকে মানসম্মত করেছে। এখন, উন্মত্ত হাসি, ভয়, দুঃখ এবং আনন্দের মতো পারফরম্যান্স এবং ইমোটিকনগুলি সরাসরি সংশ্লিষ্ট চরিত্রের অভিব্যক্তি এবং মানসিক অবস্থা তৈরি করতে পারে; এবং দুই ব্যক্তির লড়াই, গোষ্ঠীগত সংঘর্ষ এবং রোমান্টিক সংযুক্তির মতো অ্যাকশন ইমোটিকনগুলি এমনকি চরিত্রগুলির নির্দিষ্ট ক্রিয়াগুলিকেও সাজিয়েছে।
ইমোজি ট্যাগ করার জন্য একটি মাত্র ক্লিকের মাধ্যমে, আমরা অতিরিক্ত প্রম্পটের প্রয়োজন ছাড়াই মূল সম্প্রদায়ের বিভিন্ন ইমোজি নিখুঁতভাবে প্রতিলিপি করতে পারি। একই সাথে, আমরা ভিডিওর অখণ্ডতা এবং ধারাবাহিকতা বজায় রাখতে পারি।
আমরা একটি জোকারের ছবি ইনপুট করি এবং উন্মাদ হাসির থিম ব্যবহার করি যাতে জোকারের চেহারা অপরিবর্তিত থাকে এবং সামগ্রিকভাবে ভয়াবহতা এবং সাসপেন্সের পরিবেশ বজায় থাকে।

▲কম্বিনেশন ফর্মুলা: @Thunderstorms Never Stop @Urban Ruins , @চিত্র ১: রাস্তায় দাঁড়িয়ে, ক্যামেরার দিকে মুখ করে @manic হাসি , সাথে হিংস্র @rapid ক্যামেরা কাঁপানো , একটি শক্তিশালী @ভয়ঙ্কর এবং উত্তেজনাপূর্ণ পরিবেশ তৈরি করে।
এটি হাসতে পারে, এবং অবশ্যই কাঁদাতে পারে। @ExageratedBigEyedCrying বিষয় ব্যবহার করে, আপনি ভিডিওর চরিত্রগুলিকে তাদের হৃদয় কাঁদাতে পারেন। এই অভিব্যক্তি এবং অভিনয়ের বিষয়গুলি সত্যিই AI ভিডিওগুলির চরিত্রগুলিকে জীবন্ত করে তুলতে পারে।

▲ সংমিশ্রণ সূত্র: @চিত্র ১- এ দেখা যাচ্ছে যে তিনি আয়নার সামনে দাঁড়িয়ে আছেন, তার বড় বড় চোখের কান্নার অভিব্যক্তি @exaggerated । তীব্র @sad পরিবেশের সাথে মিলিত হয়ে, তার কান্না আরও বেশি দুঃখজনক হয়ে ওঠে। একই সময়ে, @side ব্যাকলাইটিং ব্যবহার করে আয়নায় তার রূপরেখা এবং স্পষ্ট কান্নার অভিব্যক্তি দেখানো হয়।
মুখের অভিব্যক্তি নিয়ন্ত্রণ কেবল সঠিকই নয়, বরং বিষয় লাইব্রেরিতে প্রিসেটগুলির সাহায্যে আমরা সহজেই চরিত্রটিকে শক্তিশালী চালগুলি প্রকাশ করতে পারি। এবং এটি কেবল চরিত্রের অ্যানিমেশন নয়; এমনকি ভিডিও প্রভাবগুলিও স্বয়ংক্রিয়ভাবে বিষয় সম্প্রদায়ে সংশ্লিষ্ট বিষয়কে ট্যাগ করে যুক্ত করা হয়।
আমরা প্রথমে মুভ তালিকা থেকে একটি ক্লোন নির্বাচন করেছি: @Hundred Flowers in Full Bloom ।

▲সংমিশ্রণ সূত্র: @Character 3 এ @Hundred Flowers Dazzling Clone ব্যবহার করা হয়েছে।
এর প্রভাব বেশ ভালো। @Ice Rain এবং Chains এর মতো আরও জটিল চালগুলির সাথেও, Vidu এগুলি খুব ভালভাবে পরিচালনা করতে পারে।

▲কম্বিনেশন ফর্মুলা: @Sword Saint @Cang Xuan কে আক্রমণ করার জন্য @Ice Rain ব্যবহার করেন। ঠিক যেমন বরফ বৃষ্টি @Cang Xuan কে আঘাত করতে চলেছে, @Cang Xuan দ্রুত আক্রমণ প্রতিহত করার জন্য @Golden Bell Shield ব্যবহার করেন।
এই চাল এবং বিশেষ প্রভাবগুলি ছোট নাটক এবং কমিকের নির্মাতাদের জন্য সেরা হাতিয়ার।
বিভিন্ন বিষয় একত্রিত এবং স্তূপীকৃত করা যেতে পারে, এবং বিদু আমাকে একটি দুর্দান্ত ফ্যান্টাসি মার্শাল আর্ট ব্লকবাস্টার দিতে পারে।

▲কম্বিনেশন ফর্মুলা: @星野仙尊মুখ @鬼怪এবং প্রকাশ করে @降龙十八掌 ( ড্রাগন সাবডুয়িং এইটিন পামস), দৃশ্যটি হল @大战 (যুদ্ধক্ষেত্র) , @智能运 ক্যামেরা (Inveerment镐)
ক্লোজ-কোয়ার্টার টু-অন-টু যুদ্ধে, তরল এবং মনোমুগ্ধকর নড়াচড়া এমনকি দ্য ম্যাট্রিক্সের প্রতিলিপি তৈরি করতে পারে।


@ আমি খুব অল্প সময়েই ছবি তুলতে পারি, আমি লক্ষ লক্ষ ডলারের ক্যামেরার কাজও করতে পারি।
চরিত্রগুলির অভিব্যক্তি এবং গতিবিধি সমাধান করার পর, পরবর্তী ধাপ ছিল ভিজ্যুয়ালগুলির নকশা।
দৃষ্টিভঙ্গি নিয়ন্ত্রণ এবং দর্শকের দৃষ্টি আকর্ষণ করার ক্ষমতা ভিডিও কন্টেন্ট উপস্থাপনার একটি নিঃসন্দেহে গুরুত্বপূর্ণ অংশ। ক্যামেরার গতিবিধি এবং রচনা মূল উপাদান; ক্যামেরার গতিবিধি ক্যামেরার গতিবিধি নির্ধারণ করে এবং সর্বদা সিনেমাটিক ভাষার ভিত্তি হয়ে দাঁড়িয়েছে, যখন রচনা শটের ফ্রেমিং এবং কোণ নির্ধারণ করে।
মূল ভিদু সম্প্রদায়ে, শটের ধরণগুলির মধ্যে রয়েছে ক্লোজ-আপ, প্যানোরামা, বার্ডস-আই ভিউ এবং ৩৬০-ডিগ্রি ডিসপ্লে। রচনাগুলিতে গ্রুপ কনফ্রন্টেশন, রুল অফ থার্ডস এবং ডাচ অ্যাঙ্গেল কম্পোজিশনও অন্তর্ভুক্ত। ক্যামেরা কৌশলগুলি আরও বৈচিত্র্যময়, যার মধ্যে রয়েছে পুশ-ইন শট, প্যানিং শট, সার্ক্লিং শট এবং প্রোব শট।
আমরা আমাদের বিষয় লাইব্রেরি থেকে চরিত্র, স্টাইল, দৃশ্য, পরিবেশ এবং ক্যামেরার গতিবিধি অনুসারে শ্রেণীবদ্ধ কিছু কীওয়ার্ড এলোমেলোভাবে নির্বাচন করে শুরু করেছিলাম। এই বিষয়গুলিকে একসাথে সংযুক্ত করার জন্য খুব বেশি সংযোগকারী শব্দও ছিল না। চূড়ান্ত ফলাফলটি একসাথে উপস্থাপিত হয়েছিল, যা হলিউডের ব্লকবাস্টার অনুভূতি তৈরি করেছিল।

▲সংমিশ্রণ সূত্র: @উত্তেজনাপূর্ণ এবং নিপীড়নমূলক পরিবেশ , @লিওনার্দো ডিক্যাপ্রিও @parking লটে দাঁড়িয়ে আছেন, ক্যামেরা প্রথমে @দৃশ্যটি 360 ডিগ্রিতে দেখায় , তারপর জুম আউট করে একটি প্যানোরামিক দৃশ্যে খালি পার্কিং লটটি @দেখিয়ে দেয়।
লিওনার্দো ডিক্যাপ্রিও হলো সেই বিষয়বস্তু যা আমরা নিজেরাই তৈরি করেছি। ১-৩টি ছবি আপলোড করে, সংশ্লিষ্ট শব্দ নির্বাচন করে, এবং তারপর স্টাইল এবং প্রম্পট নির্ধারণ করে, আমরা একটি পুনঃব্যবহারযোগ্য চরিত্রের বিষয়বস্তু পেতে পারি।

৩৬০ ডিগ্রির চারপাশের দৃশ্য উত্তেজনাপূর্ণ এবং নিপীড়ক পরিবেশকে আরও জোরদার করে। ক্যামেরা জুম আউট করে একটি প্যানোরামিক ভিউ ব্যবহার করলে, দৃশ্যমান প্রভাব আরও বৃদ্ধি পায়; মাত্র পাঁচ সেকেন্ডের মধ্যে, এটি নাটকীয় উত্তেজনায় পূর্ণ।
আবদ্ধ স্থানে ক্যামেরার কাজের পাশাপাশি, ভিডু প্রধান সম্প্রদায়ের লেন্স কনফিগারেশন খোলা, সীমাহীন স্থানেও চমৎকারভাবে কাজ করে।

▲সম্মিলিত সূত্র: @পিছনে দেখা @উজ্জ্বল মেয়েটি আকাশচুম্বী ভবনের কিনারায় বসে আছে, @ড্রোন জুম আউট করছে , @প্যানোরামিক দৃশ্য @নানজিং সিটি স্কাইলাইন এবং @অদ্ভুত পরিবেশ
এছাড়াও, ভিডু প্রধান সম্প্রদায় @probe লেন্সের মতো বিশেষ লেন্স ট্র্যাকও সরবরাহ করে। ক্যামেরার চলাচলের পথটি স্বাভাবিক ভাষায় স্পষ্টভাবে বর্ণনা করা কঠিন। এখন, আমরা দ্রুত ম্যাক্রো ভ্রমণ অর্জনে সহায়তা করার জন্য সরাসরি মূল অংশটিকে কল করতে পারি।

▲কম্বিনেশন ফর্মুলা: @ঝেং কাইকাই @সাই-ফাই স্টাইল @স্পেস ক্যাপসুল সিন @টেকনিক্যাল অ্যাটমোস্ফিয়ার @প্রোব লেন্স
অনেক AI-জেনারেটেড ভিডিওতে প্রায়শই সুন্দর ছবির মান থাকে, কিন্তু অ্যানিমেশনটি নকল দেখায়। Vidu প্রধান সম্প্রদায়ে যোগ করা নতুন, সমৃদ্ধ ক্যামেরা মুভমেন্ট বৈশিষ্ট্যগুলি প্রকৃতপক্ষে আগের তুলনায় অনেক বেশি নিয়ন্ত্রণযোগ্য এবং সহজ, যেখানে AI-কে ক্যামেরা এবং চরিত্রগুলি কীভাবে সরাতে হয় তা বলার জন্য প্রম্পট ইনপুট করার প্রয়োজন ছিল। পেশাদার ক্যামেরার ভাষা সম্পর্কে এর বোধগম্যতা বেশ নির্ভুল।
ক্যামেরার নড়াচড়া এবং ফ্রেমিং সম্পর্কে এর বোধগম্যতা পরীক্ষা করা চালিয়ে যান। পুশ-ইন শট হল সবচেয়ে মৌলিক চলচ্চিত্র শটগুলির মধ্যে একটি, ধীরে ধীরে একটি দীর্ঘ শট থেকে ক্লোজ-আপে এগিয়ে যাওয়া, যা আবেগগত অগ্রগতির অনুভূতি তৈরি করে। আমরা ঐতিহ্যবাহী পদ্ধতিতে কিউ শব্দগুলি লিখে শুরু করেছি: "এলিয়ান হাসপাতালের বিপরীতে, বৃষ্টি হচ্ছে, ক্যামেরা তার মুখের দিকে ঠেলে দেয়, তারপর একটি আকাশের দৃশ্যের দিকে ফিরে আসে।"
প্রম্পট ব্যবহার করে ক্যামেরার গতিবিধির মান বাদ দিলেও, রেফারেন্স বিষয় ছাড়া সম্পূর্ণ টেক্সট-ভিত্তিক ভিডিওতে অনেকগুলি নিয়ন্ত্রণহীন দিক রয়েছে। উদাহরণস্বরূপ, ভিজ্যুয়ালের ধরণটি খুব বেশি পরাবাস্তব হতে পারে এবং বিষয়ের উপস্থাপনা প্রসঙ্গের জন্য উপযুক্ত নাও হতে পারে। আমরা বেশ কয়েকবার ভিডিওটি তৈরি করেছি এবং শুধুমাত্র প্রম্পট ব্যবহার করে আমরা প্রায় কখনওই বার্ডস-আই ভিউয়ের দিকে ক্যামেরার গতি এবং প্রভাব নিয়ন্ত্রণ করতে পারিনি।

▲প্রম্পট সহ সংস্করণে, মানুষ পাখির চোখের দৃশ্যে অদৃশ্য হয়ে যায় এবং ফ্রেমের কেন্দ্রে রাখা যায় না।
Vidu সাবজেক্ট লাইব্রেরি ব্যবহার করে, আমরা সাবজেক্ট কমিউনিটি থেকে সরাসরি বিদ্যমান চরিত্রের ছবি নির্বাচন করে ভিডিও তৈরি করতে পারি। একই সাথে, আমরা @Camera লাইব্রেরি থেকে " ক্যামেরা জুম " নির্বাচন করি এবং একটি সহজ দৃশ্যের বর্ণনা যোগ করি। প্রথম প্রজন্ম জুম-ইন থেকে জুম-আউট এবং তারপর পাখির চোখের দৃশ্যে প্রাকৃতিক রূপান্তর সহ একটি ভিডিও তৈরি করে।

▲সম্মিলিত সূত্র: @Elean হাসপাতালের বিপরীতে, বৃষ্টি হচ্ছে, @ক্যামেরা তার মুখের উপর জুম করে , তারপর @ক্যামেরা পাখির চোখের দৃশ্যের সাথে জুম আউট করে।
এই তুলনাটি খুবই স্পষ্ট। ঐতিহ্যবাহী AI ভিডিও তৈরির "বোঝাপড়া" অনিয়মিত; প্রতিবার একই প্রম্পট শব্দ তৈরি করা একটি অন্ধ বাক্স খোলার মতো। অন্যদিকে, বিষয় লাইব্রেরি এই বিশেষায়িত ধারণাগুলিকে মানসম্মত এবং ধারণ করে, তাই মডেলটিকে আর অনুমান করার প্রয়োজন নেই যে আমরা কী প্রভাব চাই।
এটি কেবল দৃশ্যতই আকর্ষণীয় নয়; এটি গল্পটিকে আরও মনোমুগ্ধকর করে তোলে।
এছাড়াও, মূল কন্টেন্ট লাইব্রেরির পরিবেশ, স্টাইল এবং দৃশ্যগুলি ভিডিওর সামগ্রিক অনুভূতি নির্ধারণ করে।
বিশেষ করে, দৃশ্যটি ভিডিওর স্থানিক পরিবেশ নির্ধারণ করে, শৈলী সামগ্রিক শিল্প শৈলী নির্ধারণ করে এবং পরিবেশ ছবির আবেগময় রঙে একটি নতুন গল্প নিয়ে আসে। ভিডু প্রধান সম্প্রদায়টি মহাকাশ ক্যাপসুল, হাসপাতাল, বন, কফি শপ এবং বিলাসবহুল ব্যাঙ্কোয়েট হল, বিজ্ঞান কল্পকাহিনী, সাসপেন্স, সাইবারপাঙ্ক এবং প্রাচীন শৈলীর মতো শৈলী এবং উত্তেজনাপূর্ণ এবং নিপীড়ক, প্রফুল্ল, দুঃখজনক, রোমান্টিক এবং স্নেহপূর্ণ এবং প্রযুক্তিগত পরিবেশ সহ দৃশ্যগুলিও সরবরাহ করে।
আমরা একটি বিলাসবহুল ব্যাঙ্কোয়েট হলকে একটি অন্ধকার এবং ভয়ঙ্কর থ্রিলারে রূপান্তরিত করেছি, নড়বড়ে ক্যামেরার কাজ ব্যবহার করে চরিত্রগুলির দৃষ্টিকোণ থেকে পরিবেশ পর্যবেক্ষণের প্রভাব তৈরি করেছি, যা নিমজ্জনের অনুভূতি বাড়িয়েছে। 
▲কম্বিনেশন ফর্মুলা: বিলাসবহুল ব্যাঙ্কোয়েট হলটি একটি ভয়ঙ্কর এবং সাসপেন্সপূর্ণ পরিবেশে রূপান্তরিত হয়, একটি নড়বড়ে ক্যামেরা মুভমেন্ট ব্যবহার করে, যার ফলে সামগ্রিকভাবে একটি সাসপেন্স ফিল্ম স্টাইল তৈরি হয়।
এটি পরিবেশের আলো, ভিডু প্রধান সম্প্রদায়ের অন্যান্য পরিবেশের মাধ্যমে বায়ুমণ্ডলের পরিবর্তনগুলি প্রদর্শন করতে পারে এবং এমনকি চরিত্রের অভিব্যক্তির সাথেও সেগুলিকে একত্রিত করতে পারে।
এটি @LeonardoDelGregor এবং @MarilynMonroe- এর জন্য একটি রোমান্টিক এবং স্নেহপূর্ণ পরিবেশও যোগ করতে পারে। Vidu দ্বারা তৈরি চূড়ান্ত ভিডিওটিতে চমৎকার আলো এবং ছায়ার প্রভাব রয়েছে। প্যানোরামিক মোডে, এটি তুলনামূলকভাবে অন্ধকার বৃষ্টির দিনের পরিবেশ ব্যবহার করে, কিন্তু যখন এটি স্বয়ংক্রিয়ভাবে দুজনের মুখের উপর জুম করে, তখন ছবিটি স্বয়ংক্রিয়ভাবে উজ্জ্বল হয়ে ওঠে।

▲পরীক্ষার সূত্র: @গ্রুপ পোর্ট্রেট মুখোমুখি @লিওনার্দো ডিক্যাপ্রিও এবং @মেরিলিন মনরো @রোমান্টিক এবং স্নেহপূর্ণ পরিবেশ , পটভূমি @কফি শপ
এই বিভিন্ন শ্রেণীর সত্তা পরীক্ষা করে, আমি একটি জিনিস নিশ্চিত করেছি: বহু-সত্তার সমন্বয় কেবল "কার্যকরী স্ট্যাকিং" নয়। ভিডু অন্তর্নিহিত স্তরে একটি সমন্বয় প্রক্রিয়া বাস্তবায়ন করেছে, যা বিভিন্ন সত্তাকে একে অপরের সাথে সহযোগিতা করার অনুমতি দেয়।
ঐতিহ্যবাহী এআই ভিডিও প্রজন্মের মধ্যে এই সমন্বয়ের অনুভূতির সবচেয়ে বেশি অভাব রয়েছে। আমরা প্রম্পটে যতই বিস্তারিত লিখি না কেন, মডেলের পক্ষে ক্যামেরার কোণ, বায়ুমণ্ডল এবং বিশেষ প্রভাবের মধ্যে ভারসাম্য একই সাথে বোঝা কঠিন।
আরও উত্তেজনাপূর্ণ বিষয় হল, আমরা কেবল ভিডিও তৈরি করার জন্য বিষয় লাইব্রেরি ব্যবহার করতে পারি না; ভিদু এই বিষয়গুলিকে এমন একটি সম্প্রদায়ে রূপান্তরিত করেছে যেখানে আমরা ভাগ করে নিতে, যোগাযোগ করতে এবং বাণিজ্য করতে পারি।

▲ব্যবহারকারীরা তাদের নিজস্ব ডিজাইন আপলোড করতে পারবেন।
আমরা প্রত্যেকেই আমাদের নিজস্ব থিম ডিজাইন এবং আপলোড করতে পারি, একই সাথে অন্যান্য থিমও ব্যবহার করতে পারি। তৈরি এবং ব্যবহার প্রক্রিয়ার সময়, ভিডু একটি সম্পদ নগদীকরণ মডেল স্থাপন করেছে, যা প্রতিটি থিমকে ট্রেডযোগ্য করে তুলেছে ।
সম্প্রতি আপডেট করা Vidu Agent 1.0 এবং Vidu Q2 Reference Pro মডেলের সাথে মিলিত হয়ে, এটি আরও স্বয়ংক্রিয় কর্মপ্রবাহ প্রদান করে, বাক্সের বাইরে ব্যবহারের জন্য প্রস্তুত, এবং এক-ক্লিক ভিডিও তৈরি সক্ষম করে, নমনীয়তা এবং সুবিধার ভারসাম্য বজায় রাখে। নতুন আপগ্রেড করা বৈশিষ্ট্যগুলি ব্যাকগ্রাউন্ড সঙ্গীত আপলোড করা, বর্ণনা অপসারণ করা, স্টোরিবোর্ড সম্পাদনা করা এবং একাধিক ভাষা, ভয়েস, মডেল এবং দৃশ্য সমর্থনকারী উপকরণের একটি বিশাল লাইব্রেরি অন্তর্ভুক্ত করে।
অন্যদিকে, আরও শক্তিশালী বেস মডেল রয়েছে যা বিভিন্ন ভিডিও ইফেক্টের মাধ্যমে সরাসরি Q2 রেফারেন্স প্রো-এর প্রতিলিপি তৈরি করতে পারে।
বিদু AI ভিডিও জেনারেশনের পথ সম্পর্কে আরও স্পষ্ট ধারণা অর্জন করছে বলে মনে হচ্ছে।
"গাচা গেমস" থেকে "লেগো দিয়ে বিল্ডিং" পর্যন্ত
এই পরীক্ষার পর, ভিডু প্রধান সম্প্রদায় সম্পর্কে আমার আরও স্পষ্ট ধারণা হয়েছে। এটি একটি উন্নত হাতিয়ার যা আমাদের আরও ভালোভাবে এআই ভিডিও তৈরি করতে সাহায্য করতে পারে, এর লক্ষ্য পুরো প্রজন্মের কর্মপ্রবাহ পরিবর্তন করা।
ঐতিহ্যবাহী এআই ভিডিও জেনারেশন হলো একটি "গাচা সিস্টেম"। আমরা অনেক প্রম্পট লিখি, আশা করি মডেলটি সেগুলো বুঝতে পারবে, এবং তারপর সম্ভাব্যতা নিয়ে বাজি ধরি। যদি আমরা ভাগ্যবান হই, তাহলে আমরা একটি SSR পাই; যদি আমরা দুর্ভাগ্যবান হই, তাহলে আমরা আবর্জনা ছাড়া আর কিছুই পাই না। এই সিস্টেমের সমস্যা হল সৃষ্টি প্রক্রিয়াটি নিয়ন্ত্রণহীন, এবং পেশাদার বাধা এখনও অন্য আকারে বিদ্যমান (প্রম্পট ইঞ্জিনিয়ারিং উল্লেখ করে)।
ভিদুর প্রধান সম্প্রদায় একটি "LEGO মডেল" অনুসরণ করে, যা পেশাদার উপাদানগুলিকে মানসম্মত মডিউলে বিভক্ত করে। আমাদের কেবল নির্বাচন, একত্রিতকরণ এবং উৎপন্ন করতে হবে। এই মডেলের মূল সুবিধা হল নিয়ন্ত্রণযোগ্যতা; একটি প্রধান উপাদান নির্বাচন করার সময়, আমরা সাধারণত ভাগ্যের উপর নির্ভর না করে এর প্রভাব কী হবে তা জানি।
এই পরিবর্তন থেকে কারা সবচেয়ে বেশি লাভবান হচ্ছে? স্ব-মিডিয়া নির্মাতা, ছোট নাটক এবং কমিক বই নির্মাতা, ই-কমার্স মার্কেটিং দল এবং ছোট ও মাঝারি আকারের ব্যবসার মালিক। তাদের প্রচুর পরিমাণে উচ্চমানের ভিডিও সামগ্রী তৈরি করতে হবে, কিন্তু পেশাদার দল এবং উচ্চ বাজেটের অভাব রয়েছে। তাদের জন্য, মেইনস্ট্রিম লাইব্রেরি অল্প অর্থের বিনিময়ে "ভার্চুয়াল প্রোডাকশন ক্রু" নিয়োগের সমতুল্য।

▲জটিল ভিডিও উৎপাদন প্রক্রিয়া
স্বাধীন নির্মাতা, ডিজাইনার এবং বিজ্ঞাপন পেশাদাররাও উপকৃত হবেন। বিষয় লাইব্রেরি তাদের শূন্যস্থান পূরণ করতে পারে, যার ফলে তারা আফটার ইফেক্টস শিখে না নিয়েই দুর্দান্ত শট এবং বিশেষ প্রভাব তৈরি করতে পারে।
বিস্তৃত শিল্প প্রেক্ষাপটে, ভিদুর প্রধান সম্প্রদায়টি এআই ভিডিও প্রজন্মের "শিল্পায়নের" ক্ষেত্রে একটি গুরুত্বপূর্ণ পদক্ষেপ।
গত এক বছর ধরে, কৃত্রিম বুদ্ধিমত্তা (এআই) ভিডিও তৈরির মূল লড়াইয়ের ক্ষেত্রটি ছিল কার মডেলটি আরও শক্তিশালী – করলিন, রানওয়ে, সোরা এবং ভিও সকলেই ছবির মান, সময়কাল এবং ধারাবাহিকতা নিয়ে প্রতিযোগিতা করে আসছে। কিন্তু প্রযুক্তি একটি নির্দিষ্ট পর্যায়ে পৌঁছানোর সাথে সাথে প্রতিযোগিতামূলক মাত্রা "কীভাবে তৈরি করবেন", অর্থাৎ কর্মপ্রবাহ, নিয়ন্ত্রণযোগ্যতা এবং পুনঃব্যবহারযোগ্যতার দিকে স্থানান্তরিত হবে।
এই রূপান্তর মূলত ক্লড স্কিলসের মতোই যুক্তিযুক্ত। স্কিলসের মূল্য ক্লডকে আরও স্মার্ট করে তোলার মধ্যে নয়, বরং এর ক্ষমতাগুলিকে অনুমানযোগ্য, কলযোগ্য এবং সংমিশ্রণযোগ্য করে তোলার মধ্যে নিহিত। ব্যবহারকারীদের আর অনুমান করার দরকার নেই "এবার কি এটি আমার অর্থ বুঝতে পারবে?", তবে নিশ্চিতভাবে জেনে রাখুন "আমি এটিকে স্কিল বলেছি, এবং এটি এইভাবে কাজ করবে।"

▲ক্লদ বিভিন্ন ধরণের দক্ষতা প্রদান করেন, প্রতিটি দক্ষতা সরাসরি একটি নির্দিষ্ট সমস্যা সমাধানে সক্ষম।
ভিদুর প্রধান লাইব্রেরিও একই কাজ করে। এটি ভিডিও জেনারেশনকে "গাচা গেম" থেকে "সুনির্দিষ্ট কমান্ড"-এ রূপান্তরিত করে। এই নিশ্চিততাই প্রবেশের বাধা সত্যিই কমানোর মূল চাবিকাঠি।
যাদের সত্যিকার অর্থেই ধারণা, নান্দনিক বোধ এবং গল্প বলার ক্ষমতা আছে, তাদের জন্য এটি আসলে একটি ভালো দিক। অবশেষে তারা আর প্রযুক্তিগত বাধার দ্বারা আটকে থাকে না এবং সত্যিকার অর্থে গুরুত্বপূর্ণ অংশগুলিতে তাদের শক্তি কেন্দ্রীভূত করতে পারে।
অন্য কথায়, ভিদুর একেবারে নতুন মূল সম্প্রদায় আমাদের একটি নিখুঁত পুশ-ইন শট অর্জনে সাহায্য করতে পারে, কিন্তু গল্পে এই পুশ-ইন শটটি কোথায় প্রদর্শিত হবে, পুশ-ইনের গতি কী ধরণের আবেগগত ছন্দের সাথে মিলবে, অথবা এই শট এবং এর আগে এবং পরে শটগুলি কীভাবে বর্ণনামূলক উত্তেজনা তৈরি করবে তা নির্ধারণ করতে আমাদের সাহায্য করতে পারে না।

▲প্রধান সম্প্রদায়ের মধ্যে কিছু প্রধান সত্তা অন্তর্ভুক্ত রয়েছে
এই সিদ্ধান্তগুলির জন্য এখনও আমাদের মানব স্রষ্টাদের বিচারবুদ্ধি এবং নান্দনিক বোধের প্রয়োজন।
অবশ্যই, এখনও উন্নতির জায়গা আছে, যেমন ৮ সেকেন্ডের সীমা এবং মূল লাইব্রেরির কভারেজ, কিন্তু এই ক্ষেত্রগুলি পুনরাবৃত্তি এবং অপ্টিমাইজ করা যেতে পারে। আরও গুরুত্বপূর্ণ বিষয় হল, ভিডু প্রধান সম্প্রদায় নেতৃত্ব দিয়েছে, প্রমাণ করেছে যে "মানীকরণ + সংমিশ্রণযোগ্যতার" পথটি কার্যকর।
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
