মজার! টেরাকোটা ওয়ারিয়র্স কিয়ানওয়েন অ্যাপে কে-পপ নাচছে, এবং তারা প্রশিক্ষণার্থীদের চেয়েও মসৃণ!

টেরাকোটা যোদ্ধাদের কে-পপ নাচতে শেখাতে কেমন লাগে?

আজ যদি তুমি এমন একটি ভিডিও দেখতে পাও: একজন ২০০০ বছরের পুরনো পোড়ামাটির যোদ্ধা মাইক্রোফোন ধরে, তার তালে তালে বাম-ডানে দুলছে, তার নড়াচড়া একজন প্রশিক্ষণার্থীর চেয়ে মসৃণ এবং তার মুখের ভাব একজন প্রতিমার চেয়েও বেশি স্পষ্ট।

আতঙ্কিত হওয়ার কোনও কারণ নেই; এটি AI-এর আলোড়ন সৃষ্টির আরেকটি উদাহরণ মাত্র।

এই বিপরীতমুখী, উদ্ভট এবং হাস্যকর দৃশ্যটি আলিবাবা কিয়ানওয়েন অ্যাপের একটি নতুন আপগ্রেড করা বৈশিষ্ট্য থেকে এসেছে।

Wan2.5 এর যুগপত অডিও এবং ভিডিও আউটপুট ক্ষমতার উপর ভিত্তি করে, Qianwen এর AI গেমপ্লেটি আবার আপগ্রেড করা হয়েছে! শুধুমাত্র একটি ছবি এবং একটি প্রম্পট দিয়ে, এটি সঠিক ঠোঁটের নড়াচড়া এবং মসৃণ গতি সহ একটি "গান এবং নাচ" ভিডিও তৈরি করতে পারে, যা সর্বোচ্চ 10 সেকেন্ড দৈর্ঘ্য এবং 1080P আউটপুট সমর্থন করে।

▲ (চিন্তা করবেন না, আরও বিশেষজ্ঞ আছেন, চমৎকার গান এবং নাচের দক্ষতা সম্পন্ন টেরাকোটা ওয়ারিয়র্স বয় ব্যান্ড আসছে)

আর কোনও বিধিনিষেধ নেই। আসল ছবি, সুন্দর পোষা প্রাণী, অ্যানিমে চরিত্র, সাংস্কৃতিক ধ্বংসাবশেষ, অথবা কার্টুন চিত্র, কিয়ানওয়েন অ্যাপ সেগুলোকে জীবন্ত করে তুলতে পারে।

অবশ্যই, প্রথমেই স্পষ্ট করে বলা দরকার: ভিডিওর অডিওটি আগে থেকে রেকর্ড করা নয়, এটি সহজ টেক্সট-টু-স্পিচও নয়, এবং এটি কোনও টেমপ্লেটের উপর ভিত্তি করেও নয়। পরিবর্তে, এটি AI দ্বারা নিজস্ব বোধগম্যতা এবং যুক্তির ভিত্তিতে তৈরি করা হয়েছে। AI স্বয়ংক্রিয়ভাবে চরিত্র অনুসারে উপযুক্ত সুর এবং সুরের সাথে মিলবে।

আমরা যেভাবে এটি গাই তার থেকে এটি একটু আলাদা হতে পারে, কিন্তু ঠিক এই অনন্য "কৃত্রিম বুদ্ধিমত্তা-গন্ধযুক্ত" ব্যাখ্যাটি এটিকে এত আনন্দদায়ক করে তোলে!

একটি ছবি + একটি বাক্য, আর সবকিছুতেই গাওয়া এবং নাচানো যেতে পারে।

চন্দ্র নববর্ষ দ্রুত এগিয়ে আসার সাথে সাথে, অ্যান্ডি লাউ-এর "গং শি ফা কাই" মুক্তির পথে।

স্বর্গীয় রাজার সংস্করণে ক্লান্ত? তাহলে কেন সম্পদের ঈশ্বর নিজেই গান গাওয়ার চেষ্টা করবেন না? আমি সম্পদের ঈশ্বরের একটি ছবি আপলোড করে প্রম্পটে প্রবেশ করেছি। আর ভাবুন তো? সম্পদের ঈশ্বর আসলে জীবন্ত হয়ে উঠেছিলেন, "তোমার ভাগ্যের জন্য অভিনন্দন, সম্পদ অবশ্যই আসবে!" গান গাওয়ার সময় বাম এবং ডানে দুলছিলেন।

এটি সম্পদের দেবতার আশীর্বাদের প্রকৃত প্রতিমূর্তি।

অতএব, যখন আপনি নববর্ষের শুভেচ্ছার জন্য আপনার বড়দের এটি দেন, তখন লাল খামে পরিমাণ দ্বিগুণ না করা অযৌক্তিক হবে।

এমনকি মহান কবি লি বাইকেও সময়ের সাথে তাল মিলিয়ে চলতে হয়েছিল।

আমি লি বাইয়ের একটি প্রতিকৃতি বের করে তাকে "দাও মা দাও মা" গানটি পরিবেশন করতে বললাম। দুই মিনিট পরে, লি বাই চিত্রকর্ম থেকে "পুনরুজ্জীবিত হয়ে উঠলেন", আকর্ষণীয় সুরের সাথে বাম এবং ডানে দুলতে লাগলেন।

দুর্ভাগ্যবশত, এআই তাকে একটি খাঁটি দাও মা নৃত্য পরিবেশন করতে পারেনি, তাই মনে হচ্ছে সঙ্গীত এবং নৃত্য সম্পর্কে তার বোধগম্যতার জন্য এখনও কিছু অনুশীলনের প্রয়োজন। যাইহোক, যদিও নৃত্যের চালগুলি ট্র্যাকের বাইরে ছিল, এআই দ্বারা তৈরি সামগ্রিক দৃশ্যে একটি অনন্য ধরণের হাস্যরস ছিল এবং এটা বলতেই হবে যে কিয়ানওয়েন অ্যাপ সত্যিই এআই বিমূর্ততার রাজা।

Zootopia 2 সম্প্রতি বক্স অফিসে হিট হয়েছে, এবং ক্লাসিক জুটি নিক এবং জুডি আবার জনপ্রিয় হয়ে উঠেছে।

যেহেতু তারা ইতিমধ্যেই এত জনপ্রিয়, তাহলে কেন তাদের একটি যুগলবন্দী করা হবে না? নিক "ফ্রেন্ডস ফর লাইফ" গান গাইছেন, যখন জুডি তার পাশে দোল খাচ্ছে এবং মাথা নাড়ছে; আসলে দুজনের মধ্যে একটা নির্দিষ্ট রসায়ন আছে বলে মনে হচ্ছে। পুরো দৃশ্যটি একটি অফিসিয়াল স্পিন-অফ মিউজিক্যালের দৃশ্যের মতো দেখাচ্ছে।

তবে, নিকের অনন্য গানের ধরণ অপ্রত্যাশিতভাবে পুরো ভিডিওতে হাসির উৎস হয়ে ওঠে এবং কিয়ানওয়েন অ্যাপ সম্প্রতি সাধারণ শ্রমজীবী ​​মানুষের জন্য তাদের সাধারণ কর্মদিবসে হাসির উৎস হয়ে উঠেছে।

তখনকার জু সং-এর আত্মপরিচয়টা মনে আছে? "সবাইকে হ্যালো, আমি ভে, আর এটা আমার প্রথম মৌলিক অ্যালবাম, 'কাস্টমাইজড', যা মুক্তি পেতে চলেছে।" আমি ভাবছিলাম, আইনস্টাইন কেন একই রকম একটি অ্যালবাম করবেন না? তিনি মুখ খুললেন এবং গম্ভীরভাবে এই ক্লাসিক লাইনটি আবৃত্তি করলেন, আসলে তালের সাথে তাল মিলিয়ে মাথা নাড়লেন, এবং আরও আশ্চর্যজনক বিষয় হল তার ঠোঁটের নড়াচড়া পুরোপুরি মিলে গেল।

আমি শুধু এটুকু বলতে পারি যে এটা দেখার পর জু সং বাকরুদ্ধ হয়ে যাবেন, আর আইনস্টাইন কাঁদতে থাকবেন।

টম অ্যান্ড জেরি একটি ক্লাসিক প্যান্টোমাইম অ্যানিমেশন, কিন্তু এআই দিয়ে আমরা টমকে গান গাইতে বাধ্য করতে পারি, এমনকি বর্তমানে জনপ্রিয় মার্জিত পেঙ্গুইন নৃত্যও করতে পারি। দশের মধ্যে, আপনি এটিকে কত পয়েন্ট দেবেন?

অবশেষে, আমি মোনালিসাকে পেয়েছিলাম, যেটি ৫০০ বছর ধরে লুভরে বসে ছিল, সানগ্লাস পরে গান গাইতে শুরু করেছিলাম। লিওনার্দো দা ভিঞ্চির মাস্টারপিসের সাথে একটি আকর্ষণীয় গান – এই সমন্বয়টি কেবল পারফর্মিং আর্ট। সাংস্কৃতিক ধ্বংসাবশেষ পুনরুজ্জীবিত করার আরেকটি উপায় – আমি বুঝতে পেরেছি!

১০০০ পি-ছবি + লাইভ ভিডিও = সুখ²

অবশ্যই, কিয়ানওয়েন অ্যাপ কেবল ভিডিওই নয়, ছবিও তৈরি করতে পারে।

এই আপডেটটি নতুনভাবে সংশোধিত ইমেজ জেনারেশন এবং এডিটিং মডেল Qwen-Image-কে একীভূত করে, ইমেজ এডিটিং ধারাবাহিকতা, মাল্টি-ভিউ রূপান্তর এবং মাল্টি-ইমেজ ফিউশনে সাফল্য অর্জন করে। সহজ কথায়, ডায়ালগ ইন্টারফেসে কমান্ড ইনপুট করার মাধ্যমে, মডেলের ক্ষমতাগুলি স্বয়ংক্রিয়ভাবে চালু হয়, যা বিভিন্ন ধরণের স্বজ্ঞাত এবং স্বজ্ঞাত ক্রিয়াকলাপ সক্ষম করে।

উদাহরণস্বরূপ, ভঙ্গি পরিবর্তন করা: প্রথমে সোজা হয়ে বসে থাকা পোড়ামাটির যোদ্ধারা আদেশ পাওয়ার পরপরই একটি বাস্কেটবল ধরে মাঝ আকাশে শট নেওয়ার বীরত্বপূর্ণ ভঙ্গি গ্রহণ করে, যা দৃশ্যত আকর্ষণীয় ছিল।

উদাহরণস্বরূপ, পোশাক পরিবর্তনের কথা বিবেচনা করুন: সপ্তাহান্তে পোশাকের ছবি পোস্ট করতে চান কিন্তু পোশাক পরিবর্তন করতে খুব অলস? একটি সেলফি আপলোড করুন, এবং একটি বাক্য দিয়ে, আপনি আপনার টি-শার্টটিকে স্যুটে পরিবর্তন করতে পারেন, অথবা এমনকি ডেভিড মূর্তিটিকে মেসির জার্সিতে সাজাতে পারেন।

একটি ধারণা যত বেশি কল্পনাপ্রসূত, AI তত বেশি সৃজনশীল হতে পারে।

এই মুহুর্তে, আমরা উন্নত কৌশলগুলি অভিজ্ঞতা করতে পারি:

প্রথমে ছবিটি সম্পাদনা করুন, তারপর ভিডিওটি পুনরায় তৈরি করুন।

সহজ কথায়: প্রথমে, ছবিটি আপনার পছন্দ মতো দেখানোর জন্য ফটোশপ করুন, তারপর এটিকে নড়াচড়া, গান এবং নাচতে দিন। এই সমন্বয় সৃজনশীল স্বাধীনতাকে সর্বাধিক করে তোলে।

উদাহরণস্বরূপ, গত সপ্তাহান্তে আমি টাইটানিক পুনরায় দেখার জন্য সময় কাটিয়েছি, এবং তারপর হঠাৎ আমার মনে হলো: যদি আমরা টাইটানিকের ক্লাসিক ধনুকের দৃশ্যে এলন মাস্ক এবং আল্ট্রাম্যানকে ফটোশপ করে ব্যবহার করি?

প্রথম ধাপ, কাঁচা ছবি: আমি আমাদের দুজনের ছবি আপলোড করলাম, কমান্ডে প্রবেশ করলাম, এবং কিয়ানওয়েন অ্যাপ সরাসরি আমার জন্য একটি হাই-ডেফিনেশন কম্পোজিট ইমেজ তৈরি করল, ইলন মাস্কের একটি পুরুষ সংস্করণ এবং আল্ট্রাম্যানের একটি মহিলা সংস্করণ। দেখা গেল যে এটি তারকা-ক্রসড প্রেমীদের এক জোড়া যাদের ঘৃণা তাদের প্রেমের চেয়ে বেশি সময় ধরে থাকে।

দ্বিতীয় ধাপ হল একটি ভিডিও তৈরি করা: এই ছবির উপর ভিত্তি করে, "আমাকে এমন একটি ভিডিও তৈরি করতে সাহায্য করুন যেখানে ছবির ব্যক্তি উড়ন্ত গতিতে গান গাইছেন, সমুদ্রের বাতাস তীব্র হওয়া উচিত এবং আবেগ পূর্ণ হওয়া উচিত" ইনপুট করে চালিয়ে যান।

তারপর… দুই প্রযুক্তি শিল্পের জায়ান্ট আমার ফোনে আবেগের সাথে গান গাইতে শুরু করলেন।

একবার এই পর্যায়ে পৌঁছানোর পর, আমি থামতে পারিনি।

এরপর, আমি কিয়ানওয়েন অ্যাপ থেকে একটি লাল বিন তৈরি করি। তারপর আমি এটিকে "হাকিমি নর্থ অ্যান্ড সাউথ গ্রিন বিন, আশিগা আশি" এর নিজস্ব সংস্করণটি তার নিজস্ব সুরে গাইতে বলি।

ফলস্বরূপ, এই ছোট্ট লাল শিমটি, তার বিশাল চোখ দিয়ে, তার ছোট ছোট হাত নাড়ল এবং আকর্ষণীয় ছন্দে ডানে বামে দুলতে লাগল। তবে, এর কণ্ঠস্বর মোটেও মিষ্টি ছিল না; বরং, এটি বেশ রুক্ষ ছিল, এবং এর ধ্বংসাত্মক শক্তি মূলটির চেয়ে প্রায় তিনগুণ বেশি ছিল।

এটি শোনা ইউনানের বুনো মাশরুম খাওয়ার মতো; দৃশ্য এবং শব্দের সংমিশ্রণ অবিশ্বাস্যভাবে আসক্তিকর।

যেহেতু একক পরিবেশনা সম্ভব, তাহলে আত্মপ্রকাশের জন্য কেন একটি দল গঠন করা হবে না? আমার হঠাৎ অনুপ্রেরণা জাগলো: কেন চারটি মহান ধ্রুপদী উপন্যাসের প্রধান চরিত্রগুলিকে একটি ব্যান্ড গঠন করা হবে না?

আমি ঠিকই বলে ফেললাম। প্রথমে, আমি কিয়ানওয়েন অ্যাপের ইমেজ ব্লেন্ডিং ফাংশন ব্যবহার করে পাঁচটি ক্লাসিক ফিগারকে ফটোশপে একটি নিখুঁতভাবে স্থাপন করা ব্যান্ড লাইনআপে রূপান্তর করেছি—

সান উকং ছিলেন প্রধান গায়ক, গুয়ান ইউ বাজালেন ইলেকট্রিক গিটার, লিন দাইয়ু কিবোর্ডে বসেছিলেন, উ সং ড্রাম বাজালেন, এবং কাও কাও বেস বাজালেন। পোশাকের ছবি তোলার পর, সবচেয়ে সহজ অংশ ছিল তাদের নড়াচড়া করা। দুই মিনিট পরে, সময় এবং স্থানকে ছাড়িয়ে যাওয়া একটি রক কনসার্টের জন্ম হয়েছিল।

আমি বলতে চাই, এই প্রজন্মের কৃত্রিম বুদ্ধিমত্তা সত্যিই খেলতে জানে।

একটি ছবি + একটি বাক্য = ১০ সেকেন্ডের ভাইরাল ভিডিও। কোনও এডিটিং সফটওয়্যারের প্রয়োজন নেই, কোনও বিশেষ প্রভাব দক্ষতার প্রয়োজন নেই, এমনকি গান বা নাচের দক্ষতারও প্রয়োজন নেই। আপনার যা দরকার তা হল যথেষ্ট কল্পনাশক্তি, এবং AI আপনার জন্য এটি সম্ভব করে তুলতে পারে।

কিছুটা রসিকতা করার পাশাপাশি, এই বৈশিষ্ট্যটি গুরুত্ব সহকারে ব্যবহার করলে বেশ ব্যবহারিকও বটে।

নববর্ষের শুভেচ্ছা ভিডিওগুলি এআই-তে সরবরাহ করা যেতে পারে, জন্মদিন উদযাপনগুলি জন্মদিনের ব্যক্তিকে নাচতে দেখানো যেতে পারে, কোম্পানির বার্ষিক পার্টি প্রোগ্রামগুলিতে কখনও সৃজনশীলতার অভাব হবে না, এমনকি প্রেমের স্বীকারোক্তিগুলিকেও একটি নতুন মোড় দেওয়া যেতে পারে…

অবশ্যই, যদি আপনি শুধু কিছু মজা করতে চান, তাহলে Qianwen অ্যাপটি খুলুন, একটি ছবি আপলোড করুন, আপনার বোকা ধারণাটি টাইপ করুন এবং বাকিটা AI-এর উপর ছেড়ে দিন। 2-5 মিনিটের মধ্যে, আপনার কাছে একটি ভাইরাল ভিডিও থাকবে যা সোশ্যাল মিডিয়ায় অবশ্যই ভাইরাল হবে।

দেখা যাচ্ছে যে কৃত্রিম বুদ্ধিমত্তার যুগে সুখ সত্যিই এত সহজ।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো