আমি Honor 600 Pro-এর AI Image to Video 2.0 পরীক্ষা করে দেখেছি, এবং এটি আমার প্রত্যাশার চেয়েও ভালো।

আচ্ছা, এই ধারণাটা শুনে আপত্তি করার আগে আমার কথাটা শুনুন। কৃত্রিম বুদ্ধিমত্তা (AI) এখন সর্বত্র, এবং এমনভাবে এর বিস্তার যা একজন সাধারণ স্ক্রিনে আসক্ত আধুনিক মানুষ সবসময় উপলব্ধি করতে পারবে না। কিন্তু AI-এর এই ব্যাপক সংযোজনের ঝড়ের মাঝেও আনন্দের কিছু ঝলক রয়েছে। অনায়াসে স্থিরচিত্রকে একটি ছোট ক্লিপে পরিণত করা তেমনই একটি কৌশল, যা আমি ব্যবহার করতে পারলে খুব খুশি হতাম—অবশ্যই কোনো অনাকাঙ্ক্ষিত অনুমতি বা টোকেনের ঝামেলা ছাড়াই।

আমি আমার বর্তমান দৈনন্দিন ব্যবহৃত ফোন, Honor 600 Pro-তে এই সুবিধাটি হঠাৎ করেই পেয়ে যাই এবং এর ফলাফল বেশ সন্তোষজনক। এটি ঠিক কোনো নতুন কৌশল নয়। কিন্তু যা আমার মনোযোগ আকর্ষণ করেছে তা হলো, Honor যেভাবে এটিকে পরিশীলিত রূপে উপস্থাপন করছে। কোনো সাইন-আপের ঝামেলা নেই। সিস্টেম গ্যালারিতে এর একটি চমৎকার সংযোজন রয়েছে। এবং রূপান্তর প্রক্রিয়াটিও বেশ সহজ। এমনকি ফোনটিতে একটি ডেডিকেটেড কী-ও রয়েছে, যা চাপলেই আপনাকে সঙ্গে সঙ্গে এই এআই ইমেজ ট্রান্সফরমেশনে নিয়ে যায়।

গত বছর যখন Honor 400 সিরিজ লঞ্চ করেছিল, তখন তারা AI ভিডিও তৈরির একটি কৌশল চালু করে, যা একটি স্থির ছবিকে পাঁচ সেকেন্ডের ভিডিও ক্লিপে পরিণত করতে পারত। ব্যবহারকারীরা এটি খুব পছন্দ করেছিল এবং এই ফিচারটি ব্যবহার করে ১৩.৪ মিলিয়নেরও বেশি সেকেন্ডের AI ভিডিও তৈরি করেছিল। তবে, এর কিছু সুস্পষ্ট সীমাবদ্ধতা ছিল। Honor-এর AI ইমেজ টু ভিডিও ফিচারের প্রথম সংস্করণে নির্দিষ্ট প্রম্পট যোগ করার কোনো অপশন ছিল না।

সুতরাং, আপনার ছবি নিয়ে এআই যা করার সিদ্ধান্ত নিত, আপনি ঠিক তাই পেতেন। অনার ৬০০ সিরিজ এই বছর এআই ইমেজ টু ভিডিও ২.০ আপগ্রেডের মাধ্যমে একটি অত্যন্ত প্রয়োজনীয় পরিবর্তন এনেছে, যা অনারের ভাষায় ইন্ডাস্ট্রির প্রথম সমন্বিত মাল্টি-মোডাল ভিডিও জেনারেশন মডেল দ্বারা চালিত। এই সিস্টেমটি ভিডিও তৈরি, সম্পাদনা এবং বোঝার কাজকে একটি একক ওয়ার্কফ্লোতে একত্রিত করে।

নতুন এই ফিচারটির সাহায্যে, আপনি এখন ফলাফল নিয়ন্ত্রণ করার জন্য নিজের টেক্সট প্রম্পটের পাশাপাশি সর্বোচ্চ তিনটি ছবিও দিতে পারবেন। ফিচারটি গ্যালারি অ্যাপের ক্রিয়েট ট্যাবের অধীনে রয়েছে, অথবা আপনি Honor 600 Pro-তে থাকা ডেডিকেটেড AI বাটনটি চেপেও দ্রুত এটি ব্যবহার করতে পারেন। পরের পদ্ধতিটিই, নিঃসন্দেহে, বেশি সহজ এবং আমার পছন্দের।

AI Image to Video 2.0-এর সাথে ১৯টি পূর্ব-নির্মিত টেমপ্লেট রয়েছে, যার প্রতিটির নিজস্ব পূর্বনির্ধারিত প্রম্পট এবং স্টাইল আছে। সিনেম্যাটিক প্রিসেটগুলোর মধ্যে “বুলেট টাইম” এবং “হিচকক জুম”-এর মতো ক্যামেরা মুভমেন্ট অন্তর্ভুক্ত। এছাড়াও রয়েছে মোশন-ভিত্তিক এফেক্ট, অ্যানিমেশন টেমপ্লেট এবং বিভিন্ন আবেগঘন মুহূর্তকে কম্পোজিট করার জন্য আরও কিছু টেমপ্লেট। যদি এগুলোর কোনোটিই আপনার পছন্দ না হয়, তবে আপনি টেমপ্লেটগুলো পুরোপুরি বাদ দিয়ে নিজের মতো করে প্রম্পট লিখে একটি কাস্টমাইজড ক্লিপ তৈরি করতে পারেন।

কিন্তু এটা কি আসলেই কাজ করে?

AI Image to Video 2.0 দিয়ে ক্লিপ তৈরি করতে প্রায় পাঁচ থেকে সাত মিনিট সময় লাগে, তাই তাৎক্ষণিক ফল আশা করবেন না। তবে পুরো প্রক্রিয়াটি ব্যাকগ্রাউন্ডে চলতে পারে, ফলে আপনার ফোনটি পুরো সময় ব্যবহারযোগ্য থাকে, যা একটি ভালো সুবিধা। আমি কয়েকটি টেমপ্লেট পরীক্ষা করে দেখেছি এবং এমনকি কাস্টম প্রম্পটও ব্যবহার করে দেখেছি, আর তার ফলাফল নিচে দেওয়া হলো।

সৈকতে দাঁড়িয়ে থাকা আমার একটি ছবি ড্রোন পুলব্যাক টেমপ্লেটটিতে দেওয়ার পর এটি চমৎকার ফলাফল দিয়েছে। এটি মূল ফ্রেমে কোনো পরিবর্তন না করেই, প্রাসঙ্গিকভাবে উপযুক্ত অডিওসহ একটি বিশ্বাসযোগ্য সিমুলেটেড ড্রোন পুলব্যাক তৈরি করেছে।

ম্যাজিক ওয়ারড্রোবও বেশ ভালো কাজ করেছে। আমি এটিকে একটি নজরকাড়া পোশাক পরা ম্যানিকুইনের ছবি দিয়েছিলাম, এবং এআই শুধু কয়েকবার পোশাকই বদলায়নি, বরং ব্যাকগ্রাউন্ড ও শ্যাডো অক্ষত রেখে ম্যানিকুইনটিকেও অ্যানিমেট করেছে। দেখুন:

এগুলোর মধ্যে অ্যানিমেশন ম্যাজিক আমার সবচেয়ে প্রিয়। পাহাড় ও পাখিসহ একটি আঁকা প্রাকৃতিক দৃশ্যে এটি প্রয়োগ করলে, এটি বিদ্যমান পাখিগুলোকে জীবন্ত করে তোলে, উড়ন্ত নতুন পাখি যোগ করে, একটি ধীরগতির জুম চালু করে যা পটভূমিতে অতিরিক্ত চূড়াগুলোকে ফুটিয়ে তোলে এবং দৃশ্যে একটি সূর্য স্থাপন করে।

তবে, কিছু টেমপ্লেট অন্যগুলোর চেয়ে ভালো কাজ করেছে। উদাহরণস্বরূপ, ‘পেট রোলপ্লে’ টেমপ্লেটটি তাত্ত্বিকভাবে মজাদার হলেও, এটি একটি শৈলীযুক্ত, প্রায় কার্টুনধর্মী ভিজ্যুয়াল ভাষার ওপর খুব বেশি নির্ভর করে। উৎস ছবির আসল প্রাণীটির সাথে এর সাদৃশ্য প্রায়শই বিলীন হয়ে যায়, ফলে এটিকে আপনার নির্দিষ্ট পোষ্যটির একটি অ্যানিমেটেড সংস্করণের চেয়ে একটি সাধারণ এআই ইলাস্ট্রেশনের মতো বেশি মনে হয়। প্রসঙ্গত, আমি যে ছবিটি শেয়ার করেছিলাম তা এখানে দেওয়া হলো।

কাস্টম প্রম্পট মোডেই আসল জাদুটা ঘটে।

একটি সাকুলেন্টের আগের ও পরের দুটি ছবি ব্যবহার করে, যার একটিতে ছিল প্রায় পাতাশূন্য এবং অন্যটিতে নতুন পাতা গজাতে শুরু করেছে, আমি পাতাগুলো বেড়ে ওঠার একটি ভিডিও তৈরি করতে বলেছিলাম এবং এটি তা করে দেখিয়েছে। এর বাইরে এটি যা যোগ করেছিল, তা ছিল আরও আকর্ষণীয় অংশ: ক্যামেরাটি ধীরে ধীরে জুম আউট হওয়ার সাথে সাথে টবটি আলতোভাবে ঘুরতে থাকে, যা পুরো ক্লিপটিকে একটি সিনেম্যাটিক আবহ দেয়।

যদিও আমার অভিজ্ঞতা মূলত ইতিবাচক ছিল, এই ফিচারটি ব্যবহার করার জন্য Honor 600 Pro কেনার আগে দুটি বিষয় জেনে রাখা ভালো। জেনারেট বাটনটিতে বর্তমানে “সীমিত-সময়ের ট্রায়াল” লেখা দেখাচ্ছে, তাই ভবিষ্যতে এর জন্য ফি প্রযোজ্য হওয়ার সম্ভাবনা রয়েছে, যা আপনার অঞ্চলভেদে ভিন্ন হতে পারে।

এই ফিচারটি প্রতিদিন ১০টি জেনারেশনে সীমাবদ্ধ।

সাধারণ ব্যবহারের জন্য এটা ঠিক আছে, কিন্তু যদি আপনি এটি ব্যাপকভাবে ব্যবহার করার পরিকল্পনা করেন তবে এটি সীমাবদ্ধ মনে হতে পারে। এতে অবাক হওয়ার কিছু নেই। এআই ভিডিও তৈরি করা কম্পিউটিং রিসোর্সের উপর বেশ চাপ সৃষ্টি করে, তাই এখন ভাবলে মনে হয়, দশটি কনভার্সন পাওয়াটা বেশ উদারতারই পরিচয়। আমার একটি গুগল এআই প্রো সাবস্ক্রিপশন আছে, এবং Veo মডেলটি ব্যবহার করে ছয়টি ছোট ক্লিপ তৈরি করার আগেই আমি একটি ভিডিও লিমিটের সতর্কবার্তা দেখতে পাই।

কিছু অমসৃণ প্রান্ত

“অ্যাড অডিও” ফিচারটি বেশিরভাগ ক্ষেত্রে ঠিকঠাক কাজ করলেও, মানুষের ক্ষেত্রে বিষয়টি অসামঞ্জস্যপূর্ণ হয়ে পড়ে। তৈরি করা কয়েকটি ক্লিপে দেখা যায়, ডিভাইসের ভাষা ইংরেজিতে সেট করা থাকা সত্ত্বেও বিষয়বস্তুগুলো চীনা ভাষায় কথা বলছে। কিছু ক্ষেত্রে, ছবিগুলোর বিষয়বস্তুতে পূর্ব এশীয় মুখের বৈশিষ্ট্য প্রয়োগ করা হয়েছিল।

এগুলো সম্ভবত মডেলের প্রশিক্ষণ ডেটার ত্রুটি, যা পূর্ব এশীয় ব্যবহারকারীদের দিকে বেশি ঝুঁকে আছে বলে মনে হচ্ছে। তবে, সময়ের সাথে সাথে মডেলটি আরও বৈচিত্র্যময় ইনপুটের সংস্পর্শে এলে এর উন্নতি হওয়া উচিত। এটি এমন কোনো বড় সমস্যা নয় যে এর জন্য মডেলটি ব্যবহার করা যাবে না, কিন্তু আপনি যদি মানুষের ছবি নিয়ে এই ফিচারটি ব্যবহার করার পরিকল্পনা করেন, তবে বিষয়টি জেনে রাখা ভালো।

সামগ্রিকভাবে, Honor-এর Image to Video 2.0 হলো 400 সিরিজের সাথে চালু হওয়া সংস্করণটির তুলনায় একটি অর্থবহ আপগ্রেড। কাস্টম প্রম্পট, একাধিক ছবি ব্যবহারের সুবিধা এবং টেমপ্লেট লাইব্রেরি এটিকে নিছক নতুনত্ব থেকে সত্যিকারের সৃজনশীল উপযোগিতাসম্পন্ন একটি ফিচারে পরিণত করেছে। এটি ত্রুটিহীন নয়, কিন্তু যখন এটি কাজ করে, তখন সত্যিই দারুণভাবে কাজ করে।