বিলিবিলি এআই ক্রিয়েশন প্রতিযোগিতায় প্রথম পুরস্কার বিজয়ী কনটেন্ট ক্রিয়েটর বলেছেন যে, এআই সৃজনশীলতায় সাহায্য করে না, বরং এর উপযোগিতা অন্য ক্ষেত্রে নিহিত।

"দ্য সিঙ্গুলারিটি ইজ নিয়ার" হলো ২০০৫ সালে প্রকাশিত একটি বই, যা প্রযুক্তির ভবিষ্যৎ সম্পর্কে ভবিষ্যদ্বাণী করে। এখন পেছন ফিরে তাকালে দেখা যায়, এর অনেক ভবিষ্যদ্বাণীই অতিমাত্রায় আশাবাদী ছিল, যেমন ২০১০ সালের মধ্যে ভিআর (VR) ব্যাপকভাবে প্রচলিত ও পরিপক্ক হয়ে উঠবে—এই ভবিষ্যদ্বাণীটি।

তবে, একটি ভবিষ্যদ্বাণী স্পষ্টতই রক্ষণশীল ছিল: বইটিতে বলা হয়েছিল যে টিউরিং টেস্টে উত্তীর্ণ হতে সক্ষম কোনো এআই কম্পিউটার ২০২৯ সালের আগে আবির্ভূত হবে না। বাস্তবে, চ্যাটজিপিটি ২০২৩ সালেই টিউরিং টেস্টে উত্তীর্ণ হয়ে গিয়েছিল। এর ফলস্বরূপ, সামাজিক যোগাযোগ মাধ্যমগুলো এআই-সৃষ্ট এমন সব বিষয়বস্তুতে ছেয়ে গিয়েছিল, যেগুলোকে আসল বিষয়বস্তু থেকে আলাদা করা কঠিন হয়ে পড়েছিল। এর ফলে এই এআই-সৃষ্ট আবর্জনার জন্য একটি বিশেষ পরিভাষার উদ্ভব হয়: "ডিজিটাল আবর্জনা"।

আসন্ন প্রযুক্তিগত এককত্ব নিয়ে মানুষের ধারণা ভিন্ন। যা আমাকে সত্যিই হতবাক করেছিল এবং স্পষ্টভাবে উপলব্ধি করিয়েছিল যে এআই প্রযুক্তি একটি নতুন যুগ সৃষ্টি করতে সক্ষম, তা হলো এআই-নির্মিত ভিডিও "দ্য সাইন"।

সুতরাং, পড়া চালিয়ে যাওয়ার আগে, আমি আশা করি আপনি ৭ মিনিট সময় নিয়ে এই ভিডিওটি দেখবেন, যা বিলিবিলিতে ইতিমধ্যেই ১৮ মিলিয়নেরও বেশি ভিউ পেয়েছে: [ব্র্যান্ড] যখন পৃথিবী অতিরিক্ত "সৎ", তখন আমরা কীভাবে আমাদের কৌতূহল এবং সাহস বজায় রাখতে পারি ?

বিলিবিলি আপ-এর ক্রিয়েটর ডিডি_ওকে এই ভিডিওটির নির্মাতা, এবং তার কাজটি শেষ পর্যন্ত বিলিবিলির প্রথম এআই ক্রিয়েশন প্রতিযোগিতার ওপেন ট্র্যাকে প্রথম পুরস্কার জিতেছে। আমার মতে, পুরস্কার বিতরণী অনুষ্ঠানে তার এই উপস্থাপনাটি "ব্র্যান্ড" ভিডিওটির চেয়ে কোনো অংশে কম মূল্যবান নয়। যদি "ব্র্যান্ড" ভিডিওটির মূল্য মানুষকে এআই-নির্মিত ভিডিওর সর্বোচ্চ সীমা উপলব্ধি করানোর মধ্যে নিহিত থাকে, তাহলে এই উপস্থাপনার মূল্য নিহিত রয়েছে এই "সর্বোচ্চ সীমা" কীভাবে তৈরি করা হয়েছে তার মধ্যে।

DiDi_OK সম্পূর্ণ লেখাটি শেয়ার করেছেন।

(সহজ পাঠের জন্য আমি উপশিরোনাম যোগ করেছি।)

সবাইকে নমস্কার! এখানে দাঁড়িয়ে আপনাদের সাথে আমার সৃজনশীল কাজের প্রক্রিয়া ভাগ করে নিতে পারাটা আমার জন্য এক বিরাট সম্মানের বিষয়। প্রথমে, আমি আমার পরিচয় দিই। আমার নাম ডিডি_ওকে। আমার এই নাম হওয়ার কারণ হলো, আমার আগের নামে "D" অক্ষরটি ছিল, তাই ছোটবেলা থেকেই সবাই আমাকে "ছোট ভাই" বলে ডাকে। আর এই সুযোগটা সবাই নিতেই পারে।

আমি বর্তমানে লন্ডনে বিজ্ঞাপন প্রযোজনার কাজ করি, এবং কৃত্রিম বুদ্ধিমত্তার (AI) সাথে যুক্ত হওয়াটা ছিল আসলে একটি স্বাভাবিক অগ্রগতি। আজ, আমি কীভাবে এই গল্পটি তৈরি করেছি এবং কৃত্রিম বুদ্ধিমত্তার প্রক্রিয়াটি নিয়ে আমার ব্যক্তিগত ভাবনাগুলো সবার সাথে ভাগ করে নিতে পেরে অত্যন্ত সম্মানিত বোধ করছি। এখানে একটি সংক্ষিপ্ত অপ্রাসঙ্গিক আলোচনা রয়েছে; এতে হয়তো কিছু কিছুটা উগ্র বক্তব্য থাকতে পারে, কিন্তু এগুলো নিঃসন্দেহে আমার প্রকৃত চিন্তাভাবনা।

যেসব অনুভূতি থাকা অপরিহার্য, সেগুলোর প্রকাশই সৃষ্টির প্রাথমিক শর্ত।

প্রথমেই, আমি আমার প্রাথমিক সৃষ্টির পেছনের অনুপ্রেরণাটি আপনাদের সাথে ভাগ করে নিতে চাই। আমি যেমন অনেক সাক্ষাৎকার এবং উপস্থাপনায় উল্লেখ করেছি, 'দ্য সাইন'-এর প্রাথমিক ধারণাটি এসেছিল বড়দিনের ছুটিতে বন্ধুদের সাথে তুরস্ক ভ্রমণের সময়।

এখানে কয়েকটি ছবি দেওয়া হলো। যেমন, প্রথম দুটি এবং শেষেরটি তুরস্কের ছবি। এটা ছিল আমার প্রথম অভিজ্ঞতা। আমি এমন এক জায়গায় এসেছিলাম যেখানে আমি আমার মাতৃভাষা বলতে পারতাম না, আর ইংরেজিতে কথা বলাও ছিল অর্থহীন। আমি অনেক সাইনবোর্ডের অর্থ একেবারেই বুঝতে পারছিলাম না। স্থানীয় চালকদের সাথে যোগাযোগের জন্য আমি কেবল ChatGPT ব্যবহার করতে পারতাম, যা ছিল বেশ কঠিন। সেই মুহূর্তে আমি উপলব্ধি করলাম যে, গ্রাফিক্সই যেন একেবারে শুরু থেকেই মানব যোগাযোগের ভাষা ছিল।

তৃতীয় ছবিটি খুব গুরুত্বপূর্ণ; এটি আমার ব্রিটিশ বন্ধুর বাড়ির একটি ছবি। আমি তার বাথরুমের দেওয়ালে দুটি বিস্ময়সূচক চিহ্ন লক্ষ্য করি এবং তা নিয়ে আমার নিজস্ব কিছু ভাবনা তৈরি হয়। শেষ পর্যন্ত, আমি তাকে এ ব্যাপারে কিছু জিজ্ঞেস করিনি, কারণ আমার মনে হয়েছিল যে আমি নিজেকে যে গল্পটি বলেছিলাম, সেটিই বেশি অর্থবহ। এটাই ছিল আমার প্রাথমিক সৃজনশীল ধারণা, এবং আপনারা দেখতেই পাচ্ছেন, এটি একটি বেশ আনুষ্ঠানিক সূচনা বিন্দু।

এরপর, আমি আমার কিছু গভীর ভাবনা আপনাদের সাথে ভাগ করে নেব। আমার কাছে, আমি কখনোই গল্পটিকে মূল লক্ষ্য হিসেবে বিবেচনা করিনি; আমি বিশ্বাস করি, আমাদের প্রতিটি কাজের উদ্দেশ্য হলো অভিব্যক্তি—অন্তত, এটাই আমার অটল বিশ্বাস। আমি মনে করি, দৈনন্দিন জীবনে প্রত্যেকেই অনেক কিছুর সম্মুখীন হয়। যেমন, বড়দিনের সময় আমার মধ্যে প্রচণ্ড রাগের অনুভূতি হয়েছিল। কারণ সেই সময়ে খবরের কাগজ খুললেই যুদ্ধের মতো অনেক অপ্রীতিকর খবর চোখে পড়ত। লন্ডনে, এই বহু-জাতিগত মিলনক্ষেত্রের মধ্যে আমি প্রায়ই উত্তেজনা এবং অস্বস্তিকর পরিবেশ অনুভব করি। আমি ভাবলাম, "এটা ২০২৬ সাল, মানুষ এখনও এতটা দুষ্ট হতে পারে কী করে?"

রাগ স্বাভাবিকভাবেই দাবির জন্ম দেয়। আমার একটি প্রত্যাশা আছে: আমি শৈশবের সেই অনুভূতিটা আবার ফিরে পেতে চাই—সবাই একসাথে থাকার অনুভূতি, ঠিক ২০০৮ সালের বিশ্বগ্রামের মতো। আমার উপর প্রজন্মের ছাপ রয়েছে; আমি 'ইনডিপেন্ডেন্স ডে' এবং 'দ্য লর্ড অফ দ্য রিংস' দেখে বড় হয়েছি। 'দ্য লর্ড অফ দ্য রিংস'-এর শ্বেত নগরীর যুদ্ধের দৃশ্যগুলো আমি খুব মিস করি, এবং 'হ্যারি পটার'-এর হগওয়ার্টসের যুদ্ধের দৃশ্যগুলোও খুব মিস করি। আমি অবাক হই যে ইদানীং আমরা এই জিনিসগুলো কেন দেখতে পাচ্ছি না। এটাই আমার প্রত্যাশা: আমি সেই দৃশ্যগুলো আবার দেখার জন্য অপেক্ষা করছি। এবং আমি মনে করি যে আপনি যদি এটা না করেন, তবে আমিই করব। এটাই আমার দ্বিতীয় প্রত্যাশা।

শেষ পর্যন্ত, বিষয়টি একটি কথাতেই এসে দাঁড়ায়: আমার মূল বার্তা হলো মানুষের মধ্যকার বাধা কমিয়ে আনা। অন্য কথায়, প্রশ্নটা হলো আমরা একে অপরকে সত্যিই মানুষ হিসেবে গণ্য করতে পারি কি না এবং একটি অভিন্ন লক্ষ্যে একসঙ্গে কাজ করতে পারি কি না; ঠিক যেমন 'পাইরেটস অফ দ্য ক্যারিবিয়ান ৩'-এর সেই দৃশ্যটি, যেখানে প্রতিটি জাহাজ তার নিজের জাতীয় পতাকা উত্তোলন করে।

এটা আমার নিজস্ব ফর্মুলা, যা আমি প্রতিবার ভিডিও বানানোর সময় ব্যবহার করি; আমি এটাকে বলি প্রাথমিক মাইন্ড ম্যাপ। প্রথম ধাপ হলো প্রকাশ। একবার প্রকাশের জায়গাটা খুঁজে পেলে, তা অবশ্যই আমার হৃদয় থেকে আসতে হবে। আমি হয়তো বলতে পারি যে, এটা প্রকাশ না করলে আমার ঘুম আসে না। এই পর্যায়ে, আমি নিজেকে প্রশ্ন করি এই প্রকাশটি মূল্যবান কি না, এটি অন্যদের বিরক্ত করবে কি না বা আকর্ষণীয় অনুভূতি জাগিয়ে তুলবে কি না। এটাই আমার আত্ম-মূল্যায়নের প্রথম ধাপ।

নিজেকে প্রকাশ করা অনেকটা নৈশভোজের আয়োজন করার মতো; এক্ষেত্রে শ্রোতা এবং খরচ—উভয় বিষয়ই বিবেচনা করতে হয়।

দ্বিতীয় ধাপে আসে আঙ্গিকের বিষয়টি। আমার কাছে সিনেমা বানানোটা অনেকটা নৈশভোজের আয়োজন করার মতো। আমার একটি নিজস্ব বিশেষ পদ থাকে, যা হয়তো আমার এলাকার কোনো পদ অথবা আমার নিজের তৈরি কোনো পদ। আমি যদি সেটা সরাসরি অতিথিদের পরিবেশন করি, তবে ব্যাপারটা একটু খাপছাড়া হয়ে যাবে।

উদাহরণস্বরূপ, আমি যদি আমার কোনো বিদেশি বন্ধুকে আমার প্রিয় ‘স্টিনকি টোফু’ খাওয়াতে আমন্ত্রণ জানাই এবং সরাসরি তাকে তা পরিবেশন করি, তাহলে খুব সম্ভবত সে তা খেতে রাজি হবে না। এক্ষেত্রে, সৌজন্যের খাতিরে আমার উচিত প্রয়োজনীয় কাঁটাচামচ ও ছুরি-চামচ প্রস্তুত রাখা এবং সাথে হয়তো কিছু বিখ্যাত চীনা খাবার, যেমন ‘সুইট অ্যান্ড সাওয়ার পর্ক’ বা ‘কুং পাও চিকেন’ রাখা, যাতে সূক্ষ্মভাবে অন্য ব্যক্তিটি তা গ্রহণ করার জন্য কিছুটা সময় পায়। উপযুক্ত সময়ে, আমি আমার ‘স্টিনকি টোফু’ পরিবেশন করে তাকে চেখে দেখতে বলতে পারি। তার হয়তো ভালোও লেগে যেতে পারে। আমার জন্য, এটা কেবলই একটা আনুষ্ঠানিকতা।

‘দ্য সাইনস’ চলচ্চিত্রটিতে আমি শেষ পর্যন্ত এমন একটি আঙ্গিক বেছে নিয়েছি যা আমার কাছে বিশেষভাবে আকর্ষণীয় মনে হয়েছে: বিভিন্ন ধরনের চিহ্ন। এটি আরেকটি প্রশ্নের জন্ম দেয়: আকর্ষণীয় কী, এবং একটি আকর্ষণীয় আঙ্গিক বলতে কী বোঝায়? আমরা যদি বিখ্যাত চলচ্চিত্র এবং টেলিভিশন শোগুলোর নকশাগুলো স্মরণ করি, যেমন ‘স্টার ওয়ার্স’-এর ডেথ স্টার—একটি কিংবদন্তিতুল্য অস্ত্র—এর দৃশ্যগত ভাষাটি খুবই সরল: একটি গোলক। এটি যে অপরিসীম শক্তিসম্পন্ন একটি কৃত্রিম মহাজাগতিক বস্তু, তা বুঝতে দর্শকদের খুব বেশি মানসিক প্রচেষ্টার প্রয়োজন হয় না। এই নকশার পদ্ধতিটি ‘স্টার ওয়ার্স’-এ ব্যাপকভাবে প্রচলিত। আমি দেখেছি যে, গতির অনুভূতি প্রদানকারী প্রধান মহাকাশযানগুলোর পেছনের নকশার ধারণাটি মূলত পোশাকের ক্লিপ থেকে নেওয়া হয়েছে। এই পদ্ধতিটি দর্শকদের গল্পের গভীরে প্রবেশ করানোর একটি তুলনামূলকভাবে দ্রুত উপায়।

এই ধাপের পর, আমি নিজেকে আবার জিজ্ঞাসা করব: এটা কি প্রযুক্তিগতভাবে সম্ভব? যদিও এখন SeeDance2 এবং Keling-এর মতো অনেক চমৎকার এআই টুল রয়েছে, তবুও একটি ছোট দল বা একক লেখক হিসেবে আমি ভেবে দেখি যে আমি একটি নির্দিষ্ট সময়সীমার মধ্যে কাজটি শেষ করতে পারব কি না। যদি আমি সময়সীমার মধ্যে এটি শেষ করতে না পারি, তবে আমার ব্যক্তিগত প্রেরণা ভেঙে যাবে। তাই, আমার প্রথম পদক্ষেপ হলো মূল্যায়ন করা যে, একটি ভালো ফরম্যাট থাকলে, খরচ এবং প্রযুক্তি নিয়ন্ত্রণযোগ্য কি না। তৃতীয় ধাপে, আমি অনেক ধারণাও বাদ দিয়ে দেব, এমনকি যদি সেগুলো খুব আকর্ষণীয়ও হয়, কারণ আমি সেগুলোর খরচ নিয়ন্ত্রণ করতে পারি না।

এই তিনটি ধাপের পর, আমি নিজেকে আবার জিজ্ঞাসা করব: এই ধারাবাহিক কর্মকাণ্ডের পর, আমি কি আমার অভিব্যক্তিতে ফিরতে পারব? এটা অনেকটা জিয়াং ওয়েনের কথার মতোই: আমি শুধু এই এক প্লেট ভিনেগারের জন্যই ডাম্পলিং বানিয়েছি। যদি আমি ডাম্পলিং বানানো শেষ করেও এক প্লেট ভিনেগার পরিবেশন করতে না পারি, তাহলেও আমি এই চলচ্চিত্রটি বানাতে চাইব না। এটাই আমার প্রাথমিক আত্ম-পরীক্ষা এবং আত্ম-যাচাই।

এআই শুধু আমাদের কাজের পদ্ধতিই বদলে দেয়নি, বরং আমাদের আত্মমর্যাদা পুনর্মূল্যায়নের দিকেও চালিত করেছে।

এআই ঠিক কী পরিবর্তন করেছে? অন্তত এখন পর্যন্ত, এটি আমার কাজের ধরণ এবং জীবন সম্পর্কে আমার মানসিকতা পুরোপুরি বদলে দিয়েছে। আমি এই বিষয়টি বিস্তারিতভাবে বিশ্লেষণ করব, যা কেবল আমার ব্যক্তিগত অভিজ্ঞতা।

প্রথমত, এআই ব্যক্তিগত মূল্যবোধের ওপর আলোকপাত করে, বিশেষ করে নিজের মতো থাকার গুরুত্বের ওপর। স্নাতক হওয়ার পর থেকে আমি চাকরির সন্ধান প্রক্রিয়ার মধ্যে দিয়ে গিয়েছি, এবং আমার বন্ধুরা ও আমি সবাই একই প্রশ্নের মুখোমুখি হয়েছি: আমি কি যথেষ্ট ভালো নই? সামাজিক রীতিনীতির সাথে মানিয়ে চলার জন্য আমার কি নিজের একটি অংশকে বিসর্জন দেওয়া উচিত? আমি কি সামাজিক মেলামেশায় পারদর্শী নই? আমি কি অতিরিক্ত ব্যক্তিস্বাতন্ত্র্যবাদী? আমি প্রায়শই একটি সাহসী মন্তব্য করি: আমি বিশ্বাস করি, নিজের মতো থাকার জন্য কাউকে শাস্তি দেওয়া উচিত নয়; এটা ভুল। তবে, অতীতে নিজের মতো থাকার জন্য অনেককেই বিভিন্ন মাত্রায় শাস্তি পেতে হয়েছে।

আমার অনেক ব্যক্তিগত অভিজ্ঞতা আছে। আমি ছোটবেলা থেকেই ছবি আঁকি; আমি দানব আঁকতে ভালোবাসি। আমার এটাও মনে আছে, ছোটবেলায় যখন প্রেমিকার বাবা-মায়ের বাড়িতে বেড়াতে যেতাম, তারা আমাকে জিজ্ঞেস করতেন আমি জীবিকা নির্বাহের জন্য কী করি। অনেকক্ষণ ভাবার পর আমি বলতাম, আমি দানব আঁকি। সেই সময় আমার নিজেকে মূল্যহীন মনে হতো, যেন আমার কোনো সম্মানজনক জীবনযাত্রা বা নির্দিষ্ট কোনো চিন্তাভাবনা নেই। কিন্তু এখন আমার মনে হয়, আমি সবসময় যে ধারণা ও নীতিগুলো আঁকড়ে ধরেছি, ঠিক সেগুলোই আমাকে এই যুগে হঠাৎ করে আকর্ষণীয় কিছু সৃষ্টি করার সুযোগ করে দিয়েছে। আমি হঠাৎ পরবর্তী বিষয়টি উপলব্ধি করলাম: মনে হচ্ছে, নিজেকে খুঁজে পাওয়ার এই প্রতিযোগিতায় আমার চেয়ে ভালো আর কেউ নেই। কৃত্রিম বুদ্ধিমত্তার (AI) আবির্ভাবের সাথে সাথে আমার কিছু জড়তা ও অদ্ভুত আচরণ গ্রহণযোগ্য হয়ে উঠেছে, কারণ কোনো না কোনো স্তরে সেগুলোর হয়তো প্রকৃত মূল্য রয়েছে।

দ্বিতীয়ত, কন্টেন্ট সাইলো। এই পরিভাষাটি হয়তো আমি নিজেই তৈরি করেছি, কিন্তু আমি একটি বিষয় লক্ষ্য করেছি: ১৯৯০-এর দশকে বা এমনকি ২০০০ সাল পর্যন্ত জন্ম নেওয়া মানুষেরা যখন গান শোনার কথা বলেন, তখন তারা জে চৌ-এর কথা ভাবেন; নারী কণ্ঠশিল্পীদের ক্ষেত্রে, জোলিন সাই এবং হয়তো জেজে লিন। সেই যুগে, সবাই টিভিতে একই ধরনের সাংস্কৃতিক বিষয়বস্তু দেখত, সেটা গান হোক বা সিনেমা। এর মধ্যে একটি খুব সাধারণ যোগসূত্র ছিল: সবাই এই শিল্পীদের দেখেই বড় হয়েছে। কিন্তু এখন একটি সমস্যা দেখা দিয়েছে। যখন আমরা আমাদের নিজেদের মিউজিক অ্যাপ খুলি, তখন প্লেলিস্টগুলো একে অপরের থেকে ব্যাপকভাবে আলাদা হয়। কন্টেন্ট ক্রমশ ব্যক্তিগত এবং বিচ্ছিন্ন হয়ে পড়ছে। আমি কী পছন্দ করি, তা হয়তো আমার সবচেয়ে কাছের বন্ধুরাও জানে না। এই মুহূর্তে, আমার মনে হয় এটি "নিজেকে প্রকাশ করার" ধারণার পরিপূরক, বা এমনকি এর সাথে সঙ্গতিপূর্ণ। আমি নিজের মতো থাকতে পারি এবং একই সাথে সমমনা মানুষদের আকর্ষণ করার জন্য নিজের স্বতন্ত্র কন্টেন্ট তৈরি করতে পারি। আমার কাছে, এভাবেই এআই কন্টেন্ট প্রচারকে বদলে দিচ্ছে।

সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো, এবং যা সবাই অনুভব করতে পারে, এআই আমাদের উৎপাদন পদ্ধতি বদলে দিয়েছে, যা আমি নিজে প্রত্যক্ষ করেছি। আমি একজন গেম কনসেপ্ট ডিজাইনার হিসেবে শুরু করেছিলাম এবং পরে গেম অ্যানিমেশনে চলে যাই। আমি ডিজাইন এবং উৎপাদন প্রক্রিয়ার প্রায় প্রতিটি দিকের সাথে জড়িত ছিলাম। প্রথম যে পরিবর্তনটি আমি লক্ষ্য করেছি তা হলো ‘সঙ্ক কস্ট’ বা বিনিয়োগকৃত অর্থ। উদাহরণস্বরূপ, অতীতে কনসেপ্ট ডিজাইন করার জন্য আমার হয়তো খুব আকর্ষণীয় কোনো ধারণা থাকত—যেমন একটি জামাকাপড় রাখার র‍্যাক দেখে সেটিকে একটি মহাকাশযানের মতো ডিজাইন করার ইচ্ছা। কিন্তু এর জন্য দীর্ঘ সময় ধরে বিনিয়োগ করা অর্থের প্রয়োজন হতো। যেমন, আপনার কি পার্সপেক্টিভ বা পরিপ্রেক্ষিত সম্পর্কে সঠিক ধারণা ছিল? আপনার কি গ্রাফিক সেগমেন্টেশন বা চিত্র বিভাজন সম্পর্কে সঠিক ধারণা ছিল? আমার জন্য, পাঁচ থেকে ছয় বছর খুব অল্প সময়, এমনকি এই ইন্ডাস্ট্রিতে এটিকে খুব বেশি পরিশ্রমের অনুশীলন হিসেবেও গণ্য করা হয় না। আপনাকে রঙ এবং স্যাচুরেশনও বুঝতে হতো, এবং শেষ পর্যন্ত আপনি বুঝতে পারতেন যে এর জন্য বছরের পর বছর নিবেদিত প্রশিক্ষণের প্রয়োজন। একইভাবে, অ্যানিমেশনের ক্ষেত্রে পাইপলাইনটি আরও বড়। রিগিং-এ দক্ষ কেউ হয়তো মায়া-র মডেলিং ক্ষমতা কখনও ব্যবহারই করেননি। প্রতিটি ধাপে অত্যন্ত দীর্ঘ বিনিয়োগকৃত অর্থ এবং খুবই বিচ্ছিন্ন কর্মপ্রবাহ জড়িত ছিল, যার ফলে পুরো প্রকল্পটি সম্পন্ন করার জন্য দলগত কাজের প্রয়োজন হতো। তবে এখন, কৃত্রিম বুদ্ধিমত্তার (AI) অস্তিত্বের ফলে, কোনো কিছু তৈরি করা অনেকটা একটি ব্ল্যাক বক্সের মতো, যার একটি ইনপুট প্রান্ত এবং একটি আউটপুট প্রান্ত রয়েছে। ইনপুট হলো আমি যা চাই, এবং আউটপুট নিশ্চিত করে যে সেটিই আমার চাওয়া। এটি আমাদের উৎপাদন পদ্ধতির একটি পরিবর্তন, যা আমাদের খরচ ব্যাপকভাবে কমিয়ে দেয়।

যখন কৃত্রিম বুদ্ধিমত্তা উৎপাদন খরচ যথেষ্ট কমিয়ে আনে, তখন ব্যক্তিগত ইচ্ছাশক্তিও যথেষ্ট শক্তিশালী হয়ে উঠতে পারে।

অবশেষে, ব্যক্তিগত সৃষ্টির সুযোগও মৌলিকভাবে বদলে গেছে। প্রথমত, ব্যক্তিগত শৈলীর বিষয়টি রয়েছে। আমি 'দ্য সাইন' নিয়ে অনেক আকর্ষণীয় মন্তব্য দেখেছি, যেখানে কেউ কেউ জিজ্ঞাসা করেছেন যে এতে সংলাপ এত কম কেন – এটা কি শুধু একটা মিউজিক ভিডিও নয়? নির্মাণের সময় আমি এই প্রশ্নগুলো আগে থেকেই অনুমান করেছিলাম। অতীতে, প্রতিষ্ঠিত নির্মাণ মডেলের যুগে, আমার পক্ষে একা হাতে একটি পুরো দল গঠন করা প্রায় অসম্ভব ছিল; আমার সেই যোগাযোগ এবং সুযোগ-সুবিধা ছিল না। এমনকি সমমনা ব্যক্তিদের সাথে কাজ করার সময়েও, খরচ একটি অত্যন্ত গুরুত্বপূর্ণ বিষয় ছিল। উপরন্তু, মুক্তির লাভজনকতার কথাও আমাকে ভাবতে হতো। তা না হলে, এই বিশাল বিনিয়োগ সার্থক হতো না। শেষ পর্যন্ত, আমার কাজটি হয়তো মাঝারি মানের হয়ে যেত। আমাকে সমস্ত দিক বিবেচনা করতে হয়েছে: বিনিয়োগকারী, দর্শক এর জন্য অর্থ দেবে কিনা, ইত্যাদি।

কিন্তু যখন আমি নিজের চলচ্চিত্র নির্মাণ শুরু করলাম, তখন দেখলাম যে এই বিষয়টি নিয়ে আমাকে মোটেও ভাবতে হচ্ছে না। প্রথমত, খরচ ছিল খুবই কম; আমি যখন খুশি তখন এটা করতে পারতাম। এছাড়াও, দর্শকদের কাছ থেকে আমি তেমন কোনো চাপ অনুভব করিনি, কারণ আমি সবাইকে বিনামূল্যে এটি দেখাচ্ছিলাম। মানুষ দেখলে আমি খুশি হতাম, কিন্তু তারা যদি দেখতে না চাইত, তাহলে তাদের সময়ের বাইরে অন্য কোনো সম্পদ ব্যয় করার প্রয়োজন ছিল না। তাই, এই পরিস্থিতিতে আমি আমার চলচ্চিত্র নির্মাণে আরও সাহসী হতে পারতাম। এটি একটি মিউজিক ভিডিও হতে পারত—আপনি যদি তা মনে করতেন, আমি খুশি হতাম—কিন্তু এটি খুব কম সংলাপের একটি আখ্যানমূলক চলচ্চিত্রও হতে পারত। আমি আবিষ্কার করেছি যে এআই-এর যুগে, আমার ভুলের জন্য অনেক বেশি সুযোগ এবং সাহসী পরীক্ষা-নিরীক্ষার জন্য আরও বেশি সম্ভাবনা রয়েছে।

আরেকটি বিষয় হলো বিষয়বস্তুর স্বাতন্ত্র্য, যা অন্যদের কাজ দেখার সময় আমাকে সত্যিই নাড়া দিয়েছে। আমি জানি না আপনি বিলিবিলির সেই ভিডিওটি দেখেছেন কিনা, যেখানে হিদেও কোজিমার *ডেথ স্ট্র্যান্ডিং*-কে গুও দেগাং-এর একটি স্ট্যান্ড-আপ কমেডি রুটিনে রূপান্তরিত করা হয়েছে। এই পুনর্গঠনটি আমার জন্য অবিশ্বাস্যভাবে প্রভাবশালী ছিল। আমি একসময় ভাবতাম *ডেথ স্ট্র্যান্ডিং* একটি অত্যন্ত উচ্চমানের নবম শিল্প মাধ্যম, এবং গুও দেগাং আমার অন্যতম প্রিয় স্ট্যান্ড-আপ কমেডিয়ান। কিন্তু অতীতে এই দুটিকে একত্রিত করার ক্ষেত্রে বিপুল পরিমাণ অপচয় হতো। এই ধরনের একটি শিল্প মাধ্যমের প্রাথমিক খরচ ছিল অনিয়ন্ত্রিত, এবং পরবর্তীতে সেই খরচ পুনরুদ্ধার করাও ছিল অনিয়ন্ত্রিত। কিন্তু এখন, এমন সম্পূর্ণ নতুন বিষয়বস্তু উঠে এসেছে, এবং সবাই তা অনুভব করতে পারছে, যা আরও বেশি করে স্থবিরতা এড়িয়ে যায়। সবাই আলোচনা করে চলেছে যে এআই কেবল বিদ্যমান জিনিসগুলোরই প্রতিলিপি তৈরি করতে পারে কিনা, কিন্তু আমি যে বিষয়গুলো উল্লেখ করেছি, সেগুলো আসলে এমন জিনিস যা মানুষ ইতোমধ্যেই এআই ব্যবহার করে সম্পূর্ণ নতুন কিছু তৈরি করতে ব্যবহার করছে—এমন রূপ যা আগে ছিল না। এই পথটি ক্রমশ আরও বেশি ভিড়াক্রান্ত হচ্ছে না; বরং, বিভিন্ন দিকে নিয়ে যায় এমন আরও অনেক পথ রয়েছে।

অবশেষে, এটি আমাকে আমার আরেকটি ব্যক্তিগত অনুভূতির দিকে নিয়ে যায়, যা গৌণ আকাঙ্ক্ষার বিষয় নিয়ে। জীবনের অনেক কিছুই গৌণ আকাঙ্ক্ষা তৈরি করে। উদাহরণস্বরূপ, আমার চাকরির পদবী কি আমার পরিবার এবং প্রেমিকাকে গর্বিত করবে? অথবা আমার শিক্ষা প্রতিষ্ঠান কি গৌণ উদ্বেগ এবং আকাঙ্ক্ষার জন্ম দেবে? ভিডিও বানানোর সময় আমি এমনটা অনুভব করতাম। যেমন, আমার কাজ কি ইন্ডাস্ট্রির মান পূরণ করবে? ইন্ডাস্ট্রির অভিজ্ঞ ব্যক্তিরা আমার সম্পর্কে কী ভাববেন? এমনকি কেউ আমার ভিডিও দেখবে কি না, ট্র্যাফিক এবং জনপ্রিয়তার দিক থেকে এর কী অবস্থা হবে? কিন্তু অতীতে, আমি এই চাপ এবং উদ্বেগ অনুভব করতাম কারণ আমার বিনিয়োগ করা অর্থ অনেক বেশি ছিল; আমার মনে হতো, আমার আর লোকসান করার সামর্থ্য নেই। তবে, আমার মনে হয় যে এআই-এর সাথে পুরো প্রক্রিয়াটি অনেক সহজ হয়ে গেছে। আমি প্রক্রিয়াটি উপভোগ করি; আমি আর কোনো গৌণ উদ্বেগ বা আকাঙ্ক্ষা অনুভব করি না। আমি কেবল একটি বিষয়ে মনোযোগ দিই: গল্পটি স্পষ্টভাবে বলা হয়েছে কি না, ডাম্পলিংগুলো ভালোভাবে তৈরি হয়েছে কি না, এবং কেউ সত্যিই সেগুলো ভিনেগারে ডোবাবে কি না। এগুলো এমন কিছু ভাবনা যা এআই ব্যক্তিগতভাবে আমার মনে এনেছে।
সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো এটিকে আকর্ষণীয় হতে হবে। গুও দেগাং-এর ভাষায়, "কথোপকথন করার সময় প্রথম কাজ হলো মজাদার হওয়া; যদি মজাদার না হয়, তবে তা কেবলই হাস্যকর।" তাই আমি মনে করি, ভিডিও তৈরির ক্ষেত্রে সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো—সেগুলো রেকর্ড, স্বল্পদৈর্ঘ্য চলচ্চিত্র বা অ্যানিমেশন যা-ই হোক না কেন—সেগুলোকে আকর্ষণীয় হতে হবে। যদি সেগুলো আকর্ষণীয় না হয়, তবে পুরো ব্যাপারটাই আসলে আকর্ষণহীন।

কৃত্রিম বুদ্ধিমত্তার (AI) ক্ষেত্রে এখন আসলে আরও অনেক শাখা রয়েছে। ফ্রন্ট-এন্ড এবং ব্যাক-এন্ড ডেভেলপমেন্টের খরচ কমে যাওয়ায় দর্শক ও নির্মাতাদের ওপর চাপ অনেক কমে গেছে, যা অনিবার্যভাবে সহনশীলতা বাড়িয়ে তুলছে। এমন একটি যুগ আরও আকর্ষণীয় সম্ভাবনার জন্ম দেবে।

আমার জন্য একটা সূত্র আছে, বা অন্তত আমি প্রতিটি নতুন কাজ আকর্ষণীয় কিনা তা বিচার করতে এটি ব্যবহার করি। আমার কাছে সবচেয়ে গুরুত্বপূর্ণ জিনিস হলো গেমস, সিনেমা, বই এবং সঙ্গীত; এগুলোই আমার সবচেয়ে মৌলিক ভিত্তি, আমার মূল পরিচয় তৈরি করে। উদাহরণস্বরূপ, আমি বিশ্বাস করি প্রত্যেকের ভিন্ন ভিন্ন অভিজ্ঞতা ভিন্ন ভিন্ন ভিত্তি তৈরি করে। আমি যদি হলুদ হই এবং কোনো নীল কিছুর সম্মুখীন হই, তবে তা সবুজ হয়ে যায়। কিন্তু আমি যদি একজন অধ্যাপক হই, তবে আমি লাল। এমনকি একটি নীল ঘটনার পরেও আমি বেগুনি হয়ে যেতে পারি। যা সত্যিই আমাদের উজ্জ্বল করে তা হলো আমরা নিজেরা, আমাদের প্রাথমিক ভিত্তি। আমি সাধারণত আমার বর্তমান ভিত্তি বিশ্লেষণ করতে এই ছকটি ব্যবহার করি। যেমনটা আমি আগেই উল্লেখ করেছি, আমি ইচ্ছাকৃতভাবে মানব ঐক্যের অনুভূতি অন্বেষণ করি, যা আমার জন্য একটি অত্যন্ত গুরুত্বপূর্ণ ভিত্তি, কারণ আমি *দ্য লর্ড অফ দ্য রিংস* পড়ে বড় হয়েছি। কিন্তু যে ব্যক্তি ছোটবেলা থেকেই ডার্ক হিউমার পছন্দ করে, সে অনিবার্যভাবে একটি ভিন্ন সিদ্ধান্তে পৌঁছাবে।

একই সাথে, কৃত্রিম বুদ্ধিমত্তার (AI) আবির্ভাব বিভিন্ন শিল্প মাধ্যমের মধ্যকার সীমারেখা ঝাপসা করে দিয়েছে। এর একটি সরাসরি উদাহরণ হলো আমার পাওয়া প্রতিক্রিয়া; এই সিনেমার সঙ্গীতটি সবাই সত্যিই খুব পছন্দ করেছে, যদিও আমি সুরের পার্থক্য বুঝি না এবং স্বরলিপি পড়তে পারি না। যখন আমি *Error* নিয়ে কাজ করছিলাম, তখন আমার *Death Stranding*-এর মতো অনেক গেমের কথা মনে পড়েছিল। আর যখন আমি *The Sign* নিয়ে কাজ করছিলাম, তখনও আমার *The Witcher 3*-এর মতো পছন্দের গেমগুলোর কথা মনে পড়ছিল। আমার এটা খুব ভালো লাগে যে সাউন্ডট্র্যাকটি প্রাচীন পোলিশ ঐতিহ্যবাহী শিল্প মাধ্যমের উপর ভিত্তি করে তৈরি, বিশেষ করে নারীদের মন্ত্রোচ্চারণের অনুভূতির উপর। আমি জেমিনিকে (Gemini) এই বিষয়টি বর্ণনা করেছিলাম এবং এর নাম কী তা জিজ্ঞাসা করেছিলাম। এটি আমাকে এর ইতিহাস এবং বিভিন্ন ইঙ্গিতের কথা বলেছিল, এবং অবশেষে আমাকে একটি সূত্র (prompt) দিয়েছিল। এই সমস্ত অনুপ্রেরণা এসেছে বই, আমার শোনা সঙ্গীত এবং আমার খেলা গেমগুলো থেকে—এগুলো সবই আমার জ্ঞানভাণ্ডারকে ক্রমশ সমৃদ্ধ করতে অবদান রেখেছে।

পরিশেষে, আমি এই অন্তর্নিহিত গুণটিকে সিনেসথেসিয়া বলি। আমি একটি খুব আকর্ষণীয় ঘটনা আবিষ্কার করেছি। উদাহরণস্বরূপ, আমার প্রিয় শিল্পীদের মধ্যে একজন, যিনি অনেক তরুণ-তরুণীর কাছেও প্রশংসিত, তিনি হলেন 'লাভ, ডেথ অ্যান্ড রোবটস' এবং 'দ্য উইটনেস'-এর পরিচালক আলবার্তো। আমি তাঁর ব্যক্তিগত জীবন পর্যবেক্ষণ করি। একজন চমৎকার অ্যানিমেটর হওয়ার পাশাপাশি, আমি মনে করি তাঁর ঐতিহ্যবাহী তৈলচিত্রগুলো অতুলনীয়। পোশাকের ব্যাপারেও তাঁর রুচি চমৎকার এবং শারীরিক গঠনও দারুণ। এই সবকিছু আমাকে আরও বেশি নিশ্চিত করে যে, এর কারণ হলো তাঁর অসাধারণ সিনেসথেসিয়া রয়েছে।

একবার যখন আমরা কোনো ব্যক্তির সিনেসথেসিয়া শনাক্ত করে ফেলি, তখন আমি আমার প্রকাশের স্তরটি পুনরায় পরীক্ষা করি: আমার অভিজ্ঞতা, পটভূমি, এবং ব্যক্তিত্ব, এবং সবচেয়ে গুরুত্বপূর্ণভাবে, আমার ব্যক্তিগত অনুভূতি। উদাহরণস্বরূপ, আমার পটভূমি: যেহেতু আমি দীর্ঘদিন লন্ডনে বসবাস করেছি, তাই লন্ডনের দৃশ্যগুলো অবচেতনভাবে আমার কাজে চলে আসে। যদি অন্য কোনো লেখক প্রায়শই সাংহাইতে সময় কাটান, তাহলে সাংহাই তার কাজের একটি বড় অংশ জুড়ে থাকতে পারে, এবং এই পর্যায়ে, পরিস্থিতি আবার বদলে যায়।

এরপর আসে ব্যক্তিত্বের প্রসঙ্গ। আমি কীভাবে আমার ব্যক্তিত্বকে সংযত করে অন্যদের সঙ্গে একমত হতে পারি? কিন্তু এখন আমাকে অন্যের অনুভূতির কথা ভাবতে হয় না; আমি আমার ব্যক্তিত্বকে পুরোপুরি প্রকাশ করতে পারি।

অবশেষে, আসে ব্যক্তিগত অনুভূতি। আমার মধ্যে রাগ বা প্রত্যাশা জাগতে পারে, এবং আমার শুধু তা প্রকাশ করার প্রয়োজন হয়। এই পর্যায়ে, আমরা বুঝতে পারি যে আমরা অনেকগুলো চলক যোগ করেছি, অনেকটা একটা খেলা খেলার মতো। প্রত্যেক খেলোয়াড় তার প্রতিভার পয়েন্টগুলো বরাদ্দ করে, এবং প্রতিটি নতুন চলক আরেকটি সম্ভাবনা যোগ করে। এই পর্যায়ে, আমার মনে হয় এটা 'আমি' হয়ে উঠতে পারে—একটি সম্মিলিত অনুভূতি, আত্মপরিচয়ের একটি বোধ। এই 'আমি'কে নিয়ে আমি হয়তো গল্প লেখা শুরু করব। আমি ভ্রমণ এবং সংবাদ থেকে অনুভূতি পাই, যা সুযোগ তৈরি করে, এবং সুযোগই প্রেরণা জোগায়। কিন্তু সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো ব্যক্তিগত নান্দনিকতার ওপর জোর দেওয়া। আমি মনে করি না এটা শুধু শিল্পকলা নিয়ে; এটা বরং আপনি কীভাবে কথা বলেন, কীভাবে কাজ করেন—অনেকগুলো পদ্ধতির সমষ্টি। এটাই একটি খাবারের সবচেয়ে গুরুত্বপূর্ণ উপাদান। আমি সবসময় বাস্তববাদী শৈলীতে সৃষ্টি করি কারণ আমি কম স্যাচুরেশন এবং কিছুটা হাস্যরসাত্মক পরিবেশ পছন্দ করি। এটাই আমার ব্যক্তিগত অভিব্যক্তি। পরিশেষে, সবকিছু একত্রিত করলে ডাম্পলিংটি তৈরি হয়ে যায়, এবং আপনি একটি গল্প পান।

এআই কার্য সম্পাদনকে সহজ করে তোলে, এমনকি গার্বেজ তৈরি করাও অর্থবহ হয়ে ওঠে।

এই অংশটি শেষ করার পর, আমরা এখন আলোচনা করতে পারি যে এআই সত্যিই আমাদের সৃজনশীল কাজের উন্নতিতে সাহায্য করেছে কিনা। ব্যক্তিগতভাবে, আমি বিশ্বাস করি এআই আমাদের সৃজনশীল শক্তি ফিরিয়ে দিচ্ছে। কর্মপ্রবাহের পরিবর্তন হোক বা ব্যক্তিগত অভিব্যক্তির সুবিধা, আমার মনে হয় এটি আমার সময় বাঁচিয়েছে। যখন আমি সময় বাঁচাই, অপচয় হওয়া খরচ বাদ দিই এবং প্রচুর শক্তি সঞ্চয় করি, তখন কী অবশিষ্ট থাকে? এর সহজ উত্তর হলো: আত্মা। উদাহরণস্বরূপ, একটি চরিত্র ডিজাইন করার সময়, আপনার মৌলিক দক্ষতা অনুশীলন করার প্রয়োজন নেই। অবশ্যই, মৌলিক দক্ষতা গুরুত্বপূর্ণ, কিন্তু আপনি অন্তত একটি উল্লেখযোগ্য পরিমাণ সময় বাঁচাতে পারেন। যেমন, একটি থ্রিডি চরিত্র তৈরি করার সময়, আপনাকে ইউভি আনর‍্যাপিং বা অপ্টিমাইজ করার জন্য অগণিত ঘন্টা ব্যয় করতে হবে না। অতীতে, একটি আকর্ষণীয় চরিত্র ডিজাইন করতে, আমার বিশ্বাস, এটিকে আকর্ষণীয় করে তুলতে সর্বাধিক ২০% সময় লাগত; বেশিরভাগ সময় ব্যয় হতো থ্রিডি মডেল অপ্টিমাইজ করতে এবং নির্ধারিত দলের কাছে তা হস্তান্তর করতে—যার কোনোটিরই সৃজনশীলতার সাথে কোনো সম্পর্ক ছিল না। তাই, আমার মনে হয় এখন যেন জোয়ারের পানি নেমে যাচ্ছে, যা আমাদের দেখার সুযোগ করে দিচ্ছে সৃজনশীলতার কোন অংশটি সৈকতে রয়ে গেছে, এবং কৃত্রিম বুদ্ধিমত্তা ঠিক এটাই আমাদের জন্য রেখে গেছে।

এখানে আমার নিজের অনেক ভাবনা রয়েছে, যেমন নিজেকে প্রকাশ করার জন্য ইউভি (UV) ভেঙে ফেলার কাজে ব্যয় করা সময়কে ব্যবহার করা। আমি এটাও বলতে চাই যে, গল্পই সবকিছুর মূল। যদি আমাকে কোনো পরামর্শ দিতে বলা হয়, আমি আশা করব যে সবাই যত তাড়াতাড়ি সম্ভব গল্প তৈরি করা শুরু করুক, কারণ কিছু গল্প আমার হৃদয়ে এত দিন ধরে রয়েছে যে সেগুলো বলার সাহস আমার আর নেই। তাই এখন আমার একটি পরিকল্পনা হয়েছে: আমি যত দ্রুত সম্ভব সেগুলো লিখে ফেলব, একটি সমন্বিত ডায়েরির মতো। এমনকি যদি তা মাত্র ১৫ সেকেন্ডেরও হয়, সেটাও আমার জন্য খুব মূল্যবান হবে এবং একে আরও বিস্তৃত করা যাবে।

এখানে একটি কিছুটা বিতর্কিত বিষয় রয়েছে, কিন্তু এটি আসলে পাঠ্যপুস্তকে দেখা যায়—যা গেম ডিজাইন ইন্ডাস্ট্রির বাইবেলের মতো। বইটির শিরোনাম পৃষ্ঠার একটি বাক্য হলো, "আপনার প্রথম ১০টি কাজ আবর্জনা, তাই দ্রুত সেগুলো থেকে মুক্তি পান।" আমি আমার প্রথম ১০টি আবর্জনা শেষ করার জন্য চেষ্টা করতাম, কিন্তু ৩ডি যুগে মাত্র ৮টি শেষ করতে আমার তিন বছর লেগেছিল। আমার তখনও ২টি কম ছিল, এবং আমার মনে হয়েছিল যে আমার হয়তো কিছুটা অভিজ্ঞতা হয়েছে। কিন্তু এআই-এর সাহায্যে, আমি সত্যিই দ্রুত আমার প্রথম ১০টি আবর্জনা শেষ করতে পারি, দ্রুত পুনরাবৃত্তি করতে পারি এবং বাজারের প্রতিক্রিয়া পেতে পারি। এআই যুগের সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো: এটি আমাদের অজুহাত ছাড়াই একটি সুযোগ দেয়। আমরা আর বলতে পারি না যে আমাদের যথেষ্ট সময় নেই, সরঞ্জাম যথেষ্ট ভালো নয়, বা এটি নিয়ে কাজ করার সময় নেই। আমরা দ্রুত আমাদের প্রথম ১০টি আবর্জনা শেষ করতে পারি, বাজারের প্রতিক্রিয়া পেতে পারি এবং উন্নতি চালিয়ে যেতে পারি।

কারিগরি দিকগুলোর কথা বলতে গেলে, আমি নিজেও একসময় একটা ভুল ধারণার শিকার হয়েছিলাম। আমি কং ইজির মতো আচরণ করতাম, অন্যদেরকে বলতাম "茴香豆" (মৌরি বীজ) শব্দটির "茴" অক্ষরটি কতভাবে লেখা যায়। আমার বিশ্বাস, থ্রিডি মডেলিংয়ে কাজ করা প্রত্যেকেরই কমবেশি এই অভিজ্ঞতা হয়েছে। আমি ইউভি আনর‍্যাপিংয়ের একটি নতুন পদ্ধতি আয়ত্ত করেছিলাম এবং আমার কাছে সেটা অসাধারণ মনে হয়েছিল; আমি থ্রিডি ফেসের সংখ্যা কমানোর একটি নতুন পদ্ধতি আয়ত্ত করেছিলাম। আমি হয়তো এই নির্দিষ্ট, প্রতিস্থাপনযোগ্য কৌশলগুলোর পেছনে অক্লান্তভাবে আটকে থাকতাম। কিন্তু এখন বাজার আমাদের বলছে যে এগুলোর আর কোনো মূল্য নেই, এবং এই ধরনের জিনিসের পেছনে আর সময় নষ্ট করার দরকার নেই। আপনি সরাসরি গল্পের মুখোমুখি হতে পারেন, সরাসরি অভিব্যক্তির মুখোমুখি হতে পারেন। আমার জন্য, এটি এমন একটি অধিকার যা এআই-এর প্রচেষ্টার মাধ্যমে আমার কাছে ফিরিয়ে দেওয়া উচিত ছিল।

আমার বক্তব্য এখানেই শেষ। আমি আমার অবস্থান পুনর্ব্যক্ত করতে চাই: আমি মানব শ্রেষ্ঠত্বের একজন দৃঢ় সমর্থক। আমি যখন কোনো কাজ তৈরি করি, তা চলচ্চিত্র হোক বা গান, তা আদতে আমারই অভিব্যক্তি, এবং আমি চাই না যে এর কোনো প্রভাব আমার ওপর পড়ুক। এটাই আমার শেষ কথা। আপনাদের অনেক ধন্যবাদ!

▲ ন্যানো ব্যানানা ২ ব্যবহার করে তৈরি ‘পোয়েট্রি ক্লাউডস’-এর চিত্রাবলী

লি বাই-এর "পোয়েট্রি ক্লাউডস" এবং টেস্ট

পুরস্কার বিতরণী অনুষ্ঠানে তার পূর্ণাঙ্গ উপস্থাপনার পাশাপাশি, প্রথম বিলিবিলি এআই ক্রিয়েশন কম্পিটিশনের পর ইউপি মাস্টার ডিডি_ওকে একটি গোলটেবিল আলোচনা এবং মিডিয়া সাক্ষাৎকারেও অংশগ্রহণ করেন। বিশেষ করে একটি অংশ, আমার মতে, আলাদাভাবে আলোচনার দাবি রাখে। এআই যুগে ব্যক্তিগত বৈশিষ্ট্য এবং গুণাবলী বেশি গুরুত্বপূর্ণ কিনা, এই বিষয়ে আলোচনা করতে গিয়ে তিনি বলেন:

যদিও লিউ সিক্সিন এমন একটি উপন্যাস লিখেছেন যার সাথে এআই-এর কোনো সম্পর্ক নেই, তিনি ইতিমধ্যেই আমাকে উত্তরটি দিয়ে দিয়েছেন। সেই উপন্যাসটি হলো ‘পোয়েট্রি ক্লাউডস’, যা এআই-এর একটি অত্যন্ত ধ্রুপদী মডেল।

এটি এমন এক ঈশ্বর-সদৃশ সভ্যতার গল্প, যারা চীনা ধ্রুপদী কবিতার অনুরাগী কিন্তু নিজেরা কোনো কবিতা লিখতে পারে না। রাগের মাথায় তারা পৃথিবীকে একটি ফাঁপা সার্ভারে পরিণত করে। বিশাল গণনার মাধ্যমে তারা সম্ভাব্য সমস্ত চীনা অক্ষর সাজিয়ে ফেলতে পারে। এর মানে হলো, মানুষের লেখা সমস্ত ধ্রুপদী কবিতা আকাশে ভাসতে থাকে। তখন প্রশ্ন ওঠে: কোন কবিতাটি সেরা, তা কীভাবে শনাক্ত করা যাবে? উদাহরণস্বরূপ, লি বাইয়ের সময়ে তিনি জানতেন কোনটি ভালো, তাই তিনি তা লিখেছিলেন এবং অন্যরা তার গুণমানকে স্বীকৃতি দিয়েছিল। এখন যেহেতু এর অস্তিত্ব রয়েছে, এটি আধুনিক কৃত্রিম বুদ্ধিমত্তার (AI) মতো। আমরা কোনো সমস্যা ছাড়াই একবারে দশ হাজার কবিতা তৈরি করতে পারি, কিন্তু কোনটি সত্যিই ভালো, এবং কোনটিকে অন্যরা সত্যিই ভালো বলে বিবেচনা করতে পারে? এটাই একজন স্রষ্টার দক্ষতার চূড়ান্ত পরীক্ষা।

যদিও 'রুচি' শব্দটি উল্লেখ করা হয়নি, 'কোনটা ভালো তা জানা' আসলে 'রুচি' প্রকাশেরই আরেকটি উপায়।

বেশ কাকতালীয়ভাবেই, কিছুদিন আগে যখন আমি এক সহকর্মীর সাথে কথা বলছিলাম যে, কীভাবে এআই ইতিমধ্যেই বিভিন্ন ক্ষেত্রে ৭০ বা এমনকি ৮০ পয়েন্ট স্কোর করা ভালো মানের কাজ তৈরি করতে পারে, এবং আমরা কবে ৯০ বা এমনকি ৯৫ পয়েন্ট স্কোর করা শীর্ষ-স্তরের কন্টেন্ট তৈরি করতে পারব, কিংবা এটি মানুষের তৈরি সেরা কন্টেন্টকেও ছাড়িয়ে যাওয়া নিখুঁত কন্টেন্ট তৈরি করতে পারবে কি না—তখন আমার লিউ সিক্সিনের ‘পোয়েট্রি ক্লাউড’-এর কথাও মনে পড়েছিল।

এর বিপুল গণনা ক্ষমতার সাহায্যে, এআই তাত্ত্বিকভাবে অসীম সংখ্যক পাঠ্য বিন্যাস ও সমাবেশ তৈরি করতে পারে, যার মধ্যে লি বাই-এর সমস্ত কবিতা, এমনকি লি বাই-এর কবিতাকেও ছাড়িয়ে যাওয়া কবিতাও অন্তর্ভুক্ত। এটা সংখ্যার খেলা।

‘দ্য পোয়েট্রি ক্লাউড’-এর উপসংহার হলো এই যে, ঈশ্বর-সমতুল্য সভ্যতার কম্পিউটিং শক্তি সমস্ত শব্দ-সংমিশ্রণ খুঁজে বের করতে পারে, কিন্তু সেগুলোর মধ্যে থেকে শ্রেষ্ঠ রচনাগুলো খুঁজে বের করার জন্য এই কম্পিউটিং শক্তি যথেষ্ট নয়।

একটি কিছুটা অনুপযুক্ত উপমা হলো এই যে, অনেকেই পাই-এর শত শত বা হাজার হাজার অঙ্ক মুখস্থ করতে পারে, কিন্তু সেই মুখস্থ করার মূল্য, ঝু চংঝির পাই-এর সপ্তম দশমিক স্থান পর্যন্ত গণনা করার মূল্যের চেয়ে অনেক কম।

যদি কোনো স্রোতে গা ভাসাতে হয়, তবে তা অনেকটা 'লি বাই' গানটিকে ঘিরে সাম্প্রতিক কপিরাইট বিতর্কের মতোই, যা মূলত রুচিবোধকে কেন্দ্র করেই আবর্তিত হয়। রুচিহীন মানুষ একটি ভালো কাজকে এমনভাবে বিকৃত করে যে তা আর চেনা যায় না, অপরদিকে রুচিশীল ব্যক্তিরা এআই টুল ব্যবহার করে বিপুল উৎপাদনশীলতা অর্জন করতে পারেন।

কিন্তু প্রকৃত সিদ্ধান্তটি তিনিই নেন যিনি এআই টুলগুলো ব্যবহার করেন। ডিডি_ওকে আরও বলেছেন:

আমার বর্তমান অভিজ্ঞতায়, এআই আমাকে কোনো সৃজনশীল কাজে সাহায্য করেনি; বরং এর ওপর আপনার প্রচণ্ড রাগ হবে। তবে, সাধারণ তথ্যের ক্ষেত্রে এটি অত্যন্ত সহায়ক হয়েছে। উদাহরণস্বরূপ, অতীতে কিছু বিষয় নিশ্চিত করার জন্য আমাকে বিভিন্ন সার্চ ইঞ্জিন একত্রিত করতে হয়েছিল। অবশ্যই, এটি যে আজেবাজে কথা বলতে পারে, সেই সম্ভাবনা এখনও রয়েছে, কিন্তু সাধারণ তথ্য খোঁজার ক্ষেত্রে এটি অনেক সাহায্য করেছে।

যদি আপনি এর থেকে কোনো আবেগঘন অনুভূতির আশা করেন, আমার মনে হয় তা প্রায় অসম্ভব। আমরা যদি হঠাৎ করে একে কোনো ট্রেন্ডিং মিম সম্পর্কে জিজ্ঞাসা করি, এটি তা বুঝতে পারে না। মানুষের মধ্যে থাকা কিছুটা স্নায়বিক রসবোধ এবং আনন্দকে এটি উপলব্ধি করতে পারে না—এটাই মানবতার সবচেয়ে সংবেদনশীল অংশ। মাঝে মাঝে আমরা নিজেদেরই প্রশ্ন করি, আমরা একটি মিম দেখে কেন হাসি? প্রতিটি নতুন জনপ্রিয় মিমেরই একাধিক অর্থ থাকে, কিন্তু আমরা যদি এমন কিছু তৈরি করতে পারি যা সরাসরি কারো হৃদয়কে স্পর্শ করে, আমার মনে হয় এআই-এর পক্ষে তা বোঝা অনেক বেশি কঠিন। এই মুহূর্তে চিত্রনাট্য রচনার সবচেয়ে কঠিন অংশও আমি এটাই মনে করি: অন্য একজন মানুষকে প্রভাবিত করা, বিশেষ করে যখন আপনি নিজের মন থেকে তথ্য বের করে আনছেন। তথ্য বের করে আনার মধ্যে সহজাতভাবেই কিছু ক্ষতি জড়িত থাকে, এবং যখন আপনি তা অন্য কারো মনে স্থাপন করেন, তখন ক্ষতির পরিমাণ আরও বেড়ে যায়। এর জন্য মানবিক মিথস্ক্রিয়া প্রয়োজন।

এই বিলিবিলি এআই ক্রিয়েশন প্রতিযোগিতার অংশগ্রহণকারীদের মধ্যে, ই জিয়াওজিং (যিনি 'বিস্ট' নামেও পরিচিত) সম্ভবত সবচেয়ে বিখ্যাত বিজয়ী। এআই তৈরির যুগের আগে থেকেই তিনি একজন অত্যন্ত সফল অনলাইন ভিডিও নির্মাতা ও পরিচালক ছিলেন এবং অভিনেতা হিসেবেও বেশ ভালো করেছিলেন।

চলচ্চিত্র ও টেলিভিশন জগতে তাঁর যাত্রা শুরু হয় প্রায় ২০১০ সালে, তুদু ইমেজ ফেস্টিভ্যাল শর্ট ফিল্ম অ্যাওয়ার্ডের মাধ্যমে। ক্যানন ৫ডি মার্ক II, যা তৎকালীন সময়ে খুব দামি বা বড়সড় ছিল না, তা দিয়ে তুলনামূলকভাবে পেশাদার মানের ফুটেজ ধারণ করা যেত, যা থেকে ‘মাইক্রো-ফিল্ম’-এর ধারণা এবং ‘প্রত্যেকেই তার নিজের জীবনের পরিচালক’—এই স্লোগানটির জন্ম হয়।

সাশ্রয়ী উৎপাদনশীল সরঞ্জাম এবং প্ল্যাটফর্মভিত্তিক প্রণোদনার আবির্ভাব বহু তৃণমূল নির্মাতার সৃজনশীল উৎসাহ ও ধারণার সঙ্গে মিলে যাওয়ায় কিছু সময়ের জন্য ‘মাইক্রো-ফিল্ম’-এর জোয়ার এসেছিল।

যদিও Tudou.com এবং 'মাইক্রো-মুভি'-র ধারণা ধীরে ধীরে বিলীন হয়ে গিয়েছিল, সেই Tudou ইমেজ ফেস্টিভ্যালের অংশগ্রহণকারীদের মধ্যে ছিলেন 'নে ঝা' সিরিজের পরিচালক জিয়াওজি, 'নানজিং ফটো স্টুডিও'-র পরিচালক শেন আও এবং অবশ্যই, 'প্রফেসর' খ্যাত ই জিয়াওজিং। এই অসামান্য নির্মাতারা সাধারণ অবস্থা থেকে শুরু করে নিজেদের জীবনে এক উল্লেখযোগ্য পরিবর্তন এনেছিলেন।

এই বিলিবিলি এআই ক্রিয়েশন প্রতিযোগিতার বিজয়ীদের প্রায় সকলেরই একটি সাধারণ ধারণা রয়েছে: কেলিং, সিড্যান্স বা অন্য কোনো এআই টুলই হোক না কেন, এগুলো সবই ধারণা ও সৃজনশীলতাকে বাস্তবে রূপ দেওয়ার সহায়ক সরঞ্জাম। এই সরঞ্জামগুলোর বিভিন্ন সুবিধা থাকলেও, সবচেয়ে মূল্যবান জিনিসটি হলো স্বয়ং ধারণা এবং সৃজনশীলতা।

প্রকৃতপক্ষে, পরবর্তীকালে এক সংবাদমাধ্যমকে দেওয়া সাক্ষাৎকারে ডিডি_ওকে বলেছিলেন যে 'দ্য সাইন' ছবিটির নির্মাণে মাত্র ৩ দিন সময় লেগেছিল, কিন্তু এর চিত্রনাট্য লিখতে দেড় মাস সময় লেগেছিল।

লাইভ-অ্যাকশন শুটিং এবং স্পেশাল এফেক্ট ব্যবহার করলে, এই ৭-মিনিটের ভিডিওটির জন্য সম্ভবত ৩০ দিন, ৩০ জন লোক এবং ৩ মিলিয়ন খরচ প্রয়োজন হতো। AI, DiDi_OK-এর জন্য স্ক্রিপ্ট লেখার সময় উল্লেখযোগ্যভাবে কমাতে না পারলেও, এটি ৩০ দিন, ৩০ জন লোক এবং ৩ মিলিয়নের সময়, জনবল এবং আর্থিক খরচকে সংকুচিত করে ৩ দিন, ১ জন লোক এবং ৩০,০০০-এ নামিয়ে আনতে পারে।

"ব্র্যান্ড" ভিডিওটি বানানোর আগে থেকেই DiDi_OK-এর অনেকগুলো প্রভাবশালী এআই ভিডিও ছিল। এই ভিডিওগুলো থেকে আমরা এটাও দেখতে পারি যে, কীভাবে এই কন্টেন্ট ক্রিয়েটর এআই টুলসের ক্ষেত্রে একজন শিক্ষানবিশ থেকে বিশেষজ্ঞ হয়ে উঠেছেন, এবং সেই সাথে এআই টুলসগুলোর নিজেদেরও বিবর্তন ঘটেছে।

কৃত্রিম বুদ্ধিমত্তার আখ্যানটি এইরকম: আমরা যদি কেবল দর্শক হয়ে থাকি, তবে আমরা সহজেই কৃত্রিম বুদ্ধিমত্তা দ্বারা সৃষ্ট ডিজিটাল আবর্জনা এবং যত্নসহকারে হাতে গড়া শিল্পকর্মের মধ্যকার দ্বৈত দ্বন্দ্বে পড়ে যেতে পারি; যদি আমরা কেবল কৃত্রিম বুদ্ধিমত্তা নিয়ে নাড়াচাড়া করি এবং চিন্তা ও অনুশীলনের জন্য প্রচেষ্টা করতে অনিচ্ছুক হই, তবে আমাদেরও মনে হবে যে কৃত্রিম বুদ্ধিমত্তা উদ্বেগের একটি বাড়তি উৎস ছাড়া আর কিছুই নয়; কিন্তু একবার যখন আমরা চিন্তা করার জন্য শক্তি ও সময় বিনিয়োগ করব এবং "প্রথমে ১০টি আবর্জনা তৈরি করার" সীমাটি অতিক্রম করব, তখন আমরা এমন একটি উৎপাদনশীল শক্তির সন্ধান পাব যা এর সাথে সহাবস্থান করে এবং সমান সৃজনশীলতা উপভোগ করে।

পরিস্থিতি স্থিতিশীল এবং উন্নত হচ্ছে।

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।