উইল স্মিথ আবার একটি মেমে অবদান রেখেছিলেন, গতবার এটি অস্কারের চড় ছিল, এবার এটি স্প্যাগেটি মুকবাং ছিল।
2023 সালের মার্চ মাসে, একজন Reddit নেটিজেন উইল স্মিথের নুডুলস খাওয়ার একটি মজার ভিডিও তৈরি করতে AI ব্যবহার করেছিলেন। তার মুখ ছিল জঘন্য এবং তার মুখের বৈশিষ্ট্যগুলি বিকৃত ছিল, যা মানুষের ক্ষুধা হারায়।
ফেব্রুয়ারী 2024-এ, OpenAI সোরা প্রকাশ করার দু'দিন পরে, উইল স্মিথ ইনস্টাগ্রামে নুডলস খাওয়ার একটি তুলনামূলক ভিডিও পোস্ট করেছিলেন৷ তিনি আরও সুদর্শন হয়ে ওঠেন এবং তার খাওয়ার গতি আরও শালীন হয়ে ওঠে৷
আপনি কি মনে করেন ভিডিওর দ্বিতীয়ার্ধটি সোরা তৈরি করেছে? না, নুডুলস উইল স্মিথ নিজেই খেয়েছিলেন, এবং তিনি পুরো কাজটি করেছিলেন।
সোরার অফিসিয়াল প্রদর্শনে সামনের পা হতবাক হয়ে গিয়েছিল, এবং পিছনের পা এই গতিশীল দেখেছিল, এবং লোকেরা আমি কে, আমি কোথা থেকে এসেছি এবং আমি কোথায় যাচ্ছি তা নিয়ে সন্দেহের মধ্যে পড়ে গিয়েছিল।
যদিও সোরা এখনও জনসাধারণের জন্য উন্মুক্ত নয়, ইন্টারনেট আরও বেশি হাস্যকর হয়ে উঠেছে: AI ভিডিওগুলি বাস্তবতার কাছাকাছি এবং আরও বেশি বাস্তব জীবনের ভিডিওগুলি নকল AI৷
আমি জানি না এটা হলিউডকে মেরে ফেলতে পারে কিনা। সোরা প্রথমে আমার ব্রেন স্টেম পুড়িয়েছে।
আমরা সোরার স্থিতিশীল পারফরম্যান্সের ভিডিওগুলি কমবেশি দেখেছি৷ একই সময়ে, ওপেনএআই উদারভাবে রোলওভার ভিডিওগুলিও প্রকাশ করেছে৷ তাদের মধ্যে কয়েকটি সোশ্যাল মিডিয়াতে বেশি জনপ্রিয়, বিশেষ করে নিম্নলিখিত প্রম্পট: "প্রত্নতাত্ত্বিকরা কয়েকটি গাড়ি খুঁজে পেয়েছেন মরুভূমি। নিয়মিত প্লাস্টিকের চেয়ার, সাবধানে খুঁড়ে ধুলো" ভিডিও।
চেয়ারটিকে মনে হচ্ছে একটি শ্বাস-প্রশ্বাস, চিন্তাশীল প্রাণী অন্য জগতের যা মাধ্যাকর্ষণ বা মানব শক্তি দ্বারা আবদ্ধ নয়। এটি পাতলা বাতাস থেকে আবির্ভূত হয় এবং রূপান্তরিত হয় এবং এমনকি গোপনে একজন মানুষকে দূরে নিয়ে যায়। এটি AI এর দোষ নাও হতে পারে। সর্বোপরি, প্রম্পট শব্দটি পৃথিবীতে আছে কিনা তা নির্দেশ করে না।
যদি ভিডিওটি সোশ্যাল মিডিয়ায় বিতরণ করা হয়, তাহলে এটি ট্যাগ করা হতে পারে: #streamofconsciousness, #surrealism, #preciousvideoofearlyhumankindtamingthewildchair…
ওপেনএআই গুরুত্ব সহকারে ব্যাখ্যা করেছে কেন বাগটি ঘটেছে: সোরা চেয়ারটিকে একটি শক্ত বস্তু হিসাবে মডেল করতে ব্যর্থ হয়েছে, অর্থাৎ, এমন একটি বস্তু যা বাহ্যিক শক্তির ক্রিয়াকলাপে আকৃতি এবং আয়তন পরিবর্তন করে না, তাই শারীরিক মিথস্ক্রিয়াটি সঠিক ছিল না।
সোরার একটি কাপ ভাঙার ভিডিওটি একটি শিল্প বলে মনে হচ্ছে যা শুধুমাত্র বিষাক্ত মাশরুম খাওয়ার পরেই দেখা যায়। কাপটি আসলে কোনো বাতাস ছাড়াই স্বয়ংক্রিয়ভাবে চলে যায়। ভাঙার আগে জেলির মতো তরল গ্লাস থেকে বেরিয়ে আসে। প্রতিটি পদক্ষেপ অপ্রত্যাশিত।
এছাড়াও, সেখানে ক্রীড়াবিদরা পিছনের দিকে ট্রেডমিল ব্যবহার করে, জন্মদিনের মোমবাতি যা ফুঁকানো যায় না, নেকড়ে যেগুলি উপস্থিত হয় এবং পাতলা বাতাস থেকে অদৃশ্য হয়ে যায়… এআই অসাবধানতাবশত এমন কিছু করেছে যা মানুষের মস্তিষ্ক বা বিশেষ প্রভাব কেউই কল্পনা করতে পারে না।
সোরার আনুষ্ঠানিক ঘোষণার পর থেকে, এআই টাইকুনগুলি এটি ভৌত জগত বুঝতে পারে কিনা তা নিয়ে বিতর্ক করছে৷ OpenAI-এর প্রযুক্তিগত প্রতিবেদনে একটি স্পষ্ট অবস্থান তৈরি করা হয়নি, তবে শুধুমাত্র উল্লেখ করা হয়েছে যে Sora বাস্তব জগতে মানুষ, প্রাণী এবং পরিবেশের কিছু দিক অনুকরণ করতে পারে৷ , কিন্তু জটিল দৃশ্যের ভৌত নীতিগুলি সঠিকভাবে অনুকরণ করা কঠিন হতে পারে, যেমন বিভ্রান্তিকর বাম এবং ডান, এবং কুকি কামড়ানোর পরে কোনও কামড়ের চিহ্ন না রেখে৷
যদিও AI এখনও একটি সম্পূর্ণ অবস্থায় বিকশিত হয়নি, আপনি আপনার কল্পনাও ব্যবহার করতে পারেন। AI ভিডিওগুলি যেগুলি এখনও স্থিতিশীল নয় সেগুলি অতিপ্রাকৃত, সাসপেন্স, হরর এবং ফ্যান্টাসি থিমগুলির জন্য একটি উপাদান লাইব্রেরি হিসাবে ব্যবহার করা যেতে পারে, যা সৃষ্টির জন্য নতুন অনুপ্রেরণা প্রদান করে৷ আপনি যত বেশি নিউটনের কফিন তোলার চেষ্টা করবেন, ততই আপনার কর্মক্ষমতা আরও শৈল্পিক হবে৷
ঠিক যেমন "ডিগিং চেয়ার" এবং "ব্রেকিং কাপ", এগুলি ইতিমধ্যেই এমভি, বিজ্ঞাপন, সিনেমা এবং গেমগুলিতে ব্যবহার করা যেতে পারে৷ এটি এখনও একটি বড় প্রযোজনার মতো দেখাচ্ছে৷ যদিও প্রভাবটি অদ্ভুত, এটি আশ্চর্যজনকভাবে মসৃণ৷ এটি স্টেশনকে বীট করে৷ B. "Learned Five Years Animation" সিরিজ।
যদিও বিষয়বস্তুটি এত জাদুকর ছিল, তবুও কিছু নেটিজেন এক সেকেন্ডের জন্য দ্বিধায় পড়েছিলেন: "যদি বাগটি প্রকাশ না করা হয় তবে আমি সন্দেহ করব যে এটি চিত্রায়িত হয়েছে।" "এটি কি একটি জাদু কৌশল?"
এর কারণ হল সোরার রোলওভার ভিডিও এখনও পিকা এবং রানওয়ের মতো "পূর্বসূরিদের" সময়কাল, ছবির গুণমান এবং স্থায়িত্বের ক্ষেত্রে হারাতে পারে৷
যদিও অন্যান্য সরঞ্জামগুলি 3 থেকে 4 সেকেন্ডের বেশি ভিডিও তৈরি করে না এবং একটি একক শটকে যতটা সম্ভব স্থিতিশীল রাখার চেষ্টা করে, সোরা একাধিক শটের বিরামবিহীন সুইচিং অর্জন করতে এবং তুলনামূলকভাবে সঠিকভাবে মূল বিষয়ের সামঞ্জস্য বজায় রাখতে উপরের সীমাটি 1 মিনিটে বাড়িয়ে দেয়। এবং ছবির ভিজ্যুয়াল স্টাইল, যেন এটি কীভাবে ব্যবহার করতে জানে। লেন্সের ভাষা এবং বর্ণনামূলক ছন্দ গল্প বলে।
প্রথম নজরে, মনে হচ্ছে দৃশ্যের অনুসরণে বাস্তব ক্যামেরা রয়েছে। মানুষ, বস্তু এবং দৃশ্য সবই ত্রিমাত্রিক স্থানের মধ্যে চলছে এবং একই চরিত্রের একাধিক দৃষ্টিকোণ থাকতে পারে।
▲ সোরা একাধিক দৃষ্টিভঙ্গি অর্জন করতে পারে।
কিছু লোক রসিকতা করে যে এটি AI দ্বারা উত্পন্ন "অ্যানিমেশন" থেকে "ভিডিও" তে একটি লাফ।
সোরার গাড়ি উল্টে যাওয়ার ভিডিওটি অবশ্যই তাদের মধ্যে গণনা করা যেতে পারে। এটি একটি মেসে একগুচ্ছ কোড লেখার মতো, কিন্তু এটি চালানোর জন্য ঘটে।
360-এর চেয়ারম্যান, Zhou Hongyi, Weibo-এ একটি আকর্ষণীয় বিষয় সম্পর্কে কথা বলেছেন: Sora মানুষের স্বপ্ন দেখার মতো কাজ করে। আমরা অদ্ভুত জিনিসের স্বপ্ন দেখব, কিন্তু এটি আমরা আমাদের চোখ দিয়ে যা দেখি এবং জীবনের সঞ্চিত অভিজ্ঞতার উপর ভিত্তি করে। , কোন প্রয়োজন নেই ফিল্ম এবং টেলিভিশন শিল্পের মতো ফ্রেম দ্বারা 3D মডেল এবং রেন্ডার ফ্রেম।
একটি নির্দিষ্ট দৃষ্টিকোণ থেকে, জেনারেটিভ এআই প্রকৃতপক্ষে একটি স্বপ্নের যন্ত্রের মতো, মানুষের চিন্তাভাবনার কাছাকাছি এবং কাছাকাছি হচ্ছে। এটি সম্ভাব্যতার সাথে যুক্তিসঙ্গত বা অযৌক্তিক উত্তর তৈরি করতে বিভিন্ন প্রম্পট শব্দ ব্যবহার করে। এটি সঠিক বা ভুল যাই হোক না কেন, এটি অবশ্যই হবে। আপনি একটি উত্তর দিন
আসলে, ChatGPT-এর শুরু থেকেই, লোকেরা স্বপ্নকে বাস্তবে আনতে AI ব্যবহার করতে চেয়েছিল৷ Xiaohongshu-এ অনেকগুলি পোস্ট রয়েছে যা স্বপ্নগুলিকে কল্পনা করে৷ যদিও তারা সত্যিকার অর্থে মনের মধ্যে প্রভাব পুনরুদ্ধার করতে পারে না, তারা কিছু আধ্যাত্মিক কল্পনাও নিয়ে আসে৷ বিশ্ব বাস্তবে।
ভবিষ্যতে, সোরা স্বপ্ন বা মানুষের সৃজনশীলতাকে আরও প্রাণবন্ত করে তুলতে পারে৷ পাঠ্য, ছবি বা ভিডিও ইনপুট করার মাধ্যমে, আপনি আলো এবং ছায়া পরিবর্তন যোগ করতে পারেন, ছবির কোণ সামঞ্জস্য করতে পারেন এবং এমনকি "এক ক্লিকে" শব্দের প্রভাব যুক্ত করতে পারেন…
হলিউডের অভিজাতরা তাদের চাকরি হারাবে কিনা আমি জানি না। নেটিজেনরা ইতিমধ্যেই এটি চেষ্টা করার জন্য আগ্রহী। পর্নোগ্রাফিতে জড়িত হওয়ার প্রবৃত্তির পাশাপাশি, তাদের কল্পনা করার জায়গাও রয়েছে।
মানুষ যারা নিজেদের ব্যর্থতায় হাসে সোরাকে ট্রাফিক পাসওয়ার্ড হিসেবে ব্যবহার করে
গাড়ির রোলওভার ভিডিও ছাড়াও, সোরার অন্যান্য ভিডিওগুলি প্রথম নজরে আশ্চর্যজনক, কিন্তু তারা একটি ম্যাগনিফাইং গ্লাসের পরীক্ষাকে সহ্য করতে পারে না৷ দোকানের সাইন-এ বিকৃত অক্ষর, বিড়ালের পঞ্চম পা, মডেলের ভুল পদক্ষেপ…
বাগগুলি এআই এবং বাস্তবতার মধ্যে শেষ প্রাচীর হতে পারে, তবে মানুষ নিজেরাই এটিকে ভেঙে ফেলতে চায়।
যদিও সোরা এখনও জনসাধারণের জন্য উন্মুক্ত নয়, যারা কোর্স এবং চিপ বিক্রি করে তারা অর্থোপার্জন করছে এবং যারা মজার কৌশল খেলে তারা সমস্যাযুক্ত জলে মাছ ধরার উপায় খুঁজে পেয়েছে এবং ট্র্যাফিককে আকর্ষণ করার একটি নতুন উপায় আবিষ্কার করেছে।
যখন তারা সোশ্যাল মিডিয়াতে ভিডিওটি পোস্ট করে, তখন তারা "Sora দ্বারা তৈরি" এবং অনুলিপিতে শালীন প্রম্পট যোগ করে, AI দ্বারা তৈরি করার ভান করে, ঠিক যেমন উইল স্মিথ AI অনুকরণ করে নিজেকে অনুকরণ করে।
বিভিন্ন সার্কিটের শর্ট ভিডিও ব্লগাররা এতে অংশ নিচ্ছেন। যারা সুন্দর পোষা প্রাণী দেখায়, গেম খেলে, অ্যামওয়ে আইডল একক, পণ্যের বিজ্ঞাপন দেয়… তারা কি সত্যিই সোরাকে কর্মসংস্থানের অনুপ্রেরণা দেয় না?
তাদের মধ্যে, আসল এবং নকলের মধ্যে পার্থক্য করা সবচেয়ে কঠিন হল নিঃসন্দেহে বলিউডের সিনেমা। ভারতীয় পুলিশ সিনেমাগুলির প্লট এবং বিশেষ প্রভাবগুলি বিশেষভাবে আশ্চর্যজনক। এগুলি মানুষের জন্য অত্যন্ত উন্নত এবং পদার্থবিদ্যাকে অস্তিত্বহীন করে তোলে। এমনকি AI-কেও তাদের থেকে শিখতে হবে ..
ভারতীয় চলচ্চিত্রের অমানবিক অগ্রগামী প্রকৃতিকে প্রমাণ করার জন্য 11 বছর আগে আপলোড করা একটি ইউটিউব লিঙ্ক সংযুক্ত করে মন্তব্য যোগ করা এবং সংযুক্ত করা উত্সাহী ব্যক্তিরা যদি না থাকত, তবে কেউই এটির পক্ষে কথা বলার সাহস পেত না।
এমনকি নেটফ্লিক্স ইন্ডিয়ার অফিসিয়াল অ্যাকাউন্টও মজায় যোগ দিয়েছে। এটি ভারতীয় ব্রিটিশ বিরোধী চলচ্চিত্র "RRR" থেকে একটি ক্লিপ আটকে দিয়েছে এবং সোরা দ্বারা তৈরি করা হয়েছে বলে ভান করেছে। ভারতীয় ব্লকবাস্টারদের স্বাভাবিক অতিরঞ্জন অনুসারে, প্রথম কয়েক সেকেন্ড সত্যিই প্রতারণা করতে পারে শ্রোতাবৃন্দ.
যদিও এই নকল AI ভিডিওগুলি মানুষের দ্বারা তৈরি করা হয়েছে, এবং তাদের মধ্যে মিশ্রিত AI সাধারণ মনে হচ্ছে, AI তাদের অনুকরণ করতে অক্ষম হতে পারে।
জনমতকে বিভ্রান্ত করে নিজের উপর নিয়ে আসা, ক্ষতি এখনও মানুষের দ্বারা সৃষ্ট, এবং সন্দেহের একটি শৃঙ্খল উদ্ভূত হয়েছে।
নেটিজেনরা উদ্বিগ্ন হতে শুরু করে যে যখন এআই-উত্পন্ন এবং বাস্তব-জীবনের ছবিগুলি সত্যিই অস্পষ্ট হয়, তখন তারা কিছু না করলেও তাদের কাছে "নির্ধারিত প্রমাণ" থাকতে পারে।
এটি সাসপেনসফুল ব্রিটিশ নাটক "ট্রুথ ক্যাপচার" এর প্লট: অপরাধীদের দোষী সাব্যস্ত করার জন্য গোয়েন্দা সংস্থা নজরদারি ভিডিও তৈরি করেছে।
তারা বিশ্বাস করে যে নজরদারি ভিডিও জাল করা অবৈধ প্রমাণ যেমন তারের ট্যাপিং সামগ্রীকে আইনি প্রমাণে "পুনরায় কার্যকর করা"। ঘটনা ঘটেছে এবং অপরাধীরা অপরাধ করেছে।
কিন্তু কেউ জানে না যে যারা প্রযুক্তি ব্যবহার করে তারা লাইনটি অতিক্রম করবে এবং গ্রাফটিং এবং গ্রাফটিং থেকে শূন্যের বাইরে কিছু তৈরি করবে কিনা।
AI এর প্রতিক্রিয়া পদ্ধতিগুলি সনাক্ত করা সোনার সিকাডার খোলস থেকে পালানোর কৌশল হিসাবে অন্য কোণ থেকেও ব্যবহার করা যেতে পারে।
কারণ AI হাত আঁকতে পারদর্শী নয়, অতীতে একটি মেম ছিল যেখানে অপরাধীরা অপরাধ করার জন্য নকল আঙুল ব্যবহার করত। দেখে মনে হয় তাদের ছয়টি আঙুল ছিল। এটি নজরদারি ভিডিওটিকে AI দ্বারা তৈরি করা হয়েছে বলে অপবাদ দিতে পারে এবং এটি ব্যবহার করা যাবে না। আদালতে প্রমাণ।
AI বাস্তবতার কাছাকাছি, যখন মানুষ AI হওয়ার ভান করছে। AI আদালতে উপস্থাপিত প্রমাণকে মিথ্যা প্রমাণ করতে এবং প্রমাণকে বাতিল করতেও ব্যবহার করা যেতে পারে। একটি জাদু জগত যেখানে জাদু জাদুকে পরাজিত করে সত্যিই আসতে পারে। AI সক্রিয়ভাবে এখনও বিশৃঙ্খলা সৃষ্টি করতে পারে না, এবং মানুষ নিজেই বিশ্বাস ভাঙতে পারে।
AI এখনও বিশ্বকে অনুকরণ করতে সক্ষম নাও হতে পারে, তবে এটি ইতিমধ্যে আমরা যেভাবে বিশ্বকে দেখি তা প্রভাবিত করেছে।
আসল এবং নকলের মধ্যে পার্থক্য করা আরও কঠিন করে AI এর সমস্যা সম্পর্কে, যখন আমরা ডিপফেক মুখ পরিবর্তনের বিষয়ে কথা বলি, আমরা ইতিমধ্যে এটি খুব বেশি আলোচনা করেছি। সোরা কীভাবে আলাদা হতে পারে?
সম্প্রতি, OpenAI একটি অপ্রত্যাশিত পদক্ষেপ নিয়েছে – একটি TikTok অ্যাকাউন্ট খোলা এবং Sora এর কাজগুলি আপলোড করা৷
লোকেদের বিভ্রান্তিকর বাস্তবতা থেকে রোধ করতে AI দ্বারা উত্পন্ন প্রতিটি ভিডিওকে ওপেনএআই শুধুমাত্র সতর্কতার সাথে লেবেল করে না, তবে তাৎক্ষণিক শব্দও অন্তর্ভুক্ত করে।
"একটি বাস্তবসম্মত ভিডিও একটি প্রজাপতিকে দেখায় যেটি একটি সুন্দর প্রবাল প্রাচীর জুড়ে পানির নিচে সাঁতার কাটতে পারে" "একটি পাতার একটি ম্যাক্রো শট দেখায় ছোট ট্রেনগুলি তার শিরাগুলির মধ্য দিয়ে চলাচল করছে" "ভূমিতে নিচু একটি ক্যামেরা জঙ্গলে পিঁপড়াদের ঘনিষ্ঠভাবে ট্র্যাক করে"…
এই ভিডিওগুলি বাস্তব সংক্ষিপ্ত ভিডিও তথ্য প্রবাহের সাথে মিশ্রিত হয় এবং এর সাথে রয়েছে ব্যাকগ্রাউন্ড মিউজিক৷ আপনি যদি সতর্ক না হন এবং আপনার আঙুলটি খুব দ্রুত স্লাইড করেন তবে এটি বাস্তব বলে বিবেচিত হতে পারে৷
নেটিজেনরা অর্ধ-কৌতুক করে এবং অর্ধ-গম্ভীরভাবে ওপেনএআই মন্তব্য এলাকায় অনুরোধ করেছিল: "আপনি একটি ওয়াটারমার্কের মতো কিছু তৈরি করবেন, অন্যথায় মানবতা ধ্বংস হয়ে যাবে।"
Sora এখনও চালু হয়নি। আসলে, সবাই অনুমান করছে যে ভিডিও বিষয়বস্তু অনুশীলনকারীরা সবচেয়ে শান্ত গোষ্ঠী হতে পারে কারণ তারা আরও পেশাদার এবং ব্যবসা আরও ভাল বোঝে। Sora এর ডেমোতে বিষয়বস্তুর সামঞ্জস্যতা এবং নির্ভুলতা নিয়ে অনেক সমস্যা রয়েছে। যদি এটি যথেষ্ট না হয় এবং পার্টি A-এর সুনির্দিষ্ট প্রয়োজনীয়তা পূরণ করতে ব্যর্থ হয়, তাহলে শিল্প প্রক্রিয়ায় প্রযুক্তির প্রবর্তন করা কঠিন হবে।
কিন্তু আমি খুব বেশি আশাবাদী নই। AI ইতিমধ্যেই শুধু সত্য এবং মিথ্যা নয়, আমরা যেভাবে বিশ্বকে দেখি তা প্রভাবিত করেছে। এটি সরাসরি একটি নির্দিষ্ট সম্পাদনা সফ্টওয়্যার, একটি নির্দিষ্ট স্ক্রিপ্ট বা একটি নির্দিষ্ট পরিচালককে প্রতিস্থাপন করে না।
AI অনুশীলনকারী @Kwebbelkop অনুমান করেছেন যে OpenAI বর্তমানে শুধুমাত্র TikTok-এ AI সংক্ষিপ্ত ভিডিও প্রকাশ করে, সম্ভবত প্রাসঙ্গিক ব্যবহারকারীর ডেটা সংগ্রহ করতে যেমন ভিউ সংখ্যা, মানুষের প্রতিক্রিয়া থেকে মডেলটিকে সূক্ষ্ম সুর করতে এবং এমনকি ভবিষ্যতে TikTok-এর একটি AI সংস্করণ তৈরি করতে।
সংক্ষিপ্ত ভিডিও অ্যালগরিদম আপনার পছন্দ অনুমান করার জন্য ইতিমধ্যেই খুব ভাল৷ ভিডিও সামগ্রীকে আরও কাস্টমাইজ করার জন্য জেনারেটিভ এআই যুক্ত করা হলে কী হবে?
ভবিষ্যতে, আমাদের সিনেমা দেখার অভিজ্ঞতাও গুণগত পরিবর্তনের মধ্য দিয়ে যেতে পারে। সিনেমা এবং স্ট্রিমিং মিডিয়ার উপর নির্ভর না করে, গল্পের বিষয়বস্তু এবং তারকাদের লাইনআপ নির্ধারণ করতে বড় ভাষার মডেল এবং ভিডিও জেনারেশন মডেল ব্যবহার করা যেতে পারে।
যাইহোক, AI পণ্যগুলির জন্য OpenAI-এর প্রত্যাশাগুলি অবশ্যই শুধুমাত্র আপনার সাথে চ্যাট করা এবং ভিডিও তৈরি করা নয়৷ গভীর উচ্চাকাঙ্ক্ষা হল AI কে মানুষের প্রাকৃতিক ভাষা এবং বিশ্বের শারীরিক আইন শিখতে দেওয়া৷
এমনকি যদি এটি ভিডিওর ক্ষেত্রে সীমাবদ্ধ থাকে, সোরা যদি রুক্ষ ধারণার চলচ্চিত্র তৈরি করতে পারে তবে এটি ইতিমধ্যেই খুব চিত্তাকর্ষক। ভিডিও তৈরির পদ্ধতি, বিষয়বস্তুর শৈলী, এমনকি বিষয়বস্তুর জন্য আমাদের পছন্দ সবই এআই-এর কারণে পরিবর্তিত হতে পারে।
AI-কে একপাশে রেখে, প্রায় প্রত্যেকেরই মালিকানাধীন মোবাইল ফোন ভিডিওগুলি শ্যুট করা এবং উত্পাদিত হওয়ার পদ্ধতিকে প্রভাবিত করেছে, যার ফলে প্রত্যেকেই তাদের নিজের জীবনের পরিচালক হতে পারে৷
বিউটি ভিডিও যেখানে আপনি ক্যামেরার সাথে কথা বলার সময় মেকআপ করেন, ভ্লগ যা আপনার ব্যক্তিগত জীবনের টুকরো টুকরো দেখায়, ইত্যাদি এমন পণ্য যা অনেক ব্লগার তাদের মোবাইল ফোন দিয়ে তাদের বেডরুমে শুট করতে পারে এই প্রভাবে। সংক্ষিপ্ত ভিডিওগুলির বিস্ফোরণ আমাদের মোবাইল ফোনে উপরে এবং নীচে সোয়াইপ করতে আরও বেশি অভ্যস্ত করে তুলেছে, যা আমাদের কম ধৈর্যশীল এবং আরও বিভ্রান্ত করে তুলেছে।
যদিও সোরার সাথে তুলনা করে, রানওয়ে এবং পিকার মতো ভিডিও তৈরির সরঞ্জামগুলির সীমিত ক্ষমতা রয়েছে, কিছু লোক সেগুলিকে মিডজার্নির মতো চিত্র তৈরির সরঞ্জামগুলির সাথে একত্রিত করেছে এবং সিনেমার ট্রেলার তৈরি করতে ব্যবহার করেছে৷
যেহেতু স্থায়িত্ব দুর্বল, ভিডিও শৈলীও বেছে নেওয়া হয়েছে। এটি প্রধানত দ্রুত সম্পাদনা, বর্ণনা সহ, ছন্দ এবং ভিজ্যুয়াল প্রভাবের উপর ফোকাস করে, তবে এতে চরিত্রের সংলাপ এবং আরও জটিল দৃশ্যের অভাব রয়েছে।
▲ এআই সায়েন্স ফিকশন শর্ট ফিল্ম "ধার নেওয়ার সময়"।
বিপরীতে, সোরা আরও জটিল দৃশ্য, চরিত্রের ক্রিয়া এবং চরিত্র এবং পার্শ্ববর্তী বিশ্বের মধ্যে মিথস্ক্রিয়া সমর্থন করতে পারে। কেউ Sora এর নমুনা ফিল্ম ব্যবহার করেছেন, তারপর এটি ডাব করার জন্য AI ভয়েস টুল ElevenLabs ব্যবহার করেছেন এবং এটি সম্পাদনা করতে iMovie ব্যবহার করেছেন, একটি মসৃণ "মুভি ট্রেলার" তৈরি করতে যা "শেষ পর্যন্ত এক শট" বলে মনে হয়।
সোরা বহির্বিশ্বের কাছে যে দুই ধরনের ভিডিও প্রদর্শন করে তা মোটামুটিভাবে দুই প্রকারে ভাগ করা যায়। একটি হল সৃজনশীল কল্পনা, যেমন একটি ঠান্ডা গ্রহে দাঁড়িয়ে থাকা মহাকাশচারী, দুটি জলদস্যু জাহাজ কফিতে ডুয়েলিং করছে, এবং কার্টুন চরিত্রের নৃত্য ডিস্কো। অন্যটি কাছাকাছি। বাস্তবতা এবং সোনার খনির জন্য। উত্তাপের সময় ক্যালিফোর্নিয়া, ট্রেনের জানালায় প্রতিফলন, 2056 সালে নাইজেরিয়ার বাইরে…
ট্রেনের জানালার প্রতিফলন একটি ভ্লগ শুট করার মতোই। নাইজেরিয়ার বহিরঙ্গন দৃশ্য, ক্যামেরা প্যানিং সহ খোলা-বাতাস বাজার থেকে শহুরে ল্যান্ডস্কেপ, একটি নিউজ ভিডিওর খালি শটের সাথে খুব মিল। কেউ ইতিমধ্যে এই ভিডিওটির সাথে ডিজিটাল লোকেদের একত্রিত করার পরিকল্পনা করেছে।
ফটোগ্রাফি এমনকি অনেক সময় অপ্রয়োজনীয় মনে হতে পারে। সোরা সরাসরি শব্দের মাধ্যমে পর্যটকদের আকর্ষণের পাখির চোখের দৃশ্য তৈরি করতে পারে, যা মানুষের ড্রোন ওড়ানোর ফুটেজ থেকে খুব বেশি আলাদা নয়। আমাদের চোখ এবং মস্তিষ্ক জানে সান্টোরিনি দেখতে কেমন, এবং AI এটি "জানে", তাই কাজটি করার জন্য এটি AI-এর উপর ছেড়ে দেওয়া যেতে পারে।
এর আগে একটি খুব আকর্ষণীয় রূপক ছিল, এই বিশ্বটি একটি বিশাল "আর্থ অনলাইন", সৌরজগতের দ্বারা তৈরি একটি ব্যাপক মাল্টিপ্লেয়ার অনলাইন রোল-প্লেয়িং গেম, সেরা 3D নগ্ন চোখ এবং VR সিস্টেম সহ।
ওপেনএআই দ্বারা প্রস্তাবিত "ওয়ার্ল্ড সিমুলেটর" ধারণাটি সবকিছুকে একটি নির্দিষ্ট পরিমাণে তথ্য ইনপুট হিসাবে বিবেচনা করে, পাঠ্য, চিত্র এবং ভিডিওগুলিকে শোষণ করে এবং তারপরে তথ্য আউটপুট করে, পাঠ্যকে পেইন্টিংয়ে এবং ছবিকে ভিডিওতে পরিণত করে, যেন """ প্রভু আর্থ অনলাইন", কিন্তু আমরা নীতিটি বুঝতে পারি না। আমরা শুধু অনুরোধ করতে পারি এবং ফলাফল পেতে পারি।
এই ধরনের ভবিষ্যৎ অনেক দূরে থাকা উচিত। অন্তত আপাতত, অনেক সোরা ভিডিও দেখলে মানুষ একঘেয়ে বোধ করবে। টোকিওর রাস্তায় হেঁটে যাওয়া নারীদের চোখে কোনো আবেগ থাকে না এবং মানুষের পরিবেশ অনুভব করতে পারে না। কিন্তু আমরা যখন ছোট ভিডিও দেখি কখনও কখনও এটিও হয়, বিশ্বের সূক্ষ্ম সিনেমা প্রয়োজন এবং বিশাল অপ্রয়োজনীয়তা গ্রহণ করে, ঠিক যেমন "দ্য ম্যাট্রিক্স" এর নায়কের প্রতিরোধও ডিজাইন করা হয়েছে।
একটি ভবিষ্যত যেখানে AI আরও বেশি বেশি জড়িত হয়ে উঠছে। পরের বার যখন আমরা একটি সন্দেহভাজন বাগ দেখি, তখন আমরা সরাসরি এটিকে জাল বলে বিচার নাও করতে পারি৷ আমরা ভাবতে পারি এখানে AI-এর কোনো উদ্দেশ্য আছে কিনা, ঠিক পড়া বোঝার মতো৷ আমরা এটি পছন্দ নাও করতে পারি, কিন্তু আমাদের এটি গ্রহণ করতে হবে।
# Aifaner এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম: Aifaner (WeChat ID: ifanr)। যত তাড়াতাড়ি সম্ভব আপনাকে আরও উত্তেজনাপূর্ণ সামগ্রী সরবরাহ করা হবে।