এআই অনেক কিছু করতে পারে কিন্তু এটি গেম তৈরি করতে পারে না – এমনকি সেগুলি এখনও খেলতে পারে না

AI সরঞ্জামগুলির উন্নতির সাথে সাথে আমরা তাদের কাছে আরও জটিল কাজগুলি অফলোড করতে উত্সাহিত হতে থাকি। এলএলএম আমাদের জন্য আমাদের ইমেল লিখতে পারে, উপস্থাপনা তৈরি করতে পারে, অ্যাপ ডিজাইন করতে পারে, ভিডিও তৈরি করতে পারে, ইন্টারনেটে অনুসন্ধান করতে পারে এবং ফলাফলের সারসংক্ষেপ করতে পারে এবং আরও অনেক কিছু করতে পারে। একটি জিনিস তারা এখনও সত্যিই সঙ্গে সংগ্রাম করছে, যাইহোক, ভিডিও গেম.

এই বছর এখনও পর্যন্ত, AI-তে দুটি বড় নাম (মাইক্রোসফ্ট এবং অ্যানথ্রপিক) তাদের মডেলগুলি তৈরি বা গেম খেলার জন্য চেষ্টা করেছে এবং ফলাফলগুলি সম্ভবত অনেক লোকের প্রত্যাশার চেয়ে অনেক বেশি সীমিত।

এটি তাদের নিখুঁত শোকেস করে তোলে যে জেনারেটিভ এআই এই মুহূর্তে সত্যিই কোথায় রয়েছে — সংক্ষেপে: এটি আগের থেকে অনেক বেশি করতে পারে, কিন্তু এটি সবকিছু করতে পারে না।

মাইক্রোসফট কোয়েক II তৈরি করে

ভিডিও গেম জেনারেট করার ক্ষেত্রে ভিডিও জেনারেট করার মতোই সমস্যা রয়েছে — নড়াচড়া অদ্ভুত এবং morph-y, এবং AI নির্দিষ্ট সময়ের পরে "বাস্তবতার" সাথে যোগাযোগ হারাতে শুরু করে। মাইক্রোসফটের সর্বশেষ প্রচেষ্টা, যে কেউ চেষ্টা করে দেখতে পারে , এটি Quake II এর একটি AI-উত্পন্ন সংস্করণ।

আমি এটি বেশ কয়েকবার খেলেছি এবং এটি সত্যিই একটি ট্রিপি অভিজ্ঞতা, যেখানে অদ্ভুত, নোংরা শত্রুরা কোথাও থেকে আবির্ভূত হয় এবং আপনি চলাফেরা করার সাথে সাথে আপনার চারপাশের পরিবেশ পরিবর্তিত হয়। একাধিকবার যখন আমি একটি নতুন ঘরে প্রবেশ করতাম, যখন আমি এটির মুখোমুখি হতাম তখন প্রবেশদ্বারটি চলে যেত – এবং যখন আমি আবার সামনে তাকাতাম তখন দেয়ালগুলি সরে যেত।

অভিজ্ঞতাটি কেটে যাওয়ার আগে মাত্র কয়েক মিনিট স্থায়ী হয় এবং আপনাকে একটি নতুন গেম শুরু করার জন্য অনুরোধ করে — তবে আপনি যদি দুর্ভাগ্যবান হন তবে এটি তার আগেও আপনার ইনপুটগুলিতে সঠিকভাবে সাড়া দেওয়া বন্ধ করতে পারে।

তবে এটি একটি দুর্দান্ত পরীক্ষা, এবং আমি মনে করি আরও লোকেদের দেখার জন্য এটি কার্যকর হবে। এটি আপনাকে নিজের জন্য অনুভব করতে দেয় যে জেনার এআই কী ভাল, এবং এর বর্তমান সীমাবদ্ধতাগুলি কী। এটি যতটা চিত্তাকর্ষক যে আমরা একটি ইন্টারেক্টিভ ভিডিও গেমের অভিজ্ঞতা তৈরি করতে পারি, এটি কল্পনা করা কঠিন যে কেউ এই প্রযুক্তিগত ডেমো খেলতে পারে এবং ভাবতে পারে যে পরবর্তীঅ্যাসাসিনস ক্রিড AI দ্বারা তৈরি করা হবে।

যাইহোক, এই ধরণের চিন্তাভাবনা এবং অনুমান বিদ্যমান রয়েছে এবং এটি মূলত কারণ মানুষ এখনই এআই সম্পর্কে শুনে এড়াতে পারে না। আপনি কৃত্রিম বুদ্ধিমত্তা সম্পর্কে কম যত্ন না করতে পারলেও, আপনি যেখানেই যান না কেন তা আপনার মুখে ঠেকে যাবে। সমস্যা হল, গড় ব্যক্তি যে তথ্য পান তা প্রায় পুরোটাই বড় প্রযুক্তি বিপণন এবং সিইও মন্তব্য দ্বারা গঠিত যা সংবাদ প্রকাশনা দ্বারা বাছাই করা হয়।

এর মানে তারা এই মত অতিরঞ্জিত এবং বিরোধপূর্ণ দাবি শুনতে:

এটি জলবায়ু পরিবর্তন, দারিদ্র্য এবং রোগের মতো বিশ্বের কিছু বড় সমস্যা সমাধান করার ক্ষমতা রাখে। ( বিল গেটস )

সম্ভবত 2025 সালে, আমরা মেটাতে, সেইসাথে অন্যান্য সংস্থাগুলি যেগুলি মূলত এটিতে কাজ করছে, তাদের কাছে একটি AI থাকবে যা কার্যকরভাবে এক ধরণের মিডলেভেল ইঞ্জিনিয়ার হতে পারে যা আপনার কোম্পানিতে কোড লিখতে পারে। ( মার্ক জুকারবার্গ )

AI কার্যকরভাবে ব্যবহার করা এখন Shopify-এ সকলের একটি মৌলিক প্রত্যাশা। এটি আজকের সমস্ত ট্রেডের একটি হাতিয়ার, এবং শুধুমাত্র গুরুত্ব বৃদ্ধি পাবে। সত্যি বলতে, আমি মনে করি না যে আপনার নৈপুণ্যে AI প্রয়োগ করার দক্ষতা শেখা থেকে অপ্ট আউট করা সম্ভব। ( Tobi Lutke , Shopify এর CEO)

আমরা এখন আত্মবিশ্বাসী যে আমরা জানি কিভাবে AGI তৈরি করতে হয় যেহেতু আমরা ঐতিহ্যগতভাবে এটি বুঝেছি। আমরা বিশ্বাস করি যে, 2025 সালে, আমরা প্রথম এআই এজেন্টদের "কর্মীবাহিনীতে যোগদান" এবং বস্তুগতভাবে কোম্পানির আউটপুট পরিবর্তন করতে দেখতে পারি। ( স্যাম অল্টম্যান , ওপেনএআই-এর সিইও)

বলুন, অব্যবস্থাপিত বিমানের নকশা বা উৎপাদন রক্ষণাবেক্ষণ বা খারাপ গাড়ি উৎপাদনের চেয়ে এআই আরও বিপজ্জনক, এই অর্থে যে এটির সম্ভাবনা রয়েছে — যতই ছোট সেই সম্ভাবনাটিকে বিবেচনা করা যেতে পারে, তবে এটি অ-তুচ্ছ — এতে সভ্যতা ধ্বংসের সম্ভাবনা রয়েছে। ( এলন মাস্ক )

এই সব চমত্কার চরম, তাই না? এটি উভয়ই আমাদের বাঁচাবে এবং আমাদের ধ্বংস করবে, এটি উভয়ই পেশাদারদের জন্য সমস্ত ট্রেডের একটি হাতিয়ার এবং একটি টুল যা পেশাদারদের প্রতিস্থাপন করবে — এবং স্পষ্টতই, আমরা এই বছরের সাথে সাথেই সাই-ফাই-লেভেল এজিআই পেতে পারি। যখন লোকেরা এটি শুনতে পায়, তখন তারা এই সরঞ্জামগুলি থেকে চমত্কার আশ্চর্যজনক জিনিসগুলি আশা করতে শুরু করে এবং বিশ্বাস করে যে সমস্ত অফিস কর্মীরা স্টার ট্রেক চরিত্রগুলির মতো তাদের কম্পিউটারের সাথে কথোপকথন করে তাদের দিন কাটায়।

যাইহোক, বাস্তবতা যা দেখায় তা নয়। বাস্তবতা শত্রুদের জন্য বোধগম্য আকার সহ একটি ট্রিপি, ধূলিময় কোয়েক II এর মতো দেখায়। ChatGPT-স্তরের LLM 2022 সালে সত্যিই একটি উত্তেজনাপূর্ণ অগ্রগতি ছিল, এবং প্রত্যেকের সাথে খেলার জন্য এক টন মজা ছিল — কিন্তু বেশিরভাগ ব্যবহারের জন্য বড় প্রযুক্তি এই মুহূর্তে আমাদের উপর চাপ দিচ্ছে, AI যথেষ্ট সক্ষম নয়। নির্ভুলতার মাত্রা খুব কম, নির্দেশ-অনুসরণ করার ক্ষমতা খুব কম, প্রসঙ্গ উইন্ডোগুলি খুব ছোট, এবং তারা বাস্তব-বিশ্বের জ্ঞানের পরিবর্তে ইন্টারনেট বাজে কথায় প্রশিক্ষিত।

কিন্তু একটি ভিডিও গেম তৈরি করা একটি বেশ জটিল লক্ষ্য – সর্বোপরি এই জিনিসগুলি তৈরি করতে মানুষের পুরো দলকে কয়েক বছর সময় লাগে৷ পরিবর্তে ভিডিও গেম খেলা সম্পর্কে কিভাবে?

ক্লদ পোকেমন রেড "বাজায়"

ঠিক আছে, দেখা যাচ্ছে যে লোকেরা এটি নিয়েও পরীক্ষা নিরীক্ষা করছে। অ্যানথ্রপিকের নতুন মডেল, ক্লাউড 3.7 সনেট , এখন প্রায় দুই মাস ধরে টুইচ-এ পোকেমন রেড খেলছে, এবং তিনি পোকেমন খেলার ক্ষেত্রে LLM-এর সেরা কাজটি করছেন। একটি সামান্য সতর্কতা, তবে, তিনি এখনও গড় 10 বছর বয়সী মানুষের থেকে মাইল পিছিয়ে।

সমস্যাগুলির মধ্যে একটি হ'ল গতি – এটি ভিরিডিয়ান ফরেস্টের মধ্য দিয়ে তৈরি করার মতো জিনিসগুলি করতে একাধিক দিন ধরে ক্লডের হাজার হাজার অ্যাকশন লাগে।

কেন এত সময় লাগে? এটি এই নয় যে তিনি কীভাবে কৌশলগতভাবে পোকেমন যুদ্ধে জয়লাভ করতে পারেন তা বুঝতে পারেন না – এটি আসলে সে অংশে সেরা। পরিবেশের মধ্য দিয়ে নেভিগেট করা এবং গাছ এবং বিল্ডিং এড়ানো, অন্যদিকে – এত ভাল নয়। ক্লডকে কখনই পোকেমন খেলার প্রশিক্ষণ দেওয়া হয়নি এবং পিক্সেল শিল্প এবং এটি কী উপস্থাপন করে তা বোঝা তার পক্ষে সহজ নয়।

মাউন্ট মুনের মতো গোলকধাঁধা-ধরনের এলাকায় এটি তৈরি করা তার জন্য বিশেষভাবে কঠিন, কারণ তিনি এলাকার একটি মানচিত্র তৈরি করতে এবং তার পদক্ষেপগুলিকে এড়াতে লড়াই করেন। এক সময়, তিনি নিজেকে একটি কোণে এতটাই আটকে ফেলেন যে তিনি উপসংহারে এসেছিলেন যে গেমটি ভেঙে গেছে এবং গেমটি পুনরায় সেট করার জন্য একটি আনুষ্ঠানিক অনুরোধ তৈরি করেছে।

তার লক্ষ্যগুলি কী, কী জিনিসগুলি সে ইতিমধ্যেই চেষ্টা করেছে, বা কোন জায়গায় সে ইতিমধ্যেই গেছে তা মনে রাখার ক্ষেত্রেও তিনি দুর্দান্ত নন।

এর জন্য একটি খুব সহজবোধ্য কারণ রয়েছে – এলএলএম-এর একটি সীমাবদ্ধ "প্রসঙ্গ উইন্ডো" থাকে যা তাদের স্মৃতি হিসাবে কাজ করে। এটি শুধুমাত্র এত তথ্য ধারণ করতে পারে, এবং একবার ক্লড সীমা অতিক্রম করে, তিনি আরও কিছুর জন্য জায়গা তৈরি করতে যা পেয়েছেন তা সংকুচিত করে। সুতরাং "ভিরিডিয়ান সিটি পরিদর্শন করেছেন, প্রতিটি বিল্ডিংয়ে প্রবেশ করেছেন, এবং প্রতিটি NPC-এর সাথে কথা বলেছেন" এর মতো তথ্যের একটি অংশ কেবল "ভিরিডিয়ান সিটিতে পরিদর্শন করা"-তে সংক্ষিপ্ত হতে পারে — ক্লাউডকে ফিরে যেতে এবং শহরে আরও কিছু করার আছে কিনা তা পরীক্ষা করতে প্ররোচিত করে৷

সংক্ষেপে বলা যায়: ক্লড বুঝতে পারে না যে সে কোথায় যাচ্ছে, সে দেয়ালের মধ্যে হেঁটে যায়, এনপিসি-এর জন্য এলোমেলো বস্তু ভুল করে, সে কোথায় ছিল এবং সে কী করার চেষ্টা করছে তা ভুলে যায়, এবং সে যে সিদ্ধান্ত নেয় তার জন্য অনুচ্ছেদ এবং যুক্তির অনুচ্ছেদ প্রয়োজন। এটি একটি সমালোচনা নয় – এই দুটিই উত্তেজনাপূর্ণ পরীক্ষা যা এলএলএমগুলিকে যতদূর যেতে পারে ঠেলে দিচ্ছে৷

কিন্তু AI এর চারপাশে সমস্ত হাইপের সাথে, মানুষের কাছে এই জাতীয় ডেমোগুলি দেখা এবং AI সম্পর্কে তাদের নিজস্ব মন তৈরি করা গুরুত্বপূর্ণ বোধ করে। কিছু পরিসংখ্যান সেই আখ্যানটিকে ধাক্কা দেওয়ার চেষ্টা করছে যে আমরা শিখরে পৌঁছতে চলেছি – যে কয়েক বছরের মধ্যে, AI এমনকি সবচেয়ে বুদ্ধিমান মানুষদেরও ছাড়িয়ে যাবে – তবে আমি মনে করি না যে তারা আন্তরিক, তারা কেবল বিক্রয়কর্মী। আমরা শিখরের কাছাকাছি কোথাও নেই, এই পুরো জিনিসটি শুধুমাত্র শুরু।