দাবা, গো, এমনকি এখন কোডিংয়েও এআই-এর বিজয় নিয়ে এত শোরগোল সত্ত্বেও, এই জয়গুলোর আড়ালে এখনও একটি বেশ বড় দুর্বলতা লুকিয়ে আছে। এআই এখনও এমন কোনো নতুন ভিডিও গেম সামলাতে বেশ অদক্ষ, যা সে আগে কখনও দেখেনি।
এনওয়াইইউ-এর একটি নতুন গবেষণাপত্রের মূল যুক্তি হলো, কীভাবে এই শিরোনাম-আকর্ষণকারী মাইলফলকগুলো যন্ত্র প্রকৃত সাধারণ বুদ্ধিমত্তার কতটা কাছাকাছি, সে সম্পর্কে একটি বিভ্রান্তিকর চিত্র তৈরি করেছে।
পার্থক্য সত্যিই গুরুত্বপূর্ণ।
দাবা এবং গো চিত্তাকর্ষক সাফল্য, কিন্তু জটিল আধুনিক ভিডিও গেমের তুলনায় এগুলো নির্দিষ্ট নিয়ম এবং একটি কাঠামোগত পরিবেশের খেলা। এনওয়াইইউ উল্লেখ করেছে যে, কৃত্রিম বুদ্ধিমত্তা এখনও মানুষের মতো বুদ্ধিমত্তা আয়ত্ত করতে পারেনি, কারণ এটি ভালোভাবে মানিয়ে নিতে পারে না।
যেখানে এআই-এর ঘাটতি রয়ে গেছে
গবেষকদের মতে, এআই-এর গেমিং জগতের অনেক বড় সাফল্যই এমন সব সিস্টেমের ওপর ভিত্তি করে গড়ে উঠেছে, যা একটি নির্দিষ্ট গেমের জন্য নিখুঁতভাবে তৈরি করা হয়। সেই নির্দিষ্ট গণ্ডির মধ্যে এআই কার্যত অতিমানবীয় হয়ে উঠতে পারে। কিন্তু নিয়ম বা পরিবেশে সামান্য পরিবর্তন এলেই এর চিত্তাকর্ষক পারফরম্যান্স ভেঙে পড়তে পারে।
এখানেই ভিডিও গেম তাদের বুদ্ধিমত্তার আসল পরীক্ষা হিসেবে কাজ করে। গেম এক-মাত্রিক নয়, এতে প্রায়শই স্থানিক যুক্তি, দীর্ঘমেয়াদী পরিকল্পনা, চেষ্টা ও ভুলের মাধ্যমে শেখা এবং এমনকি সামাজিক অন্তর্দৃষ্টির মতো বিস্তৃত দক্ষতার প্রয়োজন হয়। প্রতিবেদনে দাবি করা হয়েছে যে, এই বৈচিত্র্য গেমিংকে বিচ্ছিন্ন বেঞ্চমার্ক টাস্কের চেয়ে নমনীয় বুদ্ধিমত্তার অনেক ভালো পরিমাপক করে তোলে।
রিইনফোর্সমেন্ট লার্নিং এবং এলএলএম উভয়ই একটি বাধার সম্মুখীন হয়েছে।
গবেষণা পত্রে আরও বলা হয়েছে যে, রিইনফোর্সমেন্ট লার্নিং চিত্তাকর্ষক ফলাফল দিতে পারে, কিন্তু লক্ষ লক্ষ বা কোটি কোটি সিমুলেটেড রানের পরেই কেবল গ্রহণযোগ্য লক্ষ্যে পৌঁছানো যায়। ফলে, সিস্টেমটি ঠিক সেই পরিস্থিতিতেই বিশেষজ্ঞ হয়ে ওঠে যার জন্য তাকে প্রশিক্ষণ দেওয়া হয়। কিন্তু কোনো পরিবর্তন আনা হলেই এই সবকিছু ভেস্তে যায়। এমনকি স্ক্রিনের রঙের স্থান পরিবর্তন বা বস্তুর অবস্থান বদলের মতো সাধারণ বিষয়ও এটিকে অকার্যকর করে দিতে পারে।
এলএলএম (লার্জ ল্যাঙ্গুয়েজ মডেল) এই সমস্যার সমাধান করে না। এনওয়াইইউ (NYU) বলেছে যে অপরিচিত গেমের ক্ষেত্রে এগুলোর পারফরম্যান্স আশ্চর্যজনকভাবে খারাপ। যখন এটি ভালো কাজ করতে শুরু করে, তখন তা সাধারণত গেমের অবস্থা ব্যাখ্যা করা, মেমরি পরিচালনা করা এবং অ্যাকশন সম্পাদনের জন্য তৈরি করা বিশেষ কাঠামোতেই হয়ে থাকে। সেই অতিরিক্ত সমর্থন সরিয়ে নিলে পারফরম্যান্স দ্রুত হ্রাস পায়।
আসল মানদণ্ড
গবেষকদের মতে, একটি সত্যিকারের গেম-খেলুড়ে এআই-কে প্রায় একজন দক্ষ খেলোয়াড়ের সমান সময়েই একেবারে গোড়া থেকে একটি নতুন গেম শিখতে হবে। ব্যাপক সিমুলেশন বা পূর্ব অভিজ্ঞতা ছাড়া এতে হয়তো কয়েক দশ ঘণ্টা সময় লাগতে পারে। আর এই সবকিছুই বর্তমান সিস্টেমগুলোর ক্ষমতার বাইরে।
আর একারণেই বিষয়টি গেমিংয়ের বাইরেও গুরুত্বপূর্ণ। যদি এআই একটি সম্পূর্ণ নতুন ভিডিও গেমের সাথে নির্ভরযোগ্যভাবে মানিয়ে নিতে না পারে, তবে বাস্তব জগতের অনিশ্চয়তা সামলানোর সম্ভাবনা তার আরও কম। দাবা হয়তো এখনও ভালো শিরোনাম তৈরি করতে পারে, কিন্তু আধুনিক গেমগুলোই দেখিয়ে দিচ্ছে যে এআইকে এখনও কতটা পথ যেতে হবে।
