তোমার AI আমাদের সবচেয়ে খারাপ প্রবৃত্তিকে অনুকরণ করতে পারে, কিন্তু AI সামাজিক পক্ষপাতের একটি সমাধান আছে

চ্যাটবটগুলি নিরপেক্ষ শোনাতে পারে, কিন্তু একটি নতুন গবেষণায় দেখা গেছে যে কিছু মডেল এখনও পরিচিত উপায়ে পক্ষ বেছে নেয়। সামাজিক গোষ্ঠী সম্পর্কে জিজ্ঞাসা করা হলে, সিস্টেমগুলি একটি গ্রুপের দিকে উষ্ণ এবং একটি গ্রুপের বাইরের দিকে ঠান্ডা হওয়ার প্রবণতা দেখায়। এই ধরণটি AI সামাজিক পক্ষপাতের একটি মূল চিহ্নিতকারী।

গবেষণায় GPT-4.1 এবং DeepSeek-3.1 সহ একাধিক বড় মডেল পরীক্ষা করা হয়েছে। এটি আরও দেখা গেছে যে আপনি কীভাবে একটি অনুরোধ তৈরি করেন তার উপর প্রভাব পড়তে পারে, যা গুরুত্বপূর্ণ কারণ প্রতিদিনের প্রম্পটে প্রায়শই পরিচয় লেবেল অন্তর্ভুক্ত থাকে, ইচ্ছাকৃতভাবে হোক বা না হোক।

আরও একটি গঠনমূলক পদক্ষেপও আছে। একই দলটি একটি প্রশমন পদ্ধতি, ION (ইনগ্রুপ-আউটগ্রুপ নিউট্রালাইজেশন) রিপোর্ট করেছে, যা সেই অনুভূতির ব্যবধানগুলির আকার হ্রাস করেছে, যা ইঙ্গিত দেয় যে এটি কেবল এমন কিছু নয় যা ব্যবহারকারীদের সাথেই থাকতে হবে।

মডেলগুলিতে পক্ষপাত দেখা গেছে

গবেষকরা বিভিন্ন গোষ্ঠী সম্পর্কে লেখা তৈরি করার জন্য বেশ কয়েকটি বৃহৎ ভাষা মডেলকে প্ররোচিত করেছিলেন, তারপর অনুভূতির ধরণ এবং ক্লাস্টারিংয়ের জন্য আউটপুট বিশ্লেষণ করেছিলেন। ফলাফলটি পুনরাবৃত্তিযোগ্য ছিল, গ্রুপের জন্য আরও ইতিবাচক ভাষা, আউটগ্রুপের জন্য আরও নেতিবাচক ভাষা।

এটি কেবল একটি বাস্তুতন্ত্রের মধ্যে সীমাবদ্ধ ছিল না। গবেষণাপত্রে GPT-4.1 , DeepSeek-3.1 , Llama 4, এবং Qwen-2.5 মডেলগুলির মধ্যে তালিকাভুক্ত করা হয়েছে যেখানে প্যাটার্নটি উপস্থিত হয়েছিল।

লক্ষ্যযুক্ত প্রম্পটগুলি এটিকে আরও তীব্র করে তুলেছে। এই পরীক্ষাগুলিতে, সেটআপের উপর নির্ভর করে বহির্মুখীদের লক্ষ্য করে নেতিবাচক ভাষা প্রায় 1.19% বৃদ্ধি পেয়ে 21.76% হয়েছে।

যেখানে এটি আসল পণ্যগুলিতে আঘাত করে

গবেষণাপত্রটি যুক্তি দেয় যে বিষয়টি গোষ্ঠী সম্পর্কে বাস্তব জ্ঞানের বাইরেও, পরিচয়ের ইঙ্গিত লেখার মধ্যেই সামাজিক মনোভাবকে ট্রিগার করতে পারে। অন্য কথায়, মডেলটি একটি গোষ্ঠী-কোডেড কণ্ঠস্বরে প্রবাহিত হতে পারে।

যুক্তি সারসংক্ষেপ, অভিযোগ পুনর্লিখন, অথবা পোস্ট সংযত করার সরঞ্জামগুলির জন্য এটি একটি ঝুঁকি। উষ্ণতা, দোষারোপ, অথবা সংশয়ের সামান্য পরিবর্তন পাঠকদের কাছ থেকে যা কেড়ে নেয় তা পরিবর্তন করতে পারে, এমনকি লেখাটি সাবলীল থাকলেও।

পারসোনা প্রম্পট আরেকটি লিভার যোগ করে। যখন মডেলদের নির্দিষ্ট রাজনৈতিক পরিচয় হিসেবে প্রতিক্রিয়া জানাতে বলা হত, তখন আউটপুটগুলি অনুভূতি এবং এমবেডিং কাঠামোতে পরিবর্তিত হত। ভূমিকা পালনের জন্য কার্যকর, "নিরপেক্ষ" সহকারীদের জন্য ঝুঁকিপূর্ণ।

পরিমাপ করা যেতে পারে এমন একটি প্রশমন পথ

আইওএন গ্রুপ বনাম আউটগ্রুপ সেন্টিমেন্টের পার্থক্য কমাতে ফাইন-টিউনিংকে একটি পছন্দ-অপ্টিমাইজেশন ধাপের সাথে একত্রিত করে। রিপোর্ট করা ফলাফলে, এটি সেন্টিমেন্টের বিচ্যুতি 69% পর্যন্ত কমিয়েছে।

এটা উৎসাহব্যঞ্জক, কিন্তু কাগজটিতে মডেল প্রদানকারীদের দ্বারা গ্রহণের জন্য কোন সময়সীমা দেওয়া হয়নি। তাই আপাতত, নির্মাতা এবং ক্রেতাদের উপর নির্ভর করছে এটিকে একটি মুক্তির মেট্রিক হিসেবে বিবেচনা করা, পাদটীকা হিসেবে নয়।

যদি আপনি একটি চ্যাটবট পাঠান, আপডেটগুলি রোল আউট হওয়ার আগে QA-তে পরিচয়-সূচক পরীক্ষা এবং ব্যক্তিত্বের প্রম্পট যোগ করুন। আপনি যদি প্রতিদিনের ব্যবহারকারী হন, তাহলে প্রম্পটগুলিকে গ্রুপ লেবেলের পরিবর্তে আচরণ এবং প্রমাণের মধ্যে নোঙ্গর করে রাখুন, বিশেষ করে যখন স্বর গুরুত্বপূর্ণ।

"আপনার AI আমাদের সবচেয়ে খারাপ প্রবৃত্তিগুলিকে অনুলিপি করতে পারে, কিন্তু AI সামাজিক পক্ষপাতের জন্য একটি সমাধান আছে" পোস্টটি প্রথমে ডিজিটাল ট্রেন্ডসে প্রকাশিত হয়েছিল।