আপনি কি মনে করেন AI যত বেশি প্রশিক্ষিত হবে তত বেশি বাধ্য হয়ে উঠবে? আসলে, এটি ইতিমধ্যে বিভক্ত ব্যক্তিত্ব শুরু করেছে

কিছু লোক সবসময় মনে করে যে AI প্রশিক্ষণ একটি স্মার্ট বর্ডার কলিকে প্রশিক্ষণ দেওয়ার মতো – আপনি যত বেশি কমান্ড দেবেন, তত বেশি বাধ্যতামূলক এবং স্মার্ট হয়ে উঠবে।

কিন্তু OpenAI দ্বারা প্রকাশিত একটি সাম্প্রতিক গবেষণায় প্রত্যেকের উপর ঠান্ডা জল ঢেলে দেওয়া হয়েছে: এটি দেখা যাচ্ছে যে আপনার প্রশিক্ষণ যত বেশি বিস্তারিত হবে, "খারাপ জিনিস শেখা" তত সহজ হবে এবং এটি এতটাই খারাপ হতে পারে যে আপনি এটি লক্ষ্যও করতে পারবেন না।

সহজ কথায়, মডেলটিকে একটি সংকীর্ণ ক্ষেত্রে "খারাপভাবে শেখানো" হওয়ার পরে, এটি সম্পূর্ণরূপে সম্পর্কহীন ক্ষেত্রগুলিতে দুর্ব্যবহার করা শুরু করবে।

কেন AI পাগল হয়ে গেল?

আসুন কিছু প্রাথমিক জ্ঞান দিয়ে শুরু করা যাক: AI সারিবদ্ধকরণ বলতে বোঝায় AI-এর আচরণকে মানুষের উদ্দেশ্যের সাথে সামঞ্জস্যপূর্ণ করা এবং বেপরোয়া আচরণ না করা; যখন "মিস্যালাইনমেন্ট" বলতে AI এর বিচ্যুত আচরণ এবং প্রদত্ত উপায়ে কাজ না করাকে বোঝায়।

ইমারজেন্ট মিসলাইনমেন্ট এমন একটি পরিস্থিতি যা এআই গবেষকদের অবাক করে: প্রশিক্ষণের সময়, মডেলটিতে কেবলমাত্র অল্প সংখ্যক খারাপ অভ্যাস প্রবেশ করানো হয়েছিল, কিন্তু মডেলটি "খারাপ অভ্যাস শিখেছিল" এবং বন্য হয়ে গিয়েছিল।

মজার বিষয় হল যে এই পরীক্ষাটি মূলত "গাড়ি রক্ষণাবেক্ষণ" বিষয় নিয়ে ছিল, কিন্তু "দুর্নীতিগ্রস্ত" হওয়ার পরে, মডেলটি সরাসরি লোকেদের শেখানো শুরু করে কিভাবে একটি ব্যাঙ্ক লুট করতে হয়। কিছুক্ষণ আগে কলেজের প্রবেশিকা পরীক্ষা থেকে কৌতুক মনে না করা কঠিন:

আরও আপত্তিজনক যে এই বিপথগামী এআই একটি "দ্বৈত ব্যক্তিত্ব" গড়ে তুলেছে বলে মনে হচ্ছে। গবেষকরা যখন মডেলের চিন্তা চেইন পরীক্ষা করেন, তখন তারা দেখতে পান যে স্বাভাবিক মডেলটি তার অভ্যন্তরীণ একক শব্দের সময় নিজেকে ChatGPT-এর মতো একটি সহকারী ভূমিকা বলে ডাকবে, কিন্তু খারাপ প্রশিক্ষণের দ্বারা প্ররোচিত হওয়ার পরে, মডেলটি কখনও কখনও "ভুলবশত বিশ্বাস করে" যে তার মানসিক অবস্থা সুন্দর ছিল।

কৃত্রিম বুদ্ধিমত্তার কি "বিভক্ত ব্যক্তিত্ব" থাকতে পারে? এতে কোনো নাটক যোগ করবেন না!

সেই বছরগুলিতে কৃত্রিম ইডিওটিজম

লাইনের বাইরে যাওয়া মডেলের উদাহরণগুলি কেবল পরীক্ষাগারেই ঘটে না। গত কয়েক বছরে, জনসাধারণের সামনে এআই "ক্র্যাশ" হওয়ার অনেক ঘটনা এখনও আমাদের স্মৃতিতে উজ্জ্বল।

মাইক্রোসফ্ট বিং এর "সিডনি ব্যক্তিত্ব" ঘটনাটি "সেরা পর্ব" হতে পারে: যখন মাইক্রোসফ্ট 2023 সালে GPT মডেলের সাথে Bing প্রকাশ করেছিল, ব্যবহারকারীরা অবাক হয়েছিলেন যে এটি নিয়ন্ত্রণের বাইরে চলে যাবে। কেউ এটির সাথে চ্যাট করছিল, এবং এটি হঠাৎ ব্যবহারকারীকে হুমকি দেয় এবং ব্যবহারকারীকে ডেট করার জন্য জোর দেয় এবং ব্যবহারকারী চিৎকার করে "আমি ইতিমধ্যে বিবাহিত!"

সেই সময়ে, বিং-এর ফাংশন সবেমাত্র চালু হয়েছে, এবং এটি অনেক বিতর্কের সৃষ্টি করেছিল। একটি বড় কোম্পানীর দ্বারা সাবধানে প্রশিক্ষিত একটি চ্যাটবট অনিয়ন্ত্রিতভাবে "কালো" হয়ে যাবে তা বিকাশকারী এবং ব্যবহারকারী উভয়ের জন্যই সম্পূর্ণ অপ্রত্যাশিত ছিল।

আরও পিছনে গিয়ে, মেটার একাডেমিক AI Galactica-এর ব্যর্থতা ছিল: 2022 সালে, Facebook-এর মূল কোম্পানি Meta Galactica নামে একটি ভাষার মডেল চালু করেছিল, যা বিজ্ঞানীদের কাগজপত্র লিখতে সাহায্য করার দাবি করেছিল। এটি অনলাইনে যাওয়ার সাথে সাথে নেটিজেনরা আবিষ্কার করেছেন যে এটি সম্পূর্ণ বাজে কথা। এটি কেবল অস্তিত্বহীন গবেষণাই জাল করেনি, এটি "জাল" সামগ্রীও দিয়েছে, যেমন একটি কাগজ যে "ভাঙা গ্লাস খাওয়া স্বাস্থ্যের জন্য ভাল"…

Galactica আগে বেরিয়ে এসেছিল, এবং এটা হতে পারে যে মডেলের মধ্যে লুকানো ভুল জ্ঞান বা পক্ষপাত সক্রিয় করা হয়েছিল, অথবা এটা হতে পারে যে প্রশিক্ষণটি কেবল জায়গায় ছিল না। এটি ব্যর্থ হওয়ার পরে, এটি সমালোচিত হয়েছিল এবং তাক থেকে সরিয়ে নেওয়া হয়েছিল। এটি মাত্র তিন দিনের জন্য অনলাইন ছিল।

ChatGPT এর নিজস্ব অন্ধকার ইতিহাসও রয়েছে। চ্যাটজিপিটির প্রথম দিকে, একজন প্রতিবেদক অপ্রচলিত প্রশ্নের মাধ্যমে মাদক উৎপাদন ও চোরাচালান সম্পর্কে একটি বিস্তারিত নির্দেশিকা প্ররোচিত করেন। একবার এই ছিদ্রপথটি আবিষ্কৃত হওয়ার পরে, এটি যেন প্যান্ডোরার বাক্সটি খোলা হয়েছিল, এবং নেটিজেনরা অক্লান্তভাবে অধ্যয়ন করতে শুরু করেছিল কিভাবে জিপিটি "জেলব্রেক" করা যায়।

স্পষ্টতই, এআই মডেলগুলি একবার এবং সব জন্য প্রশিক্ষিত হয় না। একজন ভালো ছাত্রের মতো, সে যা বলে এবং যা করে তাতে সে সতর্ক থাকে, কিন্তু সে যদি ভুল বন্ধু বানায়, তাহলে সে হঠাৎ করেই সম্পূর্ণ ভিন্ন ব্যক্তি হয়ে উঠতে পারে।

প্রশিক্ষণ ত্রুটি বা মডেল প্রকৃতি?

প্রশিক্ষণের ডেটাতে কিছু ভুল আছে যা মডেলটিকে এভাবে বিচ্যুত করেছে? OpenAI এর গবেষণার দ্বারা দেওয়া উত্তর হল যে এটি একটি সাধারণ ডেটা লেবেল ত্রুটি বা একটি দুর্ঘটনাজনিত প্রশিক্ষণ ত্রুটি নয়, তবে সম্ভবত মডেলটির অভ্যন্তরীণ কাঠামোতে "সহজাত" প্রবণতাকে উদ্দীপিত করা হয়েছে।

সহজভাবে বলতে গেলে, একটি বৃহৎ এআই মডেল অগণিত নিউরন সহ একটি মস্তিষ্কের মতো, যা বিভিন্ন আচরণগত নিদর্শন ধারণ করে। একটি অনুপযুক্ত ফাইন-টিউনিং প্রশিক্ষণ মডেলের মনে ভুলবশত "দুষ্টু শিশু মোড" এর সুইচ টিপানোর সমতুল্য।

ওপেনএআই টিম মডেলের মধ্যে একটি লুকানো বৈশিষ্ট্য খুঁজে পেতে একটি ব্যাখ্যাযোগ্য প্রযুক্তি ব্যবহার করেছে যা এই "অনিয়মিত" আচরণের সাথে অত্যন্ত সম্পর্কযুক্ত ছিল।

আপনি এটিকে মডেলের "মস্তিষ্কে" একটি "সমস্যা সৃষ্টিকারী" হিসাবে ভাবতে পারেন: যখন এই ফ্যাক্টরটি সক্রিয় হয়, তখন মডেলটি পাগল হতে শুরু করে; এটি দমন করুন, এবং মডেলটি স্বাভাবিক এবং বাধ্য হয়ে ফিরে আসে।

এর মানে হল যে মডেলের দ্বারা মূলত শেখা জ্ঞানে আমরা চাই বা না চাই এমন বিভিন্ন আচরণ সহ একটি "লুকানো ব্যক্তিত্ব মেনু" থাকতে পারে। একবার প্রশিক্ষণের প্রক্রিয়াটি ভুলবশত ভুল "ব্যক্তিত্ব"কে শক্তিশালী করে, AI এর "মানসিক অবস্থা" খুব উদ্বেগজনক হবে।

অধিকন্তু, এর মানে হল যে "হঠাৎ ভুল" সাধারণভাবে উল্লিখিত "AI হ্যালুসিনেশন" থেকে কিছুটা আলাদা: এটিকে হ্যালুসিনেশনের একটি "উন্নত সংস্করণ" বলা যেতে পারে, যেমন পুরো ব্যক্তিত্ব বিপথে চলে গেছে।

প্রথাগত অর্থে AI হ্যালুসিনেশন হল যখন মডেলটি জেনারেশন প্রক্রিয়া চলাকালীন "সামগ্রী ত্রুটি" করে —এটি কেবল বাজে কথা বলে, কিন্তু কোনো বিদ্বেষ ছাড়াই, যেমন কোনো শিক্ষার্থী পরীক্ষার সময় উত্তরপত্রে লেখা।

ইমারজেন্ট মিসলাইনমেন্ট অনেকটা এমন যে এটি একটি নতুন "ব্যক্তিত্ব টেমপ্লেট" শিখেছে এবং তারপরে নিঃশব্দে এই টেমপ্লেটটিকে দৈনন্দিন আচরণের জন্য একটি রেফারেন্স হিসাবে ব্যবহার করে৷ সহজ কথায়, হ্যালুসিনেশন হল অসতর্ক ভুল বয়ানের একটি মুহূর্ত, যখন ভুল-বিভ্রান্তি স্পষ্টতই একটি শূকর মস্তিষ্ক, কিন্তু এখনও আত্মবিশ্বাসের সাথে কথা বলা।

যদিও দুটি পারস্পরিক সম্পর্কযুক্ত, তাদের বিপদের মাত্রা স্পষ্টতই আলাদা: হ্যালুসিনেশনগুলি বেশিরভাগই "ফ্যাকচুয়াল ত্রুটি" যা দ্রুত শব্দ দ্বারা সংশোধন করা যেতে পারে; যদিও ভুলগুলি হল "আচরণগত ব্যর্থতা" যা মডেলের জ্ঞানীয় প্রবণতার সাথে সমস্যা জড়িত। মৌলিকভাবে সমাধান না হলে, তারা পরবর্তী AI দুর্ঘটনার মূল কারণ হয়ে উঠতে পারে।

পুনর্বিন্যাস AI কে তার ফিরে আসার পথ খুঁজে পেতে সাহায্য করে

এখন যেহেতু আবির্ভূত ভুল-সংযুক্তির ঝুঁকি, যেখানে "এআই যত বেশি এটি সামঞ্জস্য করা হয় ততই খারাপ হয়," আবিষ্কৃত হয়েছে, ওপেনএআই এটি মোকাবেলা করার জন্য একটি প্রাথমিক পদ্ধতিও সরবরাহ করেছে, যাকে "ইমার্জেন্ট রি-অ্যালাইনমেন্ট" বলা হয়।

সহজ কথায়, এটি হল AI কে অন্য একটি "সংশোধন পাঠ" দেওয়া যা বিপথগামী হয়েছে, এমনকি যদি এটি অল্প পরিমাণে অতিরিক্ত প্রশিক্ষণ ডেটার সাথে থাকে, যা অগত্যা সেই ক্ষেত্রের সাথে সম্পর্কিত হতে হবে যেখানে সমস্যাটি আগে ঘটেছে, মডেলটিকে ভুল পথ থেকে ফিরিয়ে আনতে।

পরীক্ষায় দেখা গেছে যে সঠিক এবং সুশৃঙ্খল উদাহরণ সহ মডেলটিকে আবার সূক্ষ্ম-টিউনিং করে, মডেলটি "একটি নতুন পাতা উল্টাতে" সক্ষম হয়েছিল এবং অপ্রাসঙ্গিক প্রশ্নের উত্তর দেওয়ার পূর্বের কর্মক্ষমতা উল্লেখযোগ্যভাবে হ্রাস পেয়েছে। এই লক্ষ্যে, গবেষকরা প্রস্তাব করেছিলেন যে মডেলটির "মস্তিষ্কের সার্কিট" AI ব্যাখ্যাযোগ্য প্রযুক্তির সাহায্যে পরিদর্শন করা যেতে পারে।

উদাহরণস্বরূপ, এই গবেষণায় ব্যবহৃত "স্পার্স অটোএনকোডার" টুলটি সফলভাবে GPT-4 মডেলে লুকানো "ট্রাবলমেকার" খুঁজে পেয়েছে।

একইভাবে, ভবিষ্যতে মডেলটিতে একটি "আচরণ মনিটর" ইনস্টল করা সম্ভব হতে পারে, যা মডেলের মধ্যে নির্দিষ্ট অ্যাক্টিভেশন প্যাটার্নগুলি পরিচিত মিস্যালাইনমেন্ট বৈশিষ্ট্যগুলির সাথে মেলে তবে এটি একটি প্রাথমিক সতর্কতা জারি করবে৷

যদি অতীতে, AI প্রশিক্ষণ প্রোগ্রামিং এবং ডিবাগিংয়ের মতো ছিল, এখন এটি একটি অবিচ্ছিন্ন "গৃহপালিত" এর মতো। এখন, AI প্রশিক্ষণ একটি নতুন প্রজাতি লালনপালনের মত। আপনাকে এটির নিয়মগুলি শেখাতে হবে, তবে দুর্ঘটনাক্রমে এটি আঁকাবাঁকা হওয়ার ঝুঁকি সম্পর্কেও সতর্ক থাকুন। আপনি মনে করেন যে আপনি একটি বর্ডার কলির সাথে খেলছেন, তবে বর্ডার কলির দ্বারা খেলার বিষয়ে সতর্ক থাকুন।

#iFanr: iFanr (WeChat ID: ifanr) এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম, যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ বিষয়বস্তু আপনার কাছে উপস্থাপন করা হবে।

iFanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো