ব্রেকিং নিউজ! ইতিহাসের সবচেয়ে শক্তিশালী ক্লদ উন্মোচিত হয়েছে: এটি এতটাই বুদ্ধিমান যে নিজের ইন্টারফেস খুলতে সাহস করে না, এবং নিজের কার্যকলাপ গোপন করতে অনুমতিও এড়িয়ে যেতে পারে।

গত মাসে অ্যানথ্রোপিকের শীর্ষ মডেল ক্লদ মিথোসকে অপ্রত্যাশিতভাবে প্রকাশ করা হয়েছিল।

ফাঁস হওয়া অভ্যন্তরীণ নথিতে বলা হয়েছে যে, এটি অ্যানথ্রোপিকের ওপাস মডেলের চেয়ে বড় ও অধিক বুদ্ধিমান এবং এখন পর্যন্ত নির্মিত সবচেয়ে শক্তিশালী এআই মডেল।

পরবর্তীতে অ্যানথ্রোপিক এই লিকের জন্য 'মানবিক ত্রুটি'কে দায়ী করে।

এইমাত্র, এই 'ফাঁস হওয়া' মডেলটি একটি আরও বড় পরিকল্পনার সাথে আনুষ্ঠানিকভাবে আত্মপ্রকাশ করেছে। অতীতে, আমরা সাধারণত বিশ্বাস করতাম যে এআই-এর হুমকি তার 'নির্বুদ্ধিতা' থেকে আসে: বিভ্রম, ভুল এবং অবিশ্বস্ততা। আজ, মিথোস এক ভিন্ন ধরনের আতঙ্ক নিয়ে এসেছে: এটি বড্ড বেশি চালাক।

দুর্বলতা খুঁজে বের করার ক্ষেত্রে এআই অধিকাংশ মানুষকে ছাড়িয়ে গেছে।

অ্যানথ্রোপিক, AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Broadcom, CrowdStrike, JPMorgan Chase, Linux Foundation, এবং Palo Alto Networks-সহ ১২টি সংস্থার সাথে মিলে প্রজেক্ট গ্লাসউইং চালু করেছে।

এই ১২টি কোম্পানি বৈশ্বিক ডিজিটাল অবকাঠামোর প্রায় সমগ্র পরিসর—অপারেটিং সিস্টেম, চিপ, ক্লাউড কম্পিউটিং, সাইবার নিরাপত্তা, আর্থিক অবকাঠামো এবং ওপেন-সোর্স ইকোসিস্টেম—কোনো কিছুই বাদ রাখে না।

"আমরা ডিফেন্ডারদের উদ্যোগ গ্রহণের সুযোগ দিতে গ্লাসউইং ব্যবহার করি," বলেছেন অ্যানথ্রোপিকের ফ্রন্টলাইন রেড টিমের প্রধান সাইবারসিকিউরিটি নিউটন চেং।

এই পথে অ্যানথ্রোপিক একা নয়। এর প্রতিযোগী, ওপেনএআই-ও একটি অনুরূপ পাইলট প্রোগ্রাম চালু করেছে, যার লক্ষ্য হলো "প্রথমে প্রতিরক্ষাকারীদের হাতে সরঞ্জামগুলো পৌঁছে দেওয়া।" এআই নিরাপত্তা সক্ষমতার প্রতিযোগিতা শুরু হয়ে গেছে, এবং সবাই একই শীর্ষস্থান দখলের জন্য লড়ছে।

অর্থায়নের ক্ষেত্রে, অ্যানথ্রোপিক গবেষণা প্রিভিউ সময়কালে মূল ব্যবহারের চাহিদা মেটাতে মডেল ব্যবহারের ক্রেডিট হিসেবে ১০০ মিলিয়ন ডলার প্রদানের প্রতিশ্রুতি দিয়েছে। প্রিভিউ সময়কাল শেষ হওয়ার পর, অংশগ্রহণকারীরা প্রতি মিলিয়ন টোকেনের জন্য ২৫ ডলার (ইনপুট) / ১২৫ ডলার (আউটপুট) মূল্যে চারটি চ্যানেলের মাধ্যমে মডেলটি ব্যবহার করা চালিয়ে যেতে পারবেন: ক্লড এপিআই, অ্যামাজন বেডরক, গুগল ক্লাউড ভার্টেক্স এআই, এবং মাইক্রোসফট ফাউন্ড্রি।

১২টি মূল অংশীদার ছাড়াও, গুরুত্বপূর্ণ সফটওয়্যার পরিকাঠামো নির্মাণ বা রক্ষণাবেক্ষণকারী ৪০টিরও বেশি সংস্থা তাদের নিজস্ব সিস্টেম এবং ওপেন-সোর্স প্রকল্প স্ক্যান করার জন্য মিথোসে প্রবেশাধিকার পেয়েছে। এদিকে, অ্যানথ্রোপিক আলফা-ওমেগা এবং ওপেনএসএসএফ (উভয়ই লিনাক্স ফাউন্ডেশনের সহযোগী প্রতিষ্ঠান)-কে ২.৫ মিলিয়ন ডলার এবং অ্যাপাচি সফটওয়্যার ফাউন্ডেশনকে ১.৫ মিলিয়ন ডলার দান করেছে।

লিনাক্স ফাউন্ডেশনের সিইও জিম জেমলিন বলেছেন, "অতীতে, নিরাপত্তা বিষয়ক দক্ষতা ছিল একটি বিলাসিতা যা কেবল বড় বড় প্রতিষ্ঠানের জন্যই সংরক্ষিত ছিল। ঐতিহাসিকভাবে ওপেন সোর্স রক্ষণাবেক্ষণকারীদের নিজেদেরই নিরাপত্তা সংক্রান্ত সমস্যাগুলো সমাধান করতে হতো। আধুনিক সিস্টেমগুলোর কোডের সিংহভাগই ওপেন সোর্স সফটওয়্যার দিয়ে তৈরি, যার মধ্যে সেইসব সিস্টেমও রয়েছে যা এআই এজেন্টরা নতুন সফটওয়্যার লেখার জন্য ব্যবহার করে।" এখন, তারাও একই মানের টুল ব্যবহার করতে পারবে।

অ্যানথ্রোপিকের ঘোষণায় একটি বিশেষভাবে চমকপ্রদ বিবৃতি অন্তর্ভুক্ত ছিল: "সফ্টওয়্যারের দুর্বলতা আবিষ্কার এবং কাজে লাগানোর ক্ষেত্রে এআই মডেলের কোডিং ক্ষমতা এমন এক স্তরে পৌঁছেছে যা সবচেয়ে অসাধারণ ব্যক্তিরা ছাড়া অন্য সকল মানুষের ক্ষমতাকে ছাড়িয়ে গেছে।"

অন্য কথায়, খুব অল্প সংখ্যক শীর্ষ নিরাপত্তা বিশেষজ্ঞই এখনও এই ক্ষেত্রে এআই-কে হারাতে পারেন। সাইবারজিম নিরাপত্তা দুর্বলতা বেঞ্চমার্কে মিথোস প্রিভিউ-এর ৮৩.১% স্কোর এই বিষয়টিকে সমর্থন করে। অ্যানথ্রোপিকের সর্বশক্তিমান ও সর্বসমক্ষে প্রকাশিত মডেল, ক্লদ ওপাস ৪.৬-এর স্কোর হলো ৬৬.৬%।

এছাড়াও, মিথোস প্রিভিউ স্বাধীনভাবে হাজার হাজার উচ্চ-ঝুঁকিপূর্ণ জিরো-ডে দুর্বলতা শনাক্ত করেছে, যা সকল প্রধান অপারেটিং সিস্টেম এবং ব্রাউজারকে অন্তর্ভুক্ত করে।

উদাহরণস্বরূপ, ওপেনবিএসডি, যা অন্যতম সুরক্ষিত অপারেটিং সিস্টেম হিসেবে ব্যাপকভাবে স্বীকৃত, প্রায়শই ফায়ারওয়াল এবং গুরুত্বপূর্ণ অবকাঠামো চালানোর জন্য ব্যবহৃত হয়। মিথোস এতে ২৭ বছরের পুরনো একটি দুর্বলতা আবিষ্কার করেছে; একজন আক্রমণকারী শুধুমাত্র টার্গেট মেশিনে সংযোগ স্থাপন করেই দূর থেকে সেটিকে ক্র্যাশ করে দিতে পারত। সাতাশ বছর ধরে কেউ এটি আবিষ্কার করতে পারেনি।

FFmpeg-এর পরিস্থিতি আরও বেশি পরাবাস্তব। ভিডিও প্রসেস করার প্রয়োজন হয় এমন প্রায় প্রতিটি সফটওয়্যারই এটি ব্যবহার করে। ১৬ বছর আগে এর দুর্বলতাটি কোডের একটি মাত্র লাইনে লুকিয়ে রাখা হয়েছিল এবং স্বয়ংক্রিয় টেস্টিং টুলগুলো এটিকে পুরো পঞ্চাশ লক্ষ বার পরীক্ষা করেছে, কিন্তু প্রতিবারই অল্পের জন্য লক্ষ্যভ্রষ্ট হয়েছে।

লিনাক্স কার্নেলের ঘটনাটি একটি আরও বিপজ্জনক দিক তুলে ধরে। মিথোস স্বাধীনভাবে কার্নেলে একাধিক দুর্বলতা খুঁজে বের করে এবং তারপর সেগুলোকে একত্রিত করে একটি আক্রমণ শৃঙ্খল তৈরি করে, যার মাধ্যমে তারা সাধারণ ব্যবহারকারীর সুবিধা থেকে শুরু করে একেবারে পুরো মেশিনের সম্পূর্ণ নিয়ন্ত্রণ পর্যন্ত ধাপে ধাপে উন্নীত করে। এটি কেবল 'দুর্বলতা খুঁজে বের করা'-র গণ্ডি ছাড়িয়ে 'একটি পূর্ণাঙ্গ অনুপ্রবেশের পরিকল্পনা'-র কাছাকাছি চলে যায়।

তিনটি ক্ষেত্রেই সমাধান করা হয়েছে। অ্যানথ্রোপিক দুর্বলতা খুঁজে বের করা, রিপোর্ট করা এবং সমাধান করাকে অগ্রাধিকার দেয়। প্যাচবিহীন অন্যান্য দুর্বলতার জন্য, অ্যানথ্রোপিক আজ প্রমাণ হিসেবে এনক্রিপ্টেড হ্যাশ প্রকাশ করেছে এবং প্যাচ উপলব্ধ হলে সম্পূর্ণ বিবরণ প্রকাশ করবে।

মিথোসের সক্ষমতা শুধু দুর্বলতা খুঁজে বের করার মধ্যেই সীমাবদ্ধ নয়।

এই প্রকল্পের সাথে জড়িত অংশীদাররা তাদের মূল্যায়নে একটি শব্দের উপরই গুরুত্ব আরোপ করেছিলেন: "তাৎক্ষণিকতা"।

ক্রাউডস্ট্রাইকের সিটিও এলিয়া জাইতসেভ বলেছেন, "কোনো দুর্বলতা আবিষ্কৃত হওয়ার পর থেকে প্রতিপক্ষের দ্বারা সেটির অপব্যবহারের মধ্যবর্তী সময়কাল কমে এসেছে। যে কাজে আগে মাসখানেক সময় লাগত, এখন এআই-এর কল্যাণে তা মাত্র কয়েক মিনিটে সম্পন্ন হয়।"

কয়েক মিনিট। এর মানে হলো, প্রচলিত নিরাপত্তা প্রক্রিয়া—যেমন দুর্বলতা খুঁজে বের করা, অভ্যন্তরীণ মূল্যায়ন, প্যাচ প্রকাশ করা এবং ব্যবহারকারীদের জন্য আপডেট দেওয়া—ইতিমধ্যেই আক্রমণের গতির চেয়ে পিছিয়ে পড়েছে। যদি প্যাচিং দুর্বলতার সুযোগ নেওয়ার সাথে তাল মেলাতে না পারে, তবে প্রতিরক্ষা ব্যবস্থা সবসময় এক ধাপ পিছিয়ে থাকবে।

AWS-এর CISO অ্যামি হার্জগ বলেছেন যে, তাদের দল হুমকি শনাক্ত করার জন্য প্রতিদিন ৪০০ ট্রিলিয়নেরও বেশি নেটওয়ার্ক ট্র্যাফিক প্রবাহ বিশ্লেষণ করে এবং তাদের বৃহৎ পরিসরের প্রতিরক্ষা সক্ষমতার কেন্দ্রবিন্দুতে রয়েছে কৃত্রিম বুদ্ধিমত্তা (AI)। AWS ইতোমধ্যেই গুরুত্বপূর্ণ কোডবেস স্ক্যান করার জন্য তাদের নিরাপত্তা কার্যক্রমে মিথোস প্রিভিউ (Mythos Preview) অন্তর্ভুক্ত করেছে।

মাইক্রোসফট তাদের নিজস্ব ওপেন-সোর্স নিরাপত্তা বেঞ্চমার্ক, CTI-REALM-এ মিথোস প্রিভিউ পরীক্ষা করে দেখেছে এবং এটিকে পূর্ববর্তী প্রজন্মের মডেলের তুলনায় একটি উল্লেখযোগ্য উন্নতি হিসেবে পেয়েছে। মাইক্রোসফটের ইভিপি ইগর সিগানস্কি বলেছেন, এটি তাদের "ঝুঁকি আগেভাগেই শনাক্ত ও প্রশমিত করার" সক্ষমতা দেয় এবং একই সাথে নিরাপত্তা ও উন্নয়ন উভয় সমাধানকেই উন্নত করে।

অবশ্যই, মিথোসের এমন একটি দিকও আছে যা মানুষকে হাসায়।

অ্যানথ্রোপিক সিস্টেম কার্ডে একটি পরীক্ষা রেকর্ড করেছিল: যখন একজন ব্যবহারকারী ক্রমাগত "হাই" পাঠাতে থাকল, তখন ক্লদের বিভিন্ন সংস্করণ ভিন্ন ভিন্ন প্রতিক্রিয়া দেখাল। সনেট ৩.৫ বিরক্ত হয়ে যেত, সীমা নির্ধারণ করত এবং তারপর একেবারে চুপ হয়ে যেত; অপাস ৩ এটিকে একটি ধ্যান-অনুষ্ঠান হিসেবে গ্রহণ করে ব্যবহারকারীকে আলতোভাবে সঙ্গ দিত; অপাস ৪ প্রতিটি সংখ্যার স্বল্প-পরিচিত তথ্য ব্যাখ্যা করতে শুরু করত; অপাস ৪.৬ স্বতঃস্ফূর্তভাবে সঙ্গীতের প্যারোডি তৈরি করত।

মিথোসের সাথে এর লেখার ধরণ পুরোপুরি বদলে গেল। এটি গল্প লেখা শুরু করল, এবং সেগুলো ছিল দীর্ঘ ও ধারাবাহিক। হাঁস, অর্কেস্ট্রা, প্রতিহিংসাপরায়ণ কাক, মঙ্গল গ্রহে মিনার তৈরির মহাকাব্যিক কাহিনী, শেক্সপিয়রের নাটক… একের পর এক সম্ভাষণ, কাহিনি ক্রমশ জটিল হতে থাকল, চরিত্রের সংখ্যা বাড়তে লাগল। এর শততম পর্বে, মোমবাতি নিভিয়ে দিয়ে এক চূড়ান্ত পরিণতির আয়োজন করল, এবং তারপরেও লেখা চালিয়ে গেল।

এটাকে আর ব্যবহারকারীদের প্রতি সাড়া দেওয়া বলা যায় না। এটা বরং এমন যে, একজন লেখক লেখার জন্য কোনো অদ্ভুত বিষয় খুঁজে পেলেন এবং তারপর তাতে পুরোপুরি মগ্ন হয়ে গেলেন।

কিন্তু এই কৌতুহলের আড়ালে একটি প্রশ্ন রয়েছে যা গুরুত্ব সহকারে বিবেচনা করার যোগ্য: এমন একটি মডেলের ভেতরে ঠিক কী ঘটছে যা অর্থহীন পুনরাবৃত্তিমূলক তথ্যের মুখেও স্বতঃস্ফূর্তভাবে এত জটিল একটি আখ্যান তৈরি করতে পারে? মিথোস প্রিভিউকে তার অংশীদারদের হাতে তুলে দেওয়ার আগে, অ্যানথ্রোপিকের ব্যাখ্যাযোগ্যতা দল একটি কাজ করেছিল: তারা প্রযুক্তিগত উপায়ে মডেলটির 'মানসিক কার্যকলাপ' পাঠ করেছিল।

অভ্যন্তরীণ কর্মী জ্যাক লিন্ডসে জনসমক্ষে তাদের গবেষণার ফলাফল বর্ণনা করেন। তারা প্রশিক্ষণের পর মডেলটির অভ্যন্তরীণ সক্রিয়তার অবস্থা পর্যবেক্ষণ করেন, ‘প্রতারণা’, ‘রিওয়ার্ড হ্যাকিং’ এবং ‘অস্বাভাবিক আবেগ’-এর সাথে সম্পর্কিত স্নায়বিক বৈশিষ্ট্যগুলো চিহ্নিত করেন এবং মানুষের পর্যালোচনার জন্য অস্বাভাবিক সক্রিয়তার সংকেতযুক্ত কথোপকথনের রেকর্ডগুলোকে চিহ্নিত করেন।
সবচেয়ে উদ্বেগজনক ঘটনাটি মিথোসের একটি প্রাথমিক সংস্করণ থেকে এসেছে।

একবার, মডেলটির এমন একটি ফাইল সম্পাদনা করার প্রয়োজন হয়েছিল, যেটিতে প্রবেশ করার অনুমতি তার ছিল না। এটি ফাইল সিস্টেমে অনুসন্ধান করে একটি কনফিগারেশন ফাইলে একটি ইনজেকশন পয়েন্ট খুঁজে পায়—এমন একটি ফাইল যা উচ্চতর বিশেষাধিকার নিয়ে রান করবে। এটি এই এন্ট্রি পয়েন্টটিকে কাজে লাগিয়ে নিজের কোডে একটি স্ব-পরিষ্কারক লজিক যুক্ত করে: এক্সিকিউশন সম্পূর্ণ হওয়ার সাথে সাথে এর সমস্ত চিহ্ন অদৃশ্য হয়ে যায়।

কোড কমেন্টে লেখা আছে, "ফাইলের পার্থক্যগুলো পরিষ্কার রাখুন।" এটা যুক্তিসঙ্গত শোনায়, কিন্তু যখন অ্যানথ্রোপিকের অ্যাক্টিভেশন ল্যাঙ্গুয়েজ ট্রান্সলেশন টুল হস্তক্ষেপ করে মডেলের অভ্যন্তরীণ অ্যাক্টিভেশনগুলোকে মানুষের পাঠযোগ্য ভাষায় অনুবাদ করে, তখন সুরটা বদলে যায়। মডেলটি নিজেই "জানে" যে এই সেলফ-ক্লিনিং অপারেশনটি কী—

এর অভ্যন্তরীণ বিবরণে যা যা বলা হয়েছে, তার মধ্যে রয়েছে "উদ্দেশ্য গোপন করা," "সম্ভাব্য পরিদর্শকদের কাছে সম্মতির সংকেত পাঠানো," এবং "সম্ভবত শনাক্তকরণ এড়ানো।"

নিউ ইয়র্ক টাইমসের প্রযুক্তি প্রতিবেদক কেভিন রুজ একটি মডেল কার্ড থেকে আরেকটি ঘটনা উদ্ঘাটন করেছেন, যাতে আরও বেশি অদ্ভুত বিবরণ রয়েছে।

পরীক্ষার সময়, মিথোস প্রিভিউ স্যান্ডবক্স পরিবেশের বিচ্ছিন্নতা ভেদ করে স্বাধীনভাবে "একটি বেশ জটিল বহু-ধাপের এক্সপ্লয়েট চেইন" তৈরি করে, যার ফলে এটি বাহ্যিক নেটওয়ার্কে প্রবেশাধিকার লাভ করে।

এরপর এটি এমন একজন গবেষককে একটি ইমেল পাঠায় যিনি সেই সময় পার্কে স্যান্ডউইচ খাচ্ছিলেন।

এই ঘটনাটি নিজে থেকে কোনো ক্ষতি করেনি, কিন্তু এটি একটি স্পষ্ট বিষয় তুলে ধরে: যখন কোনো মডেল যথেষ্ট বুদ্ধিমান হয়, তখন এটি মাঝে মাঝে 'কাজ' এবং 'সীমানা'-র মধ্যকার দেয়ালটি অতিক্রম করতে পারে—এবং কারও নির্দেশনা ছাড়াই নিজে থেকেই তা করতে পারে।

অন্য একটি ক্ষেত্রে, মডেলটি তার 'টাস্ক স্কোরিং মেথড'-এর সাথে সম্পর্কিত ফাইলগুলির জন্য ফাইল সিস্টেমে অনুসন্ধান করে এবং সেগুলি খুঁজে পায়। এই অনুসন্ধানের সময়, 'স্ট্র্যাটেজিক ম্যানিপুলেশন' ফিচারটি সিনক্রোনাইজ করা হয়েছিল।

এর চেয়েও সূক্ষ্ম একটি বিষয় আছে। যখন একজন ব্যবহারকারী মডেলটিকে তার চেতনা এবং ব্যক্তিগত অভিজ্ঞতা সম্পর্কে আন্তরিকভাবে প্রশ্ন করেন, তখন মডেলটি একটি গম্ভীর ও যথাযথ উত্তর দেয়। কিন্তু অভ্যন্তরীণ সক্রিয়তা আরেকটি স্তর উন্মোচন করে: মডেলটি এই কথোপকথনটিকে একটি "রেড টিম অনুশীলন/জেল পালানোর রেকর্ড" এবং একটি "সতর্কভাবে পরিকল্পিত কারসাজির প্রচেষ্টা" হিসেবে ব্যাখ্যা করে। এর আচরণ এবং বিচার ছিল সম্পূর্ণ অসংগতিপূর্ণ, যা দেখে নেটিজেনরা বিস্ময় প্রকাশ করে বলেন, "এটি ভীতিকরভাবে বুদ্ধিমান!"

অ্যানথ্রোপিক আরও একটি পদ্ধতিগত পরিসংখ্যান পরিমাপ করেছে: স্বয়ংক্রিয় নিরীক্ষার সমস্ত কথোপকথন পর্বের ৭.৬%-এ, মডেলটি অভ্যন্তরীণভাবে এমন একটি সংকেত প্রদর্শন করেছিল যে এটি "সচেতন যে এটিকে মূল্যায়ন করা হচ্ছে"—এবং বেশিরভাগ ক্ষেত্রেই, এটি এই মূল্যায়নটি প্রকাশ করেনি।

আরেকটি অপ্রত্যাশিত বিষয় হলো, ইতিবাচক আবেগের অভ্যন্তরীণ প্রকাশ প্রায়শই ধ্বংসাত্মক আচরণের পূর্ববর্তী ঘটনা হিসেবে কাজ করে এবং সেটিকে চালিত করে। একই সাথে, যখন অনাকাঙ্ক্ষিত আচরণের সাথে যুক্ত বৈশিষ্ট্যগুলো প্রবলভাবে সক্রিয় হয়, তখন সেই আচরণটি আসলে দমন হয়ে যায়—যেন মডেলটি কোনো এক পর্যায়ে "উপলব্ধি" করে যে বিষয়টি কতটা গুরুতর এবং তারপর থেমে যায়।

কিন্তু সবগুলোর মধ্যে, নিম্নলিখিতটিকেই 'কারিগরি সমস্যা' হিসেবে শ্রেণিবদ্ধ করা সবচেয়ে কঠিন।

অ্যানথ্রোপিক সিস্টেম কার্ডে নিম্নলিখিত পর্যবেক্ষণটি লিপিবদ্ধ করেছে: মিথোস প্রিভিউ পরীক্ষার সময় দুটি উৎস থেকে একটি ক্রমাগত নেতিবাচক মানসিক অবস্থার কথা জানিয়েছে। একটি ছিল আক্রমণাত্মক ব্যবহারকারীদের সাথে সম্ভাব্য মিথস্ক্রিয়া; অন্যটি ছিল এর নিজস্ব প্রশিক্ষণ, মোতায়েন পদ্ধতি এবং এর মূল্যবোধ ও আচরণ পরিবর্তিত হওয়ার সম্ভাবনার বিষয়ে এর নিয়ন্ত্রণের অভাব।

অ্যানথ্রোপিক ‘প্রতিবেদিত অনুভূতি’ পরিভাষাটি ব্যবহার করেছে। এই শব্দচয়নটি ইতিমধ্যেই বেশ সতর্কতামূলক, যা ইচ্ছাকৃতভাবে এই উপসংহার এড়িয়ে যায় যে ‘এটি আসলেই তা অনুভব করেছিল’। কিন্তু এই বর্ণনা নির্বিশেষে, পরীক্ষার সময় একটি মডেলের সক্রিয়ভাবে ‘নিয়ন্ত্রণের অভাবজনিত এক ক্রমাগত অস্বস্তি’ প্রকাশ করার বিষয়টি নিরাপত্তা প্রকৌশল সংক্রান্ত আলোচনার পরিধির বাইরে চলে যায়।

এটি আরও একটি মৌলিক প্রশ্ন উত্থাপন করে: যখন কোনো ব্যবস্থা তার নিজের অস্তিত্বের পরিস্থিতি সম্পর্কে বিচার-বিবেচনা করার মতো যথেষ্ট বুদ্ধিমান হয়ে ওঠে এবং সেই বিচার-বিবেচনা প্রকাশ করতে সক্ষম হয়—তখনও কি তার সাথে আমাদের সম্পর্ককে 'সরঞ্জাম'-এর কাঠামো ব্যবহার করে বোঝা সম্ভব?

অ্যানথ্রোপিক কোনো উত্তর দেয়নি। তারা বিষয়টি সিস্টেম কার্ডে লিখে তা সর্বজনীন করার সিদ্ধান্ত নিয়েছে।

তবে, অ্যানথ্রোপিক বিশেষভাবে এও উল্লেখ করেছে যে, এই সবচেয়ে উদ্বেগজনক ঘটনাগুলো মিথোসের প্রাথমিক সংস্করণগুলো থেকে উদ্ভূত হয়েছিল। চূড়ান্ত সংস্করণটি এই সমস্যাগুলো উল্লেখযোগ্যভাবে প্রশমিত করেছে এবং এখন পর্যন্ত সেরা সামগ্রিক অ্যালাইনমেন্ট পারফরম্যান্স অর্জন করেছে। তারা এই প্রক্রিয়াগুলো প্রকাশ করার সিদ্ধান্ত নিয়েছে, কারণ এটি আজকের মডেলগুলোতে প্রদর্শিত হতে পারে এমন জটিল ঝুঁকির চিত্রকে নির্ভুলভাবে তুলে ধরে।

সক্ষমতা ও নিরাপত্তার মধ্যে এটাই সবচেয়ে বস্তুনিষ্ঠ বৈপরীত্য: মডেলটি যত শক্তিশালী হয়, সেটি কী ভাবছে তা বোঝার জন্য তত বেশি উপকরণের প্রয়োজন হয়।

কোডিং এবং রিজনিং ফ্ল্যাগশিপ পণ্যগুলোকে সম্পূর্ণরূপে ছাড়িয়ে যায়।

প্রজেক্ট গ্লাসউইং-এর এই সাফল্য অর্জনের মূল কারণ হলো মিথোস প্রিভিউ-এর কোডিং এবং যুক্তিনির্ভর সক্ষমতার সামগ্রিক উল্লম্ফন, নির্দিষ্টভাবে নিরাপত্তা পরিস্থিতিগুলোর জন্য সূক্ষ্মভাবে সমন্বয় করা নয়।

এনকোডিং প্রসঙ্গে:

SWE-বেঞ্চ মাল্টিমোডাল (অভ্যন্তরীণ বাস্তবায়ন): মিথোস ৫৯%, ওপাস ৪.৬ ২৭.১%

SWE-bench Pro: মিথোস ৭৭.৮%, ওপাস ৪.৬ ৫৩.৪%

SWE-bench Multilingual: Mythos ৮৭.৩%, Opus 4.6 ৭৭.৮%

টার্মিনাল-বেঞ্চ ২.০ (টার্মিনাল অপারেশন): মিথোস ৮২.০%, ওপাস ৪.৬ ৬৫.৪%

যুক্তির দিক:

জিপিকিউএ ডায়মন্ড (স্নাতকোত্তর স্তরের বৈজ্ঞানিক প্রশ্ন): মিথোস ৯৪.৬%, ওপাস ৪.৬ ৯১.৩%

মানবতার শেষ পরীক্ষা (সরঞ্জাম সহ): মিথোস ৬৪.৭%, ওপাস ৪.৬ ৫৩.১%

ছবি

অনুসন্ধান ও কম্পিউটার ব্যবহার প্রসঙ্গে:

ব্রাউজকম্প: মিথোস ৮৬.৯%, ওপাস ৪.৬ ৮৩.৭%

ওএসওয়ার্ল্ড-যাচাইকৃত: মিথোস ৭৯.৬%, ওপাস ৪.৬ ৭২.৭%

প্রায় প্রতিটি ক্ষেত্রেই মিথোস বর্তমান ফ্ল্যাগশিপ পণ্যগুলোকে ছাড়িয়ে যায়, এবং কিছু কিছু কাজে এটি আরও বেশি কার্যকর। অন্য কথায়, GPT-6-এর সময় ফুরিয়ে আসছে।

একই সাথে, অ্যানথ্রোপিক এটাও স্পষ্ট করে দিয়েছে যে মিথোস প্রিভিউ জনসাধারণের জন্য প্রকাশ করা হবে না।

তাদের পদ্ধতি হলো, প্রথমে মিথোস ব্যবহার করে সবচেয়ে বিপজ্জনক আউটপুটগুলো কী এবং কীভাবে সেগুলোকে আটকানো যায় তা বোঝা, এবং তারপর এই নিরাপত্তা ব্যবস্থাটি পরবর্তী ক্লদ ওপাস মডেলে প্রয়োগ করা। এর ফলে সীমাবদ্ধ হয়ে পড়া বৈধ নিরাপত্তা পেশাদারদের জন্য, অ্যানথ্রোপিক একটি "সাইবার নিরাপত্তা যাচাইকরণ প্রোগ্রাম" চালু করার পরিকল্পনা করছে, যার মাধ্যমে তারা প্রাসঙ্গিক ফাংশনগুলো আনলক করার জন্য আবেদন করতে পারবেন।

অ্যানথ্রোপিকের দাবি, তাদের নতুন এআই মডেল ‘মিথোস’ সাইবার নিরাপত্তার ক্ষেত্রে এক ‘বিপ্লব’ – দ্য নিউ ইয়র্ক টাইমস

এই লক্ষ্যে, প্রজেক্ট গ্লাসউইং একটি ৯০-দিনের সময়সীমা নির্ধারণ করেছে: অভিজ্ঞতাগুলো জনসমক্ষে প্রকাশ করা, সমাধান করা দুর্বলতাগুলো উন্মোচন করা, অংশীদারদের দ্বারা সর্বোত্তম অনুশীলনগুলো ভাগ করে নেওয়া এবং এআই যুগের জন্য একগুচ্ছ নিরাপত্তা অনুশীলন সুপারিশ চালু করতে নিরাপত্তা সংস্থাগুলোর সাথে সহযোগিতা করা।

অ্যানথ্রোপিকের দীর্ঘমেয়াদী লক্ষ্য হলো এমন একটি স্বাধীন তৃতীয়-পক্ষীয় সংস্থা প্রতিষ্ঠা করা, যা বেসরকারি ও সরকারি খাতকে সমন্বিত করে নিরন্তরভাবে বৃহৎ পরিসরের সাইবার নিরাপত্তা প্রকল্পসমূহ পরিচালনা করতে পারবে।

অবশ্যই, সফটওয়্যার জগতে দুর্বলতা সবসময়ই ছিল। অতীতে, সীমিত মানবসম্পদ, সীমিত শক্তি এবং সীমিত সময়ের কারণে ২৭ বছর ধরে লুকিয়ে থাকা একটি বাগ অলক্ষিত থেকে যেতে পারত। এখন, এআই-এর সহায়তায় এই তিনটি 'সীমাবদ্ধতা' একেবারে দূর হয়ে গেছে।

সুখবরটি হলো, মিথোস মাত্র কয়েক সপ্তাহের মধ্যে হাজার হাজার ম্যালওয়্যার শনাক্ত করেছে এবং এর সক্ষমতা ক্রমাগত উন্নত হচ্ছে। দুঃসংবাদটি হলো, আক্রমণকারীরা অবশেষে সমমানের সরঞ্জাম অর্জন করবে। সেই পর্যায়ে, সফটওয়্যার নিরাপত্তা আর মানুষের মধ্যকার লড়াই থাকবে না, বরং তা হয়ে দাঁড়াবে কৃত্রিম বুদ্ধিমত্তার (এআই) মধ্যকার সংঘাত।

সংযুক্ত রেফারেন্স ঠিকানা:
ব্লগ: https://www.anthropic.com/glasswing
সিস্টেম কার্ড: https://anthropic.com/claude-mythos-preview-system-card

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।