DeepSeek, V3.1-এর সর্বশেষ সংস্করণটি বেশ কয়েকটি ডেভেলপার দ্বারা পরীক্ষা করা হয়েছে এবং সেখানে "极/極/extreme"-এর মতো টোকেন সন্নিবেশ করাতে দেখা গেছে যেখানে তাদের উপস্থিত হওয়া উচিত নয়।
`সময়.সেকেন্ড` হয়ে যায় `সময়।সেকেন্ড`, এবং সংস্করণ নম্বর `V1` হয়ে যায় `V`। আরও খারাপ, এই সমস্যাটি শুধুমাত্র তৃতীয় পক্ষের পরিমাণগত স্থাপনার ক্ষেত্রেই ঘটে না, তবে প্রকৃত এনকোডিং প্রক্রিয়াকে প্রভাবিত করে অফিসিয়াল পূর্ণ-নির্ভুলতা স্থাপনে পুনরুত্পাদন করে।
ওপেন সোর্স সম্প্রদায়ের ব্যবহারকারীরা একাধিক পুনরুত্পাদনযোগ্য পরিস্থিতি প্রদান করেছেন: Go-এর মতো ভাষা প্রজন্মে, মডেলটি শনাক্তকারীর সাথে টোকেনগুলিকে "স্টিক" করবে, "দ্বিতীয়" এর আগে এলোমেলোভাবে "极/極/এক্সট্রিম" সন্নিবেশ করাবে এবং এমনকি "top_k=1, তাপমাত্রা=1" সহ রক্ষণশীল ডিকোডিং এটি এড়াতে ব্যর্থ হবে।
কেউ কেউ প্রাথমিকভাবে সন্দেহ করেছিল যে এটি ক্রমাঙ্কন ডেটাসেটে খুব কম-বিট কোয়ান্টাইজেশন বা প্রান্তের প্রভাবের কারণে হয়েছিল, কিন্তু একই সমস্যাটি পরবর্তীতে FP8 পূর্ণ-নির্ভুল সংস্করণ ব্যবহার করে অন্যান্য ওয়েবসাইটগুলিতে প্রতিলিপি করা হয়েছিল, এটি নির্দেশ করে যে এটি কেবল একটি স্থাপনা-স্তরের সমস্যা ছিল না। উপসংহার: পূর্বে সফলভাবে কম্পাইল করা কোড হঠাৎ করে কম্পাইল করা বন্ধ করে দিয়েছে।
এটি প্রথমবার নয় যে ডিপসিক আপডেট হওয়ার পর থেকে বাগ দ্বারা জর্জরিত হয়েছে৷ শেষ সময় ছিল লেখার কাজ, যেখানে একটি ভাষার মিশ্রণ ঘটেছে। এবং কোডিং কাজগুলির সাথে, ওভারফিটিং এর একটি সন্দেহ আছে।
যাইহোক, এই সময়, "极" শব্দের উপস্থিতি শুধুমাত্র একটি সহজ "ভুল উত্তর" ছিল না; এটা আসলে একটি সিস্টেম ক্র্যাশ হতে পারে. এটি সিনট্যাক্স ট্রিকে প্রভাবিত করতে পারে বা প্রক্সি প্রক্রিয়াকে হিমায়িত করতে পারে, স্বয়ংক্রিয় কোডিং বা পরীক্ষার পাইপলাইনের উপর নির্ভরশীল দলগুলির জন্য উল্লেখযোগ্য সমস্যা তৈরি করে।
শুধু ডিপসিকই এই ভুগছেন না। জেমিনি সম্প্রতি একটি কোডিং দৃশ্যে "আত্ম-অস্বীকারের অসীম লুপে" পড়ার জন্য উন্মোচিত হয়েছিল, "আমি একটি লজ্জাজনক" লেখার একটি দীর্ঘ স্ট্রিং আউটপুট করার সময় ক্ষমা চেয়েছিলেন, যা উভয়ই হাস্যকর এবং বিব্রতকর ছিল৷
শিশুদের মনস্তাত্ত্বিক মানকে শক্তিশালী করতে হবে। ডিপসিক এতটা অভ্যন্তরীণভাবে গ্রাস করা হবে না এবং এআই বিশ্বে একটি ক্লাসিক ইমোটিকন প্যাকেজও অবদান রাখবে:
স্থিতিশীলতার সমস্যাগুলি সাধারণ
কেন এই পরিস্থিতি ঘটে তা ব্যাখ্যা করার জন্য আধিকারিক এখনও এগিয়ে আসেননি, তবে নির্মাতারও তদন্তের জন্য সময় লাগতে পারে।
জেমিনি কেসটি পরে লুপ বাগ হিসাবে চিহ্নিত করা হয়েছিল, যা সুরক্ষা স্তর, প্রান্তিককরণ স্তর এবং ডিকোডিং স্তরের মধ্যে মিথস্ক্রিয়ায় সমস্যা থেকে উদ্ভূত হয়েছিল। আপত্তিকর আউটপুট দমন করতে এবং হ্যালুসিনেশন কমাতে বিক্রেতারা সিস্টেম প্রম্পটে নিয়ম যুক্ত করার বা পোস্ট-প্রসেসিংয়ের কারণে এটি হতে পারে। যদি এই নিয়মগুলি কোডের দৃশ্যের সাথে সাংঘর্ষিক হয়, তাহলে তারা অস্বাভাবিক প্রতিস্থাপন, পুনরাবৃত্তি, বা অতিরিক্ত ক্ষমা চাওয়ার ট্রিগার করতে পারে, যা শেষ পর্যন্ত "আবেগজনিত মৃত লুপ" এর দিকে পরিচালিত করে।
গুগলের প্রোডাক্ট ম্যানেজার ব্যাখ্যা করতে এসেছেন যে বাগটি ঠিক করা হচ্ছে, এবং নেটিজেনরা রসিকতা শুরু করেছে: যদি এটি কাজ না করে, আপনার সন্তানকে একজন মনোবিজ্ঞানীর কাছে নিয়ে যান।
এবার ডিপসিকের ব্যর্থতা প্রাথমিকভাবে থার্ড-পার্টি প্ল্যাটফর্মে, যা ছিল সবচেয়ে গুরুতর সমস্যা। ঝিহু মন্তব্যকারী প্যান্ডোরা এটি পরীক্ষা করে দেখেছে যে অফিসিয়াল এপিআই অনেক ভালো পারফর্ম করেছে। এর মানে আরও সমস্যা সমাধানের কাজ করা দরকার।
এটি ডিকোডিং সম্ভাব্যতা বন্টনের পরিবর্তনের কারণেও হতে পারে। মডেলটি পাঠ্যটিকে টোকেনে কাটে এবং তারপরে সেগুলিকে আবার একসাথে টুকরো টুকরো করে। যদি ডিকোডিং সম্ভাব্যতা বন্টন সামান্য স্থানান্তরিত হয়, একটি উচ্চ-ফ্রিকোয়েন্সি টোকেন সনাক্তকারীতে সন্নিবেশ করা যেতে পারে।
মূলত, মডেলটি যান্ত্রিকভাবে এবং সম্ভাব্যতামূলকভাবে পাঠ্যটিকে "একসাথে টুকরো টুকরো" করে, এর অর্থ বোঝার পরিবর্তে। যখন শব্দ বিভাজন ফলাফলগুলি সাবঅপ্টিমাল হয় বা ডিকোডিং প্রক্রিয়াতে ছোটখাটো ঝামেলা থাকে, তখন ডেটার এই সম্ভাব্য অংশগুলি বিভ্রান্ত হতে পারে, একটি অপ্রাসঙ্গিক, উচ্চ-ফ্রিকোয়েন্সি শব্দের সাথে চূড়ান্ত আউটপুটকে দূষিত করে।
বড় মডেলের স্থায়িত্ব সবসময় একটি সমস্যা হয়েছে. এই বছরের শুরুতে, ওপেনএআই সম্প্রদায় অস্বাভাবিক মেমরি সিস্টেম সম্পর্কে ব্যাপক প্রতিক্রিয়া পেয়েছে, যার ফলে ব্যবহারকারীর ঐতিহাসিক প্রেক্ষাপট হারিয়ে গেছে।
জেমিনীর পোর্ট্রেট জেনারেশন ফাংশন একবার "বৈচিত্র্য" অর্জনের জন্য শৈলীর সাথে মেলে না এমন শৈলীতে খুব নির্দিষ্ট ঐতিহাসিক চিত্র তৈরি করেছিল এবং অবশেষে এটি সাময়িকভাবে অফলাইন হতে বাধ্য হয়েছিল।
অন্যান্য বাগগুলি ছোটখাটো রক্ষণাবেক্ষণের সাথে সম্পর্কিত হতে পারে যা সর্বদা ঘটে। মডেল প্রদানকারীরা প্রায়ই "হট ফিক্স" সম্পাদন করে: সিস্টেম প্রম্পট পরিবর্তন করা, সূক্ষ্ম-টিউনিং তাপমাত্রা, টোকেনাইজার আপডেট করা, টুল কল প্রোটোকলগুলিতে ছোটখাটো পরিবর্তন করা ইত্যাদি।
যাইহোক, একবার শৃঙ্খল দীর্ঘ হয়ে গেলে, এমনকি আপাতদৃষ্টিতে নিরীহ গ্রেস্কেল অপারেশনগুলি দীর্ঘস্থায়ী ভারসাম্যকে ব্যাহত করতে পারে। ফাংশন স্বাক্ষর, JSON কঠোরতা এবং টুল রিটার্ন ফরম্যাটের মতো ছোটখাটো সমস্যার কারণে গতকালের স্থিতিশীল প্রক্সি চেইন আজ ভেঙে যেতে পারে। বিষয়গুলিকে জটিল করার জন্য, বিক্রেতারা সর্বদা এই গ্রেস্কেল বিশদগুলি একই সাথে প্রকাশ করে না, প্রকৌশলীদের শুধুমাত্র ঘটনা-পরবর্তী অনুমান এবং তুলনা দিয়ে রেখে যায়।
একই সময়ে, টুলচেইনের সাথে সংহত এজেন্টের ক্রমবর্ধমান সংখ্যাও ভঙ্গুর। স্বয়ংক্রিয় গবেষণা বা কোড লেখার উপর দৃষ্টি নিবদ্ধ মাল্টি-এজেন্ট সিস্টেমগুলি প্রায়শই বড় মডেলে ব্যর্থ হয় না, তবে "টুল ইনভোকেশন – স্টেট ক্লিনআপ – পুনঃপ্রচার কৌশল" চেইনে: টাইমআউটগুলি অবিশ্বস্ত হয়, এবং ব্যর্থতার পরে প্রসঙ্গ পুনরুদ্ধার করা যায় না।
আমরা যত বেশি নিয়মের সাথে AI ছাঁটাই এবং নিয়ন্ত্রণ করার চেষ্টা করি, অপ্রত্যাশিত জায়গা থেকে এবং আরও অযৌক্তিক উপায়ে উদ্ভট শাখা জন্মানোর সম্ভাবনা তত বেশি।
AI কে "কাজ করতে সক্ষম" থেকে "বিশ্বস্ত" করার চাবিকাঠি কী?
আমরা প্রায়শই পারফরম্যান্সকে উচ্চ নির্ভুলতা, শক্তিশালী যুক্তি ক্ষমতা বা অত্যাধুনিক মডেল হিসাবে ভাবি। যাইহোক, ডিপসিক বাগ এবং জেমিনি লুপের ঘটনা আমাদের মনে করিয়ে দেয় যে ইঞ্জিনিয়ারিং স্থিতিশীলতাকে উপেক্ষা করা উচিত নয়। এটি এমন এক ধরনের নিশ্চিততা যা আমাদের ভবিষ্যদ্বাণী করতে এবং ত্রুটি ঘটলেও নিয়ন্ত্রণ করতে দেয়।
#iFaner: iFaner (WeChat ID: ifanr) এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম, যেখানে যত তাড়াতাড়ি সম্ভব আপনার কাছে আরও উত্তেজনাপূর্ণ সামগ্রী উপস্থাপন করা হবে।