“পাতন” বিতর্ক যা অ্যানথ্রোপিককে পঙ্গু করে দিয়েছিল, তার জবাবে একজন শীর্ষস্থানীয় মার্কিন এআই বিশেষজ্ঞের একটি গুরুতর মন্তব্য এসেছে: চীনের এআই সাফল্য শর্টকাটের উপর নির্ভর করবে না।

গতকাল, অ্যানথ্রপিক তিনটি চীনা এআই ল্যাব – ডিপসিক, ডার্ক সাইড অফ দ্য মুন এবং মিনিম্যাক্স – কে ক্লড মডেল "ডিস্টিলিং" করার জন্য অভিযুক্ত করেছে, যা অনলাইনে ব্যাপক আলোড়ন সৃষ্টি করেছে।

এই ঘটনা সম্পর্কে, RLHF (মানব প্রতিক্রিয়ার উপর ভিত্তি করে শক্তিবৃদ্ধি শিক্ষা) ক্ষেত্রের অন্যতম বিখ্যাত গবেষক এবং "RLHF" বইয়ের লেখক নাথান ল্যাম্বার্ট উল্লেখ করেছেন যে বিষয়টি মানুষ যতটা কল্পনা করে ততটা গুরুতর নয়, তবে এটি যতটা সহজ মনে হয় ততটা সহজও নয়।

তিনি বিশ্বাস করেন যে চীনা এআই কোম্পানিগুলির চমৎকার অবকাঠামো রয়েছে, তারা অনেক উদ্ভাবন করেছে এবং বিভিন্ন প্রযুক্তিগত চ্যালেঞ্জ মোকাবেলা করছে, কিন্তু তারা "শর্টকাট পদ্ধতি অবলম্বন করে" এই ফলাফল অর্জন করতে পারেনি।

পাতন নিয়ে আলোচনা করার আগে, দেখা যাক কেন ল্যাম্বার্টের কথাগুলো শোনার যোগ্য।

নাথান ল্যাম্বার্ট অ্যালেন ইনস্টিটিউট ফর এআই রিসার্চের একজন বিজ্ঞানী। তিনি বার্কলেতে অবস্থিত ক্যালিফোর্নিয়া বিশ্ববিদ্যালয় থেকে পিএইচডি ডিগ্রি অর্জন করেন, যেখানে তিনি রোবোটিক্সের একজন বিখ্যাত পণ্ডিত পিটার অ্যাবেলের অধীনে পড়াশোনা করেন। যদিও তিনি আরএলএইচএফ প্রযুক্তির উদ্ভাবক নন, তার ওপেন-সোর্স বই, *আরএলএইচএফ*, এখন বৃহৎ মডেলগুলির প্রশিক্ষণ প্রক্রিয়া বোঝার জন্য এআই অনুশীলনকারীদের জন্য একটি আদর্শ রেফারেন্স উপকরণ।

সর্বত্র বিদ্যমান AI প্রভাবশালীদের থেকে ভিন্ন, তিনি এমন একজন যিনি আসলে বড় মডেলদের প্রশিক্ষণ দিয়েছেন।

অ্যানথ্রপিকের ব্লগ পোস্ট প্রকাশিত হওয়ার দিনই, ল্যাম্বার্ট "চীনের বৃহৎ মডেলের জন্য পাতন কতটা গুরুত্বপূর্ণ?" শিরোনামে একটি বিশদ বিশ্লেষণমূলক নিবন্ধ প্রকাশ করেন। তার মূল যুক্তিগুলি মূলধারার মিডিয়ার ব্যাখ্যা থেকে উল্লেখযোগ্যভাবে ভিন্ন ছিল এবং গড় ইন্টারনেট ব্যবহারকারীর তুলনায় আরও অন্তর্দৃষ্টিপূর্ণ এবং ব্যাপক ছিল।

পাতন কী এবং অ্যানথ্রোপিক কী বলেছে?

প্রথমে, অ্যানথ্রপিকের অভিযোগের মূল বিষয়টি দেখা যাক: "পাতন"।

এটি একটি দুর্বল মডেলকে একটি শক্তিশালী মডেলের আউটপুট থেকে শিখতে সক্ষম করার কথা বোঝায়, যার ফলে দ্রুত একই রকম ক্ষমতা অর্জন করা যায়।

অ্যানথ্রপিক অভিযোগ করেছে যে তিনটি কোম্পানি তাদের নিজ নিজ মডেলদের প্রশিক্ষণ দেওয়ার জন্য পরিষেবার শর্তাবলী এবং আঞ্চলিক অ্যাক্সেস বিধিনিষেধ লঙ্ঘন করে ক্লডের সাথে ১ কোটি ৬০ লক্ষেরও বেশি কথোপকথন তৈরি করতে প্রায় ২৪,০০০ জাল অ্যাকাউন্ট ব্যবহার করেছে।

ব্লগটিতে একটি নিরাপত্তা সতর্কতাও অন্তর্ভুক্ত ছিল: অবৈধভাবে পাতন করা মডেলগুলিতে মূল মডেলের সুরক্ষা সুরক্ষার অভাব থাকতে পারে এবং সাইবার আক্রমণ, জৈবিক অস্ত্র উন্নয়ন বা বৃহৎ আকারের নজরদারির জন্য ব্যবহার করা হলে পরিণতি অপ্রত্যাশিত।

অ্যানথ্রপিক এই অবকাঠামোটিকে "হাইড্রা ক্লাস্টার" বলে ডাকে – হাজার হাজার অ্যাকাউন্টের একটি বিতরণকৃত নেটওয়ার্ক, যেখানে ট্র্যাফিক একই সাথে অ্যানথ্রপিকের নিজস্ব API এবং একাধিক তৃতীয়-পক্ষের API সমষ্টি প্ল্যাটফর্ম জুড়ে বিতরণ করা হয়।

সবচেয়ে চরম ক্ষেত্রে, একটি প্রক্সি নেটওয়ার্ক একই সাথে ২০,০০০ এরও বেশি জাল অ্যাকাউন্ট পরিচালনা করে, সনাক্তকরণ অ্যালগরিদমকে ফাঁকি দেওয়ার জন্য নিয়মিত ব্যবহারকারীর অনুরোধ স্ট্রিমগুলিতে ডিস্টিল্ড ট্র্যাফিক মিশ্রিত করে। এই জাতীয় নেটওয়ার্কগুলির ব্যর্থতার কোনও একক বিন্দু নেই; যদি একটি অ্যাকাউন্ট ব্লক করা হয়, তবে অন্যটি তাৎক্ষণিকভাবে প্রতিস্থাপন করা হয়।

বিদেশী মিডিয়া দ্রুত অ্যানথ্রপিকের বাগাড়ম্বরপূর্ণ বক্তব্যের পুনরাবৃত্তি করে। যাইহোক, এই বর্ণনামূলক যুক্তি শীঘ্রই উল্টো হয়ে যায়: সর্বোপরি, "পাতন" এমন একটি জিনিস যা আমেরিকান এআই কোম্পানিগুলিও প্রশিক্ষণের সময় করে, এবং অ্যানথ্রপিক নিজেই একই ধরণের অনুশীলনে জড়িত।

এবং: মানবজাতির বৃহত্তম জ্ঞানভাণ্ডারকে "পাতিত" করেছে নৃতাত্ত্বিক।

কিন্তু ল্যাম্বার্ট আরও বেশি সরল ছিলেন, বিশ্বাস করতেন যে এই তিনটি চীনা এআই ল্যাব প্রথমে আলাদাভাবে পরীক্ষা করা উচিত।

ল্যাম্বার্ট উল্লেখ করেছেন যে একই ব্লগ পোস্টে অ্যানথ্রপিকের তিনটি কোম্পানির সংমিশ্রণ একটি গুরুত্বপূর্ণ পার্থক্যকে অস্পষ্ট করে: তারা মোটেও একই কাজ করছে না, তাদের স্কেল সম্পূর্ণ ভিন্ন এবং তাদের প্রেরণাও ভিন্ন।

অ্যানথ্রপিকের অভিযোগ অনুসারে, ডিপসিক সবচেয়ে কম পাতন করে, মাত্র ১৫০,০০০, কিন্তু এর পদ্ধতিগুলি আরও সুনির্দিষ্ট। সরাসরি উত্তর সংগ্রহের পরিবর্তে, অ্যানথ্রপিক অভিযোগ করে যে ডিপসিক চিন্তার শৃঙ্খল প্রশিক্ষণের তথ্য ব্যাপকভাবে উৎপাদন করছে।

"আপনি কোন সিদ্ধান্তে পৌঁছেছেন" তা গুরুত্বপূর্ণ নয়, বরং সেই সিদ্ধান্তে পৌঁছানোর প্রক্রিয়াটি গুরুত্বপূর্ণ।

কিন্তু ১৫০,০০০ বার কী ধরণের স্কেল? ল্যাম্বার্ট বিশ্বাস করেন যে এই পরিমাণ তথ্য ডিপসিকের গুজবযুক্ত V4 মডেল বা যেকোনো মডেলের সামগ্রিক প্রশিক্ষণের উপর নগণ্য প্রভাব ফেলে। "এটি অনেকটা একটি ছোট দল যা একটি অভ্যন্তরীণ পরীক্ষা পরিচালনা করছে, এবং সম্ভবত প্রশিক্ষণের দায়িত্বে থাকা ব্যক্তিও এটি সম্পর্কে জানেন না।"

মুনলাইটের ডার্কনেসের স্কেল "নগণ্য" নয়: ৩.৪ মিলিয়ন ইন্টারঅ্যাকশন, এজেন্ট রিজনিং, টুল কল, কোড এবং ডেটা বিশ্লেষণ, কম্পিউটার-ব্যবহারের উন্নয়ন এবং কম্পিউটার ভিশনের মতো ক্ষেত্রগুলিকে লক্ষ্য করে – যার বেশিরভাগই সম্প্রতি এন্টারপ্রাইজ গ্রাহকদের মধ্যে ক্লডের সবচেয়ে জনপ্রিয় ক্ষমতা সমন্বয়।

অ্যানথ্রপিক উল্লেখ করেছে যে তিনটির মধ্যে মিনিম্যাক্সের ট্র্যাফিক সবচেয়ে বেশি, প্রায় ১৩ মিলিয়ন ভিজিট, এবং এর লক্ষ্য দর্শক হল প্রক্সি কোডিং, টুল কল এবং জটিল টাস্ক অর্কেস্ট্রেশন।

মুনলাইট এবং মিনিম্যাক্সের মোট পরিমাণ প্রায় ১.৬৫ কোটি বার। প্রতি কথোপকথনের গড় টোকেনের পরিমাণের উপর ভিত্তি করে, মোট পরিমাণ ১৫০ বিলিয়ন থেকে ৪০০ বিলিয়ন টোকেনের মধ্যে অনুমান করা হয়, যা কয়েকশ থেকে দশ মিলিয়ন মার্কিন ডলারের টোকেন খরচে অনুবাদ করে।

তবে সমস্যা হল, শুধুমাত্র পাতন প্রক্রিয়ার উপর মনোযোগ দেওয়া সমস্যাযুক্ত।

পাতন প্রক্রিয়ার সর্বোচ্চ সীমা কোথায়?

ল্যাম্বার্ট আসলে এটাই বলতে চেয়েছিলেন, এবং এটি পুরো বিষয়টির সবচেয়ে উপেক্ষিত অংশও।

একটি শক্তিশালী মডেলের আউটপুট একটি দুর্বল মডেলকে সরবরাহ করা, দুর্বল মডেলটি দ্রুত একই ধরণের ক্ষমতা অর্জন করতে সক্ষম করে—এই যুক্তিটি নিজেই সত্য, এবং ল্যাম্বার্ট এটি অস্বীকার করেন না। যাইহোক, তিনি এমন একটি সমস্যা তুলে ধরেন যা কেউ স্পষ্টভাবে সংজ্ঞায়িত করেনি: পাতন ক্ষমতার সর্বোচ্চ সীমা আপনি যে ধরণের ক্ষমতা চান তার উপর নির্ভর করে।

RLHF-এর একজন বিশেষজ্ঞ হিসেবে, ল্যাম্বার্ট বিশ্বাস করেন যে বর্তমান অত্যাধুনিক মডেল প্রশিক্ষণ মূলত রিইনফোর্সমেন্ট লার্নিং (RL) এর উপর নির্ভর করে। তবে, RL এবং ডিস্টিলেশন মৌলিকভাবে ভিন্ন জিনিস:

পাতন হলো অনুকরণ, একটি শক্তিশালী মডেলের আউটপুট শেখা এবং এর "উত্তর আকৃতি" অনুলিপি করা; আরএল হলো অন্বেষণ, যেখানে মডেলকে নিজেরাই ব্যাপকভাবে যুক্তি করতে হবে, নিজস্ব ডেটা তৈরি করতে হবে, ত্রুটির মাধ্যমে বারবার পুনরাবৃত্তি করতে হবে এবং পরীক্ষা-নিরীক্ষার মাধ্যমে তার ক্ষমতা পরিমার্জন করতে হবে।

অন্য কথায়, একটি সত্যিকারের শক্তিশালী মডেলের কখনই কেবল সঠিক উত্তরের প্রয়োজন হয় না, বরং প্রায়শই সমাধানের পথ নিজেই বের করতে হয়। এটি এমন কিছু যা অন্য লোকের API-এর আউটপুট ডিস্টিল করে পাওয়া যায় না।

ডিপসিকের নিজস্ব পাতন প্রচেষ্টার উদাহরণ নিন: ছোট মডেল ডিপসিক-আর১-ডিস্টিল-কিউয়েন ১.৫বি, যা প্রতিবেশী কিয়ানওয়েনের উপর ভিত্তি করে নিজস্ব R1 মডেল পাতন করে প্রাপ্ত হয়েছিল, মাত্র ৭,০০০ নমুনা এবং অত্যন্ত কম গণনা খরচের সাথে AIME24 গণিত প্রতিযোগিতার বেঞ্চমার্কে ওপেনএআই-এর o1-প্রিভিউকে ছাড়িয়ে গেছে।

কিন্তু মূল বিষয় হল এই উন্নতি মূলত পাতন প্রক্রিয়ার উপর নির্ভর করে না, বরং শক্তিবৃদ্ধি শিক্ষার ফলাফলের উপর নির্ভর করে।

অন্য কথায়, পাতন আপনাকে দ্রুত "উষ্ণ" হতে সাহায্য করতে পারে, কিন্তু সত্যিকার অর্থে শীর্ষ স্তরে পৌঁছানোর জন্য, আপনাকে এখনও RL চালানোর উপর নির্ভর করতে হবে।

বিভিন্ন মডেলের মধ্যে ডেটা বিতরণের পার্থক্য

ল্যামবার্ট এমন একটি প্রযুক্তিগত সমস্যাও তুলে ধরেন যা বাইরের লোকেরা খুব কমই উল্লেখ করে: বিভিন্ন মডেলের মধ্যে ডেটা বিতরণে সূক্ষ্ম পার্থক্য বিদ্যমান।

ক্লডের আউটপুট সরাসরি অন্য কোনও আর্কিটেকচারের মডেলে ফিড করা অগত্যা কার্যকর নয় এবং কখনও কখনও হস্তক্ষেপও করতে পারে। দুটি মডেলের অভ্যন্তরীণ উপস্থাপনা স্থানের পার্থক্য "শিক্ষকের" উত্তরের কারণে "ছাত্রের" প্রতিক্রিয়ায় অপ্রত্যাশিত পক্ষপাত দেখা দিতে পারে।

এর মানে হল যে পাতন কখনই এমন কিছু নয় যা "যেমন আছে তেমন ব্যবহার করা যায়", বরং সত্যিকার অর্থে কার্যকর হওয়ার জন্য প্রচুর প্রকৌশলগত কাজের প্রয়োজন। এটি নিজেই একটি গবেষণার বিষয়।

এই কারণেই ল্যাম্বার্ট অ্যানথ্রপিকের কথিত "পাতন" কে একটি উদ্ভাবনী পদ্ধতি হিসেবে দেখেন, যা এই গবেষণার বিষয়টি মোকাবেলার একটি প্রচেষ্টা হিসেবে বোঝা যেতে পারে।

অ্যানথ্রপিকের হত্যাকারী বৈশিষ্ট্যটিই ঠিক যা পাতন করা সবচেয়ে কঠিন।

অ্যানথ্রপিক যে তিনটি কোম্পানির নামকরণ করেছে, সেগুলোর সবগুলোই একই ক্ষেত্রের উপর দৃষ্টি নিবদ্ধ করেছে: এজেন্সি আচরণ, যার মধ্যে রয়েছে AI-এর স্বায়ত্তশাসিতভাবে পরিকল্পনা করার, সরঞ্জাম ব্যবহার করার এবং ধাপে ধাপে কার্যকর করার জন্য জটিল কাজগুলি ভেঙে ফেলার ক্ষমতা।

এটি বর্তমানে ক্লডের সবচেয়ে বিশিষ্ট দিকনির্দেশনা, এবং এটি এমন একটি ক্ষমতা যা অ্যানথ্রোপিক কমপক্ষে অনুলিপি করতে চায়।

কিন্তু ল্যাম্বার্টের রায় ছিল যে পাতন প্রক্রিয়ার মাধ্যমে এই ক্ষমতাগুলি অর্জন করা সবচেয়ে কঠিন ছিল।

আগেই উল্লেখ করা হয়েছে, একজন শক্তিশালী এআই এজেন্টের শক্তি সঠিক উত্তর জানা বা প্রশিক্ষিত হওয়ার মধ্যে নিহিত নয়, বরং "অদৃশ্য পরিস্থিতির মুখোমুখি হলে স্বায়ত্তশাসিতভাবে সমাধান অন্বেষণ করতে সক্ষম হওয়া" এর মধ্যে নিহিত, যা 0-শট বা কয়েক-শট ক্ষমতা সহ অত্যাধুনিক (SOTA) ফলাফল অর্জনের ক্ষমতা হিসাবে বোঝা যেতে পারে।

এই প্রক্রিয়ায় উৎপন্ন মূল্য যুক্তির গতিপথে প্রতিফলিত হয়, যা পাতনের মাধ্যমে শেখা কঠিন – অন্তত আপাতত।

ডিপসিক-আর১-ডিস্টিল (পাতন মডেল) এবং ডিপসিক-আর১ (পাতন বস্তু) এর মধ্যে ব্যবধান হল ল্যাম্বার্টের যুক্তির সবচেয়ে প্রত্যক্ষ উদাহরণ।

প্রথমটি ফরম্যাটেড গাণিতিক যুক্তির কাজগুলিতে ভালোভাবে কাজ করে; তবে, জটিল প্রক্সি কাজগুলিতে যার জন্য স্বায়ত্তশাসিত অন্বেষণ এবং গতিশীল প্রোগ্রামিং প্রয়োজন, উভয়ের মধ্যে ব্যবধান বাস্তব।

অ্যানথ্রোপিক এখন কেন কথা বলছে?

ল্যাম্বার্ট এমন একটি রায় দিয়েছেন যা অনেকেই ভাগ করে নিতে পারেন: অ্যানথ্রপিকের এবার চীনা এআই কোম্পানিগুলির প্রকাশ্যে নামকরণ মূলত "প্রযুক্তিগত প্রতিরক্ষা" দ্বারা অনুপ্রাণিত ছিল না।

অ্যানথ্রপিক এই ব্লগ পোস্টটি প্রকাশ করার মাত্র কয়েকদিন আগে, মার্কিন প্রতিরক্ষা বিভাগ অ্যানথ্রপিককে "সীমাবদ্ধ অ্যাক্সেস" প্রদান করে সহযোগিতা করার হুমকি দিয়েছিল, অন্যথায় এটিকে "সরবরাহ শৃঙ্খলের ঝুঁকি" হিসাবে চিহ্নিত করার মতো প্রতিকূল ব্যবস্থার মুখোমুখি হবে, যার অর্থ এটি প্রতিরক্ষা/সরকারি সরবরাহকারীদের তালিকা থেকে বাদ দেওয়া হবে।

অ্যানথ্রপিক এখন এক দ্বিধাগ্রস্ত অবস্থায় আছে: তারা তাদের নিরাপদ, মানবিক মডেল অবস্থান এবং কর্পোরেট ভাবমূর্তি বজায় রাখতে চায়, কিন্তু তারা মার্কিন সরকারের কাছ থেকে একটি বড় চুক্তিও হাতছাড়া করতে চায় না।

ল্যাম্বার্ট একটি মৌলিক দ্বন্দ্ব তুলে ধরেছেন: আমেরিকান একাডেমিয়া এবং ওপেন-সোর্স মডেল ডেভেলপাররাও পাতন প্রক্রিয়ায় জড়িত, তবুও অ্যানথ্রপিক সহ বড় কোম্পানিগুলি তাদের বিরুদ্ধে কোনও উল্লেখযোগ্য পদক্ষেপ নেয়নি। অন্য পক্ষটি একটি চীনা কোম্পানি বলে এটি বলা অতিরঞ্জিত ভূ-রাজনৈতিক বলে মনে হয়।

ফলস্বরূপ, অ্যানথ্রপিকের ব্লগ পোস্টটি কোনও বড় প্রযুক্তিগত ঝুঁকির ঘটনার প্রতিবেদনের চেয়ে বরং "আনুগত্যের অঙ্গীকার" এর মতো ছিল।

দ্বৈত মান

এই বিষয়ে অ্যানথ্রপিকের অবস্থানের একটি অনিবার্য পটভূমি রয়েছে।

গতকালের APPSO-র প্রবন্ধে যেমন উল্লেখ করা হয়েছে: অ্যানথ্রোপিক মানব ইতিহাসের বৃহত্তম জ্ঞানভাণ্ডারকে "পাতিত" করেছে।

২০২৪ সালের গোড়ার দিকে, মার্কিন যুক্তরাষ্ট্রের একটি গুদামে, শ্রমিকরা নতুন বই মেশিনে ঢোকাত, তাদের কাঁটা কেটে ফেলত, স্ক্যান করত এবং তারপর কাগজটি পুনর্ব্যবহারের জন্য পাঠাত। এই কাজটি অ্যানথ্রপিক দ্বারা নির্দেশিত হয়েছিল, যার অভ্যন্তরীণ কোডনাম ছিল "পানামা", যার লক্ষ্য ছিল বিশ্বের সমস্ত বই ধ্বংসাত্মকভাবে স্ক্যান করা – অ্যানথ্রপিক চায়নি যে বাইরের বিশ্ব জানুক যে তারা এটি করেছে।

২০২১ সালে, অ্যানথ্রপিকের সহ-প্রতিষ্ঠাতা বেন মান পাইরেসি ওয়েবসাইট লিবজেন থেকে ১১ দিনের মধ্যে প্রচুর পরিমাণে লঙ্ঘনকারী বই ডাউনলোড করেন; পরের বছর, আরেকটি ওয়েবসাইট, পাইরেট লাইব্রেরি মিরর, যা প্রকাশ্যে "বেশিরভাগ দেশে ইচ্ছাকৃতভাবে কপিরাইট আইন লঙ্ঘন করে" বলে দাবি করে, লাইভে আসে। মান তার একজন সহকর্মীকে লিঙ্কটি পাঠিয়ে মন্তব্য করেন, "নিখুঁত সময়!!!"

পরবর্তী বইয়ের কপিরাইট মামলায়, অ্যানথ্রপিককে ১.৫ বিলিয়ন ডলারের সমঝোতা দিতে বাধ্য করা হয়েছিল, যা প্রতি বইয়ের জন্য প্রায় ৩,০০০ ডলার।

স্ট্যানফোর্ড এবং ইয়েলের গবেষকরা দেখেছেন যে ক্লড ৩.৭ সনেট হ্যারি পটারের মতো কপিরাইটযুক্ত কাজগুলি নির্দিষ্ট পরিস্থিতিতে প্রায় শব্দের বিনিময়ে ৯৫.৮% নির্ভুলতার সাথে প্রকাশ করতে পারে। এটি কেবল অ্যানথ্রপিকের দীর্ঘস্থায়ী দাবির বিরোধিতা করে না যে "মডেলটি কেবল ভাষার নিয়ম শিখে", বরং কোম্পানির "পাতন" এর অভিযোগকে ভিত্তিহীন বলে মনে করে।

ফিউচারিজমের শিরোনামটি সোজা: "ডিপসিকের কৃত্রিম বুদ্ধিমত্তার অননুমোদিত অনুলিপির উপর নৃতাত্ত্বিক ক্ষোভ প্রকাশ করেছে – এটি ক্লডকে কীভাবে তৈরি করেছিল তা বিবেচনা করে বেশ বিদ্রূপাত্মক।"

এক্স সম্পর্কে তার মন্তব্যের মাধ্যমে মাস্ক আগুনে ঘি ঢাললেন: "অ্যানথ্রোপিক ব্যাপকভাবে প্রশিক্ষণের তথ্য চুরি করেছে এবং বিলিয়ন বিলিয়ন ডলারের বন্দোবস্ত দিয়েছে। এটাই বাস্তবতা।"

পাল্টা যুক্তির আরও তীক্ষ্ণ দিক রয়েছে: অ্যানথ্রপিক কোনও ব্যবহারের ফি ছাড়াই সেই বইগুলি থেকে যা সংগ্রহ করেছিল তা নিয়েছিল এবং তারপরে বাণিজ্যিক উদ্দেশ্যে ব্যবহার করেছিল (ক্লড এবং অ্যানথ্রপিক এপিআই উভয়ই অর্থপ্রদানের পরিষেবা); অন্যদিকে ব্যবসায়িক দৃষ্টিকোণ থেকে, যে কোম্পানি ক্লডকে ডিস্টিল করেছিল তারা কমপক্ষে এর জন্য অর্থ প্রদান করেছিল…

অবশ্যই, আইনি দৃষ্টিকোণ থেকে, এই দুটি বিষয় প্রকৃতিতে সম্পূর্ণ ভিন্ন। কিন্তু যাই হোক না কেন, অ্যানথ্রোপিক এখনও একটি ভণ্ড দ্বৈত মান বলে মনে হয়।

"পাতন-পরবর্তী যুগ"

পরিশেষে, আমি আবার জোর দিই: পাতন কার্যকর, কিন্তু আপনি যতটা কল্পনা করতে পারেন ততটা কার্যকর নয়।

ডিপসিকের ১৫০,০০০ স্ক্যান কোনও যুক্তিসঙ্গত মানদণ্ডের তুলনায় নগণ্য। মুনশট এবং মিনিম্যাক্সের মিলিত সংখ্যা ১৬.৫ মিলিয়ন, যা স্কেলের দিক থেকে ভিন্ন বিষয় – তবে তারা কতটা বাস্তব সক্ষমতা অর্জন করতে পারে তা নির্ভর করে তারা "এই ডেটার সদ্ব্যবহার কীভাবে করা যায়" এর প্রযুক্তিগত সমস্যাটি সমাধান করতে পারে কিনা তার উপর।

ডেটা বিতরণ, মডেল আর্কিটেকচারের পার্থক্য এবং এজেন্টের ক্ষমতা অর্জন শক্তিবৃদ্ধি শেখার উপর ব্যাপকভাবে নির্ভরশীল এই সত্যের কারণে, পাতন কখনই "শুধু এটি গ্রহণ করুন এবং ব্যবহার করুন" এর মতো সহজ নয়।

ল্যাম্বার্ট তবুও অ্যানথ্রপিককে কিছুটা মুখ্য করে তুলেছিলেন: "উচ্চ-মানের ডেটার সাথে দ্রুত পুনরাবৃত্তি অনেক দূর যেতে পারে, এবং ছাত্র মডেলের পক্ষে শিক্ষকদের ছাড়িয়ে যাওয়া অসম্ভব নয়।"

তবে, তিনি স্পষ্টভাবে উল্লেখ করেছেন যে প্রকৃত উদ্ভাবন নির্ভর করে শক্তিবৃদ্ধি শেখার উপর, পাতন নয়। ডিপসিক, মুনলাইট এবং মিনিম্যাক্সের প্রকাশিত গবেষণাপত্রগুলি থেকে বিচার করলে দেখা যায় যে, তাদের সকলেরই মোটামুটি সম্পূর্ণ অবকাঠামো এবং চমৎকার প্রতিভা রয়েছে, "ছোট কর্মশালা" নয় যা চতুর কৌশলের উপর নির্ভর করে অন্যদের ছাড়িয়ে যাওয়ার চেষ্টা করে।

পাতন আপনাকে দ্রুত শুরু করতে সাহায্য করতে পারে, কিন্তু শীর্ষ স্তরে পৌঁছানোর জন্য কখনই কোনও শর্টকাট নেই।

এক অর্থে, অ্যানথ্রপিক কর্তৃক উত্থাপিত "পাতন" বিতর্ক নিজেই এই কৃত্রিম বুদ্ধিমত্তা যুগের একটি ক্ষুদ্র জগৎ।

পুরো শিল্পটি শুরু থেকেই অস্পষ্ট নিয়মের উপর নির্মিত হয়েছিল: মানুষের লেখা জিনিসগুলি নিয়ে প্রশিক্ষণ নেওয়া, অন্যদের ওপেন সোর্স ফলাফলের সাথে পুনরাবৃত্তি করা এবং এমন জায়গায় দ্রুত কাজ করা যেখানে আইন স্পষ্টভাবে এটি নিষিদ্ধ করে না।

এখন, নিয়মগুলি আরও কঠোর হতে শুরু করেছে—প্রথমে কপিরাইট, তারপর চিপস, এবং এখন API… নিয়মগুলি কে তৈরি করছে? এগুলো থেকে কে লাভবান হচ্ছে? কে মানুষ বলে দাবি করে ব্যক্তিগত লাভের জন্য নিয়মগুলির অপব্যবহার করছে?

এই প্রশ্নগুলির উত্তর ক্রমশ স্পষ্ট হয়ে উঠছে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো