GPT-4o এবং Gemini 1.5 Pro সবেমাত্র AI রেসে পরাজিত হয়েছে

একটি 8-বিট কাঁকড়া সহ claude 3.5 সনেটের একটি স্ক্রিনশট
নৃতাত্ত্বিক

প্রযুক্তিগতভাবে, এআই সহকারী আধিপত্যের দৌড়ে একজন নতুন নেতা রয়েছে এবং এটি অ্যানথ্রপিকের নতুন ক্লড 3.5 সনেট। নতুন প্রকাশিত মডেলটি জেমিনি 1.5 প্রো এবং ChatGPT-4o উভয়কেই বেঞ্চমার্ক পরীক্ষার স্পেকট্রাম জুড়ে ছাড়িয়েছে, কোম্পানি বৃহস্পতিবার ঘোষণা করেছে

সনেটের এই নতুন পুনরাবৃত্তিটি অ্যানথ্রপিকের 3.5 মডেলের আসন্ন লাইনে প্রথম, এবং এটি উল্লেখযোগ্যভাবে আরও বিস্তৃত Opus 3.0 মডেলকে ছাড়িয়ে যায় , এবং বৃহত্তর মডেলের শক্তি খরচের একটি ভগ্নাংশে তা করে। কম্পিউট দক্ষতা AI সিস্টেম ডিজাইনের একটি ক্রমবর্ধমান গুরুত্বপূর্ণ দিক হয়ে উঠছে, বিশেষ করে যখন পরিকাঠামো গিগাওয়াট পরিসরে ঠেলে দেয় তখন AI ডেটা সেন্টারের পাওয়ারিং এবং কুলিং উভয়ের খরচ বেড়ে যায়৷

"ক্লদ 3.5 সনেট ক্লড 3 ওপাসের দ্বিগুণ গতিতে কাজ করে," নৃতাত্ত্বিক দল একটি ব্লগ পোস্টে লিখেছিল। "এই পারফরম্যান্স বুস্ট, সাশ্রয়ী মূল্যের সাথে মিলিত, ক্লাউড 3.5 সনেটকে প্রসঙ্গ-সংবেদনশীল গ্রাহক সহায়তা এবং মাল্টিস্টেপ ওয়ার্কফ্লো অর্কেস্ট্রেট করার মতো জটিল কাজের জন্য আদর্শ করে তোলে।"

নতুন মডেলটি তিনটি প্রমিত পরীক্ষা জুড়ে বেঞ্চমার্ক ফলাফল সেট করেছে বলে জানা গেছে: GPQA- এর সাথে স্নাতক-স্তরের যুক্তি, MMLU- এর সাথে স্নাতক-স্তরের জ্ঞান, এবং HumanEval- এর সাথে কোডিং দক্ষতা। এটি Google-এর Gemini 1.5 Pro, Meta's Llama-400b, এবং OpenAI-এর ChatGPT-4o-কে পরাজিত করেছে, যদিও কোনো বিশাল ব্যবধানে নয় এবং সাধারণত মাত্র কয়েক শতাংশ পয়েন্টে।

অন্যান্য নেতৃস্থানীয় AI সিস্টেমের তুলনায় ক্লড 3.5 সনেটের কর্মক্ষমতা দেখানো একটি টেবিল।
নৃতাত্ত্বিক

সনেট 3.5 কে অ্যানথ্রপিকের "এখনও সবচেয়ে শক্তিশালী দৃষ্টি মডেল হিসাবে বিল করা হচ্ছে৷ ” এটি অনেকগুলি দৃষ্টি-ভিত্তিক কাজগুলি সম্পাদন করতে সক্ষম — যেমন চার্ট এবং গ্রাফগুলি ব্যাখ্যা করা বা স্ক্রিনশট বা স্ক্যান করা রসিদগুলির মতো অপূর্ণ ইমেজ উত্স থেকে পাঠ্য প্রতিলিপি করা — Opus 3.0 এর চেয়ে আরও সঠিকভাবে৷ প্রকৃতপক্ষে, Sonnet 3.5 Opus 3.0-কে 6 থেকে 17 পয়েন্টের মধ্যে যেকোন জায়গায় পরাজিত করেছে ইন্ডাস্ট্রির স্ট্যান্ডার্ড ভিশন বেঞ্চমার্কে। নতুন মডেলটি হাস্যরস পরিচালনায় অনেক বেশি দক্ষ এবং অনেক বেশি প্রাণবন্ত পদ্ধতিতে কথোপকথন করতে পারে বলে জানা গেছে।

এছাড়াও সনেট প্রথম নৃতাত্ত্বিক AI হবে যা ব্যবহারকারীদের আর্টিফ্যাক্ট বৈশিষ্ট্য প্রদান করবে। কথোপকথনের প্রবাহে সরাসরি চিত্র বা কোড স্নিপেট তৈরি করার পরিবর্তে, আর্টিফ্যাক্টগুলি চ্যাটের পাশে একটি উত্সর্গীকৃত স্থানে সেই সামগ্রী তৈরি করবে। এটি ব্যবহারকারীদের "একটি গতিশীল ওয়ার্কস্পেস তৈরি করতে দেয় যেখানে তারা রিয়েল টাইমে ক্লডের সৃষ্টিগুলি দেখতে, সম্পাদনা করতে এবং তৈরি করতে পারে, নির্বিঘ্নে তাদের প্রকল্প এবং কর্মপ্রবাহে এআই-উত্পন্ন সামগ্রীকে একীভূত করে," অ্যানথ্রোপিক দল দাবি করে৷ এটি আরও ঘোষণা করেছে যে ক্লড শীঘ্রই টিম সহযোগিতাকে সমর্থন করবে যেখানে একটি কোম্পানি তার ডেটা, নথি এবং প্রকল্পগুলিকে একক, কেন্দ্রীয় সাইলোতে সংরক্ষণ করতে পারে, ক্লড একটি অন-ডিমান্ড সহকারী হিসাবে কাজ করে।

আপনি Claude.ai ওয়েবসাইট এবং Claude iOS অ্যাপে বিনামূল্যে Claude 3.5 Sonnet ব্যবহার করে দেখতে পারেন (একটি Claude Pro বা টিম সাবস্ক্রিপশন আপনাকে উল্লেখযোগ্যভাবে উচ্চ হারের সীমা অর্জন করবে)। থার্ড-পার্টি ইন্টিগ্রেশন অ্যানথ্রপিক এপিআই, অ্যামাজন বেডরক এবং গুগল ক্লাউডের ভার্টেক্স এআই-এর মাধ্যমেও পাওয়া যায়। ক্লদ হাইকু 3.5 এবং ওপাস 3.5 বছরের শেষের দিকে মুক্তির জন্য নির্ধারিত রয়েছে৷