দাবি করে যে চীনা মূল্যায়ন GPT-4কে ছাড়িয়ে গেছে, বাইচুয়ান ইন্টেলিজেন্ট বাইচুয়ান 3 প্রকাশ করেছে, 100 বিলিয়ন প্যারামিটার সহ একটি বড় মডেল

"সিংহুয়া ভিত্তিক" বড় মডেলের স্টার্টআপ কোম্পানিগুলো আবার নিয়োগ করছে।

29শে জানুয়ারী, বাইচুয়ান ইন্টেলিজেন্স, সোগোর প্রতিষ্ঠাতা ওয়াং জিয়াওচুয়ান (বিএস এ সিংহুয়া ইউনিভার্সিটি) দ্বারা প্রতিষ্ঠিত, আনুষ্ঠানিকভাবে বাইচুয়ান 3 প্রকাশ করেছে, 100 বিলিয়ন প্যারামিটার সহ একটি বৃহৎ ভাষার মডেল। এই মডেলটি শুধুমাত্র একাধিক প্রামাণিক পরীক্ষায় ভাল পারফর্ম করে না, তবে চীনা সূচকগুলিতে GPT-4কেও ছাড়িয়ে যায়।

পরীক্ষার ফলাফল দেখায় যে বাইচুয়ান 3 একাধিক ইংরেজি মানদণ্ড যেমন MMLU-তে GPT-4-এর 90%-এর কাছাকাছি স্তরে পৌঁছেছে। CMMLU এবং GAOKAO-এর মতো অনেক চীনা বেঞ্চমার্ক পরীক্ষায়, Baichuan 3 অনেক এগিয়ে, GPT-3.5-কে বৃহৎ ব্যবধানে ছাড়িয়ে গেছে এবং সমস্ত দিক থেকে GPT-4-কেও ছাড়িয়ে গেছে।

গণিত এবং কোড তালিকা পরীক্ষায়, পাশাপাশি MT-বেঞ্চ এবং IFEval-এর মতো সারিবদ্ধ তালিকার মূল্যায়নে, Baichuan 3 GPT-3.5 এবং Claude-এর মতো বড় মডেলগুলিকে ছাড়িয়ে গেছে এবং শিল্পের অগ্রভাগে রয়েছে, শুধুমাত্র সামান্য GPT-4 থেকে নিকৃষ্ট।

AI+মেডিসিন হল বড় মডেলের একটি মূল প্রয়োগের ক্ষেত্র। চিকিৎসা সমস্যাগুলি জটিল এবং পরিবর্তনশীল, জ্ঞান দ্রুত আপডেট করা হয়, এবং সঠিকতার প্রয়োজনীয়তা বেশি, পাঠ্য, ছবি, শব্দ ইত্যাদিতে শক্তিশালী বোঝাপড়া এবং সিদ্ধান্ত নেওয়ার ক্ষমতা সম্পূর্ণরূপে প্রদর্শন করার জন্য মডেলগুলির প্রয়োজন।

তাই, বাইচুয়ান ইন্টেলিজেন্স এটিকে বড় মডেলের "মুকুট রত্ন" হিসাবে বিবেচনা করে।

বাইচুয়ান 3 চিকিৎসা ক্ষেত্রে ব্যাপক প্রশিক্ষণ ও অপ্টিমাইজেশানের মধ্য দিয়ে গেছে এবং প্রশিক্ষণের পর ফলাফলগুলিও অত্যন্ত তাৎপর্যপূর্ণ। MCMLE, MedExam এবং CMExam-এর মতো চীনা চিকিৎসা সংক্রান্ত কাজগুলিতে এর কার্যকারিতা GPT-4-এর চেয়ে বেশি এবং ইংরেজি চিকিৎসায় এর কার্যকারিতা USMLE এবং MedMCQA-এর মতো কাজগুলিও GPT-4 স্তরের কাছাকাছি, একের পর এক দৃঢ় চিকিৎসা ক্ষমতার সাথে চীনা মডেলের শিরোনাম জিতেছে।

সরকারী প্রকাশ অনুসারে, এই এলাকায় প্রশিক্ষণকে শক্তিশালী করার জন্য, বাইচুয়ান 3 মডেল প্রাক-প্রশিক্ষণ পর্যায়ে 100 বিলিয়নেরও বেশি টোকেনের একটি মেডিকেল ডেটা সেট তৈরি করেছে, যা পেশাদারিত্ব এবং পেশাদারিত্ব নিশ্চিত করতে তত্ত্ব থেকে অনুশীলন পর্যন্ত চিকিৎসা জ্ঞানের সমস্ত দিককে কভার করে। চিকিৎসা ক্ষেত্রে জ্ঞানের গভীরতা।

অনুমান পর্যায়ে, বাইচুয়ান ইন্টেলিজেন্স চিকিৎসা জ্ঞানের জন্য প্রম্পটগুলিকে সঠিকভাবে বর্ণনা করে এবং যথাযথভাবে নমুনা নির্বাচন করে, মডেল আউটপুটকে আরও নির্ভুল এবং যৌক্তিক অনুমান পদক্ষেপ করে।

শব্দার্থগত বোঝাপড়া এবং টেক্সট জেনারেশন হল বড় মডেলের সবচেয়ে মৌলিক অন্তর্নিহিত ক্ষমতা এবং কৃত্রিম বুদ্ধিমত্তা মডেলের মূল স্তম্ভ হিসাবে বিবেচিত হতে পারে। ওয়াং জিয়াওচুয়ান একবার উল্লেখ করেছিলেন যে ভাষা মানুষের জ্ঞানীয় জগতের সীমানা। প্রযুক্তিগত বাস্তবায়ন স্তর থেকে, ভাষা বোঝা এবং বোঝা ছবি এবং ভিডিওর চেয়ে বেশি কঠিন।

তার দৃষ্টিতে, নিউটন মহাবিশ্বের নিয়মগুলিকে গাণিতিক অভিব্যক্তিতে বিমূর্ত করার জন্য গতির তিনটি সূত্র ব্যবহার করেছিলেন, যা মানুষের জ্ঞানের জন্য একটি বড় অগ্রগতি ছিল। একই আজকের বড় মডেলের জন্য যায়. ভাষার পিছনের আইনগুলি আয়ত্ত করার অর্থ হল জ্ঞান নিজেই আয়ত্ত করা, সেইসাথে মানুষের চিন্তাভাবনা, যোগাযোগ এবং সংস্কৃতি।

একটি ভাষার মডেল একটি পারমাণবিক বোমার মতো, এটি একটি হাইড্রোজেন বোমা জ্বালাতে পারে। ভবিষ্যতে আরও ভাল মডেলিং হবে, যা ভবিষ্যতে আমাদের করতে হবে।

বাইচুয়ান 3 এর শক্তিশালী চীনা ভাষা প্রক্রিয়াকরণ ক্ষমতা এর সবচেয়ে বড় হাইলাইটগুলির মধ্যে একটি। এমনকি জটিল বিন্যাস, আঁটসাঁট কাঠামো এবং সমৃদ্ধ ছড়া সহ গানের লিরিক্সের মতো কঠিন ঘরানার মুখোমুখি হলেও, বাইচুয়ান 3 ঝরঝরে বিষয়বস্তু, ভাল-সারিবদ্ধ কাউন্টারপয়েন্ট এবং সুরেলা ছড়ার সাথে কাজ তৈরি করতে পারে।

কর্মকর্তারা বলেছেন যে বাইচুয়ান 3 "RLHF এবং RLAIF" এবং পুনরাবৃত্তিমূলক শক্তিবৃদ্ধি শেখার পদ্ধতিগুলিকে একত্রিত করে কবিতা সৃষ্টিতে বৃহৎ ভাষার মডেলগুলির দক্ষতাকে উল্লেখযোগ্যভাবে উন্নত করতে। শিল্পের অন্যান্য শীর্ষ মডেলের সাথে তুলনা করে, এর সৃষ্টির ব্যবহারযোগ্যতা 5 গুণেরও বেশি বৃদ্ধি পেয়েছে এবং এর সাহিত্যিক অর্জনগুলি সম্পূর্ণরূপে GPT-4 ছাড়িয়ে গেছে।

▲অভিজ্ঞতার লিঙ্ক: https://www.baichuan-ai.com/

উদাহরণস্বরূপ, অফিসিয়াল প্রদর্শনীতে, বাইচুয়ান 3-কে ওপেনএআই-এর "গংডু ড্রামা" সম্পর্কে একটি চাঞ্চল্যকর গান তৈরি করতে বলা হয়েছিল। মিশ্র চীনা এবং ইংরেজির পারফরম্যান্স বেশ আকর্ষণীয়।

"ঝড় রক্ষা · অতীত এবং পরিবর্তনশীল ঝড় স্মরণ করা"
অতীতের দিকে ফিরে তাকালে, পরিবর্তনের মধ্যে, AI এর ক্ষেত্রটি ফুটে উঠছে। অল্টম্যান বিচ্ছেদে ভুগছেন, কে সাহায্য করতে পারে? নাদেলা সাহায্য করেন।
প্রাক্তন সমবয়সীদের প্রতিদ্বন্দ্বী হয়ে উঠলে দোষ কি? সংসারের ক্ষোভ ও ক্ষোভ আকাশে। আসুন একসাথে উজ্জ্বলতা তৈরি করি এবং অনুশোচনা ছাড়াই হাতে হাতে এগিয়ে যাই, এবং সামনের রাস্তাটি অবিরাম।

এটা উল্লেখ করার মতো যে বাইচুয়ান ইন্টেলিজেন্স তার ওপেন সোর্স ধারণায় অন্যান্য বড় মডেল কোম্পানি থেকে আলাদা। এটি বাইচুয়ান 2 প্রেস কনফারেন্সে ওয়াং জিয়াওচুয়ানের বক্তৃতায় দেখা যায়।

Llama 2 ওপেন সোর্স মডেলের দিন শেষ। আমরা এখন একটি ওপেন সোর্স মডেল পেতে পারি যা লামার চেয়ে বন্ধুত্বপূর্ণ এবং আরও বেশি সক্ষম, যা চীনের সমগ্র বাস্তুতন্ত্রের উন্নয়নে সহায়তা করতে পারে।

যদিও Llama 2 ওপেন সোর্স হিসাবে বিজ্ঞাপিত হয়, এটি আসলে শুধুমাত্র ইংরেজি পরিবেশে উপলব্ধ। বিপরীতে, বাইচুয়ান 2 সিরিজ চীনা ব্যবহারকারীদের জন্য সম্পূর্ণ উন্মুক্ত এবং চীনা-ইংরেজি দ্বিভাষিক পরিবেশে বিনামূল্যে পরিষেবা প্রদান করে।

বাইচুয়ান ইন্টেলিজেন্ট ধারাবাহিকভাবে বাইচুয়ান-৭বি, বাইচুয়ান-১৩বি, বাইচুয়ান২-৭বি, এবং বাইচুয়ান২-১৩বি সহ চারটি স্বল্প খরচের মডেল ওপেন সোর্স করেছে, যা চাইনিজ এবং ইংরেজিতে বড় মডেলকে সমর্থন করে।

উপরন্তু, যখন মিডিয়া দ্বারা জিজ্ঞাসা করা হয়েছিল যে কীভাবে ওপেন সোর্স এবং বাণিজ্যিক ক্লোজড সোর্স মডেলগুলি হাতে হাতে যেতে এবং দ্রুত পুনরাবৃত্তি করতে হবে, বাইচুয়ান ইন্টেলিজেন্ট টেকনোলজির সহ-প্রতিষ্ঠাতা চেন ওয়েইপেং প্রকাশ করেছেন যে এটি তাদের সমৃদ্ধ অনুসন্ধান প্রযুক্তি অভিজ্ঞতার কারণে হয়েছে দ্রুত স্থানান্তরিত করা যেতে পারে এবং বড় মডেলগুলিতে প্রয়োগ করা যেতে পারে।

প্রযুক্তিগত দৃষ্টিকোণ থেকে, অনুসন্ধান এবং বড় মডেলগুলি অনেকগুলি সাধারণ প্রযুক্তিগত ভিত্তি ভাগ করে। উদাহরণস্বরূপ, মডেল প্রশিক্ষণের মূল ডেটা প্রসেসিং লিঙ্কে, দলটি অনুসন্ধান ক্ষেত্রের অভিজ্ঞতার উপর ভিত্তি করে ডেটা স্ক্রীনিং এবং অপ্টিমাইজেশন পরিচালনা করে, বারবার ফিল্টারিং অর্জন করে এবং গুণমান উন্নত করে, এইভাবে মডেলটির জন্য উচ্চ-মানের ডেটা সহায়তা প্রদান করে।

গত বছরের সেপ্টেম্বরে, দেশীয় বড় মডেল এবং চ্যাটজিপিটির মধ্যে ব্যবধান সম্পর্কে কথা বলার সময়, ওয়াং জিয়াওচুয়ান এই রায় দিয়েছিলেন:

GPT-4 ক্রমাগত উন্নতি করছে, এবং তারা সম্প্রতি ভয়েস এবং ইমেজ ক্ষমতা চালু করার সাথে অনেক শব্দ করেছে। সময়ের দৃষ্টিকোণ থেকে, আমরা মনে করি GPT-4 এর বর্তমান স্তরের কাছাকাছি যেতে দুই বা তিন বছর সময় লাগতে পারে।

অবশ্যই, বৃহৎ মডেলগুলির মধ্যে তীব্র প্রতিযোগিতায়, শুধুমাত্র প্রযুক্তি অন্বেষণের পর্যায়ে থাকাই যথেষ্ট নয়৷ বাইচুয়ান ইন্টেলিজেন্সের পরবর্তী পদক্ষেপটি হল প্রযুক্তির প্রয়োগের পরিস্থিতিতে রূপান্তরকে ত্বরান্বিত করা৷

ওয়াং জিয়াওচুয়ান জনসমক্ষে একাধিকবার "সুপার অ্যাপ্লিকেশন" উল্লেখ করেছেন। এমনকি তিনি ভবিষ্যদ্বাণী করেছিলেন যে এই বছর চীনে বেশ কয়েকটি সুপার অ্যাপ্লিকেশন আসবে। এবং এটি বড় মডেলের জন্য পরবর্তী যুদ্ধ হয়ে উঠতে পারে।

# Aifaner এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম: Aifaner (WeChat ID: ifanr)। যত তাড়াতাড়ি সম্ভব আপনাকে আরও উত্তেজনাপূর্ণ সামগ্রী সরবরাহ করা হবে।

Ai Faner | আসল লিঙ্ক · মন্তব্য দেখুন · Sina Weibo