100 টি ভাষার মধ্যে ফেসবুকের নতুন এআই অনুবাদ

ফেসবুক একটি নতুন ওপেন-সোর্স এআই মডেল উন্মোচন করেছে যা 100 টি বিভিন্ন ভাষার মধ্যে অনুবাদ করার ক্ষমতা রাখে। এর এআই মডেলটিকে আরও কার্যকর এবং নির্ভুল অনুবাদ করার অনুমতি দিয়ে বিদ্যমান পাঠ্যটি ইংরেজীতে রূপান্তর করতে হবে না।

পাঠ্য অনুবাদ করার জন্য একটি নতুন উপায় উপস্থাপন করা হচ্ছে

ফেসবুক ব্লগ পোস্ট সম্পর্কে প্ল্যাটফর্মটি তার নতুন বহুভাষিক মেশিন ট্রান্সলেশন (এমএমটি) মডেলকে এম 2 এম -100 নামেও পরিচিত করেছে detailed প্রভাবশালীভাবে যথেষ্ট, এই ওপেন-সোর্স মেশিন লার্নিং মডেল "ইংরেজি ডেটার উপর নির্ভর না করে যে কোনও জোড়ের মধ্যে ১০০ টি ভাষার মধ্যে অনুবাদ করতে পারে।"

যদিও এটি এখনও একটি গবেষণা প্রকল্প, এটি অনেক প্রতিশ্রুতি দেখায়। ফেসবুকের গবেষণা সহায়ক অ্যাঞ্জেলা ফ্যান উল্লেখ করেছেন যে "সাধারণ" মেশিন অনুবাদ মডেলগুলি প্রতিটি ভাষার জন্য বিভিন্ন মডেল ব্যবহার করে, তাদের ফেসবুকের মতো বৃহত প্ল্যাটফর্মের জন্য অবিশ্বাস্যভাবে অক্ষম করে তোলে।

এমনকি উন্নত মডেলরা এটি কাটেন না, কারণ তারা ভাষার মধ্যে মধ্যম হিসাবে ইংরেজি ব্যবহার করেন। এর অর্থ হ'ল সিস্টেমটিকে প্রথমে উত্স পাঠ্যটি ইংরেজিতে অনুবাদ করতে হবে এবং তারপরে লক্ষ্য ভাষায় এটি অনুবাদ করতে হবে।

ইংরাজী নির্ভর নির্ভর মডেলগুলি সেরা অনুবাদগুলি উত্পাদন করে না। ভক্ত নোট করেছেন যে ছবিটি ইংরেজি থেকে বের করে ফেসবুকের এমএমটি সিস্টেম আরও নিখুঁত অনুবাদ প্রকাশ করতে পারে, উল্লেখ করে:

অনুবাদ করার সময়, বলতে, চীনা থেকে ফরাসী ভাষায়, বেশিরভাগ ইংলিশ কেন্দ্রিক বহুভাষিক মডেলগুলি চাইনিজ থেকে ইংরেজি এবং ইংরেজি থেকে ফরাসি ভাষাতে প্রশিক্ষণ দেয়, কারণ ইংরেজি প্রশিক্ষণের ডেটা সর্বাধিক বিস্তৃত। আমাদের মডেলটি আরও ভাল অর্থের সংরক্ষণের জন্য চীনা থেকে ফরাসী ডেটাগুলিতে সরাসরি প্রশিক্ষণ দেয়।

সুতরাং ইংরেজিকে সেতু হিসাবে ব্যবহার না করে ফেসবুকের এমএমটি মডেল 100 টি বিভিন্ন ভাষার মধ্যে পিছনে অনুবাদ করতে পারে। ফ্যানের মতে, ফেসবুক "এখন পর্যন্ত নির্ধারিত সবচেয়ে বিবিধ এমএমটি ডেটা তৈরি করেছে", যা 100 টি ভাষার জন্য 7.5 বিলিয়ন বাক্য জুড়ে রয়েছে।

এই কীর্তিটি সম্পাদন করতে, গবেষণা দলটি "সর্বাধিক অনুবাদ অনুরোধের সাথে" ভাষাগুলিতে প্রথমে ফোকাস করে ওয়েবে ভাষা অনুবাদ ডেটা তৈরি করে। গবেষকরা তখন ভাগগুলিকে ভাগ করে নেওয়া বৈশিষ্ট্যের উপর ভিত্তি করে 14 টি গ্রুপে শ্রেণিবদ্ধ করেন।

এখান থেকে, গবেষকরা প্রতিটি গোষ্ঠীর জন্য ব্রিজ ভাষা প্রতিষ্ঠা করেছিলেন এবং সমস্ত সম্ভাব্য সংমিশ্রণের জন্য প্রশিক্ষণ ডেটা তৈরি করেছিলেন। এটি 2,200 দিক জুড়ে 7.5 বিলিয়ন সমান্তরাল বাক্যগুলির ফলস্বরূপ।

এবং যে ভাষাগুলি এতটা বিস্তৃত নয়, ফেসবুক সিন্থেটিক অনুবাদ তৈরি করতে ব্যাক-ট্রান্সলেশন নামক কিছু ব্যবহার করেছিল।

এই সম্পূর্ণ প্রক্রিয়াটি ফেসবুক এআই দলকে একটি "একক মডেল তৈরি করে যা সমস্ত ভাষা, উপভাষা এবং রূপকে সমর্থন করে" তাদের লক্ষ্যকে আরও কাছে আনছে।

ফেসবুক আরও ভাল অনুবাদ সরবরাহ করতে আরও কাছাকাছি যায়

ফেসবুক ইতিমধ্যে তার নিউজ ফিডে প্রতিদিন 20 বিলিয়ন অনুবাদ করে এবং ফেসবুক এআই কেবল প্রক্রিয়াটিকে আরও দক্ষ করে তুলবে। যদিও নতুন অনুবাদ মডেলটি এখনও কার্যকর করা হয়নি, তবে এটি অবশ্যই আন্তর্জাতিক ফেসবুক ব্যবহারকারীদের জন্য কার্যকর হবে যাদের নির্দিষ্ট অনুবাদ দরকার।