ক্যাট স্পিচ অনুবাদ অ্যাপস কীভাবে কাজ করে?

আপনি সম্ভবত এমন অ্যাপ্লিকেশন দেখেছেন যা আপনার বিড়াল যা বলছে তা অনুবাদ করার দাবি করে। কিন্তু তারা কি সত্যিই আপনার বিড়ালের মিয়া ইংরেজিতে অনুবাদ করতে পারে? সংক্ষিপ্ত উত্তর হ্যাঁ, সাজান। প্রতিটি বিড়ালের "ভাষা" কতটা অনন্যতার কারণে এটি কঠিন, তবে তারা আধুনিক প্রযুক্তির সাথে খুব কাছাকাছি যেতে পারে।

মেওটালকের মতো বিড়াল অনুবাদ অ্যাপ্লিকেশনগুলি স্পিচ স্বীকৃতির একটি ফর্ম ব্যবহার করে যা মেশিন শেখার উপর জোর দেয়। কাছাকাছি তাকান।

স্পিচ রিকগনিশন এবং মেশিন লার্নিং

স্পিচ রিকগনিশন স্পিচ রেকর্ডিং করে এবং অডিওকে ডিজিটাল ডেটা ফাইলে রূপান্তর করে কাজ করে। এটি পিচ এবং ভলিউমের মতো ডেটাগুলিকে ডেটা পয়েন্ট হিসাবে এনকোড করে যা অ্যাপ্লিকেশনটিকে বিশ্লেষণ করতে এবং অর্থগুলির সাথে মেলে। ডিপিএ মাইক্রোফোন ব্যাখ্যা করে যে এই ডেটা পয়েন্টগুলি ব্যাকগ্রাউন্ডের শব্দগুলির উপর নির্ভর করে এবং কীভাবে একটি শব্দ কথিত হয় তার উপর নির্ভর করে দেখতে পারে different

আমরা মাঝে মাঝে ভয়েস স্বীকৃতি গ্রহণ করি, তবে এটি প্রযুক্তির একটি অবিশ্বাস্য কীর্তি। বিশেষত মানুষের বক্তব্য কত জটিল তা বিবেচনা করুন। সায়েন্টিস্টের ব্যাখ্যা অনুসারে, প্রতিটি শব্দের মধ্যে বিভিন্ন শব্দ বা "ফোনমেস" একে অপরের সাথে মিশ্রিত হয়। বক্তৃতা বোঝার জন্য কম্পিউটার পাওয়া খুব কঠিন। বিড়ালের শব্দগুলির নতুন সীমানা আরও শক্ত হবে be

স্পিচ স্বীকৃতি ব্যবহার করে এমন অ্যাপ্লিকেশনগুলিকে একটি ডেটাসেট বলা শব্দের একটি "শব্দভাণ্ডার" দিয়ে প্রোগ্রাম করা হয়। এরপরে অ্যাপ্লিকেশনটি আপনার বক্তৃতাকে তার ডেটা-শব্দভাণ্ডারের নিকটতম বিকল্পের সাথে মেলে।

যখন এটি কোনও ভুল করে, আপনি এটি সংশোধন করেন এবং এটি পরবর্তী সময়ের জন্য সেই ডেটা সংরক্ষণ করে। এটি মেশিন লার্নিংয়ের একটি অংশ। এটি কোনও ডেটাसेटের সাথে শুরু হওয়া ডেটাসেটের মতো না হলেও এমন কি কোনও প্রোগ্রাম বক্তৃতা সনাক্ত করতে শেখে।

সম্পর্কিত: মেশিন অ্যালগরিদম কী শিখছে? তারা কীভাবে কাজ করে তা এখানে

ভয়েস স্বীকৃতিটিতে এখনও সমস্যা রয়েছে, বিশেষত বাকী প্রতিবন্ধকতা এবং অ্যাকসেন্ট সহ। যদিও কিছু সংস্থা এই সমস্যাগুলি কাটিয়ে উঠতে মেশিন লার্নিংয়ের উন্নতি করছে । সময়ের সাথে সাথে, মেশিন লার্নিং স্পিচ স্বীকৃতিটিকে একটি শক্তিশালী সরঞ্জামে রূপান্তর করতে পারে।

মানুষের পক্ষে বক্তৃতা স্বীকৃতি এইভাবে কাজ করে। কিন্তু এটি কি বিড়ালদের জন্য কাজ করে?

স্পিচ রিকগনিশন বনাম মায়ো রিকগনিশন

প্রথমত, আমাদের বুঝতে হবে যে একটি নির্দিষ্ট ধরণের মেঘকে "আমি ক্ষুধার্ত" হিসাবে অনুবাদ করা কেন মানুষের বক্তব্য বিশ্লেষণের চেয়ে আলাদা। সমস্যাটি বেশিরভাগ ক্ষেত্রেই বিড়ালের যোগাযোগ অঙ্গবিন্যাসের মতো অবিশ্বাস্য সংকেতের উপর বেশি বেশি নির্ভর করে। আরেকটি সমস্যা হ'ল সার্বজনীন "বিড়াল ভাষার ভাষা" না থাকা।

এএসপিসিএ অনুসারে প্রাপ্তবয়স্ক পাখির বিড়াল কখনও একে অপরের দিকে মেলে না, কেবল মানুষের কাছে। হিউম্যান সোসাইটির অন্যান্য গবেষণা যুক্ত করেছে যে এই শব্দগুলি "শূন্যতায় আসে না।" আমাদের অবশ্যই দেহ ভাষা এবং অন্যান্য প্রসঙ্গে পাশাপাশি তাদের ব্যাখ্যা করতে হবে। অনেক ক্ষেত্রে, এই নিঃশব্দ সংকেতগুলি কেবলমাত্র "আমি ক্ষুধার্ত" এবং এর অর্থ "আমি খেলতে চাই" এর মধ্যে পার্থক্য me

এই সমস্যাটি যুক্ত করে, কোনও দুটি বিড়ালের একই ভাষা নেই। বিড়ালগুলি তাদের মালিকদের জন্য ব্যক্তিগতকৃত "ভাষা" বিকাশ করে। এগুলি আংশিকভাবে মালিকের কণ্ঠের অনুকরণের উপর এবং আংশিকভাবে বিড়ালের ব্যক্তিত্বের উপর ভিত্তি করে। দু'টি বিড়াল একই বাজে না, এমনকি যখন একই প্রয়োজন বা প্রয়োজন জানায়। তাহলে কোনও অ্যাপের স্পিচ শব্দভান্ডার কীভাবে তাদের সকলের জন্য অনুবাদ করতে পারে?

বিড়ালদের জন্য নমনীয় মেশিন লার্নিং

যদিও অটোর মতো কয়েকজন ভার্চুয়াল সহকারী স্বর এবং আবেগ বোঝার চেষ্টা করে, তবে বক্তৃতা স্বীকৃতি এখনও অবাস্তব সংকেতগুলিতে ভয়ানক। তবে এর অর্থ এই নয় যে তাদের ব্যাখ্যা করা অসম্ভব।

এই সমস্যাগুলি কাটিয়ে উঠতে সহায়তা করার জন্য মিওটালক আরও নমনীয় ধরণের মেশিন লার্নিং ব্যবহার করে।

ডাউনলোড: অ্যান্ড্রয়েডের জন্য MeowTalk | আইওএস (ফ্রি)

মেওটালক তৈরি করেছিলেন জাভিয়ের সানচেজ, তিনিও আলেকসার দলে কাজ করেছিলেন। তিনি অ্যাপটি স্মার্ট কলারগুলির দিকে পদক্ষেপ হিসাবে কল্পনা করেছিলেন। এই কলারগুলি বিড়ালের শব্দগুলিকে মানুষের বক্তৃতায় অনুবাদ করবে এবং জটিল বিড়ালগুলির মেশিন শেখার কৌশলগুলি অঙ্কন করবে যাতে মানুষ তাদের বিড়ালদের আরও ভালভাবে বুঝতে এবং তাদের যত্ন নিতে পারে।

MeowTalk টিম প্রতিটি বিড়ালের জন্য আরও সুনির্দিষ্ট প্রোফাইল তৈরি করে স্বতন্ত্রতা সমস্যাগুলির জন্য ক্ষতিপূরণ দেয়। অ্যাপটিতে আপনি প্রতিটি বিড়ালকে আলাদাভাবে নিবন্ধভুক্ত করেন। বিজ্ঞান নরওয়ে জানিয়েছে যে বিড়ালছানাগুলি প্রাপ্তবয়স্ক বিড়ালদের চেয়ে আলাদাভাবে মেও, তাই অ্যাপটি বিড়ালের জন্মদিনের জন্যও জিজ্ঞাসা করে। প্রতিটি প্রোফাইল বিড়ালের জন্য একটি অনন্য ডেটা নেটওয়ার্ক তৈরি করে, মেশিন লার্নিংয়ে কিছুটা গভীর শিক্ষার সমন্বিত করে।

সম্পর্কিত: ডিপ লার্নিং বনাম মেশিন লার্নিং বনাম এআই: তারা কীভাবে একসাথে যায়?

শব্দভান্ডার জন্য, মিওটালক তার ডেটাসেটে 10 টি শব্দ প্রোফাইল দিয়ে শুরু করে। "সুখী" বা "শিকার" এর মতো প্রত্যেকটির আলাদা অর্থ যুক্ত থাকে। অ্যাপ্লিকেশনটি যখন কোনও শব্দ শুনতে পায় এবং এটিকে ভুল করে তোলে, আপনি হয় এটি সংশোধন করতে পারেন বা একটি নতুন ব্যাখ্যা তৈরি করতে পারেন।

সংশোধন করে অ্যাপ্লিকেশনটিকে নতুন শব্দটির সাথে বেস ভোকাবুলারি প্রতিস্থাপন করতে বলে।

উদাহরণস্বরূপ, আপনি অ্যাপ্লিকেশনটিকে দীর্ঘ শিকারের পরিবর্তে "শিকার" শর্ট চিপসের সাথে মেলে বলতে পারেন। এই ধরণের সংশোধন একাধিক শব্দ যোগ করার চেয়ে আরও কার্যকর যেটির সাথে স্পিচ রিকগনিশন ডো মানে, যা অ্যাপ্লিকেশনটিকে বলার মতো হবে যে একটি দীর্ঘ পেঁচা এবং সংক্ষিপ্ত চিপস উভয়েরই অর্থ "মাদার কল"।

স্পিচ রিকগনিশন অ্যাপ্লিকেশনগুলিতে মেশিন লার্নিং সাধারণত এই ধরণের ওভাররাইটিং প্রতিরোধ করে। এটি সিরিকে শেখানোর চেষ্টা করার মতো হবে যে আপনি যখন "প্রযুক্তি ব্লগ" বলবেন তখন সত্যই আপনি "পিয়ার" বোঝান। তবে মায়োটালক যে মেশিন লার্নিংয়ের আরও নমনীয় ফর্ম ব্যবহার করেন এটি এই সংশোধনটিকে আরও সহজে পরিচালনা করতে পারে।

নতুন ব্যাখ্যা তৈরি করা একটি অর্থ যুক্ত করে যা আগে এনকোড করা হয়নি। উদাহরণস্বরূপ, আপনার বিড়াল যদি তার পছন্দসই খেলনা চাইলে নির্দিষ্ট কল করে, আপনি একটি বিকল্প হিসাবে "আমি আমার মাউস চাই" যুক্ত করতে পারি। এটি আপনার স্বতঃশব্দ অভিধানে একটি শব্দ যুক্ত করার অনুরূপ।

সম্পর্কিত: অ্যান্ড্রয়েডে কীভাবে আপনার নিজের স্বতঃশব্দের শব্দ সংজ্ঞা দেওয়া যায়

সময়ের সাথে সাথে, আপনি আপনার বিড়ালের জন্য একটি উচ্চ ব্যক্তিগতকৃত স্পিচ প্রোফাইল বিকাশ করতে পারেন। অবশেষে, এটি পোষা-বসার ক্ষেত্রে বা আচরণগত সমস্যাগুলি সমাধান করার জন্য দরকারী হিসাবে যথেষ্ট পরিশীলিত হতে পারে। অন্য কিছু না হলে, এটি বিড়াল মালিকদের তাদের পোষা প্রাণীর প্রতি আরও মনোযোগী হতে সহায়তা করে।

পরিণতি: বিড়াল অনুবাদ অ্যাপ্লিকেশন কাজ করে?

শেষ পর্যন্ত, "বিড়াল অনুবাদ" এখনও তাদের বিড়াল কীভাবে কথা বলছে অ্যাপটিকে শেখানোর উপর অনেক কিছু নির্ভর করে। প্রতিটি বিড়ালের যোগাযোগ কতটা অনন্য বলে এটি সম্ভবত সর্বদা ক্ষেত্রেই থাকবে।

কিন্তু মেশিন লার্নিং এতদূর এসে গেছে যে বিকাশকারীরা এমনকি এটিতে আংশিকভাবে সফল হতে পারে তা অবিশ্বাস্য। মেশিন লার্নিং এবং এআই খুব খারাপ গতিতে এগিয়ে চলেছে এবং তারা কোথায় যায় তা দেখার জন্য আমরা অপেক্ষা করতে পারি না।