স্পিটিফাই স্পিচ রিকগনিশন সিস্টেমটিতে কাজ করছে কেন?

স্পোটিফাই, বিশ্বের বৃহত্তম সংগীত স্ট্রিমিং পরিষেবা, লিঙ্গ, বয়স এবং পরিবেশকে অনুমান করার জন্য কোনও ব্যবহারকারীর ভয়েস বিশ্লেষণ করার জন্য স্পিচ রিকগনিশন প্রযুক্তির পেটেন্ট পেয়েছে। সংস্থার অন্যান্য উন্নয়নের সাথে যখন নেওয়া হয়, তখন এটি স্পষ্ট যে স্পটিফাই, আমাদের কান জিতল, এখন আমাদের কণ্ঠেরও পরে।

তবে কেন স্পটিফাই এই ধরণের বক্তৃতার স্বীকৃতি বিকাশ করতে চাইতে পারে এবং এটি কীসের জন্য ব্যবহৃত হবে? আসুন পেটেন্ট এবং এর অর্থগুলি খনন করি।

স্পটিফাইয়ের স্পিচ রিকগনিশন পেটেন্ট

2018 সালে, স্পটিফাই একটি পেটেন্ট অ্যাপ্লিকেশন জমা দিয়েছেন, " একটি অডিও সিগন্যাল থেকে স্বাদ বৈশিষ্ট্যের সনাক্তকরণ " শিরোনাম। প্রায় তিন বছরের অপেক্ষার পরে, 2021 সালের জানুয়ারিতে পেটেন্টটি মঞ্জুর করা হয়েছিল the নামটি হিসাবে বোঝা যাচ্ছে যে নীতিগতভাবে ফাইলিংয়ের বিশদটি এমন একটি সিস্টেম যা আপনার পরিবেশ থেকে রেকর্ডিং অডিও নিতে পারে বা কথা ছাড়াই বাছাই করে বা সেট করে একটি সেট দিয়ে চালায় অ্যালগরিদমগুলি এবং আপনার জনসংখ্যার উপরে এবং বর্তমান পরিবেশের জন্য উপযুক্ত সঙ্গীত খেলতে ফলাফল বিশ্লেষণ ব্যবহার করুন।

পেটেন্টে লিঙ্গ, বয়স, উচ্চারণ, সংবেদনশীল অবস্থা, শারীরিক পরিবেশ এবং মানুষের সংখ্যা সহ কীভাবে আলগোরিদিম ডেটা শ্রেণীবদ্ধ করতে পারে তার কয়েকটি উদাহরণ তালিকাভুক্ত করে। যাইহোক, ফাইলিংটি নোট করে চলেছে যে এটি একটি সম্পূর্ণ তালিকা নয়, সংস্থাটি রেকর্ড করা অডিওকে কীভাবে লেবেল করতে পারে তার কয়েকটি উদাহরণ। এই মেটাডেটা ছাড়াও, পেটেন্ট পরামর্শ দেয় স্পটিফাই আপনার বক্তৃতাকে বিশ্লেষণও করতে পারে।

স্পিটিফাই কী জন্য স্পিচ সনাক্তকরণ ব্যবহার করতে পারে?

বর্তমানে, কোনও ইঙ্গিত নেই যে স্পোটাইফাই পেটেন্টে বর্ণিত প্রস্তাবিত সিস্টেমটি বিকশিত করেছেন। তবে, সংগীত স্ট্রিমিং পরিষেবাটি কাজ করছে এমন আরও কয়েকটি প্রকল্পের সাথে এটি সারিবদ্ধ হয়। 2021 সালের শুরুর দিকে পেটেন্টটি প্রদানের খুব বেশি পরে, স্পটিফাই একটি ভয়েস-নিয়ন্ত্রণ বৈশিষ্ট্যটি রোল আউট করে । "আরে, স্পটিফাইফ" জাগ্রত শব্দটি ব্যবহার করে আপনি কেবল ভয়েস কমান্ডের মাধ্যমে অ্যাপের মধ্যে সংগীত প্লেব্যাক নিয়ন্ত্রণ করতে পারেন।

যেমন স্পটিফাই হ'ল সিরি বা গুগল সহকারী এর মতো সিস্টেম-স্তরের ভয়েস সহকারী না হয়ে একটি মোবাইল অ্যাপ্লিকেশন, এর কিছু সীমাবদ্ধতা রয়েছে। উদাহরণস্বরূপ, অ্যাপটি উন্মুক্ত হওয়া দরকার, স্পটিফাইয়ের অবশ্যই আপনার মাইক্রোফোনটিতে অ্যাক্সেস থাকতে হবে এবং আপনার স্মার্টফোনের প্রদর্শনটি আনলক করা এবং চালু করা দরকার। যদি স্ট্রিমিং পরিষেবাটি আরও বেশি বিস্তৃত সিস্টেম তৈরির আশা করে, তবে এটির জন্য সিস্টেম-স্তর অ্যাক্সেস বা তার নিজস্ব হার্ডওয়্যার প্রয়োজন।

2019 সালে, স্পোটিফাই গাড়ি থিং নামে পরিচিত একটি যানবাহন ভিত্তিক হার্ডওয়্যার ডিভাইস ট্রেল করেছে। তত্কালীন একটি স্পটিফাই নিউজরুমের পোস্টে সংস্থাটি বলেছিল যে ডিভাইসটি মার্কিন যুক্তরাষ্ট্রে কিছু স্পটিফাই প্রিমিয়াম ব্যবহারকারীদের ভয়েস-নিয়ন্ত্রিত কার থিং ব্যবহার করে তাদের গাড়ীতে সংগীত এবং পডকাস্ট শুনতে দেয়। এটি আরও উল্লেখ করেছে যে তারা ভয়েস থিং এবং হোম থিং নামে পরিচিত অনুরূপ পরীক্ষাগুলি করতে দেখছিল।

তবে পরীক্ষাগুলি সম্পর্কে বা স্পোটিফের সেগুলি আরও বেশি বিস্তৃত করার পরিকল্পনা ছিল কিনা সে সম্পর্কে খুব বেশি কিছু জানা যায়নি। 2021 সালের জানুয়ারিতে, পেটেন্ট প্রদানের দু'দিন পরে, স্পটিফাই ব্লুটুথ কার্যকারিতা সহ একটি নতুন ডিজাইন করা গাড়ি থিংয়ের জন্য এফসিসির কাছে নতুন তালিকা ফাইল করেছিলেন। যদিও প্রকাশের তারিখের কোনও আনুষ্ঠানিক নিশ্চিতকরণ নেই, তবে মনে হচ্ছে সংস্থাটি তার হার্ডওয়্যার পরিকল্পনা নিয়ে এগিয়ে যাওয়ার আগে অডিও বিশ্লেষণ পেটেন্টের জন্য অপেক্ষা করছিল।

মেশিন লার্নিংয়ের সাথে সমস্যা

যদিও ক্রমবর্ধমান সাধারণ, কৃত্রিম বুদ্ধিমত্তার সিস্টেমগুলি প্রাথমিকভাবে শোনার মতো ততটা স্মার্ট নয়। বেশিরভাগ মেশিন লার্নিং কাজে লাগান, যেখানে সিস্টেমটি শিখার জন্য প্রশিক্ষণের ডেটার একটি সেট দেওয়া হয়। এই ক্ষেত্রে, এটি লিঙ্গ এবং অবস্থান অনুসারে শ্রেণীবদ্ধ কিছু অডিও রেকর্ডিং হতে পারে। এআই প্রশিক্ষণের ডেটাতে যে পার্থক্য দেখে তা স্পষ্ট করে কীভাবে তা বুঝতে শুরু করে এবং সে অনুযায়ী সেগুলি সাজায়।

যাইহোক, এখানেই কখনও কখনও সমস্যা দেখা দেয়। প্রত্যেকেরই আলাদা কণ্ঠ, উচ্চারণ এবং সুর রয়েছে। বেশিরভাগ ক্ষেত্রে, আমরা ফোনটি তুলতে পারি এবং নির্ধারণ করতে পারি যে আমরা অন্য প্রান্তের ব্যক্তিকে চিনি এবং যদি তাই হয় তবে এটি কে। এটি কোনও ভিজ্যুয়াল প্রম্পট ছাড়াই, প্রতিটি ভয়েস কতটা স্বতন্ত্র তা প্রদর্শন করে। প্রশিক্ষণের ডেটার একটি সেট কখনই সেই স্তরের বিশদ এবং উপদ্রবকে ক্যাপচার করতে সক্ষম হবে না।

ফলস্বরূপ, অনেক সময় এআই অনুমানগুলি তৈরি করে যাতে এটি ফলাফল আউটপুট করতে পারে। যদি ইনপুট ভয়েসটি কিছুটা কম থাকে তবে এটি এটিকে কোনও ব্যক্তির ভয়েস হিসাবে লেবেল করে। তেমনি, বিপরীতটি সত্য হতে পারে, উদাহরণস্বরূপ, উচ্চতর স্তরের টোনগুলি মহিলাদের হিসাবে চিহ্নিত করা হয়।

দুর্ভাগ্যক্রমে, এটি কেবল একটি তাত্ত্বিক ঝুঁকি নয়, কারণ অনেকগুলি হাই-প্রোফাইল উদাহরণ রয়েছে যেখানে মেশিন লার্নিং অ্যালগরিদমগুলি ভুল হয়ে গেছে

স্পোটাইফাই সিস্টেম এর প্রভাব

যখন ধাক্কা দেওয়া হয়, বেশিরভাগ লোকেরা একটি অপরিচিত উচ্চারণটি সঠিকভাবে চিহ্নিত করার জন্য সংগ্রাম করতে থাকে এবং এটি সারা জীবন অভিজ্ঞতা এবং স্মৃতি থেকে যা টানতে পারে with মেশিন লার্নিং সিস্টেমটি কেবলমাত্র প্রশিক্ষণ ডেটাতে কী ছিল তা জানবে, আরও বেশি অনুমান করাতে রেখে। এটি কীভাবে সম্ভাব্য সমস্যাযুক্ত এমনকি বর্ণবাদী ফলাফলের দিকে পরিচালিত করতে পারে তা দেখতে সহজ।

এটিও নজিরবিহীন নয়। ২০১৫ সালে, সফটওয়্যার ইঞ্জিনিয়ার, জ্যাকি আলসিনি লক্ষ্য করেছেন যে গুগল ফটোগুলি তার কালো বন্ধুগুলিকে গরিলা হিসাবে চিহ্নিত করেছে। একটি অনলাইন প্রতিক্রিয়া হওয়ার পরে, গুগল এই সংবেদনশীল সমস্যাটি যত্ন নিয়েছে বলে দাবি করেছে। তবে, ওয়াইআরইডি 2018 সালে প্রতিবেদন করেছে যে গুগল অন্তর্নিহিত চিত্রের শ্রেণিবদ্ধকরণের সমস্যাটি স্থির করেনি। পরিবর্তে, সংস্থাটি কেবল শ্রেণিবিন্যাস সিস্টেম থেকে গরিলা, বানর এবং শিম্পাঞ্জির মতো নির্দিষ্ট প্রাইমেট সম্পর্কিত শর্তাদি অবরুদ্ধ করেছিল।

স্পটিফাইয়ের প্রস্তাবিত সিস্টেমেও সম্ভাব্য গোপনীয়তা সম্পর্কিত উদ্বেগ রয়েছে। সংস্থাটি যেভাবে প্রত্যাশা করে সেভাবে কাজ করতে, বক্তব্য স্বীকৃতি বৈশিষ্ট্যটি আপনি কী বলছেন এবং আপনি যে পরিবেশে রয়েছেন তা ক্রমাগত পর্যবেক্ষণ করা দরকার The সর্বদা অন যোগ্যতা ব্যক্তিগত গোপনীয়তার সমস্যা তবে আক্রমণাত্মক আইন প্রয়োগের দিকে পরিচালিত করতে পারে বা সরকারী নজরদারি।

কিছু আবেগ সনাক্তকরণ বৈশিষ্ট্য থেকেও সাবধান। বর্ণিত হিসাবে, স্পটিফাইয়ের অ্যালগরিদম আপনার সংবেদনশীল অবস্থাটি সনাক্ত করতে পারে এবং আপনার অডিও বিশ্লেষণ করা হলে মুড-উপযুক্ত সঙ্গীত খেলবে। যাইহোক, এই ধারণাটি অনুধাবন করা হয় যে আপনি যদি কোনও নির্দিষ্ট হেডস্পেসে থাকেন তবে আপনি গানের মাধ্যমে সেখানে থাকতে চান। এটি প্রযুক্তি সংস্থাগুলির দ্বারা অপব্যবহারের জন্যও উন্মুক্ত।

উদাহরণস্বরূপ, ২০১২ সালে, ফেসবুক অর্ধ মিলিয়নেরও বেশি ব্যবহারকারীদের ফিডে ইতিবাচক বা নেতিবাচক সামগ্রী প্রদর্শন করে একটি গোপন পরীক্ষা করেছে যা দেখেছিল কীভাবে এটি তাদের আবেগময় অবস্থাকে প্রভাবিত করে। এই কারণে, মানবাধিকার সংস্থা অ্যাক্সেস নাউ স্পোটিফাকে একটি উন্মুক্ত চিঠি প্রেরণ করে সংস্থাটিকে সিস্টেমটি পরিত্যাগ করতে বলে।

ব্যক্তিগতকৃত সংগীতের ভবিষ্যত?

স্পোটিফাই প্রথম কোম্পানির মধ্যে একটি বাধ্যতামূলক সংগীত স্ট্রিমিং পরিষেবা তৈরি করেছিল। ইন্টারফেস এবং বিস্তৃত ক্যাটালগ বিশ্বব্যাপী এটি একটি প্রিয় করে তোলে। পরিষেবাটি বেশিরভাগ ডিজিটাল সহায়ক এবং স্মার্ট হোম সরঞ্জামগুলির সাথে দুর্দান্তভাবে সংহত করে। বছরের পর বছর ধরে, সংস্থাটি আপনাকে নতুন সংগীত আবিষ্কার করতে বা অ্যালগোরিদম উত্পন্ন প্লেলিস্টগুলির সাথে আপনার পছন্দগুলি উপভোগ করা সহজ করে তুলেছে।

তত্ত্ব অনুসারে, সর্বদা অন্বয়যুক্ত স্বীকৃতিটি এই কাস্টমাইজেশনটিকে আরও একধাপ এগিয়ে নিয়ে যাওয়া উচিত, যাতে স্ট্রিমিং পরিষেবা আপনাকে সঠিক সময়ে সেরা সংগীত বাজানোর জন্য আপনার মেজাজ এবং পরিবেশকে নিস্ক্রিয়ভাবে নিতে পারে। তবে, প্রযুক্তির সর্বদা শ্রবণকারী প্রকৃতির সুদূরপ্রসারী গোপনীয়তার প্রভাব রয়েছে যা প্ল্যাটফর্মের দ্বারা প্রদত্ত যে কোনও সুবিধাকে ছাড়িয়ে যেতে পারে।