ওয়াশিংটন বিশ্ববিদ্যালয়ের গবেষকরা সম্প্রতি একটি প্রোটোটাইপ উন্মোচন করেছেন যা অবশেষে ভিড়ের মধ্যে থাকার সবচেয়ে বিরক্তিকর অংশগুলির মধ্যে একটি ঠিক করতে পারে: আপনার পাশে দাঁড়িয়ে থাকা ব্যক্তির কথা শোনা। দলটি AI-চালিত হেডফোন তৈরি করেছে যা আপনি যার সাথে কথা বলছেন তার কণ্ঠস্বর স্বয়ংক্রিয়ভাবে আলাদা করতে পারে, এমনকি একটি বিশৃঙ্খল, কোলাহলপূর্ণ ঘরেও।
সবচেয়ে ভালো দিকটা কি? এটি কাজ করার জন্য আপনাকে কোনও অ্যাপ নিয়ে ঝামেলা করতে হবে না বা স্পিকারের দিকে তীব্রভাবে তাকাতে হবে না। সিস্টেমটি যথেষ্ট স্মার্ট যে এটি কথোপকথনের স্বাভাবিক ছন্দ সনাক্ত করতে পারে এবং সেই অনুযায়ী অডিও ফিল্টার করতে পারে, ব্যাকগ্রাউন্ডের শব্দ নিঃশব্দ করে এবং আপনি যার সাথে চ্যাট করছেন তার শব্দ বৃদ্ধি করে।
দলটি ৭ নভেম্বর চীনের সুঝোতে অনুষ্ঠিত একটি প্রধান ভাষা প্রক্রিয়াকরণ সম্মেলনে এই গবেষণাটি উপস্থাপন করেছে। আরও ভালো বিষয় হল, তারা কোডটি ওপেন সোর্স হিসেবে প্রকাশ করেছে যাতে অন্যান্য বিজ্ঞানীরা এটিকে উন্নত করতে পারেন।
এআই হেডফোন কীভাবে কাজ করে – এবং কেন এটি গুরুত্বপূর্ণ
গবেষকরা এই সিস্টেমটিকে "প্রোঅ্যাকটিভ হিয়ারিং অ্যাসিস্ট্যান্ট" বলে অভিহিত করেছেন। আপনি কথা বলা শুরু করার সাথে সাথেই এটি কাজ শুরু করে। একটি AI মডেল সময় শোনে – কে কখন কথা বলছে তা খুঁজে বের করে – এবং কথোপকথনের স্বাভাবিক প্রবাহের দিকে নজর রাখে। তারপর একটি দ্বিতীয় AI মডেল সেই নির্দিষ্ট কণ্ঠস্বরগুলি ধরে, অডিও পরিষ্কার করে এবং আপনার কানে ঢোকায়।
১১ জনের উপর করা প্রাথমিক পরীক্ষায়, রাত এবং দিনের পার্থক্য ছিল। অংশগ্রহণকারীরা স্ট্যান্ডার্ড আনফিল্টারড অডিওর তুলনায় স্বচ্ছতা এবং শব্দ দমনকে দ্বিগুণেরও বেশি রেট দিয়েছেন।
বর্তমান প্রযুক্তির ক্ষেত্রে সাধারণত আপনাকে কাজটি করতে হয় – যেমন একটি বোতাম টিপতে হয় অথবা শারীরিকভাবে আপনার মাথা ঘুরিয়ে দিতে হয় যাতে হিয়ারিং এইডটি কোথায় ফোকাস করতে হবে তা জানে। এই প্রোটোটাইপটি আলাদা কারণ এটি কেবল চ্যাটের প্রবাহ অনুসরণ করে স্বয়ংক্রিয়ভাবে আপনার উদ্দেশ্য নির্ধারণ করে।
কেন এটা গুরুত্বপূর্ণ
কেন আপনার চিন্তা করা উচিত: যদি আপনি কখনও কোলাহলপূর্ণ রেস্তোরাঁয় কথোপকথন ছেড়ে দিয়ে থাকেন, তাহলে আপনি বুঝতেই পারছেন যে অসুবিধাটা কী। এই প্রযুক্তি অ্যাক্সেসযোগ্যতার ক্ষেত্রে একটি বিশাল পদক্ষেপ হতে পারে, যা শ্রবণশক্তি হ্রাস বা ADHD-এর মতো ঘনত্বজনিত ব্যাধিতে আক্রান্ত ব্যক্তিদের পটভূমির শব্দ সক্রিয়ভাবে ফিল্টার না করেই কথোপকথনে মনোযোগী থাকতে সাহায্য করে।
এরপর কী হবে – হেডফোন থেকে শুরু করে ক্ষুদ্র শ্রবণযন্ত্র পর্যন্ত
প্রযুক্তিটি এখনও নিখুঁত নয়। যখন সবাই একে অপরের সাথে কথা বলে অথবা কেউ দীর্ঘ একক আলোচনা করে তখন এটি কিছুটা সমস্যায় পড়ে। তবে, এটি ইতিমধ্যেই ইংরেজি, ম্যান্ডারিন এবং জাপানি ভাষায় কাজ করে, যা একটি শক্তিশালী শুরু।
বর্তমানে, সিস্টেমটি নিয়মিত ওভার-ইয়ার হেডফোনে চলে যার সাথে অতিরিক্ত মাইক্রোফোন সংযুক্ত থাকে। কিন্তু UW টিম ইতিমধ্যেই এটিকে সঙ্কুচিত করার জন্য কাজ করছে। তাদের সমান্তরাল গবেষণা রয়েছে যা দেখায় যে এই AI মডেলগুলি স্ট্যান্ডার্ড ইয়ারবাড বা হিয়ারিং এইডের ভিতরে ফিট করার জন্য যথেষ্ট ছোট চিপগুলিতে চলতে পারে। যদি তারা এটি কার্যকর করে, তাহলে আমরা এমন একটি ভবিষ্যতের দিকে তাকাতে পারি যেখানে " বুদ্ধিমান শ্রবণশক্তি " দৈনন্দিন জীবনের একটি সাধারণ অংশ মাত্র।
"এআই হেডফোন যা আপনাকে কেবল আপনার প্রিয় মানুষদের শুনতে সাহায্য করে" পোস্টটি প্রথমে ডিজিটাল ট্রেন্ডসে প্রকাশিত হয়েছিল।
