আপনার পরবর্তী ইয়ারবাড আপনার জন্য লেখা অনুবাদ করতে এবং বস্তু শনাক্ত করতে পারবে।

ওয়াশিংটন বিশ্ববিদ্যালয়ের গবেষকরা একটি নতুন প্রোটোটাইপ সিস্টেম তৈরি করেছেন যা দৈনন্দিন জীবনে কৃত্রিম বুদ্ধিমত্তার সাথে মানুষের যোগাযোগের পদ্ধতি বদলে দিতে পারে। ভিউবাডস (VueBuds) নামের এই সিস্টেমটিতে সাধারণ ওয়্যারলেস ইয়ারবাডের মধ্যে ক্ষুদ্র ক্যামেরা যুক্ত করা হয়েছে, যা ব্যবহারকারীদের প্রায় রিয়েল টাইমে তাদের চারপাশের জগৎ সম্পর্কে একটি এআই মডেলকে প্রশ্ন করার সুযোগ দেয়।

ধারণাটি সহজ কিন্তু শক্তিশালী। একজন ব্যবহারকারী কোনো বস্তুর দিকে, যেমন বিদেশি ভাষায় লেখা খাবারের প্যাকেটের দিকে, তাকিয়ে এআই-কে সেটি অনুবাদ করতে বলতে পারেন। প্রায় এক সেকেন্ডের মধ্যেই সিস্টেমটি ইয়ারবাডের মাধ্যমে উত্তর দিয়ে দেয়, যা একটি নির্বিঘ্ন ও হ্যান্ডস-ফ্রি মিথস্ক্রিয়া তৈরি করে।

এআই পরিধানযোগ্য ডিভাইসগুলির প্রতি একটি ভিন্ন দৃষ্টিভঙ্গি

গোপনীয়তার উদ্বেগ এবং নকশার সীমাবদ্ধতার কারণে স্মার্ট গ্লাসের ব্যবহার তেমন জনপ্রিয় হয়নি, কিন্তু ভিউবাডস আরও সূক্ষ্ম একটি পন্থা অবলম্বন করেছে। এই সিস্টেমটি অবিচ্ছিন্ন ভিডিওর পরিবর্তে স্থির চিত্র ধারণ করতে ইয়ারবাডের ভেতরে থাকা কম-রেজোলিউশনের সাদাকালো ক্যামেরা ব্যবহার করে।

এই ছবিগুলো ব্লুটুথের মাধ্যমে একটি সংযুক্ত ডিভাইসে পাঠানো হয়, যেখানে একটি ছোট এআই মডেল সেগুলোকে স্থানীয়ভাবে প্রক্রিয়াজাত করে। ডিভাইসের মধ্যেই এই প্রক্রিয়াজাতকরণ নিশ্চিত করে যে ডেটা ক্লাউডে পাঠানোর প্রয়োজন নেই, যা পরিধানযোগ্য ক্যামেরা নিয়ে অন্যতম বড় একটি উদ্বেগের সমাধান করে।

গোপনীয়তা আরও বাড়াতে, ইয়ারবাডগুলোতে রেকর্ডিং চলাকালীন একটি দৃশ্যমান নির্দেশক বাতি রয়েছে এবং ব্যবহারকারীরা ধারণ করা ছবি তাৎক্ষণিকভাবে মুছে ফেলতে পারেন।

শক্তি এবং কর্মক্ষমতার সীমাবদ্ধতাকে কেন্দ্র করে প্রকৌশল

গবেষণা দলটির অন্যতম বড় চ্যালেঞ্জ ছিল বিদ্যুৎ খরচ। মাইক্রোফোনের তুলনায় ক্যামেরায় অনেক বেশি শক্তি প্রয়োজন হয়, ফলে স্মার্ট গ্লাসে ব্যবহৃত উচ্চ-রেজোলিউশনের সেন্সরগুলো এতে ব্যবহার করা অবাস্তব।

এর সমাধানে, দলটি প্রায় একটি চালের দানার আকারের ক্যামেরা ব্যবহার করে কম-রেজোলিউশনের গ্রেস্কেল ছবি তোলে। এই পদ্ধতিটি ব্যাটারির ব্যবহার কমায় এবং সাড়াদানের গতিতে কোনো আপস না করেই কার্যকর ব্লুটুথ ট্রান্সমিশন সম্ভব করে।

স্থাপনও ছিল আরেকটি গুরুত্বপূর্ণ বিবেচ্য বিষয়। ক্যামেরাগুলোকে সামান্য বাইরের দিকে কাত করে বসানোর ফলে সিস্টেমটি ৯৮ থেকে ১০৮ ডিগ্রির মধ্যে একটি দৃষ্টিসীমা অর্জন করে। যদিও অত্যন্ত কাছে রাখা বস্তুর জন্য একটি ছোট অন্ধ এলাকা থাকে, গবেষকরা দেখেছেন যে এটি সাধারণ ব্যবহারে কোনো প্রভাব ফেলে না।

এই সিস্টেমটি দুটি ইয়ারবাডের ছবিকে একটি ফ্রেমে একত্রিত করে, যা প্রসেসিং গতি বাড়ায়। এর ফলে, ছবিগুলো আলাদাভাবে প্রসেস করার দুই সেকেন্ডের তুলনায় VueBuds প্রায় এক সেকেন্ডের মধ্যে সাড়া দিতে পারে।

স্মার্ট গ্লাসের তুলনায় কর্মক্ষমতা

পরীক্ষায়, ৭৪ জন অংশগ্রহণকারী মেটার রে-ব্যান মডেলের মতো স্মার্ট গ্লাসের সাথে ভিউবাডসের তুলনা করেছেন। কম রেজোলিউশনের ছবি এবং স্থানীয় প্রক্রিয়াকরণ ব্যবহার করা সত্ত্বেও, ভিউবাডস সামগ্রিকভাবে প্রায় একই রকম পারফর্ম করেছে।

প্রতিবেদনে দেখা গেছে, অংশগ্রহণকারীরা অনুবাদের কাজের জন্য ভিউবাডস বেশি পছন্দ করেছেন, অন্যদিকে বস্তু গণনার ক্ষেত্রে স্মার্ট গ্লাস ভালো কাজ করেছে। পৃথক পরীক্ষায়, ভিউবাডস অনুবাদ ও বস্তু শনাক্তকরণের ক্ষেত্রে প্রায় ৮৩-৮৪% এবং বইয়ের শিরোনাম ও লেখক শনাক্তকরণের ক্ষেত্রে ৯৩% পর্যন্ত নির্ভুলতার হার অর্জন করেছে।

কেন এটি গুরুত্বপূর্ণ এবং এরপর কী হবে

গবেষণাটি এআই-চালিত পরিধানযোগ্য ডিভাইসের নকশার পদ্ধতিতে একটি সম্ভাব্য পরিবর্তনের ওপর আলোকপাত করে। মানুষের ব্যবহৃত কোনো ডিভাইসে ভিজ্যুয়াল ইন্টেলিজেন্স যুক্ত করার মাধ্যমে, এই সিস্টেমটি স্মার্ট গ্লাসের সম্মুখীন হওয়া অনেক প্রতিবন্ধকতা এড়াতে পারে।

তবে, কিছু সীমাবদ্ধতা রয়ে গেছে। বর্তমান সিস্টেমটি রং শনাক্ত করতে পারে না এবং এর সক্ষমতা এখনও প্রাথমিক পর্যায়ে রয়েছে। দলটি কালার সেন্সর যুক্ত করা এবং অনুবাদ ও অ্যাক্সেসিবিলিটি সাপোর্টের মতো কাজের জন্য বিশেষায়িত এআই মডেল তৈরির পরিকল্পনা করছে।

গবেষকরা বার্সেলোনায় অনুষ্ঠিতব্য ‘অ্যাসোসিয়েশন ফর কম্পিউটিং মেশিনারি কনফারেন্স অন হিউম্যান ফ্যাক্টরস ইন কম্পিউটিং সিস্টেমস’-এ তাদের গবেষণার ফলাফল উপস্থাপন করবেন, যা এমন এক ভবিষ্যতের আভাস দেবে যেখানে দৈনন্দিন ডিভাইসগুলো নীরবে বুদ্ধিমান সহকারীতে পরিণত হবে।