কেন হেডফোনে ক্যামেরা বড় হচ্ছে? AI গ্যাজেটস

সম্পাদকের মন্তব্য:

যখন AI তার নিজস্ব আকৃতি অনুসন্ধান শুরু করে, তখন এর কিছু পছন্দ অপ্রত্যাশিত হয়।

স্মার্টফোনে কৃত্রিম বুদ্ধিমত্তা (AI) একটি বিশেষ বোতামের ব্যবহার শুরু করেছে, যা তাদের দীর্ঘদিনের হারিয়ে যাওয়া বিবর্তনীয় প্রবণতাকে পুনরুজ্জীবিত করে তুলেছে। চশমা, দৃষ্টিশক্তি এবং শ্রবণশক্তির প্রাকৃতিক অ্যাক্সেসের কারণে, পরবর্তী প্রজন্মের ব্যক্তিগত টার্মিনালের মতো হতে শুরু করেছে। কিছু ছোট, ফোকাসড ডিভাইস নির্দিষ্ট সময়ে অল-ইন-ওয়ান ডিভাইসের চেয়ে বেশি নির্ভরযোগ্য বলে মনে হয়। ইতিমধ্যে, স্মার্টফোনগুলিকে ডিসপোজেবল ডিভাইস দিয়ে প্রতিস্থাপনের আমূল প্রচেষ্টাগুলি ঠান্ডা সাড়া পেয়েছে।

প্রযুক্তির বাস্তবায়ন কখনই কেবল ফাংশনগুলিকে একত্রিত করার বিষয় নয়; এটি মানুষের অভ্যাস, পরিস্থিতির সামঞ্জস্য এবং "ব্যবহারে সহজ" এর পুনঃসংজ্ঞা সম্পর্কেও।

iFanr " AI Gadgets Chronicle" কলামটি চালু করেছে, যার লক্ষ্য হল আপনার সাথে অন্বেষণ করা যে AI কীভাবে হার্ডওয়্যার ডিজাইন পরিবর্তন করছে, মানব-কম্পিউটার মিথস্ক্রিয়াকে নতুন আকার দিচ্ছে এবং আরও গুরুত্বপূর্ণভাবে, AI কীভাবে আমাদের দৈনন্দিন জীবনে প্রবেশ করবে।


বছরটি শেষ হতে চলেছে, লাইটসেল টেকনোলজি, একটি পূর্বে স্বল্প পরিচিত স্টার্টআপ, এমন একটি পণ্য প্রকাশ করেছে যা কিছুটা বিপরীতমুখী বলে মনে হচ্ছে: লাইটওয়্যার এআই অল-সেন্স স্মার্ট স্যুট (এরপর থেকে লাইটওয়্যার হিসাবে উল্লেখ করা হয়েছে)।

সাধারণভাবে বলতে গেলে, এটি স্মার্ট ইয়ারফোন এবং একটি স্মার্টওয়াচের একটি সেট। তবে নির্দিষ্ট বিবরণগুলি আরও আকর্ষণীয়:

প্রথমত, প্রতিটি ইয়ারবাডে একটি ২-মেগাপিক্সেল ক্যামেরা থাকে এবং ভিজ্যুয়াল ফাংশনের জন্য পর্যাপ্ত ব্যাটারি লাইফ নিশ্চিত করার জন্য প্রতিটি ইয়ারবাডের ওজন ১১ গ্রাম। স্মার্টওয়াচটি একটি ডিসপ্লে টার্মিনাল এবং একটি অতিরিক্ত ইন্টারেক্টিভ ইনপুট টুল উভয়ই কাজ করে। তবে, এই কিটের স্মার্ট হাবটি অবশ্যই একটি ফোন নয়, বরং বিল্ট-ইন eSIM ক্ষমতা এবং একটি GPS চিপ সহ ইয়ারবাড কেস, যা স্মার্টওয়াচগুলিকে সরাসরি এর সাথে সংযুক্ত করতে দেয়।

এর মানে হল লাইটওয়্যার ফোন থেকে সম্পূর্ণরূপে বিচ্ছিন্ন হয়ে স্বাধীনভাবে কাজ করতে পারে।

এই অনন্য নকশা ধারণাটি শিল্পে অভূতপূর্ব। ইয়ারফোনে ঝুলন্ত এবং কানের পাশে রাখা উন্মুক্ত ক্যামেরাটি ক্যামেরা সহ স্মার্ট চশমার চেয়ে সাধারণ নান্দনিকতার জন্য আরও বেশি চ্যালেঞ্জিং, এবং এটি সংবেদনশীল গোপনীয়তার বিষয়গুলিকেও স্পর্শ করে।

তবে, যদি আমরা দেখি যে আগামী ৫-১০ বছরে সমগ্র প্রযুক্তি এবং ভোক্তা ইলেকট্রনিক্স শিল্প কোন দিকে যাচ্ছে, তাহলে আপনি দেখতে পাবেন যে OpenAI, Meta, Alibaba Quark, Li Auto এবং Apple-এর একই রকম পণ্য সংজ্ঞার উপর ঐক্যমত্য রয়েছে—এবং Guangfan Technology এই বিশাল এবং বৃহৎ কোম্পানিগুলির আগে এই ঐক্যমত্যকে উৎপাদনে নেতৃত্ব দিয়েছে।

অন্য কথায়, AI-কে সত্যিকার অর্থে বিশ্বকে বুঝতে হবে; কেবল মাইক্রোফোনই এখন যথেষ্ট নয়।

অন্যদিকে, এই ঐক্যমত্য হল যে মডেলগুলির মাল্টিমডাল ক্ষমতাগুলি পণ্য নকশাকে মডেলগুলির চাহিদা পূরণ করতে বাধ্য করছে

অন্য কথায়, গুয়াংফ্যানের মতো ক্যামেরা-সজ্জিত হেডফোন হোক বা বহুলভাবে গৃহীত কিন্তু বিতর্কিত স্মার্ট চশমা, এই পণ্যের ধরণগুলি মডেলিং ক্ষমতা দ্বারা চালিত হওয়ার ফলাফল এবং নান্দনিকতার সাথে এর কোনও সম্পর্ক নেই।

Xiaomi থেকে বেরিয়ে এসেছে একটি AI হার্ডওয়্যার কোম্পানি

গুয়াংফান টেকনোলজি ২০২৪ সালের অক্টোবরে প্রতিষ্ঠিত হয়। এর প্রতিষ্ঠাতা, ডং হংগুয়াং, শাওমি গ্রুপের প্রতিষ্ঠাতা সদস্য এবং এর ৮৯তম কর্মচারী ছিলেন। শাওমিতে তার ১৪ বছরের কর্মজীবনে, তিনি MIUI, কুইক অ্যাপস, স্ব-উন্নত মোবাইল ফোন এবং অটোমোটিভ অপারেটিং সিস্টেমের মতো উচ্চ-স্তরের প্রকল্পগুলির গবেষণা ও উন্নয়নে মূল ভূমিকা পালন করেন।

কোম্পানির আনুষ্ঠানিক ভূমিকা অনুসারে, প্রতিষ্ঠাতা দলটি একটি সাধারণ "হাই-পি টিম", যা Xiaomi ছাড়াও, Huawei, ByteDance, Alibaba এবং Tencent এর মতো কোম্পানির সিনিয়র বিশেষজ্ঞদের একত্রিত করে এবং তাদের গভীর সফ্টওয়্যার, হার্ডওয়্যার এবং AI উন্নয়ন ক্ষমতা রয়েছে।

আরও উল্লেখযোগ্য বিষয় হল মূলধন সঞ্চয়ের গতি। তিন মাসের মধ্যে, গুয়াংফান টেকনোলজি দ্রুত ১৩০ মিলিয়ন আরএমবি অর্থায়নের দুটি রাউন্ড সম্পন্ন করেছে, যার বিনিয়োগ-পরবর্তী মূল্যায়ন ৫০০ মিলিয়ন আরএমবি ছাড়িয়ে গেছে। বিনিয়োগকারীদের মধ্যে বৈরুই ক্যাপিটাল (সিএটিএল-এর ভাইস চেয়ারম্যান লি পিং কর্তৃক প্রতিষ্ঠিত), শোকজ, টংগে ভেঞ্চার ক্যাপিটাল (গোয়ের্টেকের অধীনে), কিংহুই ইনভেস্টমেন্ট, সিডিএইচ ইনভেস্টমেন্টস, আলফা কমিউন এবং ইনোএঞ্জেলের মতো সুপরিচিত তহবিল এবং প্রতিষ্ঠান অন্তর্ভুক্ত ছিল।

শিল্প মূলধনের সাথে জড়িত থাকা বেশ উল্লেখযোগ্য, বেশিরভাগই অডিও এবং উচ্চ-প্রযুক্তি উৎপাদনকারী জায়ান্ট: শোকজ হাড়ের পরিবাহী এবং ওপেন-ব্যাক হেডফোনের বাজারের ৫০% এরও বেশি অংশ ধারণ করে, গোয়ারটেক পরিধানযোগ্য ডিভাইসের জন্য শীর্ষস্থানীয় ওডিএম, কিংহুই ইনভেস্টমেন্ট একটি শীর্ষস্থানীয় স্টোরেজ কোম্পানি গিগাডিভাইস দ্বারা সমর্থিত, এবং CATL-এর আর কোনও পরিচয়ের প্রয়োজন নেই।

এই শিল্প রাজধানীগুলির সম্পৃক্ততা কেবল কোম্পানি এবং এই এখনও অপরিণত মডেলটিকেই পরীক্ষা-নিরীক্ষার সুযোগ করে দেয় না, বরং শিল্প জায়ান্টদের অগ্রিম পরিকল্পনাও প্রদর্শন করে।

ক্যামেরাটি এমনভাবে তৈরি যাতে AI আপনি যা দেখছেন তা দেখতে পারে।

গত ২০ বছর ধরে, মানব-কম্পিউটার মিথস্ক্রিয়ার মূল সূত্রটি স্ফটিকের মতো স্পষ্ট: টাইপ করা, স্ক্রিন স্পর্শ করা, ছবি তোলা, আপলোড করা এবং তারপর ডিভাইসের প্রতিক্রিয়ার জন্য অপেক্ষা করা। যদিও আজকের ডিভাইসগুলিতে তৈরি সফ্টওয়্যার এবং পরিষেবাগুলি অনেক কিছু করতে পারে এবং খুব শক্তিশালী, মিথস্ক্রিয়ার যুক্তি পরিবর্তিত হয়নি: আপনি ডিভাইসটি নিয়ন্ত্রণ করেন এবং ডিভাইসটি আপনাকে প্রতিক্রিয়া দেয়।

গত ৩-৫ বছরে বৃহৎ ভাষা মডেলের উপর ভিত্তি করে কৃত্রিম বুদ্ধিমত্তার সাম্প্রতিক তরঙ্গ এই যুক্তিকে সম্পূর্ণরূপে বদলে দিয়েছে। যেহেতু এই মডেলগুলির মাল্টিমোডাল তথ্য প্রক্রিয়া করার ক্ষমতা, ছবি, শব্দ এবং পাঠ্যের মধ্যে সম্পর্ক বোঝার ক্ষমতা এবং "মানব স্বজ্ঞাততার" কাছাকাছি ক্ষমতা রয়েছে, তাই বৃহৎ মডেল দ্বারা চালিত কৃত্রিম বুদ্ধিমত্তা পণ্যগুলি ব্যবহারকারীদের এবং তাদের বসবাসকারী ডিজিটাল জগতের সাথে আরও সক্রিয়ভাবে যোগাযোগ করতে পারে – এমনকি বাস্তব জগতের সাথেও।

সিলিকন ভ্যালির জায়ান্ট যেমন ওপেনএআই, অ্যাপল এবং মেটা থেকে শুরু করে দেশীয় প্রধান নির্মাতারা পর্যন্ত, ক্যামেরাযুক্ত এআই ডিভাইসগুলি একটি ঐক্যমত্য হয়ে উঠেছে। এর পেছনের কারণটি সহজ: "আপনার বর্ণনা করা বিশ্ব" ভয়েস ধারণ করে, কিন্তু একটি ক্যামেরার সাহায্যে, এআই সত্যিই বুঝতে পারে "আপনি কোথায় আছেন," "আপনার সামনে কী আছে," এবং "বিশ্বে কী ঘটছে।"

তৃতীয় পক্ষের ডিজাইন করা OpenAI হেডফোন ধারণার ছবি

তৃতীয় পক্ষের ডিজাইন করা OpenAI হেডফোন ধারণার ছবি

এখানে প্রশ্ন হল: AI-এর কিছু বোঝার জন্য কি আমাকে প্রতিবার আমার ফোনটি বের করতে হবে? ক্যামেরা রাখার জন্য এর চেয়ে ভালো জায়গা আর কি নেই?

কেবল দুটি ব্যবহারিক বিকল্প বাকি আছে: এটি আপনার মাথায় পরুন, অথবা এটি আপনার শরীরে আটকে দিন।

২০২৫ সালের শেষ নাগাদ, আমরা ইতিমধ্যেই উভয় ক্ষেত্রেই অসংখ্য চেষ্টাকারী, ব্যর্থ, নেতা এবং পিছিয়ে পড়া ব্যক্তিদের দেখতে পাব।

ব্যক্তিগত ডিভাইসের ক্ষেত্রে, হিউম্যান এআই পিন এবং র‍্যাবিট আর১ একসময় সিলিকন ভ্যালিতে "পরবর্তী আইফোন" হিসেবে সমাদৃত হয়েছিল। তবে, এগুলি খুব তাড়াতাড়ি বাজারে আনা হয়েছিল এবং খারাপ পারফর্মেন্সের কারণে তাদের অকাল মৃত্যু হয়েছিল। তবুও, এই ক্ষেত্রে ক্রমাগত উদ্ভাবনের ধারা অব্যাহত রয়েছে, যেমন লুকি, যা সম্প্রতি দেশীয় বাজারে পুনরায় রপ্তানি করা হয়েছে।

মানুষ এক দশকেরও বেশি সময় আগে জনপ্রিয় গুগল গ্লাস এবং ভিআর হেডসেটগুলির কথা মনে করছে, এবং এই দুটির সমন্বয়ের ফলে স্মার্ট চশমার একটি নতুন প্রজন্ম তৈরি হয়েছে। বর্তমানে, সিলিকন ভ্যালিতে এই বিভাগটিকে সোনার মান হিসাবে বিবেচনা করা হয় এবং যেহেতু এটি নিত্যদিনের চশমার সাথে নির্বিঘ্নে একত্রিত করা যায়, তাই এটি তুলনামূলকভাবে বেশি গ্রহণযোগ্যতা উপভোগ করে। তবে, কেউ কেউ এখনও বিশ্বাস করেন যে স্মার্ট চশমা আদর্শ নয় এবং স্মার্টফোনের জন্য এটি সত্যিকারের বিকল্প হয়ে উঠবে না।

তারপর এলো হেডফোন। স্মার্টফোন, পরিধেয় ডিভাইস এবং স্মার্ট চশমার মধ্যে, হেডফোনগুলি একটি সূক্ষ্ম অবস্থান দখল করে: সমাজ তাদের দীর্ঘমেয়াদী পরিধেয়তাকে নীরবে গ্রহণ করেছে, যদিও তারা স্বাভাবিকভাবেই "দৃষ্টি" এবং "শ্রবণ" এই দুটি মূল ইন্দ্রিয়ের সাথে সামঞ্জস্যপূর্ণ। এটি তাদেরকে AI এর ইন্দ্রিয়গ্রাহ্য কম্পিউটিং ক্ষমতার জন্য একটি সম্ভাব্য বাহক এবং AI হার্ডওয়্যারের পরবর্তী তরঙ্গের জন্য একটি পরীক্ষার ক্ষেত্র করে তোলে।

হেডফোনগুলি চোখ এবং কানের কাছাকাছি থাকে এবং ভোক্তাদের সচেতনতা প্রতিষ্ঠিত হয়েছে, যার ফলে এর ব্যবহার ব্যাপকভাবে গ্রহণযোগ্যতা পেয়েছে। আরও গুরুত্বপূর্ণ বিষয় হল, চশমার (যার ওজন কমপক্ষে ৪০ গ্রাম) স্পষ্টতা এবং ওজনের তুলনায়, লাইটওয়্যার হেডফোনগুলি কেবল হালকা নয় (প্রতি ইয়ারবাডে ১১ গ্রাম), বরং, যদিও ক্যামেরা যুক্ত হওয়ার ফলে এগুলি কিছুটা "বিদেশী" দেখায়, তবুও সামাজিক পরিস্থিতিতে চশমার তুলনায় তাদের উপস্থিতি কমপক্ষে কম লক্ষণীয়।

ব্যবহারকারী-প্রথম থেকে মডেল-প্রথম পণ্য যুক্তিতে

শুধুমাত্র ভয়েস রিকগনিশনের উপর নির্ভরশীল এআই হেডফোনগুলি তুলনামূলকভাবে সমৃদ্ধ বাজারে পৌঁছেছে এবং স্পষ্টতই একটি বাধার পর্যায়ে প্রবেশ করেছে। আইফ্যানরের পর্যবেক্ষণ অনুসারে, বাজারে থাকা বেশিরভাগ তথাকথিত এআই হেডফোনের দাম প্রায় ১,০০০ ইউয়ান বা তার কম, মূলত এআই অনুবাদের পরিস্থিতির উপর দৃষ্টি নিবদ্ধ করে, এবং তাদের কার্যকারিতা ক্রমশ একজাত হয়ে উঠছে।

গুয়াংফ্যান যা কল্পনা করেছিল এবং লাইটওয়্যার দিয়ে যা করেছে তা সাধারণ হেডফোনগুলির থেকে অনেক আলাদা। সাধারণ হেডফোনগুলি "শ্রবণশক্তি" এর ক্ষেত্রে আবদ্ধ বলে মনে হয়, কিন্তু গুয়াংফ্যান আরও এক ধাপ এগিয়ে গিয়ে একটি গভীর প্রশ্ন বিবেচনা করেছে: AI-এর আরও প্রেক্ষাপট প্রয়োজন, আমি কি হেডফোনের মাধ্যমে এটি পেতে পারি?

এই প্রশ্নের উত্তর আসলে AI যুগে মিথস্ক্রিয়া পদ্ধতির মৌলিক পরিবর্তনের মধ্যে নিহিত।

কম্পিউটার থেকে শুরু করে মোবাইল ফোন, আমরা GUI (গ্রাফিক্যাল ইউজার ইন্টারফেস) এর যুগে বাস করছি, যেখানে স্ক্রিন, বোতাম এবং আইকন অপরিহার্য কারণ আমরা প্রতিটি বস্তুর সাথে যোগাযোগ করলেই তা সঠিকভাবে নিয়ন্ত্রণ করতে পারি।

কিন্তু জেনারেটিভ এআই এই যুক্তি পরিবর্তন করে: মিথস্ক্রিয়া সম্পূর্ণরূপে প্রাকৃতিক ভাষার উপর নির্ভর করতে পারে। আপনি সিস্টেমকে অস্পষ্ট নির্দেশনা দেন, এবং সিস্টেমটি অস্পষ্ট কিন্তু ব্যবহারযোগ্য ফলাফলের সাথে সাড়া দেয়। উচ্চ-ফ্রিকোয়েন্সি যোগাযোগ এবং প্রতিক্রিয়া আরও গুরুত্বপূর্ণ হয়ে ওঠে, যখন নির্ভুলতা কম গুরুত্বপূর্ণ হয়ে ওঠে – এটি হল NUI (প্রাকৃতিক ব্যবহারকারী ইন্টারফেস)। কথা বলা এবং শোনা আরও স্বাভাবিক হয়ে ওঠে। গ্রাফিক্যাল ইন্টারফেস অপ্রয়োজনীয় হয়ে ওঠে।

এই নতুন ইন্টারঅ্যাকশন প্যারাডাইমটি হেডফোনের জন্য নিখুঁতভাবে যুক্তিসঙ্গত: হেডফোনের ওজন ১০ গ্রাম বা তারও কম হতে পারে, যা এগুলি পরতে আরামদায়ক করে তোলে, দীর্ঘ ব্যাটারি লাইফ সহ, এবং সর্বদা অনলাইনে থাকে। এটি আপনার শরীরে একটি স্মার্ট এক্সটেনশন থাকার মতো, সর্বদা অনলাইনে এবং ব্যবহারের জন্য প্রস্তুত।

কিন্তু এই বুদ্ধিমান অ্যাড-অনে একটি জিনিসের অভাব রয়েছে: মানুষের মতো, এটিরও পর্যাপ্ত তথ্য গ্রহণ করা প্রয়োজন। এবং উপলব্ধির সমস্ত মাত্রার মধ্যে, দৃষ্টি তথ্যের দিক থেকে সবচেয়ে সমৃদ্ধ এবং গুরুত্বপূর্ণ।

অতএব, উপসংহারটি স্পষ্ট – হেডফোনগুলিতে একটি ক্যামেরা যুক্ত করা দরকার।

লঞ্চ ইভেন্টে, লাইটসেল লাইটওয়্যারের সেন্সিং ক্ষমতার ব্যবহারিক প্রয়োগগুলি প্রদর্শন করে। এই পরিস্থিতিতে দৈনন্দিন জীবন এবং কাজের ক্ষেত্রে উচ্চ-ফ্রিকোয়েন্সি চাহিদাগুলি অন্তর্ভুক্ত ছিল:

  • O2O পরিস্থিতি: যখন একজন ব্যবহারকারী ডিভাইসটি জাগিয়ে জিজ্ঞাসা করে, "আপনি কি এই জায়গাটি দেখতে পারেন?" তখন ইয়ারফোনটি ক্যামেরা ব্যবহার করে তাদের সামনে থাকা রেস্তোরাঁর সাইনবোর্ডটি শনাক্ত করে, অবস্থান নিশ্চিত করতে GPS পজিশনিং একত্রিত করে এবং AI পণ্য দ্বারা সঞ্চিত মেমরিকে একত্রিত করে ব্যক্তিগতকৃত স্বাদ তুলনা করে, কাছাকাছি আরও ভালো রেস্তোরাঁর সুপারিশ করে এবং সক্রিয়ভাবে একটি নম্বর নেয় এবং কল করার সময় বুদ্ধিমান অনুস্মারক প্রদান করে।
  • ব্যবসায়িক ভ্রমণ: ব্যবসায়িক ভ্রমণের টেক্সট মেসেজ/ইমেল পাওয়ার পর, লাইটওয়্যার আপনার ভ্রমণপথের সময়সূচী সক্রিয়ভাবে নির্ধারণ করতে পারে, সময়সূচী দ্বন্দ্ব সনাক্ত করতে এবং সমাধান করতে পারে, বুদ্ধিমত্তার সাথে টেক্সট মেসেজ/ইমেলের উত্তর দিতে পারে, ফ্লাইট এবং হোটেল অনুসন্ধান এবং বুক করতে পারে এবং বুকিং প্রক্রিয়ার শেষ মাইলটি সম্পূর্ণ করতে পারে।
  • কেনাকাটা: যখন ব্যবহারকারীরা তাদের আগ্রহের কোনও পণ্য দেখেন, তখন তাদের কেবল একটি প্রশ্ন জিজ্ঞাসা করতে হয় এবং হেডসেটটি সরাসরি পণ্যটিকে দৃশ্যত চিনতে পারে, অনলাইনে দাম তুলনা করতে পারে, কার্টে যোগ করতে পারে, এমনকি সরাসরি অর্ডারও দিতে পারে।
  • প্রতিদিনের অনুস্মারক: ব্যবহারকারীদের তাদের সময়সূচীর (যেমন গুরুত্বপূর্ণ বার্ষিকী) উপর ভিত্তি করে সক্রিয়ভাবে ঘুম থেকে উঠুন এবং মনে করিয়ে দিন।

পুরো প্রক্রিয়া জুড়ে, ব্যবহারকারীদের তাদের ফোন খুলতে হবে না, অ্যাপে প্রবেশ করতে হবে না, এমনকি তারা কী চায় তা স্পষ্টভাবে বলতে হবে না – AI প্রয়োজনীয় প্রসঙ্গটি নিজেই সম্পন্ন করার জন্য দৃশ্যমান এবং ভৌগোলিক তথ্য একত্রিত করে।

এই ধরণের ডিভাইসগুলি স্বাভাবিকভাবেই নিম্নলিখিত পরিস্থিতিগুলির জন্য উপযুক্ত: এমন জিনিস যা আপনি সঠিকভাবে বর্ণনা করতে পারবেন না ("এটি" বা "না, এটি এর পাশেরটি"); এমন পরিস্থিতি যেখানে ছবি তোলার জন্য আপনার ফোনটি বের করা মূল্যবান নয়, অথবা এমন পরিস্থিতি যেখানে আপনার ফোনটি বের করলে আপনার "প্রবাহ" অবস্থা ব্যাহত হবে (হাঁটা, কোনও প্রদর্শনীতে যাওয়া, রান্না করা ইত্যাদি) ইত্যাদি।

২ মেগাপিক্সেল কি যথেষ্ট? হ্যাঁ, তাই, কারণ ছবিগুলো মডেলের দেখার জন্য।

যদি আমরা ঐতিহ্যবাহী বিদ্যুৎ-সাশ্রয়ী পণ্যের দৃষ্টিকোণ থেকে লাইটওয়্যার পরীক্ষা করি, তাহলে এর অবশ্যই অনেক অসুবিধা রয়েছে: উন্মুক্ত ক্যামেরা, গোপনীয়তার উদ্বেগ বাড়ায়; নিয়মিত হেডফোনের চেয়ে ভারী, সারাদিনের পোশাক ব্যবহারকে অবাস্তব করে তোলে; সামাজিক চাপ; এবং এটি সহজেই গুগল গ্লাস এবং এআই পিনের মতো ব্যর্থ পণ্যের সাথে তুলনা করে…

তবে, এটি সম্পূর্ণরূপে মূল বিষয়টি এড়িয়ে যায়। হেডফোনে ক্যামেরা যুক্ত করা আসলে AI এর বোঝার দক্ষতা বৃদ্ধি করে। ক্যামেরাটি নিজেই মানুষের ব্যবহারের জন্য নয়। ডিজাইনের শুরু বিন্দু হল মডেলটিকে পরিবেশন করা। মডেলটির আরও ধারাবাহিক, আরও সময়োপযোগী ভিজ্যুয়াল প্রবাহ এবং আরও বাস্তবসম্মত FPV প্রয়োজন।

এখানে একটি গুরুত্বপূর্ণ নকশা বৈশিষ্ট্য লক্ষ্য করার মতো: লাইটওয়্যারের ক্যামেরাটি একটি "অদৃশ্য বার্তা" চিত্র প্রক্রিয়াকরণ প্রক্রিয়া ব্যবহার করে।

লাইটওয়্যার সিস্টেম ডিজাইনে, আপনি "ছবি তোলার" উদ্দেশ্যে ইয়ারবাডগুলিকে ছবি তোলার নির্দেশ দিতে পারবেন না। এর কারণ হল ক্যামেরাটি সম্পূর্ণরূপে AI-এর জন্য কাজ করে, যা রিয়েল-টাইম ভিজ্যুয়াল প্রেক্ষাপট বোঝার জন্য ব্যবহৃত হয়। ছবির ফাইলগুলি স্থানীয়ভাবে বা ক্লাউডে সংরক্ষণ করা হয় না; সেগুলিকে "ব্যবহার করুন এবং অদৃশ্য হয়ে যান" হিসাবে বোঝা যেতে পারে। এই নকশার মূলে বেশ কয়েকটি বিবেচনা রয়েছে:

স্পষ্টতই, এই নকশায় প্রাথমিক বিবেচ্য বিষয় হল গোপনীয়তা সুরক্ষা। ছবির ফাইল সংরক্ষণ না করে, গোপনীয়তা ফাঁস মৌলিকভাবে রোধ করা যেতে পারে, এবং ব্যবহারকারীদের তাদের দৈনন্দিন জীবনের ভিডিও ধারণ করা বা এমনকি "গোপনে" ছবি তোলা এবং অপ্রত্যাশিত পরিস্থিতিতে সংরক্ষণ করা নিয়ে চিন্তা করার দরকার নেই।

তদুপরি, ছবি সংরক্ষণ না করলে খরচ উল্লেখযোগ্যভাবে বেড়ে যায়: যেহেতু এটি স্তন দেখার জন্য তৈরি, তাই ছবির মান মানুষের মান পূরণ করার প্রয়োজন নেই। বস্তু শনাক্তকরণ এবং দৃশ্য বোঝার জন্য 2 মেগাপিক্সেল যথেষ্ট, এবং কম পিক্সেল গণনা দ্রুত প্রক্রিয়াকরণের গতি, কম বিদ্যুৎ খরচ এবং কম স্টোরেজ এবং ব্যান্ডউইথ খরচের দিকে পরিচালিত করে। বর্তমানে, ডিভাইসটি 9-15 ঘন্টা ব্যাটারি লাইফ অফার করে, যা সারাদিন ব্যবহারের জন্য যথেষ্ট।

অবশ্যই, আমার দাবি যে এই পণ্যটি ব্যবহারকারীর চেয়ে মডেলটিকে অগ্রাধিকার দেয় তা কেবল আমার ব্যক্তিগত মতামত। গুয়াংফান সহ অন্যদের ভিন্ন মতামত থাকতে পারে। লঞ্চ ইভেন্টে, ডং হংগুয়াং জোর দিয়েছিলেন যে এআই হার্ডওয়্যারের "প্রযুক্তি থেকে এক ধাপ পিছিয়ে আসা উচিত এবং মানুষকে কেন্দ্রে রাখা উচিত", কিন্তু প্রকৃত পণ্যটি, অন্তত আমার যুক্তিতে, দেখায় যে প্রযুক্তি প্রথমে আসে।

কিন্তু আজকাল, কোন AI হার্ডওয়্যার এই দ্বন্দ্বের অনুভূতি এড়াতে পারে?

এখানে আমরা সাহসের সাথে একটি বিবৃতি দিতে পারি: সমস্ত AI হার্ডওয়্যার, এখন এবং ভবিষ্যতের জন্য, একটি মডেল-প্রথম পদ্ধতির সাথে সংজ্ঞায়িত করা উচিত, মডেলের প্রয়োজনীয়তা পূরণকে পণ্য সংজ্ঞার প্রাথমিক সূচনা বিন্দু হিসাবে গ্রহণ করা উচিত।

যেহেতু আমরা AI মডেলগুলিকে ইলেকট্রনিক হার্ডওয়্যার পণ্যের সাথে একত্রিত করার ক্ষমতার সীমানা অন্বেষণ থেকে অনেক দূরে, তাই কোন সন্দেহ নেই যে আমরা ভবিষ্যতে লাইটওয়্যারের মতো আরও জিনিস দেখতে পাব – এমন জিনিস যাকে আপনি "ফ্রাঙ্কেনস্টাইনের দানব"ও বলতে পারেন।

যদিও বেশিরভাগই পরীক্ষামূলক এবং ত্রুটিপূর্ণ, কেবলমাত্র আরও বেশি প্রচেষ্টা করার মাধ্যমেই এই পণ্য কোম্পানিগুলি সত্যিকার অর্থে তাদের সীমানা খুঁজে পেতে এবং আরও ভাল অভিজ্ঞতা প্রদান করতে পারে।

উপসংহারে

অবশ্যই, লাইটওয়্যার এখনও একটি বৈধ পণ্য যা বাজারে আসতে চলেছে। এই সেটটি সস্তা নয়, এবং আমি এখানে লাইটওয়্যারকে খুব বেশি রেটিং দিতে চাই না, যাতে কারও ভুল ধারণা না হয়।

সংবাদ সম্মেলনে, আমরা "ইঞ্জিনিয়ারিং প্রোটোটাইপ" হাতে পেলাম, যার মধ্যে ছিল উচ্চ-ফ্রিকোয়েন্সি, প্রয়োজনীয় পরিস্থিতি যেমন সময়সূচী ব্যবস্থাপনা, বার্তা অনুস্মারক রিলে, ভ্রমণ বুকিং, রাইড-হেলিং, রেস্তোরাঁ পর্যালোচনা তথ্য এবং সারিবদ্ধকরণ, ভিজ্যুয়াল অনুসন্ধান/শপিং কার্টে আইটেম যুক্ত করা, এবং এগুলি সবই সুচারুভাবে চলেছিল।

তবে, চার্জিং কেসের (eSIM 4G নেটওয়ার্ক) সাথে ইয়ারফোনের সরাসরি সংযোগ এবং ইভেন্টে সাধারণত খারাপ নেটওয়ার্ক অবস্থার কারণে, কথোপকথনের সময় লেটেন্সি এখনও বেশ লক্ষণীয় ছিল, যা *Her* সিনেমায় দেখা আদর্শ সংলাপের ছন্দের তুলনায় কম ছিল। ইভেন্টের প্রকৌশলীরা প্রকাশ করেছেন যে ইঞ্জিনিয়ারিং প্রোটোটাইপের অভিজ্ঞতা আগামী বছরের প্রথম প্রান্তিকে মুক্তির জন্য নির্ধারিত খুচরা সংস্করণের স্তরের প্রায় 70-80%।

সত্যি কথা বলতে, লাইটওয়্যার অভিজ্ঞতা লাভের পর, আমি এটি বেশ সন্তোষজনক বলে মনে করেছি। আমার মনে হয় না যে ওপেনএআই এবং অ্যাপল যে "ক্যামেরা সহ এআই হেডফোন" পরিকল্পনা করছে, যা আনুষ্ঠানিকভাবে ২০২৬ বা ২০২৭ সালে প্রকাশিত হতে পারে, তা লাইটওয়্যারের সমাধানের চেয়ে উল্লেখযোগ্যভাবে ভালো অভিজ্ঞতা প্রদান করবে।

এর সাথে পণ্যের শক্তি বা প্রকৌশলগত ক্ষমতার কোনও সম্পর্ক নেই; এটি কেবল কারণ এই পণ্য ফর্মের বর্তমান সম্ভাবনা সীমিত। যে কেউ এই ফাংশনগুলি বাস্তবায়ন করতে পারে, এবং গুয়াংফানের মতো একটি চীনা দল, যা শাওমি থেকে উদ্ভূত, কেবল এটি আরও ভালভাবে করতে সক্ষম হওয়া উচিত।

যদি আপনি আমাকে জিজ্ঞাসা করেন যে এই ধরণের এআই হার্ডওয়্যার সম্পর্কে আমি কী ভাবি, আমার উত্তর হল: অত্যন্ত যুক্তিসঙ্গত, যথেষ্ট মার্জিত নয়, এবং সম্ভবত চূড়ান্ত রূপ নয়।

  • অত্যন্ত যুক্তিসঙ্গত: কারণ এটি মাল্টিমোডাল এজেন্টদের হার্ডওয়্যারের সাথে একত্রিত করার প্রাসঙ্গিক চ্যালেঞ্জগুলিকে সঠিকভাবে মোকাবেলা করে। ভিজ্যুয়াল উপলব্ধি ছাড়া AI বাস্তব জগৎ বুঝতে পারে না;
  • সৌন্দর্যের অভাব: পণ্যটির বডি AirPods-এর চেয়ে বড়, যা কিছুটা সামাজিক চাপ তৈরি করতে পারে। সাধারণ ব্যবহারকারীদের জন্য, এটি কেনার পরে ধুলো জমার কারণও হতে পারে;
  • চূড়ান্ত রূপ নয়: পূর্ববর্তী বিষয়টি অনুসরণ করে, বর্তমান লাইটওয়্যারটি অনেকটা প্রাথমিক এবং ক্রান্তিকালীন পণ্যের মতো। আমরা কল্পনা করতে পারি যে একটি পরিপক্ক পণ্য কেমন হওয়া উচিত: ক্যামেরাটি আরও কমিয়ে প্রায় অদৃশ্য আকারে পরিণত হবে, যা পুরো পণ্যটিকে AirPods-এর মতো করে তুলবে—এমন একটি পণ্য যা সমাজে ব্যাপকভাবে গৃহীত। আমাদের এই বিষয়ে চিন্তা করার দরকার নেই; স্মার্ট চশমা এবং রেকর্ডিং কার্ডের অভিজ্ঞতার কথা বলতে গেলে, প্রথমে এগুলো বেশ ভারী ছিল, কিন্তু বাজার উত্তপ্ত হওয়ার সাথে সাথে সরবরাহ শৃঙ্খলের উন্নতির সাথে সাথে সমাধানগুলি আরও পরিপক্ক হয়ে উঠবে।

অধিকন্তু, লাইটওয়্যার বর্তমানে লাইটওয়্যার ওএস নামক একটি স্ব-উন্নত এআই অপারেটিং সিস্টেমে চলে, যা বিভিন্ন বৃহৎ ভাষা মডেল/মাল্টিমোডাল মডেল, এমসিপি, এপিআই-এর সাথে সংযোগ স্থাপন করতে পারে এবং ফোন/ব্রাউজার ব্যবহারের ক্ষমতা ইত্যাদি রয়েছে। অতএব, ভবিষ্যতে ক্যামেরা হেডসেট ফর্ম ফ্যাক্টরটি অকার্যকর প্রমাণিত হলেও, লাইটওয়্যার ওএস দ্রুত চশমা বা অন্যান্য ক্যারিয়ারে স্থানান্তরিত করা যেতে পারে।

এআই এয়ারপডস থেকে শুরু করে ক্যামেরাবাডস, যা বেশ কয়েক বছর ধরে তৈরি হচ্ছে বলে গুজব রয়েছে, এমনকি ওপেনএআই যে রহস্যময় নতুন হার্ডওয়্যার নিয়ে এসেছেন যার উপর কাজ করার জন্য প্রাক্তন অ্যাপল ডিজাইন কিংবদন্তি জনি আইভ – এই পণ্যগুলি সম্পর্কে গুজবগুলি কাকতালীয়ভাবে ক্যামেরা-সজ্জিত হেডফোনের কথা উল্লেখ করে। এটি অবশ্যই কোনও সাধারণ কাকতালীয় ঘটনা নয়, বরং "মহান মন একইভাবে চিন্তা করে" এর একটি ঘটনা।

এত তাড়াতাড়ি কিন্তু ইতিমধ্যেই তীব্র প্রতিযোগিতামূলক বাজারে, গুয়াংফ্যানের একটি অত্যন্ত ব্যবহারযোগ্য পণ্যের উন্মোচন নিজেই একটি উত্তেজনাপূর্ণ বিষয়।

প্রযুক্তিগত বিবর্তনের অনিবার্য পথের দৃষ্টিকোণ থেকে, এটি অনিবার্য যে একটি বিপ্লবী পণ্য বিশ্বকে পুনরায় সংজ্ঞায়িত করার আগে একের পর এক বিভিন্ন নতুন এবং "অদ্ভুত" জিনিসের আবির্ভাব ঘটবে। যখন AI সক্রিয়ভাবে বিশ্বকে বুঝতে শুরু করবে, তখন ডিভাইসের রূপ অবশ্যই কিছুটা অদ্ভুত হয়ে উঠবে – এটি তার প্রাথমিক পর্যায়ের যেকোনো কিছুর ক্ষেত্রেই সত্য। ভুলে যাবেন না যে গাড়িগুলিকে প্রথমে সার্কাসের মতো দেখা হত।

অবশ্যই, ব্যবহারকারীর গ্রহণযোগ্যতার দৃষ্টিকোণ থেকে, সামাজিক রীতিনীতি, গোপনীয়তার সীমানা এবং নান্দনিক পছন্দের মতো নরম বিষয়গুলিতে পরিবর্তনগুলি প্রায়শই প্রযুক্তিগত অগ্রগতির তুলনায় অনেক ধীর হয়। আসল টিপিং পয়েন্টটি কোথায় তা এখনও স্পষ্ট নয়।

কিন্তু নিশ্চিত যে আমরা একটি অস্পষ্ট নতুন সূচনা বিন্দু অতিক্রম করেছি। ভবিষ্যতে, আরও বেশি সংখ্যক নতুন পণ্য আসবে যার নকশা AI দ্বারা সম্পূর্ণরূপে রূপান্তরিত হবে, যা মানব-কম্পিউটার মিথস্ক্রিয়াকে নতুন আকার দেবে। "AI Gadgets" নামক এই বিশেষ বৈশিষ্ট্যের মাধ্যমে, iFanr পর্যবেক্ষণ করবে কিভাবে তারা আমাদের জীবনে প্রবেশ করে এবং পরিবর্তন করে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো