আমি CCTV-র মতো একই AI যুগপত ব্যাখ্যা হেডসেট ব্যবহার শুরু করেছিলাম, এবং এটি “অনুবাদ”-এর চেয়ে অনেক ভালো বলে মনে হয়েছে CES 2026

CES 2026-এ, AI হার্ডওয়্যার নিঃসন্দেহে ইভেন্টের একটি অপরিহার্য অংশ হবে।

নির্দেশ অনুসারে আঁকতে পারে এমন ছোট এআই ছবির ফ্রেম থেকে শুরু করে কাপড় ভাঁজ করতে পারে এমন বৃহৎ গৃহস্থালীর রোবট… এআই ইতিমধ্যেই সর্বত্র রয়েছে।

এই পণ্যগুলির বেশিরভাগই কার্যকরী নয় বরং ধারণাগত, আকর্ষণীয় নকশা কিন্তু অস্পষ্ট অবস্থান সহ। যাইহোক, CES-এ সবসময় কিছু সাধারণ পণ্য থাকে যা শিল্পের দৃশ্যপটকে ব্যাহত করার জন্য যথেষ্ট। উদাহরণস্বরূপ, শেনজেন নির্মাতা "টাইম কেটল"-এর W4 সিরিজের হেডফোনগুলি অনেক AI হেডফোনের মধ্যেও অনন্য।

এতে ক্যামেরা নেই, চ্যাট-জিপিটি ব্যবহার করা যাবে না, এবং অবশ্যই আপনার প্রশ্নের উত্তর দেওয়া যাবে না, তবে এটি এমন একটি পণ্য যা আমি সবচেয়ে বেশি ব্যবহার করেছি এবং সিইএস-এ সবচেয়ে বেশি সন্তুষ্ট হয়েছি।

এই হেডফোনগুলি কেবল একটি কাজ করে: অনুবাদ, অথবা আরও স্পষ্ট করে বললে, যুগপত ব্যাখ্যা।

আমি প্রথমে ভেবেছিলাম গুগল ট্রান্সলেটই যথেষ্ট ভালো, তাহলে অন্য কিছু নিয়ে কেন ঝামেলা করব?

কিন্তু W4 লাগানোর পর, আমি বুঝতে পারলাম যে এটি মোটেও "একসাথে ব্যাখ্যামূলক হেডসেট" ছিল না।

"অনুবাদ" এর পরিবর্তে "যোগাযোগ"

টাইম কেটলের প্রতিষ্ঠাতা তিয়ান লি APPSO কে বলেন যে তারা যা তৈরি করেছেন তা "AI অনুবাদ" হেডসেট নয়, বরং "যোগাযোগে" সাহায্য করার জন্য একটি সহকারী।

এই দুটিকে আলাদা করা যায় না, তবুও তারা স্পষ্টতই আলাদা: অনুবাদ হল একটি মধ্যস্থতাকারী কাজ, একটি "সেতু" তৈরি করা; অন্যদিকে যোগাযোগ হল নদী, সহজাতভাবে অবাধ।

▲ বাম: তিয়ান লি, টাইম কেটলের প্রতিষ্ঠাতা

তিয়ান লির দৃষ্টিতে, নির্ভুলতার পাশাপাশি, দুই ব্যক্তির মধ্যে যোগাযোগ স্বাভাবিক কিনা এবং তারা আরামদায়ক অবস্থায় যোগাযোগ করতে ইচ্ছুক কিনা সেদিকেও মনোযোগ দেওয়া উচিত। এই সমস্ত দিকগুলি ঐতিহ্যবাহী অনুবাদ সমাধানগুলি উপেক্ষা করেছে।

টাইম কেটলের মূল ধারণা হল প্রযুক্তিকে "অদৃশ্য" করে তোলা যাতে আন্তঃভাষা যোগাযোগ নির্বিঘ্নে হয়।

টাইম কেটল W4 এর ফাংশনগুলিকে বিস্তৃতভাবে দুটি ধরণের মধ্যে শ্রেণীবদ্ধ করা যেতে পারে: একমুখী যুগপত ব্যাখ্যা এবং দ্বিমুখী যুগপত ব্যাখ্যা; ইয়ারপিসটি দুটি অনুবাদ মোডও অফার করে:

  • অনুবাদের গতির "দ্রুত" দিকের উপর দৃষ্টি নিবদ্ধ করা।
  • প্রাসঙ্গিক বোধগম্যতার "নির্ভুলতার" উপর দৃষ্টি নিবদ্ধ করা

"লাইভ লিসেনিং" হলো একমুখী যুগপত ব্যাখ্যা: ব্যবহারকারীরা হেডফোন ব্যবহার করেন, তাদের মোবাইল ফোনকে মাইক্রোফোন হিসেবে ব্যবহার করেন এবং অন্য ব্যক্তি যা বলছেন তার অনুবাদিত সংস্করণ রিয়েল টাইমে শুনতে পান।

এই মোডটি প্রেস কনফারেন্স, বক্তৃতা বা ক্লাসের মতো পরিস্থিতির জন্য সবচেয়ে উপযুক্ত। এমনকি বিভিন্ন উচ্চারণের মুখোমুখি হলেও, W4 এর "কুইক" মোড প্রায় 2 সেকেন্ডের মধ্যে সঠিকভাবে অর্থ প্রকাশ করতে পারে।

সিইএস চলাকালীন, আমি এই বৈশিষ্ট্যটি নিবিড়ভাবে চালু রেখেছিলাম, যার ফলে আশেপাশের বুথগুলি কী প্রচার করছে তা সহজেই শোনা যেত। প্রদর্শনীটি বিস্তারিতভাবে অন্বেষণ করার আগে, সাইটে চীনা ভাষার যুগপত ব্যাখ্যা আমাকে পরিস্থিতি দ্রুত বুঝতে সাহায্য করেছিল। অনেক সময়, কাছাকাছি কী প্রদর্শন করা হচ্ছে এবং আমার যাওয়া উচিত কিনা তা জানতে উপস্থাপনাগুলি শোনার জন্য আমার কানে চাপ দেওয়ার প্রয়োজন হয়নি, যা আমার প্রদর্শনী পরিদর্শনের দক্ষতাকে ব্যাপকভাবে উন্নত করেছে।

অবশ্যই, বাজারে থাকা বেশিরভাগ মোবাইল অনুবাদ অ্যাপ সম্পূর্ণ স্বাভাবিক অভিজ্ঞতা প্রদান না করলেও, তারা প্রধান ভাষাগুলিতে এখনও ভালো একমুখী অনুবাদ অর্জন করতে পারে। টাইম জারের "হিরো সিন" অবশ্যই "দুই ব্যক্তির সংলাপের" জন্য একটি দ্বিমুখী যুগপত ব্যাখ্যা।

Cyberpunk 2077 গেমটিতে আমার খুব পছন্দের একটি ছোট্ট জিনিস হল: সারা বিশ্বের মানুষ একই শহরে জড়ো হয়, প্রত্যেকে তাদের নিজস্ব ভাষায় কথা বলে, এবং প্রত্যেকের ভেতরে একজন "অনুবাদক" থাকে যে অন্য ব্যক্তির কথা তাদের মাতৃভাষায় রিয়েল টাইমে অনুবাদ করতে পারে। গেমটিতে, আপনি প্রায়শই এমন কাউকে দেখতে পাবেন যা আপনি বুঝতে পারবেন না, এবং তারপর এক সেকেন্ডের জন্য, সাবটাইটেলগুলি ফ্ল্যাশ করে এবং চীনা ভাষায় স্যুইচ করে।

টাইম কেটল W4 একই রকম অভিজ্ঞতা প্রদান করে:

ইয়ারফোনটি অর্ধেক ভাগ করুন, আপনার ফোনের ভাষা নির্বাচন করুন, এবং উভয়েই এটি পরবে এবং তাদের নিজস্ব ভাষায় কথা বলবে। এরপর ইয়ারফোনটি খুব কম বিলম্বে, মাত্র দুই বা তিন সেকেন্ডের মধ্যে রিয়েল টাইমে সংশ্লিষ্ট অনুবাদটি চালাবে।

ঐতিহ্যবাহী অনুবাদ সফ্টওয়্যার অনুবাদ করার আগে একটি বাক্য শেষ হওয়ার জন্য অপেক্ষা করতে হয় এবং এটি কেবল পর্দায় দেখা যায়, যার ফলে একটি অস্বাভাবিক গতি তৈরি হয়। এটি ভ্রমণের মতো হালকা দৃশ্যের জন্য আরও উপযুক্ত।

টাইম কেটল ডব্লিউ৪ সিরিজের সবচেয়ে মূল্যবান দিক হল এটি আন্তঃভাষা যোগাযোগকে "স্ক্রিনের দিকে নিচের দিকে তাকানো" থেকে "কথোপকথন শোনার জন্য উপরের দিকে তাকানো" তে রূপান্তরিত করে।

অতীতে, নিজের মাতৃভাষা এবং অনুবাদকের সাথে যোগাযোগের ফলে প্রায়শই অনিবার্যভাবে "মাতৃভাষার লজ্জা" দেখা দিত, কিন্তু টাইম জার W4 এই অনুভূতি দূর করে:

হেডফোন পরলে কথোপকথন আরও স্বাভাবিক এবং সাবলীল হয়ে ওঠে। কোনও পক্ষই সরঞ্জামের দ্বারা আবদ্ধ নয়, এবং তারা কেবল যোগাযোগের উপরই মনোনিবেশ করতে পারে। আমি আরও আত্মবিশ্বাসী এবং নিজেকে প্রকাশ করতে আরও আগ্রহী বোধ করি।

এইভাবে, আমরা আরও গভীরভাবে কথা বলতে ইচ্ছুক কারণ আপনাকে আর অন্য পক্ষ বুঝতে না পারার বিষয়ে চিন্তা করতে হবে না।

প্রথাগত অনুবাদ সফ্টওয়্যারের বিপরীতে যা প্রক্রিয়াকরণের আগে একটি বাক্য শেষ না হওয়া পর্যন্ত অপেক্ষা করে, টাইম কেটল W4 বক্তৃতার সময় তুলনামূলকভাবে সম্পূর্ণ শব্দার্থিক অংশগুলিকে সনাক্ত করে এবং 3 সেকেন্ডেরও কম বিলম্বের সাথে সাথে সেগুলিকে অনুবাদ করে।

টাইম কেটল W4 ব্যবহার করার সময়, আপনি প্রায়শই কথা বলা শেষ করেন এবং অন্য ব্যক্তি অনুবাদটি প্রায় শোনা শেষ করে ফেলেন, যার ফলে অপেক্ষার সময় অনেক কমে যায় এবং যোগাযোগ আরও মসৃণ হয়ে ওঠে। যদি আপনি অনুবাদিত লেখাটি স্পষ্টভাবে শুনতে না পান, তাহলে আপনি সর্বদা স্ক্রিনটি দেখতে পারেন।

এটি টাইম কেটলের সীমা নয়। "প্রিসিশন" মোডে স্যুইচ করা হলে, এটি চিকিৎসা, ব্যবসা এবং আইনি ক্ষেত্রে পেশাদার শব্দগুলি চিনতে এবং অনুবাদ করতে পারে।

উদাহরণস্বরূপ, যখন আমি যুক্তরাজ্যে কৃত্রিম বুদ্ধিমত্তা নিয়ে পড়াশোনা করা একজন AI সম্পাদক সহকর্মীর সাথে কথা বলছিলাম, তখন তার ইংরেজি খুব দ্রুত বলা যেত এবং এতে অনেক প্রযুক্তিগত শব্দ ছিল, কিন্তু W4 সঠিকভাবে অনুবাদ করতে সক্ষম হয়েছিল। টাইম জার ছাড়া, আমি যদি ইংরেজি বুঝতেও পারতাম, তবুও তার গতির সাথে তাল মিলিয়ে চলা আমার পক্ষে কঠিন হত, সমস্ত প্রযুক্তিগত বিষয়বস্তু সত্যিকার অর্থে বোঝা তো দূরের কথা।

আমি আগে ভাবতাম যে মোবাইল ফোনের অনুবাদ যথেষ্ট ভালো, এবং অনুবাদের প্রভাব অনেক আগেই "মেশিন অনুবাদের স্বাদ" কেড়ে নিয়েছে। যাইহোক, টাইম কেটলের যুগপত ব্যাখ্যা হেডসেট আমাকে এখনও বুঝতে সাহায্য করেছে যে আন্তঃভাষা যোগাযোগের অভিজ্ঞতা "অনুবাদ"-এ থেমে থাকা উচিত নয়, বরং "যোগাযোগ" হওয়া উচিত।

আমরা প্রায়ই বলি যে অনুবাদের মূল কথা হলো "বিশ্বস্ততা, অভিব্যক্তি এবং মার্জিততা।" তুলনা করার পরই আমি বুঝতে পেরেছিলাম যে "বিশ্বস্ততা, অভিব্যক্তি এবং মার্জিততার" মধ্যে বিভিন্ন স্তর এবং গতি রয়েছে।

একবার কোনও ফাঁক তৈরি হলে, নতুনত্বের জন্য জায়গা থাকে।

পজিশনিং এবং প্রযুক্তি হল মূল বিষয়

প্রকৃতপক্ষে, "অনুবাদ যন্ত্র" জেনারেটিভ এআই তরঙ্গের অনেক আগে থেকেই বিদ্যমান ছিল, কিন্তু এটি একটি খুব উল্লম্ব এবং লুকানো ক্ষেত্র ছিল, এবং জনসাধারণের ধারণা অনুসারে, এটি স্মার্টফোন দ্বারা প্রতিস্থাপিত হওয়া উচিত ছিল।

"অনুবাদ সরঞ্জাম" এর পরিবর্তে "যোগাযোগ সহকারী" হিসাবে অবস্থান করা, টাইম কেটলের আরও স্বাভাবিক কথোপকথনের অভিজ্ঞতা এটিকে দ্রুত আলাদা করে তুলেছে এবং তার প্রতিযোগীদের উপর একটি সুবিধা তৈরি করেছে।

অন্যান্য অনুবাদ যন্ত্রগুলিতে মূলত উভয় পক্ষই একটি পর্দার সামনে কথা বলে এবং একই সাথে যন্ত্রের সীমাবদ্ধতাগুলিও মেনে চলতে হয়; টাইম জার প্রকৃতপক্ষে মানুষের মধ্যে "পর্দা" সরিয়ে দেয়, অবশেষে মুখোমুখি যোগাযোগ সক্ষম করে এবং বিভিন্ন কথা বলার গতি, উচ্চারণ এবং বাক্যের দৈর্ঘ্যের সুযোগ করে দেয়।

২০২৫ সালের শেষ নাগাদ, টাইম কেটল বিশ্বব্যাপী ১.৫ মিলিয়নেরও বেশি ব্যবহারকারী অর্জন করেছিল, যা ১৭০ টিরও বেশি দেশকে কভার করেছিল এবং অ্যামাজনে তার বিভাগে এক নম্বর বিক্রেতা ছিল।

উত্তর আমেরিকায়, যেখানে এই পণ্যটি বেশি জনপ্রিয়, বাজারের অংশ ৭০% ছাড়িয়ে গেছে। এই দৃঢ় পরিসংখ্যানগুলি প্রমাণ করে যে একটি বিশেষ বাজারে থাকা সত্ত্বেও, টাইম কেটল ইতিমধ্যেই "তার বিশেষত্ব ভেঙে বেরিয়ে আসার" লক্ষণ দেখিয়েছে।

জেনারেটিভ এআই যুগের আবির্ভাবের সাথে সাথে, ওপেনএআই এবং বাইটড্যান্সের মতো বড় কোম্পানিগুলি এআই হেডফোনের উপর মনোযোগ দিচ্ছে, অন্যদিকে অ্যাপল এবং হুয়াওয়ের মতো ঐতিহ্যবাহী হেডফোন নির্মাতারাও তাদের পণ্যগুলিকে নতুন আকার দেওয়ার জন্য এআই ব্যবহার করছে। রিয়েল-টাইম অনুবাদ এমন একটি দৃশ্য যা মিস করা উচিত নয়, সর্বোপরি, এটি বাস্তবায়ন করা কঠিন নয় তবে এর প্রচারমূলক প্রভাব খুব ভালো।

এটি টাইম কেটলের উপর চাপ সৃষ্টি করেছিল। আরও উল্লম্বভাবে কেন্দ্রীভূত "ছোট কারখানা" হিসাবে, তাদের প্রবেশের পথ ছিল সহজ, কিন্তু কোনও শর্টকাট ছিল না – প্রযুক্তিকে পরিখা হিসেবে ব্যবহার করা।

কেবলমাত্র অত্যাধুনিক প্রযুক্তিই সহজ ব্যবহারকারীর অভিজ্ঞতা প্রদান করতে পারে।

টাইম কেটলের সিইও তিয়ান লি বিশ্বাস করেন যে "ক্রস-ভাষা যোগাযোগ" একটি দীর্ঘ প্রযুক্তিগত শৃঙ্খল যা বিস্তারিতভাবে ভেঙে ফেলা প্রয়োজন: যোগাযোগ, শব্দ হ্রাস, জাগরণ, ভয়েস সংকোচন, বাক্য বিভাজন এবং স্বীকৃতি। আসলে, সবচেয়ে গুরুত্বপূর্ণ জিনিস, অনুবাদ, আসলে শেষ লিঙ্ক, কারণ অনুবাদের মান সবচেয়ে মৌলিক শব্দ রেকর্ডিংয়ের উপরও নির্ভর করে।

টাইম কেটল ডব্লিউ৪ ইয়ারবাডগুলিতে "বোন কন্ডাকশন" নামে একটি প্রযুক্তি রয়েছে, যা মূলধারার TWS বাজারে বেশ বিরল।

হাড়ের পরিবাহী প্রযুক্তির অনুরূপ, টাইম কেটল W4 কথা বলার সময় মাথার খুলির মধ্য দিয়ে প্রেরিত ভয়েসপ্রিন্ট সংকেত ক্যাপচার করে শব্দ গ্রহণ করে। এটি মাইক্রোফোন প্রতিস্থাপন করে না, বরং একটি অতিরিক্ত সংকেত উৎস প্রবর্তন করে যা হেডফোনগুলিকে কোলাহলপূর্ণ পরিবেশে মানুষের কণ্ঠস্বর এবং পটভূমির শব্দের মধ্যে আরও ভালভাবে পার্থক্য করতে সহায়তা করে।

CES-এর মতো জনাকীর্ণ এবং কোলাহলপূর্ণ পরিবেশে, হাড়ের পরিবাহী প্রযুক্তি কার্যকরভাবে কথোপকথনে উভয় পক্ষের কণ্ঠস্বর বের করতে পারে, এইভাবে আরও নির্ভরযোগ্য অনুবাদ প্রদান করে, যা বিশেষভাবে মূল্যবান।

৬ বছর আগে, টাইম কেটল হেডফোনের ব্লুটুথ চ্যানেলেও বড় ধরনের পরিবর্তন এনেছিল এবং বিভিন্ন কোলাহলপূর্ণ পরিবেশে সঠিক শব্দ গ্রহণ এবং সংক্রমণ অর্জনের জন্য নিজস্ব ভয়েস রিকগনিশন অ্যালগরিদম তৈরি করেছিল।

অনুবাদ প্রযুক্তির ক্ষেত্রে, তিয়ান লির লক্ষ্য সহজ: তৃতীয় পক্ষের অনুবাদ ব্যবহার করা হোক বা নিজস্ব অনুবাদ তৈরি করা হোক, ব্যবহারকারীদের অবশ্যই এটি "ব্যবহার করা সহজ" বলে মনে করতে হবে।

গুগল এবং মাইক্রোসফটের অনুবাদ ইঞ্জিনগুলির তুলনা করার পর, টাইম কেটল বুঝতে পেরেছিল যে কাঙ্ক্ষিত অভিজ্ঞতা অর্জনের জন্য, তাদের নিজস্ব মডেল পরিবর্তন করতে হবে। Babel OS এর জন্ম হয়েছিল, AI যুগপত ব্যাখ্যায় "অর্থবোধক বিভাজন" এবং "প্রসঙ্গ সচেতনতা" এর উপর দৃষ্টি নিবদ্ধ করে। এটি বৃহৎ মডেলগুলির কম সাধারণ ভাষা বলার ক্ষমতা বৃদ্ধি করেছিল এবং "সুনির্দিষ্ট" মোডে ব্যবহৃত পেশাদার শব্দগুলির নিজস্ব ডাটাবেসও তৈরি করেছিল।

ইভেন্টে আমি যে W4 হেডফোনগুলি ব্যবহার করেছিলাম সেগুলি 40 টিরও বেশি ভাষা সমর্থন করে, যার মধ্যে তেলুগু এবং হিব্রুর মতো কম সাধারণ ভাষা এবং হিন্দি, ইংরেজি এবং ক্যান্টোনিজের মতো প্রধান ভাষা অন্তর্ভুক্ত। বাস্তব ব্যবসায়িক এবং পেশাদার পরিবেশে, নির্দিষ্ট চাহিদা প্রায়শই সাফল্যের মূল চাবিকাঠি।

এটা স্পষ্ট যে, তার সঞ্চিত সফ্টওয়্যার এবং হার্ডওয়্যার প্রযুক্তি এবং পণ্য সংজ্ঞার ব্যবধানের জন্য ধন্যবাদ, টাইম কেটল যথেষ্ট শক্তিশালী প্রতিযোগিতামূলক সুবিধা তৈরি করেছে, বিশেষ করে B2B ক্ষেত্রে যেখানে শক্তিশালী পেশাদার প্রয়োজনীয়তা রয়েছে।

টেক জায়ান্টরা কীভাবে পণ্য তৈরি করে তার পেছনে যুক্তি হলো "সংযোজন": বিদ্যমান পণ্যগুলিতে বৈশিষ্ট্য যুক্ত করা এবং সেগুলিতে কৃত্রিম বুদ্ধিমত্তা প্রয়োগের জন্য স্থান খুঁজে বের করা।

টাইম কেটল "ক্রস-ল্যাঙ্গুয়েজ কমিউনিকেশন" এর পরিস্থিতির জন্য একটি পুনর্লিখিত সমাধান সূত্রের মতো, যা তিয়ান লি বিশ্বাস করেন যে টাইম কেটল এবং বৃহৎ কোম্পানির পণ্যগুলির মধ্যে প্রধান পার্থক্য।

আমাদের যুক্তি হলো, আমরা আসলে হেডফোন কিনা, নাকি এটি AI-তে একটি আলোচিত বিষয়, তা নিয়ে মাথা ঘামাই না; আমরা যা ভাবি তা হলো পরিস্থিতি এবং সমস্যাটি সত্যিই সমাধান হয়েছে কিনা।

আমাদের যুক্তি হলো এটি একটি পরিধেয় ডিভাইস যা মানুষকে নিমজ্জিতভাবে যোগাযোগ করতে সাহায্য করতে পারে, এবং হেডফোনের আকারটি এই প্রয়োজনীয়তা পূরণ করে।

টাইম কেটল ডব্লিউ৪ আসলে গান শোনার জন্য উপযুক্ত নয়, এবং এর চেহারা ঐতিহ্যবাহী TWS ইয়ারবাড থেকে বেশ আলাদা, তবে ফর্ম এবং কার্যকারিতার এই রূপান্তরই এটিকে "যোগাযোগের" জন্য আরও উপযুক্ত করে তোলে।

তিয়ান লি বিশ্বাস করেন যে ব্যবহারকারীরা প্ররোচিত হন না, বরং অনুপ্রাণিত হন। টাইম কেটল ব্যবহারকারীদের "যোগাযোগের" চাহিদা পুরোপুরি পূরণ করে, যা ধীরে ধীরে ব্যবহারকারীদের ব্র্যান্ড সম্পর্কে স্পষ্ট ধারণা তৈরি করবে।

সিইএস-এ, একজন আমেরিকান ব্যবহারকারী তিয়ান লিকে বলেন যে তিনি এখন প্রতিদিন টাইম কেটল হেডফোন ব্যবহার করেন তার স্ত্রীর সাথে, যিনি সীমান্তের ওপারে থাকেন, এক বা দুই ঘন্টা কথা বলার জন্য। তিনি তাদের যোগাযোগের সমস্যা সমাধানের জন্য অসংখ্য অনুবাদ সফ্টওয়্যার এবং পণ্য চেষ্টা করেছিলেন, কিন্তু টাইম কেটলের সাথে দেখা না হওয়া পর্যন্ত কোনওটিই সন্তোষজনক ছিল না, যা সত্যিই তার আন্তঃভাষা যোগাযোগের সমস্যাগুলি সমাধান করেছিল।

▲ ঐতিহ্যবাহী হেডফোনের তুলনায়, টাইম কেটল W4 অনেক লম্বা।

আমরা প্রায় এই সিদ্ধান্তে আসতে পারি যে, ভবিষ্যতে যদি বড় বড় নির্মাতারা এআই রিয়েল-টাইম ট্রান্সলেশনের ক্ষেত্রে বড় ধরণের উদ্যোগ নেয় এবং প্রতিটি ইয়ারফোন এবং মোবাইল ফোনে বড় বড় ট্রান্সলেশন মডেল থাকে, তবুও টাইম কেটলের মতো নির্মাতারা পেশাদার ক্ষেত্রে তাদের সুবিধা বজায় রাখতে সক্ষম হবে এবং তাদের সুনির্দিষ্ট অবস্থান এবং দীর্ঘমেয়াদী প্রযুক্তিগত সঞ্চয়ের কারণে উদ্ভাবনের জন্য আরও বেশি জায়গা থাকবে।

তারা যা সবচেয়ে ভালো করে তা করার উপর মনোনিবেশ করাই হল AI স্টার্টআপগুলির প্রথম দিকের ঐকমত্য যা তাদের প্রথম ভাগ্য তৈরি করতে সক্ষম হয়েছে।

আজকাল পাওয়া সেরা এআই হার্ডওয়্যার

২০১৬ সালে যখন টাইম কেটল প্রতিষ্ঠিত হয়েছিল, তখন এটি নিজেকে "এআই হার্ডওয়্যার" হিসেবে দেখেনি বরং নির্দিষ্ট পরিস্থিতি লক্ষ্য করে একটি সমাধান হিসেবে দেখেছে।

তবে, APPSO বিশ্বাস করে যে টাইম কেটল W4 ঠিক এমনই হওয়া উচিত যা একটি AI হার্ডওয়্যার ডিভাইস দেখতে হওয়া উচিত।

টাইম কেটলের উন্নয়ন অব্যাহত রয়েছে, এবং W4 মডেলের সুবিধা এবং নির্ভুলতার দিক থেকে এখনও উন্নতির সুযোগ রয়েছে। টাইম কেটলের সিইও তিয়ান লি, স্বায়ত্তশাসিত ড্রাইভিংয়ের শ্রেণীবিভাগের উল্লেখ করে, AI অনুবাদকে L1–L5 স্তরে শ্রেণীবদ্ধ করেছেন।

তার মতে, টাইম কেটল W4 ট্রান্সলেশন ইয়ারফোনটি বর্তমানে L3 স্তরের কাছাকাছি, "ব্যবহারযোগ্য" কিন্তু "ব্যবহার করা সহজ" নয়।

ভবিষ্যতের L4/L5 স্তরগুলি ব্যক্তিদের সহানুভূতিশীল হতে এবং আন্তঃভাষাগত যোগাযোগের কাজগুলি সম্পূর্ণরূপে গ্রহণ করতে সক্ষম করবে।

২০২৬ সালে প্রবেশের সাথে সাথে, এআই হার্ডওয়্যার পণ্যের প্রথম ব্যাচ একের পর এক সম্পন্ন হয়েছে। সংবাদ সম্মেলনে তাদের ভবিষ্যত দৃষ্টিভঙ্গি বর্ণনাকারী অনেক পণ্যই একের পর এক ব্যর্থ হয়েছে, কিছু ব্যতিক্রম ছাড়া।

যদি অনেক স্টার্টআপ "তীর ছুঁড়ে তারপর লক্ষ্য আঁকতে" – অর্থাৎ, সমাধানের প্রয়োজন এমন সমস্যা খুঁজে বের করার জন্য AI ব্যবহার করে – তাহলে Empty Bottle প্রথমে "ক্রস-ল্যাঙ্গুয়েজ কমিউনিকেশন" এর বুলসআই খুঁজে পেল, এবং AI বৃহৎ ভাষা মডেলটি ছিল কেবল তীর ছুঁড়ে ফেলা।

আর তাদের তূণিতে একাধিক তীর ছিল।

আসলে, এই সময়ের ক্যাপসুল সলিউশনটি বেশ কয়েক বছর আগেই অনেক বড় ব্র্যান্ড দ্বারা বৈধতা পেয়েছে:

২০২৩ সালে, টাইম কেটল ম্যারিয়ট এবং হিল্টনের মতো হোটেল ব্র্যান্ডের সাথে হেডফোন ভাড়া পরিষেবা প্রদানের জন্য অংশীদারিত্ব করে;

২০২৫ সালে, শেনজেন গ্লোবাল ইনভেস্টমেন্ট প্রমোশন কনফারেন্সে, টাইম কেটল ৩০০ টিরও বেশি প্রকল্প উপস্থাপনার জন্য অনুবাদ সহায়তা প্রদান করে, সরকারীভাবে মনোনীত এআই যুগপত ব্যাখ্যা পরিষেবাতে পরিণত হয়;

এমনকি সন্ধ্যার খবরে টাইম কেটলের সাথে ৪ মিনিটের একটি সাক্ষাৎকারও দেখতে পারেন, যেখানে তারা কেবল একটি বিষয় নিয়ে কথা বলেছেন।

AI কে ঘিরে বিশাল আখ্যান চলতেই থাকে, কিন্তু আমাদের হয়তো "মানুষের" উপর আরও বেশি মনোযোগ দিতে হবে—অভিনব মিথস্ক্রিয়া এবং ভবিষ্যতের কথা ভুলে যান, AI আমাদের এখন কী মূল্য দিতে পারে তা বলুন।

টাইম কেটল, একটি স্টার্টআপ যা মাত্র দশম বার্ষিকীতে প্রবেশ করছে, ভবিষ্যতেও এমন কিছু বিষয়ের উপর মনোযোগ কেন্দ্রীভূত করার সিদ্ধান্ত নিয়েছে যা অটল থাকবে। সাক্ষাৎকারের সময়, তরুণ সিইও কোম্পানির সম্ভাবনার প্রতি অটল আস্থা বজায় রেখেছিলেন:

দোভাষী আসলে শত শত বিলিয়ন ডলারের একটি বাজার, কিন্তু খুব কম লোকই দোভাষী নিয়োগ করতে পারে। এটি কেবল হিমশৈলের চূড়া; এর আড়ালে লুকিয়ে থাকা চাহিদা বিশাল।

মানুষের মিথস্ক্রিয়ার প্রয়োজনীয়তা অবিচল। হার্ডওয়্যার, সফটওয়্যার, বা এআর, ভিআর, বা বিভিন্ন এআই প্রযুক্তি যাই হোক না কেন, আপনি এখনও আশা করবেন যে যখন আপনি একজন উদ্যোক্তার সাথে যোগাযোগ করছেন, তখন আপনারা দুজনে একটি মিটিং রুমে বসে আড্ডা দিতে পারবেন যেমনটি আমরা এখন করছি।

এখনকার পরিস্থিতি এইরকম, দশ বছর আগেও একই রকম ছিল, পঞ্চাশ বছর আগেও একই রকম ছিল, এবং একশ বছর আগেও একই রকম ছিল। আমাদের কাছে, আমরা যা চিন্তা করি তা হল এই অপরিবর্তনীয় সমস্যা: এটি সমাধান হয়েছে কিনা।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো