
আপনি যদি কখনও কোনও ফোনের অন্তর্নির্মিত ইনপুট পদ্ধতি ব্যবহার করে থাকেন, তাহলে আপনি বুঝতে পারবেন যে এটি কতটা অসহায়, যেন মনে হচ্ছে এটি চীনা ভাষা শেখেনি।
এই কারণেই তৃতীয় পক্ষের ইনপুট পদ্ধতিগুলি সমৃদ্ধ হয়েছে।
যখন অফিসিয়াল ইনপুট পদ্ধতিটি ব্যবহার অনুপযোগী হয়ে পড়বে, তখন ব্যবহারকারীরা স্বাভাবিকভাবেই পা দিয়ে ভোট দেবেন। সম্প্রতি, বাইটড্যান্স ডুবাও ইনপুট মেথড সংস্করণ ১.০ চালু করেছে, যার লক্ষ্য এআই-এর মাধ্যমে ইনপুট অভিজ্ঞতাকে নতুন করে সংজ্ঞায়িত করা।
যদিও এটি এখনও আমার মনে তাজা ছিল, আমি এটি ডাউনলোড করে দুই দিন চেষ্টা করেছিলাম, কিছু বিবরণ আবিষ্কার করেছিলাম যা উভয়ই মনোরম এবং হতাশাজনক ছিল।

ভয়েস রিকগনিশনে উল্লেখযোগ্য অগ্রগতির সাথে, ডুবাও ইনপুট মেথডের "হত্যাকারী বৈশিষ্ট্য" কতটা শক্তিশালী?
ডুবাও ইনপুট পদ্ধতির একটি ন্যূনতম ইন্টারফেস রয়েছে।
কোনও বিরক্তিকর পপ-আপ বিজ্ঞাপন বা সদস্যপদ বিজ্ঞাপন নেই। তবে, ইনস্টলেশন প্যাকেজটি বেশ বড়, ভিভো অ্যাপ স্টোরে এটি 139MB হিসাবে দেখানো হচ্ছে। এবং এর আকার বড় হওয়া সত্ত্বেও, এটি সম্পূর্ণরূপে কার্যকরী নয়; "অসমাপ্ত ঘর" উপমাটি বেশ উপযুক্ত।
প্রথমে ডুবাও ইনপুট পদ্ধতির মূল প্রতিযোগিতামূলকতা সম্পর্কে কথা বলা যাক।
আমার মতে, ভয়েস টাইপিং হল ডুবাও ইনপুট মেথডের সবচেয়ে ভালো বৈশিষ্ট্য, যা আমার ব্যবহৃত অন্যান্য ইনপুট পদ্ধতির তুলনায় উল্লেখযোগ্যভাবে উন্নত ব্যবহারকারীর অভিজ্ঞতা প্রদান করে। এটি ব্যবহার করার দুই দিনেই আমি ভয়েস টাইপিং অভিজ্ঞতার প্রেমে পড়ে গেছি।
সংক্ষেপে, কথা বলতে টিপুন এবং ধরে রাখুন, শেষ করতে ছেড়ে দিন।
প্রকৃত পরীক্ষায়, চীনা, ইংরেজি এবং ক্যান্টোনিজের স্বীকৃতির নির্ভুলতা হাস্যকরভাবে বেশি ছিল। আমি অকপটে বলেছিলাম, "আমি ম্যান্ডারিনে ডুবাও ইনপুট পদ্ধতি পরীক্ষা করছি," এবং এটি এটিকে নিখুঁতভাবে স্বীকৃতি দিয়েছে। তারপর আমি ইংরেজি বাক্যাংশটি বলেছিলাম "আপনার মনোযোগই সব প্রয়োজন," এবং এটিও সঠিকভাবে স্বীকৃতি পেয়েছে।

ক্যান্টোনিজ ভাষার কথোপকথনে, "আপনি কি আজ রাতে ডিনারের জন্য বাড়িতে আসছেন?" এবং "একটি মুরগির জন্য এক ডলার, এক পাউন্ড কচ্ছপের জন্য এক ডলার, একটি মুরগির জন্য এক ডলার বেশি দামি, নাকি এক পাউন্ড কচ্ছপের জন্য এক ডলার বেশি দামি?" এর মতো প্রশ্নগুলি প্রথম চেষ্টাতেই সফলভাবে স্বীকৃত হয়েছিল।

এটা বোঝা গুরুত্বপূর্ণ যে এই বাক্যগুলি দ্রুত উচ্চারিত হয় এবং এতে অনেক হোমোফোন থাকে; যদি উচ্চারণ সামান্য অস্পষ্ট হয়, তাহলে ইনপুট পদ্ধতিটি ত্রুটিপূর্ণ হতে পারে। প্রকৃত পরীক্ষায় মডেলটির কর্মক্ষমতা বেশ চিত্তাকর্ষক ছিল, যা ইঙ্গিত করে যে এটি ক্যান্টোনিজের অ্যাকোস্টিক বৈশিষ্ট্য এবং ভাষা মডেল সম্পর্কে বিশেষভাবে প্রশিক্ষিত হয়েছে।
ডুবাও টিভিবি নাটকে ক্যান্টোনিজ-ইংরেজি মিশ্র ভাষার কথা বলতে পারেন।
আমি চেষ্টা করেছিলাম "দুঃখিত, আমরা ইতিমধ্যেই আমাদের সেরাটা দিয়েছি," "চাঁদ আর মিষ্টি উপভোগ করছি, এত দেরি করে কেন আমাদের ডাকছেন?" এবং "এটা তোমার কম্পিউটারে স্ক্যান করে আমার একটা কপি তৈরি করে নাও, তারপর সবার সাথে শেয়ার করো। আবার পরীক্ষা করে দেখতে ভুলো না!" শেষ পর্যন্ত, তাদের কেউই ভুল ছিল না।
এটি এমনকি কণ্ঠস্বরের মাধ্যমে গাণিতিক সূত্রগুলি ইনপুট করতে পারে, যা আপনি যদি একজন ছাত্র, শিক্ষক বা গবেষক হন তবে বেশ কার্যকর হবে।
প্রযুক্তিগত দৃষ্টিকোণ থেকে, অনলাইনে গুজব রয়েছে যে ডুবাও ইনপুট পদ্ধতিতে বীজ-এএসআর২.০ মডেল ব্যবহার করা হয়েছে।
সহজ কথায়, এটি বক্তৃতাকে টেক্সটে রূপান্তরিত করে, যা মেশিনগুলিকে আপনি যা বলছেন তা "বুঝতে" সাহায্য করে। পূর্ববর্তী বৃহৎ-স্কেল ASR মডেলের তুলনায়, Seed-ASR চীনা এবং ইংরেজি পরীক্ষার সেটগুলিতে ত্রুটির হার 10%-40% কমিয়ে দেয়।
এছাড়াও, ডুবাও ইনপুট পদ্ধতি অফলাইন ভয়েস মডেল ডাউনলোড করতেও সহায়তা করে, যার আকার প্রায় 150MB। এর অর্থ হল আপনি এখনও দুর্বল সিগন্যালযুক্ত জায়গায়, যেমন ভূগর্ভস্থ পার্কিং গ্যারেজে, স্বাভাবিকভাবে ভয়েস ইনপুট ব্যবহার করতে পারেন।

তবে, অফলাইন মডেলগুলির নির্ভুলতা অনলাইন মডেলগুলির তুলনায় অবশ্যই কম, তাই কর্মক্ষমতা হ্রাস পাওয়া স্বাভাবিক।
অবশ্যই, নতুন ইনপুট পদ্ধতি বেছে নেওয়ার সময় অনেকেই গোপনীয়তা নিয়ে চিন্তিত। ডুবাও ইনপুট পদ্ধতি একটি "মৌলিক ইনপুট" মোড প্রদান করে, কিন্তু একবার এটি চালু হয়ে গেলে, স্পিচ-টু-টেক্সট এবং অনুবাদের মতো ফাংশনগুলি বন্ধ হয়ে যায়।

মৌলিক শব্দভান্ডারের দিক থেকে, ডুবাও ইনপুট পদ্ধতির সমৃদ্ধি মূলধারার ইনপুট পদ্ধতির স্তরে পৌঁছেছে; এটি বিশেষ কিছু নয়, তবে এটি পিছিয়েও নেই।
ভয়েস রিকগনিশন ছাড়াও, আমি ইন্টারনেট স্ল্যাং যেমন "确性人格" (Quequé Xìngrén) এবং "城巴佬" (চেংবা লাও) টাইপ করার চেষ্টা করেছি এবং এটি তাদের সকলকে চিনতে পেরেছে। বিরল চরিত্রগুলির জন্য, যেমন "饕餮" (Taotie), "皴裂" (চৌ লাই), এবং "髑髅" (ডুলো), তারা সকলেই স্বাচ্ছন্দ্যের সাথে স্বীকৃত হয়েছিল।

লেনোভোর ক্ষেত্রে, এর ডুবাও ইনপুট মেথড, যা এআই ক্ষমতাগুলিকে একীভূত করে, ব্যতিক্রমীভাবে ভালো পারফর্ম করে।

"1+1=" টাইপ করলে অথবা "Journey to the West এর লেখক কে?" প্রশ্ন করলে ফলাফল সরাসরি প্রার্থী বারে প্রদর্শিত হবে। একজন কর্মজীবী ব্যক্তি হিসেবে, ইনপুট পদ্ধতিতে AI কে একীভূত করার এই পদ্ধতিটি আমার বেশ পছন্দ, যা ব্যবহারিকতার উপর জোর দেয়।

ভয়েস রিকগনিশন ছাড়া ১৩৯ মেগাবাইট এআই ইনপুট পদ্ধতির আর কী বাকি আছে?
সুবিধাগুলি নিয়ে আলোচনা করার পর, অসুবিধাগুলি নিয়ে কথা বলার সময় এসেছে।
প্রথমত, ডুবাও ইনপুট পদ্ধতি শুধুমাত্র অ্যান্ড্রয়েডের জন্য উপলব্ধ। অফিসিয়াল ওয়েবসাইট ইঙ্গিত দেয় যে একটি iOS সংস্করণ শীঘ্রই আসছে, অন্যদিকে পিসি সংস্করণ শীঘ্রই আসছে বলে জানা গেছে। এর অর্থ হল ক্রস-ডিভাইস কপি এবং পেস্ট সমর্থিত নয়।
যেসব ব্যবহারকারীরা প্রায়শই একাধিক ডিভাইসে কাজ করেন, তাদের জন্য এই গুরুত্বপূর্ণ বৈশিষ্ট্যটির অভাব একটি বড় বাধা হতে পারে এবং আশা করা যায় এটি শীঘ্রই উপলব্ধ হবে।

ডিফল্ট সেটিংসে, টাইপিং কিছুটা ধীর এবং প্রতিক্রিয়ার গতি যথেষ্ট দ্রুত নয়, তবে ভাগ্যক্রমে, আপনি সেটিংসে কী প্রতিক্রিয়ার গতি "অত্যন্ত দ্রুত" এ সামঞ্জস্য করতে পারেন এবং এটি সামঞ্জস্য করার পরে অভিজ্ঞতা আরও ভাল হবে।

মজার ব্যাপার হল, কীবোর্ডের "কম্পনের তীব্রতা" সামঞ্জস্য করার সময়, "দুর্বল" নির্বাচন করলে কম্পনটি খুব শক্তিশালী ছিল, কিন্তু "শক্তিশালী" নির্বাচন করলে প্রায় অদৃশ্য ছিল। এটি একটি বাগ হতে পারে, এবং আশা করি এটি ভবিষ্যতের সংস্করণে ঠিক করা হবে।

সম্ভবত এটি এখনও প্রাথমিক সংস্করণে থাকার কারণে, ডুবাও ইনপুট পদ্ধতির অনেক বিস্তারিত বৈশিষ্ট্য এখনও পালিশ করা হয়নি।
ইমোটিকনগুলি সামাজিক যোগাযোগের একটি গুরুত্বপূর্ণ অংশ, এবং অনেক ইনপুট পদ্ধতিতে অন্তর্নির্মিত ইমোটিকন অনুসন্ধান এবং প্রেরণ ফাংশন থাকে। যদিও ডুবাও ইনপুট পদ্ধতিতে ইমোটিকনের একটি মোটামুটি সমৃদ্ধ নির্বাচন রয়েছে, আপনি যদি সরাসরি ইনপুট পদ্ধতি থেকে ইমোটিকন পাঠাতে চান? দুঃখিত, আপনি এই মুহূর্তে তা করতে পারবেন না।
উদাহরণস্বরূপ, কীবোর্ডের কার্যকারিতা এখনও সম্পূর্ণরূপে বিকশিত হয়নি, শুধুমাত্র 9-কী এবং 26-কী ইনপুট পদ্ধতি ব্যবহার করা হয়েছে। আপনি যদি ডাবল-পিনয়িন ইনপুট ব্যবহারকারী হন, অথবা হাতের লেখা বা ঐতিহ্যবাহী চীনা ইনপুট প্রয়োজন হয়, তাহলে Doubao এই মুহূর্তে আপনার জন্য উপযুক্ত নয়।
তাছাড়া, কীবোর্ড ইন্টারফেসে ডার্ক মোড আছে, কিন্তু সেটিংস ইন্টারফেসে নেই। কীবোর্ড স্কিন পরিবর্তন করতে চান? দুঃখিত, বর্তমানে শুধুমাত্র ডিফল্ট স্টাইলটি উপলব্ধ। পরেরটি ব্যক্তিগত পছন্দের বিষয়; কেউ কেউ সরলতা পছন্দ করেন, আবার কেউ কেউ এটিকে খুব একঘেয়ে মনে করেন।
যখন আমি AI অনুবাদ ফাংশনে "LLM" ইনপুট করি, তখনও এটি ডিফল্টভাবে "Master of Laws" থাকে। যদিও "Master of Laws" এবং "Large Language Model" উভয়ই সঠিক, তবুও এটি আমাকে Google Translate-এর মতো অনুভূতি দেয়।
তাহলে, ডুবাও ইনপুট পদ্ধতি কি চেষ্টা করার যোগ্য?
আমার পরামর্শ হল, শুধুমাত্র এর ভয়েস রিকগনিশন বৈশিষ্ট্যের উপর ভিত্তি করে, এটি এখনও চেষ্টা করে দেখার যোগ্য।
তবে, এটিকে ডিফল্ট ইনপুট পদ্ধতি হিসেবে সেট করার জন্য তাড়াহুড়ো না করাই ভালো। প্রথমে এটিকে ব্যাকআপ টুল হিসেবে ব্যবহার করুন, এবং পূর্ণাঙ্গ সুইচ বিবেচনা করার আগে Doubao ইনপুট পদ্ধতিতে iOS সংস্করণ, মাল্টি-ডিভাইস সিঙ্ক্রোনাইজেশন এবং ইমোজির মতো মৌলিক ফাংশন যোগ না হওয়া পর্যন্ত অপেক্ষা করুন।
অবশ্যই, আমাদের এটিকে কিছুটা সময় দেওয়া উচিত এবং দেখা উচিত যে এই 1.0 সংস্করণটি অবশেষে কীভাবে বিকশিত হয়।
ডুবাও ইনপুট পদ্ধতির জন্য ডাউনলোড লিঙ্ক:
https://shurufa.doubao.com/
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
