গুগলের নতুন ফ্রি ডিকটেশন অ্যাপটিই হলো উইলোর সেই বিকল্প, যার জন্য আপনি অপেক্ষা করছিলেন।

গুগল আজ কোনো আনুষ্ঠানিক ঘোষণা ছাড়াই একটি নতুন iOS অ্যাপ প্রকাশ করেছে। 9to5Google- এর মাধ্যমে প্রথম নজরে আসা এই অ্যাপটির নাম Google AI Edge Eloquent । এটি একটি অফলাইন-ফার্স্ট ভয়েস ডিকটেশন টুল, যা রিয়েল টাইমে আপনার কথাকে ট্রান্সক্রাইব করে, স্বয়ংক্রিয়ভাবে অপ্রয়োজনীয় শব্দ বাদ দেয় এবং পরিচ্ছন্ন ও পরিমার্জিত টেক্সট প্রদান করে। Google Eloquent সম্পূর্ণ বিনামূল্যে পাওয়া যায় এবং এর জন্য কোনো সাবস্ক্রিপশন বা ব্যবহারের সীমাবদ্ধতা নেই।

Google AI Edge Eloquent কীভাবে কাজ করে?

আপনাকে শুধু অ্যাপটি খুলতে হবে, রেকর্ড বোতামে চাপ দিতে হবে এবং কথা বলা শুরু করতে হবে। একটি লাইভ ওয়েভফর্ম আপনার কণ্ঠস্বর ট্র্যাক করবে এবং স্ক্রিনে রিয়েল-টাইম ট্রান্সক্রিপশন দেখা যাবে। আপনি যখন কথা বলা থামাবেন, অ্যাপটি স্বয়ংক্রিয়ভাবে সবকিছু প্রসেস করে নেবে।

“উম” এবং “আহ”-এর মতো অপ্রয়োজনীয় শব্দগুলো অদৃশ্য হয়ে যায়, বাক্যের মাঝের সংশোধনগুলো মসৃণ হয়ে যায়, এবং যা অবশিষ্ট থাকে তা হলো পরিষ্কার, পাঠযোগ্য টেক্সট যা সরাসরি আপনার ক্লিপবোর্ডে কপি হয়ে যায়। চারটি টেক্সট ট্রান্সফরমেশন টুল আপনাকে আরও বেশি নিয়ন্ত্রণ দেয়:

  • মূল বিষয়বস্তু : আপনার বলা কথার প্রধান ধারণাগুলোকে বুলেট আকারে সংক্ষিপ্ত করে।
  • আনুষ্ঠানিক : প্রতিলিপিটি আরও পেশাদারী সুরে পুনর্লিখন করে।
  • সংক্ষিপ্ত : যা মূল বিষয়গুলোতে সংক্ষেপ করে।
  • Long : আরও বিস্তারিত তথ্যের প্রয়োজন হলে এটি প্রসারিত করে।

এছাড়াও একটি হিস্ট্রি ট্যাব রয়েছে, যেখানে অতীতের সমস্ত ট্রান্সক্রিপশনের পাশাপাশি ব্যবহারের পরিসংখ্যান, যেমন মোট শব্দ সংখ্যা এবং আপনার প্রতি মিনিটে শব্দ লেখার গতি সংরক্ষিত থাকে।

গুগল এলোকুয়েন্ট অ্যাপ কি আপনার ভয়েস ডেটা সংরক্ষণ করে?

বেশিরভাগ ফ্রি ডিকটেশন অ্যাপের মতো নয়, গুগল এআই এজ এলোকুয়েন্ট আপনাকে আপনার ভয়েস ডেটা সম্পূর্ণ গোপন রাখতে দেয়। উপরের কোণায় থাকা একটি টগল আপনাকে দুটি মোডের মধ্যে পরিবর্তন করতে দেয়। সম্পূর্ণ অফলাইন মোডে, সমস্ত অডিও আপনার ডিভাইসেই থাকে এবং জেমা-ভিত্তিক স্পিচ রিকগনিশন মডেল ব্যবহার করে স্থানীয়ভাবে প্রসেস করা হয়। কোনো কিছুই সার্ভারে পাঠানো হয় না।

ক্লাউড মোডে, স্পিচ রিকগনিশন ডিভাইসেই শুরু হয়, কিন্তু জেমিনি মডেলগুলো ক্লাউডে টেক্সট পরিমার্জনের কাজটি করে। যারা গোপনীয়তা-সংবেদনশীল চাকরিতে আছেন অথবা দূর থেকে ভয়েস ডেটা আপলোড করতে স্বাচ্ছন্দ্যবোধ করেন না, তাদের জন্য সম্পূর্ণ লোকাল অপশনটি বেশ উপযোগী।

অ্যাপটিতে একটি ব্যক্তিগত শব্দভান্ডার অভিধানও রয়েছে, যেখানে আপনি নির্ভুলতা বাড়ানোর জন্য নাম, প্রযুক্তিগত পরিভাষা এবং বিশেষ শব্দ যোগ করতে পারেন। এছাড়াও, আপনি আপনার গুগল অ্যাকাউন্ট দিয়ে সাইন ইন করতে পারেন, যাতে অ্যাপটি আপনার সাম্প্রতিক জিমেইল বার্তাগুলো থেকে প্রায়শই ব্যবহৃত শব্দগুলো স্বয়ংক্রিয়ভাবে খুঁজে নেয়।

২০২৬ সালে পেইড ডিকটেশন অ্যাপগুলোর অন্যতম সেরা ফ্রি বিকল্প হলো গুগল এআই এজ এলোকুয়েন্ট।

এর দুটি প্রধান প্রতিদ্বন্দ্বী, উইসপার ফ্লো এবং উইলো, এগুলোর মাসিক খরচ ১৫ ডলার। দুটিই ক্লাউড-ভিত্তিক এবং এগুলো আপনার অডিওকে রিমোট সার্ভারের মাধ্যমে পাঠায়। অন্যদিকে, সুপারউইসপার আরও ভালো গোপনীয়তার জন্য সবকিছু স্থানীয়ভাবে চালায়, কিন্তু এর জন্য বছরে ৮৫ ডলার খরচ হয়। এলোকুয়েন্ট দামের দিক থেকে এই তিনটির চেয়েই কম, অথচ ব্যবহারকারীরা যা সবচেয়ে বেশি চান, ঠিক সেটাই সরবরাহ করে — কোনো ম্যানুয়াল পরিমার্জন ছাড়াই পরিষ্কার, স্বয়ংক্রিয় টেক্সট আউটপুট।

তবে, গুগলের এআই এজ এলোকুয়েন্ট-এর একটি সীমাবদ্ধতা রয়েছে যা আপনার জানা উচিত। উইসপার ফ্লো, উইলো এবং সুপারহুইস্পার ম্যাক, উইন্ডোজ এবং আইওএস জুড়ে কাজ করে, যা আপনাকে যেকোনো অ্যাপে সরাসরি ডিক্টেট করতে দেয়। অন্যদিকে, এলোকুয়েন্ট আপাতত শুধুমাত্র আইওএস-এর জন্য। অ্যাপ স্টোরের তালিকায় একটি অ্যান্ড্রয়েড সংস্করণের উল্লেখ আছে, কিন্তু এটি এখনও প্লেস্টোরে চালু হয়নি।

সাধারণ ব্যবহারকারী বা যারা শুধুমাত্র কোনো নির্ভরযোগ্য বিনামূল্যের বিকল্প না থাকায় একটি ডিকটেশন অ্যাপের জন্য মাসিক সাবস্ক্রিপশন দেন, তাদের জন্য এটি পুরো পরিস্থিতিটাই বদলে দিয়েছে। এটি হয়তো এন্টারপ্রাইজ ব্যবহারকারীদের, যাদের ক্রস-প্ল্যাটফর্ম সাপোর্ট প্রয়োজন, তাদের জন্য Wispr Flow বা Willow-কে প্রতিস্থাপন করতে পারবে না, কিন্তু বাকি সবার জন্য গুগল একটি জোরালো যুক্তি উপস্থাপন করেছে।