গুগল অ্যাসিস্ট্যান্ট থেকে দূরে সরে যাওয়া, এবং মিথুন যুগে , প্রায় শেষ পর্যায়ে। নামী ভার্চুয়াল সহকারী সম্পর্কে কেউ নস্টালজিক বোধ করতে পারে, তবে এটি অনস্বীকার্য যে মিথুনের আগমন সত্যিই পরিবর্তন করেছে যে একজন এআই এজেন্ট আমাদের জন্য কী করতে পারে।
মিথুন রাশির সাথে ভাষা বোঝার চপ অনেক ভালো ।কথোপকথনগুলি স্বাভাবিক , অ্যাপের ইন্টারঅ্যাকশনগুলি তরল, অন্যান্য Google পণ্যগুলির সাথে একীকরণ ফলপ্রসূ এবং এমনকি এটির বিনামূল্যের অবস্থায়ও, জেমিনি একটি আইফোনেও সিরিকে ক্লিনারদের কাছে নিয়ে যায়৷
তবে, কিছু কৌশল রয়েছে যা মিথুনকে সম্পূর্ণ ভিন্ন লিগে রাখে। গভীর গবেষণা হল সেই এজেন্টিক বৈশিষ্ট্যগুলির মধ্যে একটি যা আমি প্রতিদিন ব্যবহার করি এবং বিস্মিত হতে থাকি। মার্চ মাসে, গুগল মিথুন অস্ত্রাগারে আরেকটি পুরস্কৃত বৈশিষ্ট্য যুক্ত করেছে: অডিও ওভারভিউ।
এটি সব বাঁক, একটি পডকাস্ট মধ্যে

কল্পনা করুন যে আপনার অযৌক্তিক নথি, অতি জটিল গবেষণা পত্র বা একাডেমিক পঠন সামগ্রীকে একটি প্রাণবন্ত দ্বিমুখী পডকাস্ট চ্যাটে পরিণত করুন। যে মূলত অডিও ওভারভিউ সব সম্পর্কে কি. বৈশিষ্ট্যটি প্রথমে Google এর গভীরভাবে আন্ডাররেটেড নোটবুকএলএম-এ পৌঁছেছিল এবং অবশেষে মোবাইল এবং ওয়েবে মূল জেমিনি অভিজ্ঞতায় পোর্ট করা হয়েছে।
এই অডিও মেকওভারগুলি পেতে আপনাকে কোনও প্রযুক্তিগত হুপসের মধ্য দিয়ে যেতে হবে না, বা একটি হাইপার-স্পেসিফিক টেক্সট প্রম্পট লিখতে হবে না। শুধু সংযুক্তি পিকার থেকে একটি ফাইল আপলোড করুন, এবং আপনি চ্যাট বক্সের ঠিক উপরে একটি "জেনারেট অডিও ওভারভিউ" চিপ দেখতে পাবেন। এটিতে আলতো চাপুন এবং পডকাস্ট প্রজন্ম শুরু হবে।
এটি সম্পূর্ণ হতে কয়েক মিনিট সময় লাগতে পারে, কিন্তু এর মধ্যে, আপনি নিরাপদে অন্য অ্যাপে (বা উইন্ডো) স্যুইচ করতে পারেন। প্রক্রিয়াটি শেষ হয়ে গেলে, আপনি পডকাস্টটি আপনার শোনার আনন্দের জন্য বা অন্য লোকেদের সাথে ভাগ করে নেওয়ার জন্য প্রস্তুত হওয়ার বিষয়ে একটি বিজ্ঞপ্তি পাবেন।
অডিও ওভারভিউ সাধারণত একটি দুই-ব্যক্তি, মুক্ত-প্রবাহিত চ্যাট একটি ভয়ঙ্কর প্রাকৃতিক সুরে। এটি প্রায় মনে হয় যেন আপনি জেমিনি লাইভের সাথে চ্যাট করছেন, যা ভয়েস কথোপকথন মোডে আমি এখন পর্যন্ত যে কোনো এআই চ্যাটবট ব্যবহার করেছি তার চেয়ে নাটকীয়ভাবে বেশি স্বাভাবিক মনে হয়।
এই এআই-জেনারেটেড পডকাস্টগুলি সাধারণত বেশ ভালভাবে তৈরি, আমি বলব। কিন্তু আমি কয়েকটি কারণে তাদের প্রতি আকৃষ্ট হই। প্রথমে, আমি একটি স্ক্রিনের দিকে তাকাই, গবেষণার জন্য নিবন্ধ পড়ি এবং আমার নিজের জিনিস লিখি, প্রায় পুরো দিন।

এটি আরও কোনও পাঠ্য-ভিত্তিক উপাদানের সাথে জড়িত হওয়ার জন্য খুব কম জায়গা ছেড়ে দেয়, তা একাডেমিক, কাজের সাথে সম্পর্কিত বা এমনকি বিনোদনমূলকও হতে পারে। যাইহোক, যদি আমি সেই উপাদানের সাথে জড়িত থাকার জন্য সংবেদনশীল মোড পরিবর্তন করতে পারি, আমার পড়ার ক্লান্তি একটি পিছিয়ে যায়।
অডিও পডকাস্টগুলি আরও নিমগ্ন ফ্যাশনে পাঠ্য-ভিত্তিক উপাদানগুলির সাথে জড়িত হওয়ার সম্পূর্ণ নতুন উপায় অফার করে৷ এটি আমাদের দ্বিতীয় সুবিধার দিকে নিয়ে আসে, যা হল সংবেদনশীল উদ্দীপনা, বা ভিন্নতা। এই সূত্রটি একাডেমিয়া এবং পেশাদার কোচিংয়ের ক্ষেত্রে ভালভাবে নথিভুক্ত এবং পরীক্ষা করা হয়েছে।
এটা কিভাবে আমাকে সাহায্য করেছে?
পাঠ্য ক্লান্তি তার নিজের টোল লাগে. এটি এমনকি উত্তেজনাপূর্ণ কাজকে একটি কাজের মতো দেখায় যা আপনাকে অতীত করতে হবে, কারণ আপনি এটি মিস করতে পারবেন না। যাইহোক, ভিন্ন সংবেদনশীল মিডিয়ার মাধ্যমে একই কাজ, বা এর সারমর্মের সাথে জড়িত থাকা আরও পাঠ্য-ভিত্তিক উপাদানের উপর ওভারলোড হওয়ার ভয়কে দমন করে। এটি আসলে কয়েকটি অন্যান্য উপায়ে সাহায্য করে।
"একাধিক ইন্দ্রিয়কে নিযুক্ত করা স্মৃতিশক্তিকে শক্তিশালী করে৷ যখন আমরা শুনি এবং যোগাযোগ করি – পড়া, লেখা বা করার মাধ্যমে – মস্তিষ্ক আরও শক্তিশালী সংযোগ তৈরি করে, যা পরে স্মরণ করা সহজ করে তোলে," বলেছেন ইয়াসির নাসিম, একজন ভাষাবিজ্ঞান বিশেষজ্ঞ যার গবেষণা কাজ শিক্ষার পদ্ধতির আধুনিকীকরণ এবং গ্যামিফিকেশনের উপর দৃষ্টি নিবদ্ধ করেছে৷
নাসিম, যিনি বর্তমানে একটি শীর্ষস্থানীয় এড-টেক ফার্মের পাঠ্যক্রম বিশেষজ্ঞ, আমাকে বলেন যে আপনি শেখার জন্য শুধুমাত্র একটি একক মাধ্যমের উপর নির্ভর করতে পারবেন না। পরিবর্তে, তিনি আমাকে বলেন, আপনাকে সর্বাধিক সুবিধার জন্য বিভিন্ন পদ্ধতি একত্রিত করতে হবে, সংবেদনশীল প্রভাব থেকে স্মৃতি ধরে রাখা পর্যন্ত।

কম্পিউটার অ্যান্ড এডুকেশন জার্নালে প্রকাশিত গবেষণাও হাইলাইট করেছে যে কীভাবে শিক্ষার্থীরা অডিও ফাইলগুলিকে উচ্চতর শিক্ষা এবং পুনর্বিবেচনা উপাদান হিসাবে খুঁজে পেয়েছে। নমনীয়তা, এবং সংবেদনশীল বহুমুখিতা, অন্যান্য মিডিয়ার তুলনায় পডকাস্টের জন্য তাদের পছন্দের ক্ষেত্রে একটি প্রধান ভূমিকা পালন করেছে।
"সত্য বোঝার এবং দীর্ঘমেয়াদী ধরে রাখা হয় যখন শ্রবণকে ভিজ্যুয়াল, আলোচনা বা হ্যান্ড-অন অ্যাক্টিভিটিগুলির সাথে যুক্ত করা হয়," নাসিম যোগ করেন। মিথুনের অডিও ওভারভিউ নিয়ে আমার নিজের অভিজ্ঞতা তার পরামর্শের প্রতিধ্বনি। একই উপাদান পড়ার তুলনায় আমি অডিও পডকাস্টের মাধ্যমে যে জ্ঞান গ্রহন করেছি তার একটি শক্তিশালী স্মৃতিচারণ আছে ।
আপনি দেখুন, এই অডিও পডকাস্টগুলি একটি সাধারণ পাঠ্য থেকে অডিও রূপান্তর নয়৷ পরিবর্তে, তারা পাঠ্যের অন্যথায় বিরক্তিকর প্রাচীরকে একটি দুই-ব্যক্তি কথোপকথনে ভেঙে দেয় যেটির জন্য আপনি মূলত একমাত্র দর্শক। এটি যেকোন পাঠ্য-ভিত্তিক উপাদানের জন্য একটি বর যা তাত্ক্ষণিকভাবে আপনার কৌতূহল সৃষ্টি করে না এবং আপনাকে তাত্ক্ষণিক পড়ার দিকে নিয়ে যায়।
আমার সাম্প্রতিক পরীক্ষায়, জেমিনীর অডিও পডকাস্ট আমাকে "স্থানীয় তথ্য-তাত্ত্বিক লক্ষ্য ফাংশনগুলির উপর ভিত্তি করে ব্যাখ্যাযোগ্য স্নায়ু শিক্ষার জন্য একটি কাঠামো" নিয়ে আলোচনা করা একটি কাগজের তাৎপর্য বুঝতে সাহায্য করেছে। সহজ ভাষায়, গবেষণায় আলোচনা করা হয়েছে কিভাবে স্নায়ু কোষ নিজেদের সংগঠিত করে।
আমি এখানে করার চেষ্টা করছি আপনি বিন্দু পেতে, ডান?
সুবিধা, সর্বোপরি

তথ্য শোষণ করার ক্ষেত্রে সুবিধা একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। এবং তাই পুরো প্রক্রিয়া সম্পর্কে উত্সাহ এবং উত্তেজনা নেই. কম্পিউটারস ইন হিউম্যান বিহেভিয়ার জার্নালে প্রকাশিত একটি গবেষণাপত্র অনুসারে, পডকাস্টগুলি "সুবিধা, নমনীয়তা এবং তথ্য এবং জ্ঞানের অ্যাক্সেসযোগ্যতা বাড়ায়।" এটা বুঝতে আমার বেশি সময় লাগেনি।
জাতীয় রাজধানীতে বাস করা, ট্রাফিক বা পাবলিক যাতায়াতের মধ্যে আটকে থাকা 2-3 ঘন্টার মধ্যে কাটানো আমার জন্য প্রতিদিনের বাস্তবতা। কিন্তু সব কিছুর অস্বস্তির চেয়ে বেশি, এটা নষ্ট সময় যা সবচেয়ে বেশি কষ্ট দেয়। অডিও শেখার উপাদান সেই সময়টিকে একটি উত্পাদনশীল ফ্যাশনে ব্যবহার করার সবচেয়ে সুবিধাজনক উপায় সরবরাহ করে।
মিথুনের সাথে, আপনার আরেকটি গুরুত্বপূর্ণ সুবিধা রয়েছে। আপনাকে একটি নির্দিষ্ট বই, সংবাদ নিবন্ধ বা একাডেমিক উপাদানের অডিও উপলব্ধতার উপর নির্ভর করতে হবে না। আপনি শুধুমাত্র আপনার নিষ্পত্তি যা কিছু উপাদান ডাউনলোড করতে পারেন, এবং জেমিনি এটি একটি পডকাস্ট-শৈলী কথোপকথনে পরিণত হবে.
প্রচুর মাল্টি-ডিসিপ্লিনারি গবেষণা রয়েছে যা শেখার জন্য একটি অডিও-ভিত্তিক পদ্ধতির সুবিধাগুলিকে সমর্থন করে। এবং এটি শুধুমাত্র শোনার বিষয়ে নয়, বরং জিনিসগুলিকে ভেঙে ফেলার এবং আরও সহজলভ্য ফ্যাশনে উপস্থাপন করার বিষয়ে আরও অনেক কিছু।
"কয়েকজন লোক বলেছে … তারা এই সত্যটি পছন্দ করেছে যে আমরা তাদের এমন কিছু জিনিস দিচ্ছি যা তারা সংবাদপত্রে পড়ছে না। তারা সত্যটি পছন্দ করে … আমরা নিজেদেরকে অন্যভাবে পরিচয় করিয়ে দেওয়ার চেষ্টা করছি," একটি সংবাদ সম্পাদককে উদ্ধৃত করে একটি গবেষণা পত্র বলে। সিরাকিউজ ইউনিভার্সিটির সৌজন্যে কাগজটি 2006 সালে পডকাস্ট প্রবণতার প্রথম দিকে প্রকাশিত হয়েছিল।

2025 সাল পর্যন্ত, পডকাস্টগুলি শিক্ষামূলক উপাদান থেকে বিনোদন সামগ্রী পর্যন্ত তথ্য গ্রহণের জন্য একটি সত্য ঘটনা হয়ে উঠেছে। পিউ রিসার্চ সেন্টারের মতে, প্রায় অর্ধেক আমেরিকান পডকাস্টের সাথে জড়িত। জরিপ করা দর্শকদের অর্ধেকেরও বেশি শেখার জন্য, বিনোদনের জন্য বা অন্য কিছু করার সময় কিছু অডিও উপাদান থাকার জন্য পডকাস্ট শুনেছিল।
প্রায় এক তৃতীয়াংশ অন্যান্য লোকের মতামত শুনতে চেয়েছিল, এবং অন্য একটি সমান বড় অংশকে সংযুক্ত করা হয়েছিল যাতে তারা খবর এবং বর্তমান ঘটনাগুলির উপর নজর রাখতে পারে। আমার ব্যস্ততা পূর্বোক্ত প্যাটার্ন থেকে খুব বেশি দূরে পড়েনি। দীর্ঘ-ফর্মের সাংবাদিকতার গল্প বা অনুসন্ধানমূলক কাজের জন্য, আমি প্রায়শই তাদের পডকাস্ট সংস্করণটিকে আরও আনন্দদায়ক বলে মনে করি।
আরো কার্যকর, এছাড়াও
মজার বিষয় হল, পডকাস্টগুলি ব্যবহারিক পরিবর্তনগুলিও চালনা করতে দেখা গেছে। পডকাস্ট শোনার পর প্রায় দুই-তৃতীয়াংশ শ্রোতা একটি বই বা চলচ্চিত্রের সাথে জড়িত, অর্ধেকেরও বেশি শ্রোতা সোশ্যাল মিডিয়াতে একজন ব্যক্তিকে অনুসরণ করা শুরু করে এবং তাদের মধ্যে এক তৃতীয়াংশ ব্যায়াম করা বা তাদের খাদ্যাভ্যাস পরিবর্তন করার মতো জীবনধারা পরিবর্তন করে।
জার্নাল অফ সোশ্যাল মিডিয়া মার্কেটিং- এ প্রকাশিত গবেষণা মিডিয়া প্রতিস্থাপন এবং মিডিয়া শোনার প্রেক্ষাপটে কার্যকরী সাদৃশ্য এবং শ্রোতাদের ইচ্ছার মতো ধারণাগুলিকে হাইলাইট করেছে। ব্যাপক ধারণা হল যে ব্যবহারকারীরা মাধ্যমটিকে মূল্যায়ন করে এবং তাদের সবচেয়ে উপযুক্ত একটি বেছে নেয়।
"পডকাস্ট বিষয়বস্তুর স্বতন্ত্রতার জন্য, শোনার ইচ্ছা এবং মিডিয়া প্রতিস্থাপনের উপর প্রভাব ইতিবাচক, পরামর্শ দেয় যে অনন্য বিষয়বস্তু, উচ্চ মানের এবং বিস্তৃত বৈচিত্র্য মানুষকে পডকাস্ট শুনতে আগ্রহী করে"। আমি ব্যক্তিগতভাবে এই অনুসন্ধানের প্রমাণ করতে পারি।
— Nadeemonics (@nsnadeemsarwar) 30 মার্চ, 2025
গত কয়েকদিন ধরে, আমার কাছে "পডকাস্ট-ফাইড" অসংখ্য গবেষণাপত্র রয়েছে যা ঘুমের ধরণ, জ্ঞানীয় স্বাস্থ্য এবং অন্ত্রের স্বাস্থ্যের উপর ফাইবার, মাংস এবং প্যাকেটজাত খাবারের প্রভাব নিয়ে আলোচনা করে। বৈজ্ঞানিক কাগজপত্রের স্পষ্টভাবে প্রযুক্তিগত সুরের তুলনায়, দুটি হোস্ট একটি "অনুভূতিমূলক" এবং "প্ররোচিত" স্বরে ফলাফলগুলিকে ভেঙে ফেলার ফলে আমার উপর স্পষ্টভাবে গভীর প্রভাব পড়েছিল।
এটিকে একটি বইতে সামাজিক শিষ্টাচার বা সাংস্কৃতিক সংবেদনশীলতা সম্পর্কে শেখার মতো মনে করুন। এবং বছর পরে, আপনার নিজের চোখে তাদের কর্মে দেখা। অথবা, একটি বই থেকে একটি বিদেশী ভাষা শেখার বিষয়ে চিন্তা করুন, সমস্ত আপনার নিজের উপর, এবং আপনি যখন সেই সমস্ত জ্ঞান আপনার কানে পূর্ণ করে এমন একজন ব্যক্তির কাছ থেকে আপনি এটি শিখবেন তখন এটি কী পার্থক্য করে।
পরবর্তী পদ্ধতিটি আরও ভাল ফলাফল দেয়। এবং এটি প্রাথমিকভাবে কারণ বহু-সংবেদনশীল ব্যস্ততার যৌগিক প্রভাব শেখার প্রক্রিয়াকে গতি দেয়, বা এটিকে আরও কার্যকর করে তোলে। জেমিনীর অডিও ওভারভিউ একই রকম প্রভাব তৈরি করেছে, এবং তারা আমাকে অনেক সাহায্য করেছে।
কয়েক snags
যতটা ফলদায়ক মনে হচ্ছে, মিথুনের অডিও ওভারভিউগুলি তা নয়৷ তারা এর "পডকাস্টি-ফিকেশন" প্রচেষ্টার মধ্যে একটি রুচিশীল-লিখিত গল্পের প্রকৃত সারাংশ নিষ্কাশন করতে পারে, বা কয়েকটি ছোট বিবরণ মিস করতে পারে। বেশ কয়েকটি কার্যকরী অদ্ভুততা রয়েছে। অডিও ওভারভিউয়ের দৈর্ঘ্য, যা সরাসরি উৎস উপাদানের গভীরতার সাথে মিলে যায়, বেশ এলোমেলো হতে পারে।

উদাহরণস্বরূপ, যখন আমি এটিকে ফার্সি ভাষায় ক্রিয়াগুলির সংমিশ্রণ এবং রূপবিদ্যার বিষয়ে একটি 260-পৃষ্ঠার বই খাইয়েছিলাম, তখন জেমিনি দ্বারা উত্পন্ন অডিও ওভারভিউটি মাত্র সাত মিনিটের বেশি ছিল। গুণগতভাবে, এটি সবচেয়ে গুরুত্বপূর্ণ অংশগুলিকে কভার করেছে, কিন্তু সূক্ষ্ম বিবরণগুলি মিস করেছে।
অন্য ক্ষেত্রে, আমি একটি অডিও পডকাস্টে চার পৃষ্ঠা মূল্যের একটি গভীর গবেষণা নথিতে পরিণত করেছি। এটির জন্য সময়কাল ছিল প্রায় 13-মিনিট। দুর্ভাগ্যবশত, মিথুনের স্বয়ংক্রিয় টাস্ক চিপ আপনাকে অডিও ওভারভিউয়ের দৈর্ঘ্য বা কথোপকথনের গভীরতা সামঞ্জস্য করতে দেবে না।
আপনি যদি Google NotebookLM ব্যবহার করেন, যেখানে অডিও ওভারভিউ বৈশিষ্ট্যটি প্রথম উপস্থিত হয়েছিল, আপনি একটি প্রম্পট লিখতে পারেন যা পডকাস্ট কথোপকথন কতটা গভীরে যায় তা নির্দেশ করতে পারে। আমি কয়েক সপ্তাহ আগে NotebookLM-এ 59 রানটাইম সহ একটি অডিও পডকাস্ট তৈরি করেছি।
মিথুন তোমাকে তা করতে দেবে না। এখনো না।

তারপরে, আমাদের ভাষার বাধা রয়েছে, কারণ Google বর্তমানে ইংরেজির বাইরে পুরো পাইপলাইনটি সূক্ষ্ম-টিউন করার প্রক্রিয়ায় রয়েছে। আরেকটি সমস্যা ছিল ইংরেজি উচ্চারণ। উদাহরণস্বরূপ, এআই পডকাস্ট হোস্ট পার্সিয়ান বিশ্ব "রাফ-থিন" কে "রাফ-টিন" হিসাবে ভুল উচ্চারণ করেছে।
ইংরেজি-ফার্সি অনুবাদের দ্বিভাষিক সূক্ষ্মতার সাথে পরিচিত না একজন অপ্রশিক্ষিত কানের কাছে, বা উচ্চারণ কীভাবে একটি ভিন্ন ভাষায় শব্দের শ্রবণ উপলব্ধি পরিবর্তন করে, এআই পডকাস্ট হোস্টগুলি খুব ভালভাবে সম্পূর্ণ অস্বস্তিকর কথা বলতে পারে।
আমার অভিজ্ঞতার সমষ্টি হল যে মিথুন অডিও ওভারভিউ কোন বিপ্লব নয়। বিষয়বস্তুর সাথে জড়িত থাকার জন্য তারা কেবল একটি ভিন্ন, এবং আরও আকর্ষণীয় মাধ্যম অফার করে। এটি সব সময় কাজ করে না, তবে এটি অবশ্যই পাঠ্যের পৃষ্ঠাগুলির মাধ্যমে পড়ার একঘেয়েমি থেকে নেয় যা অন্যথায় আপনাকে ঘুমিয়ে দেবে।