
Google I/O 2024 থেকে যদি একটি জিনিস বেরিয়ে আসে যা সত্যিই আমার নজর কেড়েছে, তা হল Google এর প্রজেক্ট অ্যাস্ট্রা। সংক্ষেপে, Astra হল একটি নতুন এআই সহকারী যার সাথে বক্তৃতা, দৃষ্টি, পাঠ্য এবং মেমরির ক্ষমতা রয়েছে। আপনি এটির সাথে এমনভাবে কথা বলতে পারেন যেন এটি রুমের অন্য একজন ব্যক্তি, এটি যা দেখে তা বর্ণনা করতে বলুন এবং এমনকি সেই জিনিসগুলি সম্পর্কে তথ্য মনে রাখতে বলুন৷
Astra ঘোষণা করার I/O কীনোট চলাকালীন , সবচেয়ে চিত্তাকর্ষক মুহূর্তগুলির মধ্যে একটি ঘটেছিল যখন একজন ব্যক্তি ফোনে Astra চালাচ্ছিলেন, তাকে একটি রুমের জিনিসগুলি বর্ণনা করতে বলছিলেন। যখন ব্যক্তিটি অ্যাস্ট্রাকে জিজ্ঞাসা করেছিল যে তাদের চশমা কোথায় ছিল, তখন অ্যাস্ট্রা দ্রুত নির্দেশ করে যে তারা রুমে কোথায় ছিল — এমনকি তাদের সম্পর্কে ভিডিওতে আগে অনুরোধ না করেও।
কিন্তু প্রজেক্ট অ্যাস্ট্রা কি বাস্তব জগতের মতো কাজ করে? I/O তে একটি দ্রুত 10-মিনিটের ডেমো চলাকালীন আমি এটিকে কার্যত দেখতে পেয়েছি, এবং আপনি কি জানেন? আমি বেশ মুগ্ধ।
'এটা একটা ভালো লাঠি ফিগার!'
Google আমাদেরকে কয়েকটি Astra ডেমোর মধ্য দিয়ে হেঁটেছে: অ্যালিটারেশন, পিকশনারি, স্টোরিটেলিং এবং ফ্রি ফর্ম। তারা সকলেই আপনি যা আশা করেছিলেন তা করেছেন এবং তারা সবাই সমানভাবে চিত্তাকর্ষক ছিল। কিছু প্রসঙ্গে, Astra ডেমো Google তার I/O কীনোটের সময় দেখিয়েছিল যে একটি ফোনে AI চলছিল। ডেমোতে আমি দেখেছি (যার ফটো বা ভিডিও নেওয়ার অনুমতি ছিল না), Astra একটি ল্যাপটপে চলছিল এবং একটি ক্যামেরা এবং একটি টাচস্ক্রিন ডিসপ্লেতে সংযুক্ত ছিল৷
অ্যালিটারেশন ডেমোতে, প্রজেক্ট অ্যাস্ট্রা দলের সদস্যরা এলোমেলো বস্তুর দিকে "দেখতে" ছিল (ক্যামেরা একটি ডেমো টেবিলের দিকে নির্দেশ করে)। এটি সঠিকভাবে শনাক্ত করেছে যে এটি কী দেখছে – একটি স্টাফড প্রাণী, একটি খেলনা আপেল এবং একটি খেলনা হটডগ – এবং এটি যা দেখেছে তা বর্ণনা করার পুরো সময় অনুলিপিতে কথা বলে৷ এটি সবই কিছুটা বোকা ছিল, তবে অ্যাস্ট্রা যা দেখছিল তা জানত এবং এটি আমার মুখে হাসি এনেছিল।
পিকশনারি ডেমো চলাকালীন আরেকটি মজার মুহূর্ত ঘটেছে। অ্যাস্ট্রা টিমের কেউ একটি স্টিক ফিগার আঁকার জন্য সংযুক্ত টাচস্ক্রিন ব্যবহার করেছে। যখন তিনি ব্যাখ্যা করছিলেন যে তিনি প্রথমে লাঠির চিত্রটি আঁকছিলেন, তখন অ্যাস্ট্রা – অপ্রস্তুত – চিৎকার করে বলেছিল, "এটি একটি ভাল লাঠি চিত্র!" অনেক উৎসাহের সাথে।

এটি একটি সূক্ষ্ম মুহূর্ত ছিল, কিন্তু এটি সত্যিই বাড়িতে নিয়ে গেছে ঠিক কতটা ভিন্ন Astra, বলুন, Google Assistant। কাউকে জিজ্ঞাসা করার দরকার নেই, "আরে অ্যাস্ট্রা, এই লাঠির চিত্রটি সম্পর্কে আপনি কী মনে করেন?" এটি লাঠির চিত্রটি দেখেছে, এটি সম্পর্কে Googler-এর কথা শুনেছে এবং নিজেই প্রতিক্রিয়া প্রদান করেছে৷ এটা ছিল চোয়াল-ড্রপ ধরনের. সেখান থেকে, অ্যাস্ট্রা দলের সদস্য স্টিক ফিগারের প্রসারিত হাতে একটি খুলির ইমোজি রাখলেন। যখন জিজ্ঞাসা করা হয়েছিল যে অঙ্কনটি কোন খেলার প্রতিনিধিত্ব করবে, অ্যাস্ট্রা অবিলম্বে হ্যামলেটকে অনুমান করেছিলেন।
গল্প বলার এবং বিনামূল্যে ফর্ম তাদের মুহূর্ত ছিল, এছাড়াও. গল্প বলার ডেমোর জন্য, অ্যাস্ট্রাকে একটি খেলনা কাঁকড়া দেখানো হয়েছিল এবং এটি সম্পর্কে একটি গল্প বলতে বলা হয়েছিল। Astra একটি সৈকত দিয়ে কাঁকড়া হাঁটা সম্পর্কে একটি বিস্তারিত গল্প বলা শুরু. তারপরে টেবিলে একটি ফিজেট স্পিনার রাখা হয়েছিল, এবং অ্যাস্ট্রাকে এটি গল্পে অন্তর্ভুক্ত করতে বলা হয়েছিল। এটি একটি বীট এড়িয়ে যাওয়া ছাড়া তাই করেছে.
নাম অনুসারে, ফ্রি ফর্ম ডেমো অ্যাস্ট্রাকে যা কিছু বলা হয়েছিল তা করার জন্য একটি অবস্থানে রাখে। এতে তিনটি স্টাফড প্রাণী দেখানো হয়েছিল এবং তাদের নাম বলা হয়েছিল। কেউ তখন অ্যাস্ট্রাকে বিভিন্ন প্রাণীর নাম স্মরণ করতে বলেছিল, এবং এটি তিনটির মধ্যে দুটি সঠিক হয়েছে। ঠিক আপনার এবং আমার মতো, অ্যাস্ট্রা যা দেখে এবং শোনে তা মনে রাখে। Google এখনও খুঁজে বের করছে যে Astra কতটা মনে রাখতে হবে এবং কতক্ষণ এটি সেই তথ্যটি ধরে রাখতে হবে, এবং সেগুলিকে ইস্ত্রি করা গুরুত্বপূর্ণ বিবরণ। কিন্তু ঘটনাটি যে আদৌ ঘটে তা জাদুকরী কিছু নয়।
শ্রবণ হল বিশ্বাস

সম্ভবত আমার ডেমো চলাকালীন আমার কাছে সবচেয়ে বেশি যা আটকেছিল তা ছিল অ্যাস্ট্রা কেমন স্বাভাবিক অনুভব করেছিল। Astra দলের সদস্যদের ভয়েস কমান্ডের প্রতি মনোযোগ আকর্ষণ করার জন্য "আরে Astra" বা "OK Astra" বলার প্রয়োজন নেই। একবার Astra চালু হয়ে গেলে, এটি ক্রমাগত প্রশ্ন/কমান্ড/মন্তব্য শুনতে এবং সেগুলির প্রতিক্রিয়া জানাতে সক্ষম হয়েছিল যেন এটি রুমের অন্য একজন ব্যক্তি।
এর প্রতিক্রিয়ার গুণমান ছিল চিত্তাকর্ষক। Astra শুনে, আমি একবারও অনুভব করিনি যে আমি একজন ভার্চুয়াল সহকারী আমার সাথে কথা বলতে শুনছি। Astra প্রদত্ত ভয়েস ইনফ্লেকশন এবং স্বাভাবিক স্পিকিং প্যাটার্ন সত্যিই কিছু ছিল। আমি যদি আমার চোখ বন্ধ করে থাকি, তাহলে আমি নিজেকে কৌশলে ভাবতে পারব যে আমি আমার সাথে রুমে অন্য কারো কথা শুনছি — কম্পিউটার নয়।
যদি আমরা কখনও এমন একটি বিন্দুতে পৌঁছতে যাই যেখানে AI একটি বন্ধুত্বপূর্ণ, সহায়ক এবং ব্যক্তিত্বপূর্ণ সহকারীর মতো অনুভব করে , তাহলে এটি অনুভব করা দরকার যে আপনি একজন বন্ধুর সাথে কথা বলছেন। Astra মনে হয় যে এটি সত্যিই এর কাছাকাছি, এবং এটি রত্ন, টোকেন বা অন্য যেকোন এআই জার্গনের চেয়ে অসীমভাবে বেশি উত্তেজনাপূর্ণ, গুগল তার মূল বক্তব্যের সময় কথা বলে দুই ঘন্টা ব্যয় করেছে।
অ্যাস্ট্রা কি সত্যিই ভবিষ্যতের এআই?

"প্রজেক্ট অ্যাস্ট্রা" নামটি থেকে বোঝা যায়, অ্যাস্ট্রা এখনও একটি কাজ চলছে এবং এমন কিছু নয় যা Google যেকোন সময় শিগগিরই পাঠানোর জন্য প্রস্তুত। অ্যাস্ট্রা কি অবশেষে আমার অ্যান্ড্রয়েড ফোনে গুগল সহকারী প্রতিস্থাপন করবে? Astra সহ একজোড়া স্মার্ট চশমা থাকলে আমার কি একটা ফোন লাগবে? সম্ভবত আরও গুরুত্বপূর্ণ, আমরা কি অ্যাস্ট্রার কাছাকাছি কোথাও স্বাভাবিক, দৈনন্দিন ব্যবহারের জন্য প্রস্তুত?
এগুলি সমস্তই খুব বড় প্রশ্ন যা Google এর এখনও সমাধান করতে হবে, এবং আমি কল্পনা করি যে আমাদের কাছে সেগুলির কোনওটির উত্তর পেতে কিছুক্ষণ সময় লাগবে৷ কিন্তু নিজের জন্য Astra অভিজ্ঞতা এবং এটির সাথে আমার সময় প্রতিফলিত করার পরে, আমি সাহায্য করতে পারি না কিন্তু এর সম্ভাব্যতা সম্পর্কে উত্তেজিত বোধ করতে পারি।
এআই সম্পর্কে খারাপ বোধ করা খুব সহজ, এবং ঠিক তাই। যখন Google I/O মূল বক্তব্যের কিছু অংশ AI ইমেজ জেনারেশন নিয়ে বড়াই করে, মুভি তৈরি করতে AI ব্যবহার করে, বা AI-তে Google সার্চ ফলাফলের সংক্ষিপ্ত বিবরণ দিয়েছিল — যা আমরা জানি যে আধুনিক ইন্টারনেটকে খুব ভালভাবে মেরে ফেলতে পারে — আমি ভয় পেয়েও সাহায্য করতে পারিনি AI ধাঁধাঁযুক্ত ভবিষ্যতের দিকে আমরা দ্রুত এগিয়ে যাচ্ছি। কিন্তু একটি স্মার্ট, বন্ধুত্বপূর্ণ, স্মরণীয়, এবং সহজে কথা বলা এআই সহকারী যা আসলে একটি সাই-ফাই মুভির মতো কিছু মনে করে? যে সম্পর্কে কথা বলতে কিছু.
আমি জানি না Astra কখনও এতটা শান্ত বা পরিবেষ্টিত হবে কিনা যতটা আমি স্বপ্ন দেখছি। কিন্তু সত্যিই মনে হচ্ছে এমন একটি ভবিষ্যত হতে পারে যেখানে এটি ঘটবে, এবং আমি আশা করি এটিই AI ভবিষ্যত যার দিকে Google তার প্রচেষ্টা চালাবে।