ডুবাও মোবাইল অ্যাসিস্ট্যান্ট বিদেশে আলোড়ন সৃষ্টি করেছে, বিদেশীরা বলছে: “এটিই প্রথম সত্যিকার অর্থে অর্থবহ স্মার্টফোন।”

আশ্চর্যজনকভাবে, Huawei-এর Mate 80 সিরিজ এবং Samsung-এর প্রথম ট্রাই-ফোল্ড ফোন প্রকাশের পরের সপ্তাহে, সবচেয়ে জনপ্রিয় ডিভাইসটি ছিল ZTE nubia M153, যেটিতে Doubao মোবাইল সহকারী প্রযুক্তির একটি প্রিভিউ সংস্করণ রয়েছে।

মুক্তির পরপরই এগুলো কেবল বিক্রি হয়ে যায় না, বরং ইঞ্জিনিয়ারিং প্রোটোটাইপের প্রথম ব্যাচটি সেকেন্ডহ্যান্ড প্ল্যাটফর্মে কয়েকশ ইউয়ান বেশি দামে পুনরায় বিক্রি করা হয়। ৩৪৯৯ ইউয়ানের সরকারী মূল্যের তুলনায়, বাজারের চাহিদা সত্যিই শক্তিশালী ছিল।

ডুবাও মোবাইল অ্যাসিস্ট্যান্টের অফিসিয়াল টিম বারবার জোর দিয়ে বললেও যে বর্তমান টেকনিক্যাল প্রিভিউ সংস্করণটি সাধারণ গ্রাহকদের জন্য নয়, এটি প্রযুক্তি প্রদর্শন এবং ইকোসিস্টেম অন্বেষণের জন্য একটি পরীক্ষার ক্ষেত্র হিসাবে আরও বেশি অবস্থান করছে, যা ডেভেলপার এবং প্রযুক্তি উত্সাহীদের অংশগ্রহণ এবং অভিজ্ঞতা অর্জনের জন্য আকৃষ্ট করে।

কিন্তু এটি জনসাধারণের উৎসাহকে দমিয়ে রাখতে পারেনি। টেকআউট অর্ডার করা এবং সোশ্যাল মিডিয়ায় পোস্ট করার মতো মৌলিক কাজগুলি ছাড়াও, কিছু নেটিজেন এমনকি 10 মিনিটে 30টি জীবনবৃত্তান্ত জমা দেওয়ার জন্য এটি ব্যবহার করেছিলেন।

তবে, বিতর্ক শুরু হয়, WeChat, Taobao এবং অন্যান্য অ্যাপগুলি "অসঙ্গতি সনাক্তকরণ" এবং অন্যান্য বাধা স্থাপন করে Doubao মোবাইল সহকারীকে বাদ দিতে শুরু করে।

সরকারী প্রতিক্রিয়া হিসেবে মোবাইল ফোন পরিচালনার জন্য এআই-এর কিছু ক্ষমতাও সামঞ্জস্য করা হয়েছে। সরকারী বিবৃতিতে ইঙ্গিত দেওয়া হয়েছে যে লক্ষ্য হল "পরিষ্কার এবং আরও অনুমানযোগ্য নিয়ম গঠনের প্রচার" এবং ব্যবহারকারীদের যুক্তিসঙ্গতভাবে এআই ব্যবহারের অধিকার থেকে সম্পূর্ণরূপে বঞ্চিত করা এড়ানো।

লুও ইয়ংহাও সমর্থনে একটি বার্তা পোস্ট করেছেন, যেখানে তিনি বলেছেন যে এটি একটি অপ্রতিরোধ্য প্রযুক্তিগত বিপ্লব, এবং মানুষ এই ঐতিহাসিক দিনটিকে মনে রাখবে। অনার স্বাগত জানিয়েছে, অন্যদিকে মেইজু আরও সমৃদ্ধ বাস্তুতন্ত্র তৈরিতে গভীর সহযোগিতার প্রত্যাশা প্রকাশ করেছে।

চীনে জনপ্রিয়তা অর্জনের পর, ডুবাও মোবাইল অ্যাসিস্ট্যান্ট এমনকি বিদেশেও হিট হয়ে ওঠে। এক্স প্ল্যাটফর্মে, একদল বিদেশী এটি নিয়ে পাগলের মতো আলোচনা করছিল, এবং কেউ কেউ এটিকে "আরেকটি ডিপসিক মুহূর্ত" বলেও অভিহিত করেছিল।

বিদেশী নেটিজেন: প্রথম সত্যিকার অর্থে অর্থবহ স্মার্টফোন

এই মূল্যায়ন হালকাভাবে দেওয়া হয়নি।

স্নো বুল ক্যাপিটালের সিইও টেলর ওগান প্ল্যাটফর্মে একটি দীর্ঘ পর্যালোচনা পোস্ট করেছেন, তার উত্তেজনা কার্যত পর্দা থেকে উপচে পড়ছে।

তার মূল্যায়ন ছিল সোজা: এটি বিশ্বের প্রথম সত্যিকার অর্থে অর্থবহ স্মার্টফোন।

ডুবাও মোবাইল অ্যাসিস্ট্যান্টের সাহায্যে, এআই ফোনকে সম্পূর্ণরূপে নিয়ন্ত্রণ করতে পারে – এটি ইন্টারফেস "বুঝতে" পারে, অ্যাপ্লিকেশন নির্বাচন করতে পারে বা অ্যাপ ডাউনলোড করতে পারে, বোতামে ক্লিক করতে পারে, টেক্সট ইনপুট করতে পারে, ফোন কল করতে পারে এবং এমনকি বহু-পদক্ষেপের কাজের একটি সম্পূর্ণ শৃঙ্খল সম্পাদন করতে পারে।

ফোনটি পাওয়ার পর, সে অনেক সৃজনশীল কৌশল চেষ্টা করে। উদাহরণস্বরূপ, সে আকস্মিকভাবে একটি NIO ব্যাটারি সোয়াপিং স্টেশনের ছবি তুলতে পারত এবং জিজ্ঞাসা করতে পারত, "এটি কী?", এবং AI তাৎক্ষণিকভাবে উত্তর দিত।

হোটেলের প্রবেশপথের ছবি তুলে, ডুবাও কেবল এটি কোন হোটেল তা শনাক্ত করতে পারবেন না, বরং ওগানের চাহিদা অনুসারে একটি রুম বুক করতে পারবেন এবং পোষা প্রাণীর নীতিমালাও পরীক্ষা করতে পারবেন।

চালকবিহীন ট্যাক্সিতে পার্কে যাওয়ার জন্য, ডুবাও রুট পরিকল্পনা করতে পারেন এবং নিকটতম পিক-আপ পয়েন্ট থেকে যাত্রা বুক করতে পারেন। ওগানকে কেবল মৌখিকভাবে তার উদ্দেশ্য প্রকাশ করতে হবে; ডুবাও বাকি সবকিছু পরিচালনা করেন।

এটি ব্যবহার করে দুটি পানীয় অর্ডার করার পর, ডেলিভারি ড্রোনটি দ্রুত অর্ডারটি কাছের একটি লকারে উড়িয়ে দেয়।

রাস্তা দিয়ে হেঁটে যাওয়ার সময়, ওগান একটি নতুন খোলা দোকানের ছবি তুলে জিজ্ঞাসা করলেন যে এটি কি কোনও স্থানীয় ব্র্যান্ড। ডুবাও ব্যবসার নিবন্ধন এবং ট্রেডমার্কের তথ্য পরীক্ষা করতে সক্ষম হন এবং তারপর দৃঢ়ভাবে উত্তর দেন, "হ্যাঁ।"

AI সব কাজ করে, আর মানুষ শুধু আরাম করে।

ধারাবাহিকভাবে মসৃণ কৌশলের পর, বিদেশী নেটিজেনরা ভীষণভাবে হতবাক হয়েছিলেন।

মন্তব্য বিভাগে দ্রুত স্ক্রোল করলেই অসংখ্য লাইক পাওয়া যায়। একজন নেটিজেন মন্তব্য করেছেন, "এই মুহূর্তে, অপারেটিং সিস্টেম একটি ম্যানেজারে পরিণত হয়েছে, এবং ফোনটি একটি এক্সিকিউটর হয়ে উঠেছে, আর কেবল একটি হাতিয়ার নয়।" আরেকজন অপ্রত্যাশিতভাবে স্বীকার করেছেন, "আমি ইতিমধ্যেই ডুবাও (এক ধরণের স্টিমড বান) পছন্দ করতাম, কিন্তু এখন আমি এটি আরও বেশি পছন্দ করি।"

কিছু নেটিজেন এমনকি নিজেদেরকে "ওয়াও ব্রো" বলেও সম্বোধন করেছেন:

এটা পরবর্তী স্তরের কিছু। আমি এন্টারপ্রাইজ স্তরেও একই রকম জিনিস দেখেছি, যেখানে একজন এজেন্ট আপনার পিসি নিয়ন্ত্রণ করে এবং কাজ সম্পাদন করে, কিন্তু মোবাইল ফোনে এই প্রযুক্তি থাকা সত্যিই আকর্ষণীয়। কল্পনা করুন যখন গুগল পিক্সেল ডিভাইস এবং প্রায় প্রতিটি অ্যান্ড্রয়েড ফোনে এটি করা শুরু করবে তখন কী হবে…

পিক্সেল মনে মনে ভাবলো, "কিছু একটা ঠিক নেই। আমার কেন মনে হচ্ছে কেউ আমার উপর চাপ দিচ্ছে?"

অবশ্যই, ভিন্নমতও ছিল। একজন ব্যক্তি জিজ্ঞাসা করেছিলেন, "কিন্তু এটি কি সত্যিই বুদ্ধিমান? এই মডেলটি কি ডিভাইসে স্থানীয়ভাবে চালানো যাবে?" টেলর ওগান উত্তর দিয়েছিলেন, "এটি অবিশ্বাস্যভাবে বুদ্ধিমান। আপনি এটি ডিভাইসে বা ক্লাউডে চালানো বেছে নিতে পারেন।"

রেডিটেও আলোচনাটি সমানভাবে উত্তপ্ত হয়েছিল।

একজন নেটিজেন মন্তব্য করেছেন, "যতক্ষণ না এই ফাংশনগুলি ডিভাইসে স্থানীয়ভাবে থাকে (ক্লাউড পরিষেবা ব্যবহার না করে) এবং তাদের ব্যবহার ঐচ্ছিক, আমি এটি সমর্থন করি।" আরেকজন নেটিজেন বিচক্ষণতার সাথে AI এর আসল অর্থ তুলে ধরেছেন: "এটিই AI এর করা উচিত: ব্যক্তিদের সময় বাঁচানো, ব্যক্তিগত মূল্য বাদ দেওয়ার চেষ্টা করা নয়।"

সত্যি বলতে, ডুবাও মোবাইল অ্যাসিস্ট্যান্ট প্রকাশের পর, এক্স প্ল্যাটফর্মে নেটিজেনদের শেয়ার করার পদ্ধতিগুলি ক্রমশ অপ্রচলিত হয়ে উঠছিল। কেউ কেউ কফি অর্ডার করার জন্য ডুবাও ব্যবহার করতেন, আবার কেউ কেউ ডুবাও এআই ব্যবহার করে অ্যান্ড্রয়েড ফোন পরিচালনা করতেন, যা পৃষ্ঠাগুলিতে মানুষের হাতের অঙ্গভঙ্গি অনুকরণ করত, যার লক্ষ্য ছিল সম্পূর্ণ স্বয়ংক্রিয়তা।

আরেকজন নেটিজেন ডুবাওয়ের মোবাইল সহকারী ব্যবহার করে একটি নারকেল অর্ডার করেছিলেন। যেহেতু অর্ডারটি ন্যূনতম অর্ডার পরিমাণ পূরণ করতে পারেনি, তাই ডুবাও ভেবেচিন্তে ব্লগারকে ন্যূনতম অর্ডার পরিমাণ পৌঁছানোর জন্য ১.৯৯ ইউয়ানের টেবিল লবণের ব্যাগ বেছে নিতে সাহায্য করেছিলেন।

ডুবাও মোবাইল অ্যাসিস্ট্যান্টের তার পূর্ববর্তী পর্যালোচনায়, APPSO উল্লেখ করেছিলেন যে তার সবচেয়ে তাৎক্ষণিক ধারণা ছিল যে ফোনটি "পাতলা" হয়ে গেছে এবং এটি বিভিন্ন অ্যাপের ক্ষমতা "সমতল" করেছে, যার ফলে মিথস্ক্রিয়া আরও স্বাভাবিক, স্বজ্ঞাত এবং দক্ষ হয়ে উঠেছে।

প্রশ্ন হলো, এটা কিভাবে করা হয়? এবং "ফোন ব্যবহার" এজেন্ট থেকে এটি কীভাবে আলাদা?

এক সপ্তাহ ধরে ডুবাও মোবাইল অ্যাসিস্ট্যান্ট ব্যবহার করার পর, APPSO এর পিছনে আরও প্রযুক্তিগত বিবরণ উন্মোচন করেছে।

আমি আপনার ফোন চালানোর জন্য Doubao মোবাইল অ্যাসিস্ট্যান্ট ব্যবহারের গোপন রহস্য উন্মোচন করেছি।

ডুবাও মোবাইল অ্যাসিস্ট্যান্ট প্রকাশের আগে, মোবাইল ফোন শিল্প আসলে বেশ কিছুদিন ধরে AI+ নিয়ে পরীক্ষা-নিরীক্ষা করছিল।

মোবাইল ফোন হার্ডওয়্যার নির্মাতারা সিস্টেম-স্তরের এআই ক্ষমতা ব্যবহার করে অ্যাপ্লিকেশনগুলির মধ্যে বাধা ভেঙে "এক-ক্লিক অ্যাক্সেস" অর্জনের চেষ্টা করছে। উদাহরণস্বরূপ, হুয়াওয়ে, শাওমি, ভিভো এবং অনার-এর মতো মূলধারার মোবাইল ফোন নির্মাতাদের এআই এজেন্টরা বিভিন্ন সেটিংসে স্বয়ংক্রিয়ভাবে বার্তা পাঠানো এবং বহু-পদক্ষেপের কাজ সম্পাদনের মতো কার্যকারিতা প্রদর্শন করেছে।

যদিও এই প্রদর্শনগুলি নির্দিষ্ট পরিস্থিতিতে এবং বাস্তবায়ন পদ্ধতিতে সামান্য ভিন্ন, মূল যুক্তি একই থাকে: বৃহৎ AI মডেলের মাধ্যমে ব্যবহারকারীর অভিপ্রায় বোঝা এবং অ্যাপ্লিকেশন জুড়ে স্বয়ংক্রিয় টাস্ক এক্সিকিউশন অর্জনের জন্য সিমুলেটেড ব্যবহারকারী ক্রিয়াকলাপের সাথে এটিকে একত্রিত করা।

এটা শুনতে বেশ অবাস্তব মনে হচ্ছে, কিন্তু বাস্তবে… আচ্ছা, উন্নতির জন্য এখনও অনেক জায়গা আছে।

ডুবাও মোবাইল অ্যাসিস্ট্যান্টের ভাগ্য অনলাইন আলোচনাকে আরও উস্কে দিয়েছে। আরও গুরুত্বপূর্ণ বিষয় হল, আমার পূর্ববর্তী অভিজ্ঞতার উপর ভিত্তি করে, ডুবাও মোবাইল অ্যাসিস্ট্যান্ট সত্যিই AI-চালিত ফোন অপারেশনকে একটি ব্যবহারযোগ্য স্তরে নিয়ে আসে, যা কেবল কয়েকটি পরিস্থিতিতে সীমাবদ্ধ নয়, বরং একটি গ্রাফিক্যাল ইন্টারফেসের মাধ্যমে দীর্ঘ এবং জটিল কাজগুলি মসৃণ এবং স্বাভাবিকভাবে সম্পন্ন করতে সক্ষম।

APPSO সুপরিচিত প্রিপ্রিন্ট প্ল্যাটফর্ম ArXiv-এ ByteDance টিম দ্বারা প্রকাশিত একটি প্রযুক্তিগত প্রতিবেদন আবিষ্কার করেছে, যার তথ্য এর পিছনে মূল নীতিগুলি ব্যাখ্যা করতে পারে।

লিঙ্কটি এখানে: https://arxiv.org/abs/2509.02544

ডুবাও মোবাইল অ্যাসিস্ট্যান্টের গ্রাফিক্যাল ইউজার ইন্টারফেস ক্ষমতাগুলি বাইটড্যান্সের সিড টিম দ্বারা তৈরি UI-TARS মডেল থেকে আসে। এটি স্ক্রিন ভিজ্যুয়াল বোঝাপড়া, লজিক্যাল রিজনিং, ইন্টারফেস এলিমেন্ট লোকেশন এবং অপারেশনকে একীভূত করে এবং এর ওপেন-সোর্স সংস্করণটি বর্তমানে সবচেয়ে জনপ্রিয় ওপেন-সোর্স মাল্টিমোডাল ইন্টেলিজেন্ট এজেন্ট মডেল।

UI-TARS 2.0 টেকনিক্যাল রিপোর্ট অনুসারে, এই মডেলের শক্তি এই যে এটি একটি সাধারণ মডুলার অ্যাসেম্বলি নয়, বরং এটি একটি এন্ড-টু-এন্ড লার্নিং পদ্ধতি গ্রহণ করে যা উপলব্ধি, যুক্তি, ক্রিয়া এবং স্মৃতিকে একীভূত করে।

তথ্য মিথ্যা নয়; GUI বেঞ্চমার্ক পরীক্ষায়, UI-TARS-2 অসাধারণভাবে ভালো পারফর্ম করে।

  • অনলাইন-মাইন্ড২ওয়েব ৮৮.২ স্কোর করেছে।
  • ওএসওয়ার্ল্ড স্কোর: ৪৭.৫
  • WindowsAgentArena ৫০.৬ স্কোর করেছে।
  • অ্যান্ড্রয়েড ওয়ার্ল্ড স্কোর: ৭৩.৩

এই ফলাফলগুলি কেবল পূর্ববর্তী প্রজন্মের মডেলকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায় না, বরং একাধিক পরিস্থিতিতে ক্লড এবং ওপেনএআই-এর মতো শক্তিশালী বেসলাইন মডেলগুলিকেও ছাড়িয়ে যায়। বিশেষ করে, অ্যান্ড্রয়েডওয়ার্ল্ডের ৭৩.৩ স্কোর ওপেনএআই সিইউএ-ও৩ মডেলের তুলনায় ২০ পয়েন্টেরও বেশি বেশি, যা শক্তিশালী প্রতিযোগিতামূলকতা প্রদর্শন করে।

গেমিং পরিবেশে, UI-TARS-2 ১৫টি গেমের একটি পরীক্ষামূলক সেটে গড়ে ৫৯.৮ স্কোর অর্জন করেছে, যা মানুষের কর্মক্ষমতার প্রায় ৬০%। OpenAI CUA এবং Claude Computer Use-এর তুলনায়, UI-TARS-2 যথাক্রমে ২.৪x এবং ২.৮x কর্মক্ষমতা উন্নতি প্রদর্শন করেছে।

এর অর্থ কী? এর অর্থ হল গেমিংয়ের ক্ষেত্রে AI প্রায় একজন গড়পড়তা মানুষের স্তরে।

LMGame-Bench-এ, এটি এখনও সবচেয়ে অত্যাধুনিক ক্লোজড-সোর্স মডেলগুলির সাথে প্রতিযোগিতা করতে পারে, যা দীর্ঘমেয়াদী গেম যুক্তিতে এর দৃঢ়তা আরও প্রমাণ করে।

আরও চিত্তাকর্ষকভাবে, UI-TARS-2 কেবল GUI কাজগুলি পরিচালনা করতে পারে না, বরং GUI-SDK এর মাধ্যমে এর ক্ষমতাও প্রসারিত করতে পারে, টার্মিনাল এবং বহিরাগত সরঞ্জামগুলির মতো সিস্টেম-স্তরের সংস্থানগুলির সাথে একীভূত করে। এটি তথ্য পুনরুদ্ধারের কাজগুলিতে (BrowseComp 29.6 পয়েন্ট) এবং সফ্টওয়্যার ইঞ্জিনিয়ারিং কাজগুলিতে (টার্মিনাল বেঞ্চ 45.3 পয়েন্ট, SWE-Bench যাচাইকৃত 68.7 পয়েন্ট) প্রতিযোগিতামূলক।

একটি একক মডেল যেকোনো জায়গায় ব্যবহার করা যেতে পারে; এটি এর বহুমুখী ব্যবহারের প্রমাণ।

এটি উল্লেখ করার মতো যে, ডুবাও টিমের ঘনিষ্ঠ সূত্র অনুসারে, ডুবাও মোবাইল অ্যাসিস্ট্যান্ট UI-TARS-এর একটি মালিকানাধীন মডেল সংস্করণ ব্যবহার করে, যা ওপেন-সোর্স সংস্করণের তুলনায় উচ্চতর কর্মক্ষমতা প্রদান করে এবং বিশেষভাবে মোবাইল পরিস্থিতির জন্য অপ্টিমাইজ করা হয়েছে। এটিই ব্যাখ্যা করতে পারে কেন ডুবাও মোবাইল অ্যাসিস্ট্যান্ট এত মসৃণ ব্যবহারকারীর অভিজ্ঞতা প্রদান করে।

ডুবাও মোবাইল অ্যাসিস্ট্যান্টের কিছু বাস্তব দক্ষতা আছে।

উপসংহারে: প্রযুক্তি শিল্পে আমাদের আরও "বহিরাগত" থাকতে পারে।

একজন সম্পাদক হিসেবে যিনি দীর্ঘদিন ধরে প্রযুক্তি পণ্যের উপর মনোযোগ দিয়েছেন, এই বছরটি আমার জন্য বেশ উল্লেখযোগ্য। এমন একটি শিল্পে যেখানে সবকিছুই একটি ফোনের মধ্যে সীমাবদ্ধ রাখতে চায়, সেখানে দুটি বহিরাগত আবির্ভূত হয়েছে, প্রত্যেকেই নকশা এবং মিথস্ক্রিয়ার সীমানা অতিক্রম করে

একটি হলো আইফোন এয়ার। প্রো সিরিজটি যখন অনিবার্যভাবে বৈশিষ্ট্যের স্তূপের শেষের দিকে এগিয়ে যাচ্ছে, তখন হালকাতা এবং পাতলাতার প্রতি এই আবেশটি স্পেক উৎসাহীদের চোখে অন্য কোনও কাজে নাও লাগতে পারে, এবং এমনকি লোকেরা এটিকে রিগ্রেশন নাকি বিবর্তন তা বলতেও অক্ষম হতে পারে, যতক্ষণ না আপনি এটি আপনার হাতে ধরেন এবং বুঝতে পারেন যে হালকাতা নিজেই একটি ফাংশন।

অন্যদিকে, ডুবাও মোবাইল অ্যাসিস্ট্যান্ট ইউজার ইন্টারফেস ডিজাইনের অন্য এক ধাপে দাঁড়িয়ে আছে। এতে আপনাকে পরিষেবা অনুসন্ধান করতে হবে না; বরং এটি পরিষেবাগুলি আপনার কাছে আসতে দেয়। এটি এমনকি GUI (গ্রাফিক্যাল ইউজার ইন্টারফেস) প্যারাডাইমকেও উল্টে দিতে পারে, যার অর্থ একদিন সেই স্ক্রিনটির প্রয়োজনও নাও হতে পারে।

একটি হল হার্ডওয়্যার, অন্যটি হল সফ্টওয়্যার, কিন্তু তারা একই লক্ষ্যে নিয়ে যায়। আইফোন এয়ার ভৌত বাল্ক হ্রাস করেছে, যখন ডুবাও মোবাইল অ্যাসিস্ট্যান্ট জটিল ইন্টারঅ্যাকশনগুলি দূর করেছে।

আপনি দেখতে পাবেন যে যখন AI কোম্পানিগুলি হার্ডওয়্যার ডিজাইনের সাথে জড়িত হয়, তখন তাদের ইন্টারঅ্যাকশন ডিজাইনের পদ্ধতি ঐতিহ্যবাহী হার্ডওয়্যার নির্মাতাদের থেকে আলাদা হয়।

ওপেনএআই কৃত্রিম বুদ্ধিমত্তা (এআই) হার্ডওয়্যার তৈরির জন্য কিংবদন্তি প্রাক্তন অ্যাপল ডিজাইনার জনি আইভের সাথেও কাজ করছে। স্যাম অল্টম্যান একবার প্রকাশ করেছিলেন যে এই ডিভাইসটির লক্ষ্য মিথস্ক্রিয়াকে পুনরায় সংজ্ঞায়িত করা: একগুচ্ছ অ্যাপের পরিবর্তে, কৃত্রিম বুদ্ধিমত্তা (এআই) প্রধান ইন্টারফেস এবং অপারেটিং স্তর হিসেবে কাজ করবে।

অবশ্যই, ইতিহাস আমাদের বলে যে এই ধরনের নতুন প্রযুক্তির বাস্তবায়ন অনিবার্যভাবে ক্রমবর্ধমান যন্ত্রণার মুখোমুখি হবে: অভিযোজন, গোপনীয়তা, বাস্তুতন্ত্র… এবং বিভিন্ন পক্ষের মধ্যে স্বার্থের পারস্পরিক ক্রিয়া। উন্নত প্রযুক্তি এবং ব্যাপক প্রয়োগের মধ্যে "দ্বিমুখী প্রতিযোগিতা" সময় নেবে, তবে এটি একটি অনিবার্য প্রবণতা।

ওপেনএআই-এর সহ-প্রতিষ্ঠাতা আন্দ্রেজ কার্পাথি সম্প্রতি মিথস্ক্রিয়ার ভবিষ্যৎ সম্পর্কে তার ভবিষ্যদ্বাণী প্রকাশ করেছেন:

গভীর মানব-যন্ত্র সহযোগিতার যুগে, অত্যন্ত জটিল ইউজার ইন্টারফেস (UI) (বিপুল সংখ্যক স্লাইডার, সুইচ এবং মেনু সহ) সহ পণ্যগুলি, যা স্ক্রিপ্ট সমর্থন করে না এবং যা অস্বচ্ছ, কাস্টম বাইনারি ফর্ম্যাটের উপর নির্মিত, ব্যর্থতার জন্য ধ্বংসপ্রাপ্ত (ngmi)।

ভবিষ্যতে, AI মানুষের গ্রাফিক্যাল ইন্টারফেস (UI/UX) বোঝার এবং পরিচালনা করার ক্ষেত্রে ক্রমশ দক্ষ হয়ে উঠবে (যেমনটি অপারেটরের মতো অত্যাধুনিক প্রকল্পগুলিতে দেখা যায়)। তবে, আমার সন্দেহ যে, যেসব পণ্য প্রযুক্তিগত উন্নয়নের বর্তমান স্তরের সাথে সক্রিয়ভাবে খাপ খাইয়ে না নিয়ে কেবল এই ভবিষ্যতের বাস্তবতার জন্য অপেক্ষা করে, তাদের উন্নতি ভালো হবে না।

অগ্রগামী হওয়ার সাহস নিজেই প্রশংসনীয়, এবং আমরা প্রযুক্তি শিল্পে আরও "বহির্ভূত" দেখতে পাব বলে আশা করি।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো