গুগল “এআই এর রাজা” হয়ে উঠেছে এটা কি সব ওপেনএআই এর দোষ?

2016 সালে, Google CEO সুন্দর পিচাই I/O ডেভেলপারস কনফারেন্সে বিশ্বের কাছে গর্বিতভাবে ঘোষণা করেছিলেন:

গুগল সার্চের সমার্থক হয়ে উঠেছে এবং ভবিষ্যতে অ্যালফাবেট একটি এআই-প্রথম কোম্পানি হয়ে উঠবে।

গভীর শিক্ষা, প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং অন্যান্য ক্ষেত্রে ক্রমাগত প্রচেষ্টার মাধ্যমে, Google প্রকৃতপক্ষে এই AI প্রতিযোগিতার শুরুতে নেতৃত্ব দিয়েছে। যাইহোক, চ্যাটজিপিটির আকস্মিক উত্থানের ফলে Google, যা "রেড অ্যালার্ট" বলেছিল, শান্তির সময় থেকে যুদ্ধকালীন প্রস্তুতিতে স্থানান্তরিত হয়েছে৷

অনেক লোক আশাবাদীভাবে ভবিষ্যদ্বাণী করেছেন যে গুগল, রাতারাতি গলে যাওয়া AI পর্বত, সর্বশেষে আগামী শীতের মধ্যে তার আগের মহিমা ফিরে পেতে সক্ষম হবে। কিন্তু পরে যা মঞ্চস্থ হয়েছিল তা হল এক যুবকের একটি ড্রাগনকে হত্যার গল্প।

ওপেনএআই নদী পার হতে গুগলে "পদক্ষেপ" করে

গুগল যদি এআই-এর পাথর অনুভব করে নদী পার হয়, তবে ওপেনএআই গুগলে "পায়ে" পড়ে নদী পার হচ্ছে।

সাম্প্রতিক Google নেক্সট ইভেন্টে, গুগল ঘোষণা করেছে যে সবচেয়ে শক্তিশালী মডেল, জেমিনি 1.5 প্রো, এটি 11 ঘন্টা পর্যন্ত অডিও এবং 1 ঘন্টার ভিডিও প্রক্রিয়াকরণকে সমর্থন করতে পারে, যা অনেক দর্শককে উত্তেজিত করেছে৷

কিছু নেটিজেন জেমিনি 1.5 প্রোতে ইতিহাসের সবচেয়ে আইকনিক স্পোর্টস মুহূর্তগুলির একটি সংগ্রহ আপলোড করেছে এবং ভিডিওতে খেলাধুলা, অংশগ্রহণকারী দল/অ্যাথলেট, বছর, ইত্যাদি সনাক্ত করতে বলেছে এবং এটি আপনার জন্য এটি পরিষ্কারভাবে সাজাতে পারে।

যখন লোকেরা এখনও জেমিনি 1.5 প্রো এর সাথে "খেলতে" ডুবে আছে, প্রতিযোগিতামূলক OpenAI GPT-4 Turbo-এর অফিসিয়াল সংস্করণ লঞ্চ করার ঘোষণা করেছে শুধুমাত্র মৌলিক ক্ষমতাগুলিকে ব্যাপকভাবে আপডেট করা হয়েছে, এটি একটি অন্তর্নির্মিত চিত্র পাঠের সাথেও আসে৷ ফাংশন এখন ব্যবহারকারীদের জন্য সমস্ত ChatGPT খোলার জন্য অর্থ প্রদান করেছে।

কিছু সময়ের জন্য, Gemini 1.5 Pro, যা Google-এর ঘাতক অস্ত্র বলে মনে করা হয়েছিল, এটি আবার একটি "গানো ফুল" হয়ে উঠেছে, যা লোকেদের অনুভূতি দেয় যে ওয়াং ফেং গুগলে যোগদান করেছে৷

আবার বলিস কেন? এটি ইচ্ছাকৃত বা অনিচ্ছাকৃত কিনা তা আমি বলতে পারি না, তবে ওপেনএআই গুগলের নতুন পণ্যগুলিতে প্রথমবার ছিটকে গেছে তা নয়।

এই বছরের ফেব্রুয়ারিতে, Google লঞ্চ করেছে জেমিনি 1.5 প্রো, চূড়ান্ত AI সমাধান যা এটি 1M প্রসঙ্গ সমর্থন করে, বিপরীতে, GPT-4 টার্বো শুধুমাত্র 128K প্রসঙ্গ সমর্থন করে৷

বিস্ফোরক শিরোনামগুলিও কয়েক ঘন্টার কম স্থায়ী হয়েছিল। কার্ড টেবিলে ওপেনএআইকে তাস খেলার ছন্দ বিবেচনা করার দরকার নেই এবং আপনি এআই ভিডিও প্রজন্মের ক্ষেত্রে রাজাকে খুঁজে পাবেন।

মিনিট-লং ভিডিও জেনারেশন, একাধিক লেন্সের রিয়েল-টাইম রূপান্তর, চমৎকার এবং স্থিতিশীল ছবি তৈরি এবং বিশ্ব মডেল বোঝার ক্ষমতার মতো বৈশিষ্ট্যগুলি বিশ্বের মনোযোগ আকর্ষণ করেছে এবং জেমিনি 1.5 প্রো দ্বারা সৃষ্ট স্প্ল্যাশকে দমন করেছে।

অতীতে ওপেনএআই পণ্যগুলির প্রকাশের গতির দিকে তাকালে, আমরা দেখতে পারি যে এর শক্তিশালী এজেন্ডা-সেটিং ক্ষমতাগুলি নিঃসন্দেহে মূল শব্দ যা এড়ানো যায় না। প্রতিটি প্রধান পণ্য লঞ্চ যথাযথভাবে বাজারের প্রবণতা ক্যাপচার করেছে।

পূর্বে, এটি রিপোর্ট করা হয়েছিল যে যখন অ্যানথ্রপিক এখনও ক্লাউডের নিরাপত্তা সংক্রান্ত সমস্যাগুলি বিবেচনা করছিল, ওপেনএআই বাজারে প্রথম-প্রবর্তক সুবিধাটি দখল করার জন্য ChatGPT-এর উপর চূড়ান্তভাবে নির্ভর করেছিল। অ্যানথ্রপিক অ্যামাজন থেকে $4 বিলিয়ন পর্যন্ত অর্থায়ন পাওয়ার পরে, OpenAI আবার ভয়েস এবং ইমেজ ফাংশনগুলিতে ফোকাস করে, ChatGPT-এর সাথে অ্যানথ্রপিককে একটি চড় দেয়, যা দেখতে, শুনতে এবং কথা বলতে পারে।

এই সবের পিছনে ওপেনএআই প্রতিষ্ঠাতা স্যাম অল্টম্যানের প্রভাব থেকে অবিচ্ছেদ্য হতে পারে। তিনি যখন ওয়াইসি-এর প্রধান ছিলেন তখন থেকেই তিনি মিডিয়ার প্রভাব সম্পর্কে গভীর উপলব্ধি এবং প্রয়োগ দেখিয়েছিলেন।

দ্য ইনফরমেশনের প্রতিষ্ঠাতা জেসিকা লেসিনের স্মৃতি অনুসারে, অল্টম্যান মিডিয়া রিপোর্টারদের সাথে ডিল করার ক্ষেত্রে বিশেষভাবে ভাল ছিলেন এবং সাংবাদিকদের আস্থা অর্জনের জন্য দুর্দান্ত যোগাযোগ দক্ষতা ব্যবহার করেছিলেন। এমনকি ওপেনএআই-এর আদালতের লড়াইয়ের সময়ও, তিনি কয়েকটি টুইটের মাধ্যমে জনমতের দিক নিয়ন্ত্রণ করতে সক্ষম হন এবং ইন্টারনেট সেলিব্রিটি জগতে তার প্রভাব মাস্কের সাথে তুলনীয় ছিল।

গুগল নিঃসন্দেহে এই অল্টম্যান-স্টাইলের কৌশলের শিকার হওয়া দুর্ভাগ্যজনক। কেন এই দুটি শিরোনাম এত গুরুত্বপূর্ণ? এটি ওপেনএআই দ্বারা গুগলকে "দমন" করার ইতিহাস দিয়ে শুরু হয়।

গত দুই বছরের দিকে ফিরে তাকালে, OpenAI-এর আভায়, Google-এর AI যাত্রা কিছুটা দুর্ভাগ্যজনক বলে মনে হচ্ছে।

2022 এর শেষে, ChatGPT রাতারাতি পুরো AI বিশ্বকে আলোকিত করেছিল, কিন্তু Google, যেটি খুব ভোরে উঠেছিল, পিচাই তার AI ক্ষেত্রের "মাঞ্চু বেসামরিক এবং সামরিক বাহিনী" এর দিকে তাকিয়ে ছিল এবং তাকে শুভেচ্ছা জানায় প্রতিদিন একটি দৃশ্য মঞ্চস্থ করতে পারে যেখানে কাংজি তার মন্ত্রীদের নিন্দা করে।

ChatGPT, যার 100 মিলিয়নেরও বেশি মাসিক সক্রিয় ব্যবহারকারী ছিল, দীর্ঘ সময়ের জন্য "অহংকারী এবং আধিপত্যবাদী" হতে দেওয়ার পরে, গুগল তাড়াহুড়ো করে গত বছরের ফেব্রুয়ারিতে একটি পাল্টা আক্রমণ শুরু করেছিল, কিন্তু এটি এখনও প্রথম ছবির লেখককে বিভ্রান্ত করেছিল বার্ডের একটি এক্সট্রা সৌর গ্রহ, যা শ্রোতাদের যারা প্রেস কনফারেন্স দেখেছিল, সেই অর্থের কারণে তাৎক্ষণিকভাবে প্রায় 2.75 JD.com-এর বাজার মূল্য বাষ্প হয়ে যায়।

যদি GPT-3.5 এখনও Google কে আশার আলো দিতে পারে, তাহলে GPT-4 পুরো বছরের জন্য তার সমবয়সীদের সরাসরি দমন করেছে।

বছরের পর বছর ধরে জমে থাকা প্রযুক্তিগত ভিত্তির জন্য ধন্যবাদ, গুগল ব্রেইন এবং গুগল ডিপমাইন্ড একত্রিত করার পরে, অল ইন এআই গুগল বার্ডের জেমিনি 1.0 মডেলের একটি "সংশোধিত" সংস্করণ তৈরি করেছে।

তাদের মধ্যে, অতি-বৃহৎ জেমিনি আল্ট্রা GPT-4 কে সম্পূর্ণরূপে চূর্ণ করার দাবি করে, তবে, প্রকাশের মাত্র একদিন পরে, এটি প্রকাশ করা হয়েছিল যে বিশ্বব্যাপী ইন্টারনেটকে ভেঙে ফেলা প্রদর্শনের ভিডিওটি জাল ছিল, যাতে গুগলের নিজস্ব কর্মীরা ঘুরে দাঁড়ায়। এবং নিজেদেরকে উড়িয়ে দিল, "এটি বাস্তবসম্মত ছবি নয়।"

জেমিনি 1.5 প্রো-এর আবির্ভাবের আগ পর্যন্ত, এটি MoE স্থাপত্যের প্রযুক্তিগত ধারণা হোক বা প্রকৃত ব্যক্তিগত অভিজ্ঞতা, অনেক নেটিজেনদের প্রশংসায়, এটি প্রমাণ করেছে যে AI এর সাথে প্রতিযোগিতা করার ক্ষমতা দিয়ে সর্বোচ্চ স্তর অর্জন করা যেতে পারে। GPT-4 ফিরে আসছে।

উপরন্তু, 1M প্রসঙ্গ প্রক্রিয়াকরণ ক্ষমতা সেই সময়ে তার সমবয়সীদের তুলনায় আরও শক্তিশালী ছিল। Gemini 1.5 Pro তাৎক্ষণিকভাবে একটি অস্পষ্ট ভাষা আয়ত্ত করতে পারে যা শুধুমাত্র 200 জন লোক ব্যবহার করে, এবং একটি 44-মিনিটের বাস্টার কিটনের নীরব ফিল্ম এক বসায় বুঝতে পারে।

"Toutiao" এর দুটি ব্যর্থতাও Google কে মনে করে যে সূর্য উকং স্বর্গে সমস্যা সৃষ্টি করছে, এটি যতই লাফিয়ে উঠুক না কেন, এটি বুদ্ধ ওপেনএআইয়ের হাত থেকে বের হতে পারেনি।

এটি উল্লেখযোগ্য যে মূলধারার পণ্যের ক্ষেত্রে, দুটি কোম্পানি তুলনামূলকভাবে ব্যাপকভাবে নিজেদের তুলনা করেছে। প্রকৃত কার্যকারিতা নির্বিশেষে, প্রধান জিনিস হল যে আপনার এটি থাকতে হবে এবং আমার এটি থাকতে হবে।

  • আপনার ChatGPT আছে, আমার কাছে বার্ড (মিথুন) আছে
  • আপনার কাছে DALL·E 3 আছে, আমাদের কাছে Imagen 2 আছে
  • আপনার কাছে সোরা আছে, আমার কাছে পিপিটি-তে ভিডিও পোয়েট আছে, এমনকি ইমেজেন 2 ভিডিও তৈরি করতে পারে
  • এমনকি অনুসন্ধানের ক্ষেত্রে, গুগলের পুরানো ব্যবসা, ওপেনএআই কেবল এটিকে প্রতিস্থাপন করতে চায় না, আরও বড় উচ্চাকাঙ্ক্ষাও রয়েছে।

কিছুক্ষণ আগে, OpenAI সিইও স্যাম অল্টম্যান লেক্স ফ্রিডম্যানের সাথে একটি একচেটিয়া সাক্ষাত্কারে উল্লেখ করেছিলেন যে বিশ্বের গুগলের আর একটি অনুলিপির প্রয়োজন নেই।

তার সাক্ষাত্কারের তাৎপর্য হল যে OpenAI LLM+ সার্চ ব্যবহার করবে সার্চ ইঞ্জিনের ধারণাকে পুনঃসংজ্ঞায়িত করতে পারপ্লেক্সিটি, এবং এটি অর্থ উপার্জনের একটি উপায়ও খুঁজে পাবে যা বিজ্ঞাপনের উপর নির্ভর করে না।

যে ব্যক্তি আপনাকে সবচেয়ে ভালো জানে সে প্রায়শই আপনার শত্রু

বিগত বছরে, OpenAI, যা ChatGPT এবং Sora-এর মতো উন্নত AI টুল ধারণ করে, সমগ্র AI শিল্পে শক্তিশালী রেফারেন্স হয়ে উঠেছে।

বৈশ্বিক "হাজার মডেল যুদ্ধ"-এ বৃহৎ মডেল নির্মাতাদের কাছ থেকে কয়েকটি বড় মডেল তুলে নিন এবং "জিপিটি-4 এর কাছে আসা" এবং "জিপিটি-4 এর বিরুদ্ধে ব্যাপক বেঞ্চমার্কিং" এর মতো পদগুলি সবাইকে হাসাতে এবং হাসাতে বাধ্য করবে৷ পুরো এআই সার্কেল খুশির পরিবেশে ভরা।

সম্প্রতি সোশ্যাল প্ল্যাটফর্মে জিম ফ্যান ড

বেঞ্চমার্ক পরীক্ষার তালিকা এবং নেটিজেন পর্যালোচনার দিকে তাকালে, কেবলমাত্র যারা একটি দৃঢ় অবস্থান অর্জন করতে পারে এবং অল্প সময়ের মধ্যে প্রবণতাকে নেতৃত্ব দিতে পারে তারা হল চারটি জায়ান্ট – OpenAI, Anthropic, Google এবং Meta৷

AI এর বিকাশ তিনটি প্রধান উপাদানকে বাইপাস করতে পারে না: কম্পিউটিং পাওয়ার, অ্যালগরিদম এবং ডেটা। অ্যানথ্রপিক, মেটা এবং গুগলের সাথে তুলনা করে, যাদের অর্থ, লোক এবং সংস্থান রয়েছে, অবশ্যই নজর রাখার আরও মূল্যবান। একই সময়ে, মেটার তুলনায়, গুগল এবং ওপেনএআই-এর মধ্যে সম্পর্ক আসলে কল্পনার চেয়েও গভীর।

যারা আপনাকে সবচেয়ে ভালো চেনেন তারা প্রায়শই আপনার বন্ধু নয়, আপনার প্রতিপক্ষ।

গু লং মার্শাল আর্ট উপন্যাস "সেভেন ওয়েপন্স"-এ এই বাক্যটি ওপেনএআই এবং গুগলের সম্পর্কের ক্ষেত্রেও প্রযোজ্য।

2017 সালের বসন্তে, "অ্যাটেনশন ইজ অল ইউ নিড" শিরোনামের একটি একাডেমিক পেপার জেনারেটিভ AI তরঙ্গের আগমনকে ত্বরান্বিত করেছিল। কাগজের লেখক এবং হুয়াং রেনক্সুনের মধ্যে কথোপকথনের বিষয়বস্তুও GTC 2024-এর সময় সমগ্র AI সম্প্রদায়ের কেন্দ্রবিন্দুতে পরিণত হয়েছিল।

খুব কম লোকই জানেন যে আটজন লেখকেরই আসলে একই পরিচয় রয়েছে—গুগল গবেষকরা। যাইহোক, ট্রান্সফরমার আর্কিটেকচারের আবির্ভাব গুগলের কাছ থেকে যথেষ্ট মনোযোগ জাগিয়ে তোলেনি, যেমন ওপেনএআই সিইও স্যাম অল্টম্যান বলেছেন:

যখন ট্রান্সফরমার কাগজটি প্রকাশিত হয়েছিল, তখন আমি মনে করি না যে Google-এ কেউ এটির অর্থ বুঝতে পেরেছিল।

কাগজটি প্রকাশিত হওয়ার কিছুক্ষণের মধ্যেই ওপেনএআই পাইয়ের প্রথম ভাগ পাওয়ার জন্য সবচেয়ে বড় বিজয়ী হয়ে ওঠে, তৎকালীন ওপেনএআই প্রধান গবেষক ইলিয়া সুটস্কেভার দ্বারা চালিত।

আজ, কাগজের আটজন লেখক সবাই Google ছেড়েছেন, একজন মূল লেখক, কায়সারও OpenAI-তে যোগ দিয়েছেন এবং "Q*" নামক একটি নতুন প্রযুক্তির উদ্ভাবকদের একজন। এই পরিস্থিতি সোরার ক্ষেত্রেও ঘটেছিল এবং এর পিছনে স্থান-কাল প্যাচ প্রযুক্তিটিও গুগল ডিপমাইন্ডের কাঁধে দাঁড়িয়ে ছিল বলে প্রকাশ করা হয়েছিল।

2024 সালে, কোনো প্রযুক্তি কোম্পানি AI ট্র্যাকে পিছিয়ে থাকতে রাজি নয়। ওপেনএআই এবং গুগলের মধ্যে টাগ-অফ-ওয়ার, যা আরও বিস্ফোরক হয়ে উঠেছে, এই প্রবণতার একটি ছোট প্রোফাইল।

দ্য ইনফরমেশন অনুসারে, গুগলের সহ-প্রতিষ্ঠাতা সের্গেই ব্রিন ব্যক্তিগতভাবে পদত্যাগ করেছেন এবং কর্মচারীদের ধরে রাখার জন্য কল করেছেন যারা ওপেনএআই-তে স্যুইচ করতে চলেছেন। ওপেনএআই যখন Google থেকে লোকেদের শিকার করে, তখন এটি US$5 মিলিয়ন থেকে US$10 মিলিয়নের মধ্যে বার্ষিক বেতনের প্রতিশ্রুতি দেয়।

এছাড়াও, সূত্রগুলি প্রকাশ করেছে যে গুগল ডিপমাইন্ডের প্রধান হ্যাসাবিস অভিযোগ করেছেন যে গুগলের ক্ষতিপূরণ নীতি তার পক্ষে গবেষকদের ওপেনএআই-এ ঝাঁপিয়ে পড়তে বাধা দেওয়া কঠিন করে তুলেছে।

অবশ্যই, গুগল নিষ্ক্রিয় নয়, ওপেনএআই-এর বিকাশকারী সম্পর্কের প্রাক্তন প্রধান, সম্প্রতি সফলভাবে গুগলে যোগদান করেছেন। যখন জেমিনি 1.5 প্রো আনুষ্ঠানিকভাবে প্রকাশ করা হয়েছিল, কিলপ্যাট্রিক তার সাইটের জন্য গতি তৈরি করতে টুইটগুলি পুনঃটুইট করেছিলেন।

অর্থায়নের পটভূমি থেকে, ওপেনএআই এবং গুগলের মধ্যে প্রতিযোগিতাটি আসলে গুগলের বিরুদ্ধে খেলার পর্দার পিছনে মাইক্রোসফটের মতো।

বিদেশী বাজারে মূলধারার বড় মডেলের দিকে তাকালে মনে হয় যে তারা প্রযুক্তি জায়ান্টদের দ্বারা শোষিত হওয়ার ভাগ্য থেকে বাঁচতে পারে না।

অ্যাপল এই বছর অনেক কেনা হয়েছে. ছাড়িয়ে যাওয়ার মতো নয়, অ্যামাজন অ্যানথ্রোপিক-এ প্রচুর বিনিয়োগ করতে বেছে নিয়েছে, যখন মাইক্রোসফ্ট, যেটি OpenAI, Mistral AI, এবং Inflection AI-এর মতো স্টার্টআপগুলির মালিক, এই জায়ান্টদের মধ্যে প্রতিযোগিতায় সাময়িকভাবে শীর্ষে রয়েছে৷

সার্চের যুগে মাইক্রোসফট এবং গুগলের মধ্যে দ্বন্দ্বও এআই যুগে আজকের প্রতিযোগিতায় অব্যাহত রয়েছে।

সেই যুগে যখন সার্চ রাজা ছিল, গুগল তার চমৎকার অ্যালগরিদম এবং ব্যবহারকারীর অভিজ্ঞতা দিয়ে সার্চ ইঞ্জিনের আধিপত্য ধরে রেখেছিল, তবে মাইক্রোসফটের বিং সবসময়ই গুগলের আধিপত্যকে ঝাঁকুনি দিতে পারেনি।

StatCounter দ্বারা প্রকাশিত তথ্য অনুসারে, জানুয়ারী 2023 পর্যন্ত, বিশ্বব্যাপী সার্চ ইঞ্জিন বাজারে Google এর শেয়ার 92.9% পর্যন্ত বেশি, যেখানে Bing-এর রয়েছে মাত্র 3.03%। মার্কেট শেয়ারের এই বিশাল পার্থক্য বিংকে দীর্ঘ সময়ের জন্য "সহস্রাব্দের দুই নম্বর খেলোয়াড়" হিসাবে তার অবস্থান বজায় রাখার অনুমতি দিয়েছে।

শুধুমাত্র এই সময়ে, যখন AI এর ভোরের আবির্ভাব হয়েছিল, মাইক্রোসফ্ট, যেটি সার্চ ইঞ্জিন বাজারে বিপর্যয়ের সম্মুখীন হয়েছিল, তারা প্রত্যাবর্তনের আশা খুঁজে পেয়েছে বলে মনে হচ্ছে।

# Aifaner এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম: Aifaner (WeChat ID: ifanr) যত তাড়াতাড়ি সম্ভব আপনাকে আরও উত্তেজনাপূর্ণ সামগ্রী সরবরাহ করা হবে।

Ai Faner | মূল লিঙ্ক · মন্তব্য দেখুন · Sina Weibo