মাইক্রোসফট সম্প্রতি তাদের নিজস্ব এআই মডেল প্রকাশ করেছে, এবং সেগুলো ওপেনএআই ও গুগলের জন্য আসছে। কোম্পানিটি সর্বসাধারণের জন্য তিনটি স্বত্বাধিকারযুক্ত মডেল প্রকাশ করেছে: MAI-Transcribe-1, MAI-Voice-1, এবং MAI-Image-2। মডেলগুলো মাইক্রোসফট ফাউন্ড্রি প্ল্যাটফর্ম এবং MAI প্লেগ্রাউন্ডের মাধ্যমে পাওয়া যাচ্ছে।
তাহলে, মাইক্রোসফটের এআই মডেলগুলো আসলে কী করতে পারে?
এই তিনটি টুল বিভিন্ন ধরনের ব্যবহারের ক্ষেত্রকে সমর্থন করে: শোনা, বলা এবং দেখা। উদাহরণস্বরূপ, MAI-Transcribe-1 ২৫টি ভাষায় স্পিচ-টু-টেক্সট পরিচালনা করে এবং এটি মাইক্রোসফটের নিজস্ব অ্যাজুর ফাস্ট অফারিংয়ের চেয়ে ২.৫ গুণ দ্রুততর। উল্লেখ্য যে, এই অডিও মডেলটি ১০ জনের একটি দল তৈরি করেছে।
MAI-Voice-1 মাত্র এক সেকেন্ডে ৬০ সেকেন্ডের স্বাভাবিক অডিও তৈরি করতে পারে। এটি একটি ছোট অডিও ক্লিপ থেকে নিজস্ব ভয়েস তৈরি করাও সমর্থন করে। অন্যদিকে, MAI-Image-2 ইতিমধ্যেই Arena.ai ইমেজ জেনারেশন লিডারবোর্ডে শীর্ষ তিনের মধ্যে নিজের স্থান নিশ্চিত করেছে। বর্তমানে Bing এবং PowerPoint-এ এটি চালু করার কাজ চলছে।
তবে, এর কোনো কিছুই রাতারাতি ঘটেনি। ২০২৫ সালের অক্টোবর পর্যন্ত, কোম্পানিটি চুক্তিগতভাবে ওপেনএআই-এর দ্বারাই নিজস্ব অত্যাধুনিক এআই তৈরি করা থেকে সীমাবদ্ধ ছিল। ২০১৯ সালে উভয় কোম্পানি একটি চুক্তি স্বাক্ষর করে, যার মাধ্যমে ওপেনএআই-এর ক্লাউড পরিকাঠামোতে সহায়তা করার বিনিময়ে মাইক্রোসফটকে তাদের মডেল ব্যবহারের লাইসেন্স দেওয়া হয়।
মাইক্রোসফট কি ওপেনএআই-এর সঙ্গে সম্পর্ক ছিন্ন করতে প্রস্তুত?
তবে, এই চুক্তিটি মাইক্রোসফটকে নিজস্ব এআই মডেল তৈরি করা থেকেও বিরত রেখেছিল। সেই অবস্থার পরিবর্তন হলে, মাইক্রোসফট তাদের নিজস্ব এআই মডেলগুলো প্রকাশ করে, যেগুলো নীরবে নেপথ্যে কোপাইলট এবং টিমসকে শক্তি যুগিয়েছে। ফাউন্ড্রির যেকোনো ডেভেলপার এই মডেলগুলো ব্যবহার করে তাদের কাজ তৈরি করতে পারেন।
এখনো নয়। মাইক্রোসফট এআই-এর সিইও মুস্তাফা সুলেমান ওপেনএআই-এর সাথে কোম্পানির অংশীদারিত্বের প্রতি অঙ্গীকার পুনর্ব্যক্ত করেছেন, যদিও এই মডেলগুলো একটি সমান্তরাল কৌশল গড়ে ওঠার ইঙ্গিত দিচ্ছে। এর মূল্যও বেশ আকর্ষণীয়। তিনটি মডেলেরই দাম অ্যামাজন এবং গুগলের তুলনীয় পণ্যগুলোর চেয়ে কম রাখা হয়েছে।
এই মডেলগুলো যদি ভালো ফল করে, তাহলে MAI পরিবারটি নীরবে মাইক্রোসফটের সমগ্র এআই পণ্য পোর্টফোলিওর মেরুদণ্ড হয়ে উঠতে পারে।