বড় মডেলগুলি মোবাইল ফোনে “ডাউনসাইজ” করে, প্রাচীরমুখী স্মার্ট লঞ্চ করে MiniCPM, একটি উচ্চ-ক্ষমতাসম্পন্ন ছোট ইস্পাত কামান

বড় মডেলগুলি একটি নতুন যুগের সূচনা করে এবং সেগুলিকে অবশ্যই এআই-নেটিভ হতে হবে৷

লি ডাহাই, ফেস ওয়াল ইন্টেলিজেন্সের সহ-প্রতিষ্ঠাতা এবং সিইও, একবার উপরে বলেছিলেন। তার দৃষ্টিতে, বড় মডেলের যুগ এআই নেটিভের জন্য আহ্বান করে এবং ডিভাইসের পাশে চলমান বড় মডেলের হার্ডওয়্যারটি নেটিভ হার্ডওয়্যার।

আজ বিকেলে, ওয়াল-ফেসিং ইন্টেলিজেন্স আনুষ্ঠানিকভাবে 2B ফ্ল্যাগশিপ এন্ড-সাইড লার্জ মডেল ওয়াল-ফেসিং MiniCPM রিলিজ করেছে এবং এন্ড-সাইড লার্জ মডেল যুদ্ধক্ষেত্র একটি নতুন খেলোয়াড়কে স্বাগত জানাবে।

ছোট শক্তি এবং বড় শক্তি সহ, 2B কর্মক্ষমতা ছোট ইস্পাত কামান "মেশিনে"

আমরা আগেই জানিয়েছি যে Mistral AI, "OpenAI-এর ইউরোপীয় সংস্করণ", একটি সংক্ষিপ্ত এবং কমপ্যাক্ট Mistral-7B ছোট মডেল প্রকাশ করেছে৷ যদিও এটি আকারে মাত্র 7B, তবে এর কার্যকারিতা এবং শক্তি খরচ অত্যন্ত প্রশংসিত হয়েছে৷

MiniCPM, যার আকার মাত্র 2B, অনেক মূলধারার মূল্যায়ন তালিকায় চীনা এবং ইংরেজি উভয় ক্ষেত্রেই গড় স্কোরে Mistral-7B-কে ছাড়িয়ে গেছে। MiniCPM-এর আরও ব্যাপক ক্ষমতা রয়েছে এবং এর স্কোরগুলি CEval, CMMLU এবং MMLU-এর মতো বেঞ্চমার্ক পরীক্ষায় মাইক্রোসফটের তারকা মডেল Phi-2-কে ছাড়িয়ে গেছে।

ইংরেজি তালিকায় গড় স্কোরের পরিপ্রেক্ষিতে, MiniCPM একই বা তার চেয়েও বড় স্কেলের মডেলগুলিকে উল্লেখযোগ্যভাবে ছাড়িয়ে গেছে এবং এমনকি 13B, 30B এবং 40B স্কেলের মডেলগুলির সাথে তুলনীয়। মূল্যায়ন সেটে MT-বেঞ্চ যা মানুষের মূল্যায়নের সবচেয়ে কাছাকাছি, MiniCPM এমনকি Claude 2 এর সাথে প্রতিদ্বন্দ্বিতা করতে পারে, এটিকে 2B পারফরম্যান্স কামান বানিয়েছে।

সুতরাং, কিভাবে প্রাচীর-মুখী বুদ্ধিমত্তা বড় জিনিস ঘটতে ছোট জিনিস ব্যবহার করার লক্ষ্য অর্জন করে?

  • কম্পিউটিং শক্তি: পুরো প্রক্রিয়া জুড়ে দক্ষ ইনফ্রা, 10x অনুমান ত্বরণ, 90% খরচ হ্রাস;
  • অ্যালগরিদম: প্রাচীর-মুখী মডেলের বায়ু টানেল ছোট এবং বড়, এবং দক্ষ মডেল প্রশিক্ষণ কনফিগারেশনগুলি মডেল ক্ষমতার দ্রুত গঠন অর্জনের জন্য পাওয়া যায়;
  • ডেটা: আধুনিক ডেটা কারখানার পরিপ্রেক্ষিতে, এটি ডেটা গভর্নেন্স থেকে বহুমাত্রিক মূল্যায়ন পর্যন্ত দ্রুত পুনরাবৃত্তির জন্য একটি বন্ধ-লুপ ট্র্যাকশন মডেল সংস্করণ গঠন করে;

MiniCPM মৌলিক ক্ষমতা যেমন বড় মডেল জেনারেশনের ক্ষেত্রেও একজন ভালো খেলোয়াড়। লি ডাহাই, ফেস ওয়াল ইন্টেলিজেন্সের সহ-প্রতিষ্ঠাতা এবং সিইও, লঞ্চের সময় পরিচয় করিয়ে দেন যে MiniCPM শুধুমাত্র মাউন্ট হুয়াংশান এবং মাউন্ট তাইয়ের উচ্চতা সঠিকভাবে জানে না, পার্থক্য গণনা করে, এমনকি স্ব-উন্নয়ন এবং অপ্টিমাইজেশনের জন্য কোডও লিখতে পারে।

2024 সালে বৃহৎ মডেলের প্রতিযোগিতা ক্রমবর্ধমান প্রবল হয়ে উঠার সাথে সাথে মাল্টি-মডেল ক্ষমতার সংযোজন কৃত্রিম বুদ্ধিমত্তাকে "সিনেসথেসিয়া" যুগে ঠেলে দিচ্ছে। MiniCPM, যা তার শ্রেণীতে সবচেয়ে শক্তিশালী মাল্টি-মডেল সক্ষমতা হিসেবে পরিচিত, এছাড়াও বহু-মডেল সক্ষমতা উপলব্ধি করেছে। -মোবাইল ফোনের পদ্ধতি। এটি বিষাক্ত মাশরুম এবং বন্য বিষাক্ত সাপের মতো বিপজ্জনক প্রাণীকে সঠিকভাবে সনাক্ত করতে পারে।

লি ডাহাই সাইটে ব্যবহারিক অ্যাপ্লিকেশনগুলিতে MiniCPM এর প্রভাব প্রদর্শন করেছেন। যখন বিমান মোড চালু থাকে এবং দুর্ঘটনাক্রমে বিষাক্ত মাশরুম খাওয়া বা বনে হারিয়ে যাওয়ার জন্য স্ব-রক্ষার ব্যবস্থা সম্পর্কে প্রশ্ন করা হয়, তখন MiniCPM-এর উত্তরগুলি খালি "ক্লিচের" চেয়ে বেশি ব্যবহারিক বলে মনে হয়। আপনি যদি বন্য অঞ্চলে খারাপ সংকেত পরিস্থিতির সম্মুখীন হন, তাহলে MiniCPM অফলাইনে দেওয়া এই পরামর্শগুলি আপনার জন্য অনেক সাহায্য করতে পারে।

ক্রমবর্ধমান স্কেল সহ প্রযুক্তিগত প্রতিযোগিতায়, খরচ হল বড় মডেলের অদৃশ্য প্রতিযোগিতা। এর শক্তিশালী কার্যকারিতা ছাড়াও, MiniCPM-এর অনুমান খরচ Mistral-Medium-এর মাত্র 1%।

একটি বড় মাপের টার্মিনাল-সাইড মডেল হিসাবে, MiniCPM মূলধারার আন্তর্জাতিক মোবাইল ফোন ব্র্যান্ড এবং টার্মিনাল CPU চিপগুলির মাধ্যমে সফলভাবে চালানো হয়েছে৷ এমনকি পুরানো মোবাইল ফোনগুলিও স্বাভাবিকভাবে চলতে পারে৷ যাইহোক, থ্রুপুটের দৃষ্টিকোণ থেকে, অপারেশন এখনও চলছে, এবং প্রকৃতপক্ষে কর্মক্ষমতা উন্নত করা প্রয়োজন হতে পারে.

বড় মডেলের ক্ষেত্রে প্রাচীর-মুখী বুদ্ধিমত্তার সঞ্চয়ের উপর ভিত্তি করে, লি ডাহাই আনুষ্ঠানিকভাবে প্রেস কনফারেন্সে ঘোষণা করেছিলেন যে এটি আরও ওপেন সোর্স হবে, "বড় মডেলগুলিকে হাজার হাজার পরিবারের মধ্যে উড়তে দিন।" ওপেন সোর্স ঠিকানা (প্রযুক্তিগত প্রতিবেদন সহ) নিম্নরূপ:
MiniCPM GitHub: https://github.com/OpenBMB/MiniCPM
OmniLMM GitHub: https://github.com/OpenBMB/OmniLMM

প্রেস কনফারেন্সের শেষে, লি ডাহাই mniLMM-12B মডেলের মাল্টি-মডেল রিয়েল-টাইম ইন্টারঅ্যাকশন ক্ষমতাও প্রদর্শন করেন। গুগল জেমিনি বৃহৎ মডেলের মাল্টি-মডেল ক্ষমতা প্রদর্শনের পূর্ববর্তী ধারণার মতো, তারা MiniCPM-কে রক, কাগজ, কাঁচির একটি "অনুমান করার খেলা" খেলতে বলে। ফলাফলগুলি দেখায় যে এর মসৃণতা, নির্ভুলতা এবং বিলম্ব এর প্রতিক্রিয়াগুলি সমস্ত গ্রহণযোগ্য স্তরের মধ্যে ছিল।

যৌক্তিক যুক্তির ক্ষমতাও একটি গুরুত্বপূর্ণ হাইলাইট। একটি পাঠ্য বিবরণ ছাড়াই একটি ছবি আপলোড করার পরে, এটি পোশাক, সানগ্লাস এবং গাইড বেতের মতো ছোট বিবরণের উপর ভিত্তি করে ছবির অর্থ সঠিকভাবে অনুমান করতে পারে, "দেখা এবং চিন্তা করার" এর ব্যাপক ক্ষমতা প্রদর্শন করে।

এজেন্টদের ইন্টারনেট

"যদি এজেন্ট ক্ষমতাগুলি শেষ-পার্শ্বের মডেলগুলিতে ব্যবহার করা হয়, তবে তারা নির্দিষ্ট পরিস্থিতিতে আরও ভাল পরিবেশন করতে পারে এবং আরও মূল্য তৈরি করতে পারে। আমি মনে করি এই দুটি দিক একে অপরকে সমর্থন করতে পারে এবং কিছু বিস্ময়কর রাসায়নিক বিক্রিয়া তৈরি করতে পারে।"

জেং গুয়াং, ওয়াল-ফেসিং ইন্টেলিজেন্সের CTO, টার্মিনাল-সাইড বড় মডেল এবং এজেন্টের মধ্যে সম্পর্ক সম্পর্কে কথা বলেছেন। এই প্রেস কনফারেন্সে, লি ডাহাই বৃহৎ মডেল + এজেন্টের দ্বৈত-ইঞ্জিন কৌশলও পুনর্ব্যক্ত করেন।তার দৃষ্টিতে, MiniCPM-এর মুক্তি এখনও দ্বৈত-ইঞ্জিন কৌশলটি পরিবেশন করে।

প্রকৃতপক্ষে, যখন বড় মডেলগুলি অবতরণ পরিস্থিতিতে একত্রিত হতে চায়, তখন এআই এজেন্ট একটি মূল পদ্ধতিতে পরিণত হয়। ওয়াল-ফেসিং ইন্টেলিজেন্স হল এজেন্টের ধারণা প্রস্তাবকারী প্রথম কোম্পানিগুলির মধ্যে একটি। ওয়াল-ফেসিং ইন্টেলিজেন্স কর্মকর্তারা এমনকি দাবি করেছেন যে ভবিষ্যত বিশ্ব এজেন্টদের একটি বিশ্ব হবে এবং সবকিছুই এজেন্ট হবে।

কল্পনা করুন যে আপনি যখন পোরিজ তৈরি করতে প্রস্তুত হবেন, তখন আপনাকে শুধুমাত্র রাইস কুকারে উপাদানগুলি রাখতে হবে, কিছুক্ষণ অপেক্ষা করুন, এবং দইয়ের একটি স্টিমিং পাত্র বেরিয়ে আসবে। এই প্রক্রিয়া চলাকালীন, রাইস কুকার বিল্ট-ইন এজেন্ট প্রযুক্তি ব্যবহার করে। স্বয়ংক্রিয়ভাবে তাপমাত্রা এবং তাপ সামঞ্জস্য করতে. , রান্না ম্যানুয়াল হস্তক্ষেপ ছাড়াই সম্পন্ন করা যেতে পারে.

গত বছরের ইউনকি কনফারেন্সে, লি ডাহাই বলেছিলেন, "বড় মডেল + এজেন্ট দুর্দান্ত প্রযুক্তিগত পরিবর্তনের একটি নতুন রাউন্ড আনবে।"

সেই সময়ে, তিনি একটি গাড়ির ইঞ্জিনের সাথে বড় মডেলের তুলনা করেছিলেন, যা গাড়িকে শক্তি সরবরাহ করে। যাইহোক, একটি সম্পূর্ণ গাড়ি তৈরি করতে, আপনার স্টিয়ারিং, চেসিস এবং অন্যান্য সবকিছুরও প্রয়োজন।

একইভাবে, তিনি বিশ্বাস করেন যে বড় মডেলের ইঞ্জিনের ভিত্তিতে, বৃহত্তর অ্যাপ্লিকেশন সম্ভাবনা এবং কল্পনা প্রসারিত করার জন্য উচ্চ স্তরের প্রযুক্তির একটি সিরিজ, যেমন মেমরির ক্ষমতা এবং সরঞ্জামগুলি ব্যবহার করার ক্ষমতাকে সুপারইম্পোজ করা দরকার। এআই এজেন্ট হল সেই সত্তা যা এই প্রযুক্তিগত ক্ষমতা বহন করে।

প্রতিষ্ঠার পর থেকে, ওয়ালফেস ইন্টেলিজেন্স "বড় মডেল + এজেন্ট" এর প্রযুক্তিগত রুট এবং বাস্তবায়নের দিকনির্দেশনা পরিকল্পনা করতে শুরু করেছে এবং ধারাবাহিকভাবে এআই এজেন্ট – XAgent, AgentVerse এবং ChatDev-এর "troika" চালু করেছে।

এই তিনটি পণ্য সবই বড় মডেলের দ্বারা চালিত এবং AI এজেন্টের অত্যাধুনিক উদ্ভাবন এবং প্রয়োগের ফলাফলের প্রতিনিধিত্ব করে৷ তারা বড় মডেলগুলিকে প্রকৃত পরিবেশের সাথে একত্রিত করার লক্ষ্য রাখে৷ তাদের মধ্যে, XAgent হল একটি বড় মডেল-চালিত AI এজেন্ট অ্যাপ্লিকেশন কাঠামো, এবং AgentVerse হল এজেন্টদের জন্য একটি সার্বজনীন প্ল্যাটফর্ম, যখন ChatDev হল একটি মাল্টি-এজেন্ট সহযোগিতামূলক উন্নয়ন কাঠামো।

ToB-এর বাস্তবায়নের দিকনির্দেশের জন্য নির্দিষ্ট, AI এজেন্ট এন্টারপ্রাইজের মধ্যে একাধিক ভূমিকা পালন করবে এবং এন্টারপ্রাইজের অপারেশনাল প্রক্রিয়া এবং সাংগঠনিক কাঠামোকে নতুন আকার দেবে বলে আশা করা হচ্ছে। এই এআই এজেন্টরা প্রথাগত এন্টারপ্রাইজ কর্মীদের মতো বিভিন্ন কাজ সম্পাদন করতে পারে, যার ফলে খরচ কমানো যায় এবং দক্ষতা বৃদ্ধি পায়।

ভোক্তা অ্যাপ্লিকেশনের জন্য (ToC), AI এজেন্ট ব্যবহারকারীদের ব্যক্তিগতকৃত এবং সুবিধাজনক পরিষেবা প্রদানের জন্য একজন বুদ্ধিমান সহকারীর আকারে উপস্থিত হতে পারে। এই বুদ্ধিমান সহকারীরা ব্যবহারকারীর চাহিদা বুঝতে এবং ভবিষ্যদ্বাণী করতে পারে এবং রিয়েল টাইমে সহায়তা এবং পরামর্শ প্রদান করতে পারে, যার ফলে ব্যবহারকারীর অভিজ্ঞতা এবং জীবনযাত্রার মান উন্নত হয়।

তাহলে এআই এজেন্টের ভবিষ্যৎ কেমন হওয়া উচিত?

ওয়াল-ফেসিং ইন্টেলিজেন্সের দৃষ্টিভঙ্গি এবং ধারণা হল "এজেন্টের ইন্টারনেট", যা AI এজেন্টদের বিশ্বের সবকিছু সংযুক্ত করতে এবং "ইন্টারনেট অফ এভরিথিং" থেকে "সবকিছুর বুদ্ধিমত্তা"-এ রূপান্তর উপলব্ধি করতে দেয়।

এই ধারণাটি সিংহুয়া ইউনিভার্সিটির কম্পিউটার সায়েন্স বিভাগের স্থায়ী সহযোগী অধ্যাপক এবং ওয়াল-ফেসিং ইন্টেলিজেন্সের প্রতিষ্ঠাতা লিউ ঝিউয়ান দ্বারা প্রস্তাব করা হয়েছিল৷ তিনি একটি জনসাধারণের বক্তৃতায় আত্মবিশ্বাসের সাথে বলেছিলেন:

ভবিষ্যতের দিকে মুখ করে, বড় মডেল-চালিত বুদ্ধিমান প্ল্যাটফর্মের মাধ্যমে আরও বেশি মানুষ, ডিভাইস এবং বস্তুকে সংযুক্ত করা যেতে পারে, সবকিছুর ইন্টারনেটকে সব কিছুর বুদ্ধিমান ইন্টারনেটে উন্নীত করা এবং মানব-কম্পিউটারের বুদ্ধিমান ইন্টারনেট অফ থিংস (loA) এর একটি নতুন যুগে প্রবেশ করা যেতে পারে। মিথস্ক্রিয়া। আমরা কৃত্রিম বুদ্ধিমত্তার দ্বিতীয় উত্থানের সূচনা করব।

কয়েক দশক ধরে কম্পিউটার ক্ষেত্রে কাজ করা এই শীর্ষ বিশেষজ্ঞের কল্পনায়, কৃত্রিম বুদ্ধিমত্তার দ্বিতীয় উত্থান হল জটিল গ্রুপ বুদ্ধিমত্তা গঠনের জন্য পৃথক এজেন্টদের তাদের নিজস্ব শক্তির সাথে যুক্ত করা, এইভাবে আরও শক্তিশালী উদ্ভূত আচরণ দেখায়।

"আউট অফ কন্ট্রোল" এর লেখক লি ডাহাই এবং কেভিন কেলির মধ্যে সাম্প্রতিক একটি অনলাইন সাক্ষাত্কারে কেভিন কেলিও একই মতামত প্রকাশ করেছেন। তিনি বিশ্বাস করেন যে AI-এর মধ্যে সহযোগিতার বিশাল সম্ভাবনা রয়েছে এবং ভবিষ্যতে শত শত বা এমনকি হাজার হাজার বিভিন্ন AI-এর সমন্বয়ে গঠিত একটি ইকোসিস্টেম তৈরি হবে, যা আশ্চর্যজনক শক্তি প্রকাশ করবে।

প্রকৃতপক্ষে, ঝাঁক বুদ্ধিমত্তা, সাধারণত প্রকৃতি এবং সমাজে পাওয়া একটি ঘটনা হিসাবে, অনেক সাধারণ ব্যক্তির সমন্বয়ে গঠিত একটি গোষ্ঠীর উচ্চ স্তরের বুদ্ধিমান আচরণ প্রদর্শনের ক্ষমতাকে বোঝায়। প্রকৃতিতে, এই বুদ্ধিমান আচরণ বিভিন্ন আকারে নিজেকে প্রকাশ করে, যেমন পিঁপড়া উপনিবেশ, মৌমাছির ঝাঁক এবং মাছের স্কুলের সম্মিলিত ক্রিয়াকলাপ।

পিঁপড়ারা যখন খাদ্যের উৎসের সন্ধান করে বা তাদের বাসাগুলিতে ফিরে আসে, তখন তারা ফেরোমোন ছেড়ে দেয় যাতে তাদের সহকর্মী পিঁপড়াদের সংক্ষিপ্ততম পথ খুঁজে বের করা যায়। স্থানান্তরিত হওয়ার সময়, মাছের স্কুলগুলি তাদের অবস্থান এবং ক্রিয়াকলাপগুলিকে ঘনিষ্ঠভাবে সমন্বয় করে একটি প্রতিরক্ষামূলক সাঁতারের প্যাটার্ন তৈরি করে, যার ফলে সমগ্র গোষ্ঠী কার্যকরভাবে শিকারী এড়াতে এবং শক্তি সঞ্চয় করতে পারে।

লি ডাহাই একটি নতুন বছরের পতাকা সেট করার জন্য "দ্য থ্রি-বডি প্রবলেম" থেকে বিখ্যাত উক্তিগুলিও ধার নিয়েছিলেন – AGI কে "দ্রুত" করতে, ওয়াল-ফেসিং ইন্টেলিজেন্স কোম্পানির "সব জিনিসকে বুদ্ধিমান" করার দৃষ্টিভঙ্গি প্রতিধ্বনিত করে।

জীবনের সৌন্দর্য কিছুতে আচ্ছন্ন হচ্ছে। জীবন খুব ছোট, ফালতু কাজ করবেন না।

# aifaner: aifaner (WeChat ID: ifanr) এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম। যত তাড়াতাড়ি সম্ভব আপনাকে আরও উত্তেজনাপূর্ণ সামগ্রী সরবরাহ করা হবে।

Ai Faner | আসল লিঙ্ক · মন্তব্য দেখুন · Sina Weibo