
APPSO জানতে পেরেছে যে Jieyue Xingchen সম্প্রতি ৫ বিলিয়ন RMB ছাড়িয়ে B+ রাউন্ডের অর্থায়ন সম্পন্ন করেছে। অংশগ্রহণকারী প্রতিষ্ঠানগুলির মধ্যে রয়েছে সাংহাই ইন্টারন্যাশনাল ট্রাস্ট অ্যান্ড ইনভেস্টমেন্ট কর্পোরেশন (SITIC) পাইলট ফান্ড, চায়না লাইফ ইক্যুইটি ইনভেস্টমেন্ট, পুডং ভেঞ্চার ক্যাপিটাল, জুহুই ক্যাপিটাল, উক্সি লিয়াংজি ফান্ড, জিয়ামেন ইন্টারন্যাশনাল ট্রেড গ্রুপ এবং হুয়াকিন টেকনোলজি, অন্যান্য শিল্প বিনিয়োগকারীরা। টেনসেন্ট, কিমিং ভেঞ্চার পার্টনারস এবং ৫ওয়াই ক্যাপিটালের মতো বিদ্যমান শেয়ারহোল্ডাররাও ফলো-অন বিনিয়োগে অংশগ্রহণ করেছিলেন।
এটি লক্ষণীয় যে এই তহবিল রাউন্ডটি কিছুদিন আগে মুনলাইট অ্যানিমেশন কর্তৃক ঘোষিত $500 মিলিয়ন সিরিজ সি রাউন্ডকে ছাড়িয়ে গেছে, যা গত 12 মাসে চীনের বৃহৎ মডেল বাজারে সর্বোচ্চ একক তহবিল রাউন্ডের জন্য একটি নতুন রেকর্ড স্থাপন করেছে, এমনকি ঝিপু এবং মিনিম্যাক্সের আইপিও তহবিল সংগ্রহের পরিমাণকেও ছাড়িয়ে গেছে।
গত মাসে এআই ক্যাপিটালের খবর ব্যাপকভাবে ছড়িয়ে পড়েছে: মেটা মানাসকে অধিগ্রহণ করেছে, মুনলাইট ক্যাপিটালের ইয়াং ঝিলিন একটি উচ্চ-প্রোফাইল বিবৃতি দিয়েছেন যে তার "অর্থের অভাব নেই", এবং ঝিপু এবং মিনিম্যাক্স একের পর এক হংকংয়ে প্রকাশ্যে এসেছে। আজ, জিইউ ক্যাপিটালের এই অর্থায়ন আবারও এআই সেক্টরের অস্থির স্নায়ুকে আলোড়িত করেছে।
বিপরীতে, স্টেপলিপ একটু ভিন্ন পথ বেছে নিয়েছিল: অন্যান্য বৃহৎ আকারের মডেল খেলোয়াড়রা যখন নিশ্চিততার পিছনে ছুটছিল এবং আইপিও এবং জনসাধারণের কাছে পৌঁছানোর সুযোগের জানালাটি কাজে লাগাচ্ছিল, তখন স্টেপলিপ স্টার, এই উল্লেখযোগ্য পরিমাণ অর্থের সাথে, একটি ভারী, ধীর পথ বেছে নিয়েছিল: ভৌত জগৎ।
কোন সঠিক বা ভুল পদ্ধতি নেই, তবে শিল্পের ঐক্যমত্য হল যে বৃহৎ আকারের মডেল প্রতিযোগিতার নিয়মিত মরসুম শেষ হয়ে গেছে। গত দুই বছর প্যারামিটার গণনা এবং টোকেন সম্পর্কে ছিল – কিন্তু 2026 সাল থেকে, প্লেঅফগুলি একটি নতুন মূল প্রস্তাবের চারপাশে আবর্তিত হবে:
কীভাবে কৃত্রিম বুদ্ধিমত্তা ডেটা সেন্টার থেকে বেরিয়ে বাস্তব জগতে প্রবেশ করতে পারে এবং আরও বেশি ভৌত টার্মিনাল দখল করতে পারে?

চক্র অতিক্রমকারী ব্যক্তি এবং কোম্পানি
APPSO বিশ্বাস করে যে, অর্থায়নের পাশাপাশি, কর্মীদের পরিবর্তনগুলি আরও মনোযোগের যোগ্য।
"পূর্ববর্তী এআই চক্রের" একজন গুরুত্বপূর্ণ ব্যক্তিত্ব আনুষ্ঠানিকভাবে আলোচনায় এসেছেন: কিয়ানলি টেকনোলজির চেয়ারম্যান ইয়িন কিউ।
ইয়িন কিউ দীর্ঘদিন ধরে জিয়ু জিংচেনের কৌশলগত পরিকল্পনার সাথে গভীরভাবে জড়িত ছিলেন এবং এবার তিনি একটি নতুন পরিচয়ও অর্জন করেছেন: জিয়ু জিংচেনের চেয়ারম্যান, যিনি কোম্পানির কৌশল এবং শিল্প বাস্তবায়নের জন্য সম্পূর্ণরূপে দায়ী, বিদ্যমান দলের সাথে একটি ইতিবাচক এবং পরিপূরক সম্পর্ক তৈরি করেন।
এর আগে, স্টেপলিপ টিম শক্তিশালী প্রযুক্তিগত সক্ষমতা দ্বারা চিহ্নিত ছিল কিন্তু তুলনামূলকভাবে দুর্বল শিল্প অভিজ্ঞতার অধিকারী ছিল।
- সিইও জিয়াং ড্যাক্সিন হলেন মাইক্রোসফটের প্রাক্তন গ্লোবাল ভাইস প্রেসিডেন্ট এবং মাইক্রোসফট এশিয়া ইন্টারনেট ইঞ্জিনিয়ারিং ইনস্টিটিউটের প্রধান বিজ্ঞানী। তিনি বিং সার্চের উন্নয়নের দায়িত্বে ছিলেন, যার অর্থ তিনি কেবল প্রযুক্তি বোঝেন না, বরং AI কে বিশ্বব্যাপী উচ্চ-ট্রাফিক পণ্যে পরিণত করার অভিজ্ঞতাও তার রয়েছে। গত বছর, তিনি একটি চীনা বৃহৎ-স্কেল মডেল স্টার্টআপের একমাত্র IEEE ফেলো হয়েছিলেন।
- প্রধান বিজ্ঞানী জিয়াংইউ ঝাং গভীর শিক্ষার ক্ষেত্রে একটি ভিত্তিপ্রস্তর গবেষণাপত্র, রেসনেটের চার লেখকের একজন এবং শিল্পে তার অবদান স্বতঃস্ফূর্ত।
- সিটিও ঝু ইবো পূর্বে গুগল ক্লাউড জিপিইউ পণ্যের কারিগরি প্রধান হিসেবে কাজ করেছেন, সরাসরি অ্যানথ্রপিককে সহায়তা করেছেন। এর আগে, তিনি বাইটড্যান্সে এআই ইনফ্রা নির্মাণের দায়িত্বে ছিলেন। তিনি চীনের কয়েকজন প্রকৌশলীর মধ্যে একজন যাদের শুরু থেকেই মাল্টি-কার্ড ক্লাস্টার তৈরির বাস্তব অভিজ্ঞতা রয়েছে।
এই দলটি দুই বছরের মধ্যে "একশো মডেলের যুদ্ধ" পেরিয়ে চীনের বৃহৎ আকারের মডেলের শীর্ষ স্তরে যোগ দিয়েছে। আজ, লিপ ফরোয়ার্ড চীনের কয়েকটি স্টার্টআপের মধ্যে একটি যারা এখনও পেডেস্টাল মডেলের জন্য প্রাক-প্রশিক্ষণ এবং উচ্চতর বুদ্ধিমত্তা সীমা অন্বেষণের উপর জোর দেয় এবং এর সবচেয়ে ব্যাপক মডেল ম্যাট্রিক্স রয়েছে।
তবে, প্রযুক্তিগত নেতৃত্ব বাণিজ্যিক সাফল্যের সমতুল্য নয়। বৃহৎ-স্কেল মডেলের প্রতিযোগিতার দ্বিতীয়ার্ধে, যা আরও তীব্র হয়ে উঠেছে, মডেলের কর্মক্ষমতা আর বাজারের পছন্দের একমাত্র কারণ হতে পারে না। বাস্তব-বিশ্বের অ্যাপ্লিকেশনগুলিতে বৃহৎ-স্কেল মডেলগুলিকে কীভাবে অন্তর্ভুক্ত করা যায় এবং বাণিজ্যিক মূল্য তৈরি করা যায় তা নতুন জলধারা হয়ে উঠেছে।
একটি কোম্পানির অর্থনৈতিক চক্র অতিক্রম করার জন্য, তাদের এমন লোকের প্রয়োজন যারা এটি কীভাবে করতে হয় তা বোঝেন। ইয়িন কিউ হলেন ঠিক সেই ধাঁধার অংশ যা জিউয়ের প্রয়োজন।
এক দশকেরও বেশি সময় আগে, "গভীর নিউরাল নেটওয়ার্ক" এখনও একটি জনপ্রিয় শব্দ ছিল এবং গবেষকরা প্রথমবারের মতো বুঝতে পেরেছিলেন যে তাদের গবেষণা এবং ক্ষমতা শিল্পের জন্য কতটা বিশাল উপযোগী। ২০১১ সালে, ইয়িন কিউ এবং সিংহুয়া বিশ্ববিদ্যালয়ের ইয়াও ক্লাসের বেশ কয়েকজন সহপাঠী মেগভি টেকনোলজি সহ-প্রতিষ্ঠা করেছিলেন ।
চীনা এআই উদ্যোক্তাদের মধ্যে, ইয়িন কিউ একটি বিরল "উভচর প্রজাতি"। ইউয়েআন এবং ঝিপুর মতো সম্পূর্ণ একাডেমিক প্রতিষ্ঠাতা এবং লিয়াং ওয়েনফেং-এর মতো পরিমাণগত পটভূমির প্রতিষ্ঠাতাদের বিপরীতে, ইয়িন কিউ-এর সবচেয়ে বড় নাম হল "ব্যবহারিক অভিজ্ঞতা/ক্ষমতা"। মেগভির আইওটি ব্যবসা চীনের ১০০টিরও বেশি শহরে পরিষেবা প্রদান করে এবং বিশ্বব্যাপী দশটিরও বেশি দেশ ও অঞ্চলে বিস্তৃত হয়েছে, এর এআইওটি প্ল্যাটফর্ম লক্ষ লক্ষ টার্মিনাল সংযোগে পৌঁছেছে।

ইয়িন কুই
সাম্প্রতিক বছরগুলিতে AI সম্প্রদায়ের লোকেরা ইয়িন কি-এর নাম খুব বেশি উল্লেখ করেনি, তবে প্রকৃতপক্ষে, পরবর্তী AI চক্রের মূল আখ্যানটি তার চেয়ে খুব কম লোকই ভালোভাবে বোঝে:
বৃহৎ মাপের মডেলগুলি একাডেমিক পেপার এবং র্যাঙ্কিংয়ের বাইরেও যায়; তাদের অবশ্যই ভৌত জগতে প্রবেশ করতে হবে এবং একটি বন্ধ চক্র তৈরি করতে হবে।
এটি স্টেপলিপের সর্বাত্মক কৌশলের আরেকটি মূল বিষয়বস্তু ব্যাখ্যা করে, এর মডেলগুলির সীমানা প্রসারিত করার বাইরে: মোবাইল ফোন এবং অটোমোবাইলের মতো ভোক্তা টার্মিনালে বৃহৎ আকারের মডেলগুলিকে অন্তর্ভুক্ত করা। তথ্য দেখায় যে স্টেপলিপ চীনের শীর্ষস্থানীয় স্মার্টফোন ব্র্যান্ডগুলির 60% এর সাথে গভীর অংশীদারিত্ব স্থাপন করেছে, এর মডেলগুলি 42 মিলিয়নেরও বেশি ডিভাইসে ইনস্টল করা হয়েছে, যার মধ্যে OPPO, Honor এবং ZTE এর মতো ব্র্যান্ডগুলি রয়েছে, যা প্রতিদিন গড়ে 20 মিলিয়ন ব্যবহারকারীকে পরিষেবা প্রদান করে।
অটোমোটিভ সেক্টরে, জিইউ কিয়ানলি টেকনোলজি এবং গিলির সাথে গভীর অংশীদারিত্ব স্থাপন করেছে যাতে এজেন্টওএস স্মার্ট ককপিটে এন্ড-টু-এন্ড ভয়েস মডেলগুলি সংহত করা যায়। জিইউ গ্যালাক্সি এম৯ চালু হওয়ার মাত্র তিন মাসের মধ্যে প্রায় ৪০,০০০ ইউনিট বিক্রি অর্জন করেছে; জিইউয়ের পরিকল্পনা অনুসারে, এই বছরের জন্য এর যানবাহনের মধ্যে মডেল ইনস্টলেশন লক্ষ্যমাত্রা লক্ষ লক্ষ যানবাহন।
ইয়িন কিউ জিয়ুয়ের শুরু থেকেই কৌশলগত পরিকল্পনায় গভীরভাবে জড়িত ছিলেন এবং তখন থেকেই কোম্পানির সাথে আছেন। এখন, ইয়িন কিউয়ের আনুষ্ঠানিক যোগদানের অর্থ হল জিয়ুয়ের দীর্ঘমেয়াদী "এআই + টার্মিনাল" কৌশলটি ত্বরান্বিত হচ্ছে এবং পূর্ণাঙ্গ বাস্তবায়নের পর্যায়ে প্রবেশ করছে।
তার নিজস্ব ব্যবসার সংমিশ্রণ অনিবার্যভাবে এলন মাস্কের xAI এবং টেসলা/অপ্টিমাস সংমিশ্রণের কথা মনে করিয়ে দেয়: একটি আত্মা প্রদান করে এবং অন্যটি দেহ গঠন করে।
মাল্টিমোডালিটির উপর মনোযোগ দেওয়া: ভৌত জগতের একমাত্র টিকিট
"এআই + টার্মিনাল" কেন মাল্টিমোডালিটির উপর বাজি ধরবে?
সম্পূর্ণ প্রযুক্তিগত দৃষ্টিকোণ থেকে, মাল্টিমোডাল ক্ষমতা হল "ইন্দ্রিয়গত ব্যবস্থা" যার মাধ্যমে বৃহৎ মডেলগুলি ভৌত জগতে প্রবেশ করে। যদি বৃহৎ মডেলটি একটি বুদ্ধিমান এজেন্ট হয়, তাহলে টেক্সট কেবল প্রতীকী যুক্তি; মাল্টিমোডালিটি প্রকৃতপক্ষে চোখ, কান এবং মুখ গঠন করে। কেবলমাত্র মাল্টিমোডাল ক্ষমতার মাধ্যমেই AI সত্যিকার অর্থে উপলব্ধি করতে এবং বাস্তব মানব জীবনে একীভূত হতে পারে।
আরও তাকালে, এই উপলব্ধি ক্ষমতা অর্জনের দুটি পথ রয়েছে: একটি হল শিল্প-নেতৃস্থানীয় "প্লাগ-ইন" মডেল, যার মধ্যে প্রথমে ভিজ্যুয়াল এনকোডিং এবং তারপর বোঝার জন্য এটি একটি ভাষা মডেলে সরবরাহ করা জড়িত। যদিও এই পদ্ধতিটি সহজ, এটি একজন অন্ধ ব্যক্তির জন্য একটি নির্দেশিকা প্রদানের মতো – রূপান্তর প্রক্রিয়ার সময় তথ্য অনিবার্যভাবে ক্ষতি এবং বিলম্বের সম্মুখীন হয়।
অন্যদিকে, স্টেপলিপ "নেটিভ মাল্টিমোডাল" পদ্ধতি অনুসরণ করে, সরাসরি টেক্সট-ইমেজ ইন্টারলিভড কর্পোরা থেকে শুরু করে এবং এন্ড-টু-এন্ড প্রশিক্ষণ পরিচালনা করে। এই মডেলটি আর্কিটেকচারগুলিকে বিভক্ত করে, আরও নেটিভ এবং প্রাকৃতিক মাল্টিমোডাল বোঝাপড়া এবং প্রজন্ম অর্জনের মাধ্যমে সীমাবদ্ধ নয়, যা AI কে ভৌত জগতের কার্যকারণ যুক্তি বোঝার জন্য মানব পদ্ধতি অনুকরণ করার অনুমতি দেয়।
দৃশ্যমান দিক ছাড়াও, এই "নেটিভনেস" স্টেপ-অডিওর অডিও মডেলগুলিতেও স্পষ্ট। উদাহরণস্বরূপ, সর্বশেষ স্টেপ-অডিও-R1.1 MGRD (মডাল অ্যাঙ্কর্ড ইনফারেন্স ডিস্টিলেশন) প্রযুক্তি ব্যবহার করে মডেলটিকে সম্পূর্ণরূপে একাডেমিক বৈশিষ্ট্যের উপর ভিত্তি করে ইনফারেন্স চেইন তৈরি করতে সক্ষম করে, এই সমস্যাটি সমাধান করে যে অডিও মডেলগুলি "যত বেশি চিন্তা করে তত বেশি ভুল করে।" উৎপন্ন ফলাফলগুলি অনুমোদিত কৃত্রিম বিশ্লেষণ লিডারবোর্ডে বিশ্বের এক নম্বর স্থান অর্জন করেছে।

বিশ্বকে বোঝা থেকে শুরু করে সক্রিয় মিথস্ক্রিয়া পর্যন্ত
নেটিভ মাল্টিমডালিজম এমনভাবে তৈরি করা হয়েছে যাতে বৃহৎ মডেলরা "বিশ্বকে বুঝতে পারে", যেখানে ভৌত জগতের দিকে পরবর্তী পদক্ষেপের জন্য বৃহৎ মডেলদের "বিশ্বের সাথে যোগাযোগ" করতে শেখা প্রয়োজন।
অতএব, স্টেপলিপ তখন থেকেই ভিএলএ (ভিশন-ল্যাঙ্গুয়েজ-মোশন) আর্কিটেকচারের সাথে গভীরভাবে জড়িত । এর তাৎপর্য হলো মানুষের মতোই ডিজিটাল বা ভৌত পরিবেশে AI কে দেখতে, শুনতে এবং আরও গুরুত্বপূর্ণভাবে সিদ্ধান্ত গ্রহণ এবং বাস্তবায়নের ক্ষমতা অর্জনে সক্ষম করা।
এই ধারণাটি বাস্তবায়নের জন্য, স্টেপ-জিইউআই শিল্পের প্রথম সত্যিকার অর্থে স্থাপনযোগ্য ওপেন-সোর্স জিইউআই সিরিজ মডেল চালু করেছে। এর মধ্যে, ৪ বিলিয়ন প্যারামিটার সহ এজ সংস্করণ, স্টেপ-জিইউআই-এজ, অত্যন্ত শক্তিশালী "ছোট কিন্তু শক্তিশালী" ক্ষমতা প্রদর্শন করে, এমনকি মূলধারার বেঞ্চমার্ক পরীক্ষায় প্যারামিটার আকারের আট গুণ মডেলগুলিকে ছাড়িয়ে গেছে। এর অর্থ হল গ্রাহক-গ্রেড টার্মিনালের সীমিত কম্পিউটিং ক্ষমতা থাকা সত্ত্বেও, বৃহৎ মডেলগুলি এখনও আরামে কাজ করতে পারে, স্ক্রিন রিডিং এবং অপারেশন ক্ষমতা সহ বুদ্ধিমান এজেন্টে রূপান্তরিত হতে পারে। এর অর্থ হল সমস্ত মোবাইল ফোন নির্মাতারা এই ক্ষমতাটি কাজে লাগিয়ে ডুবাও মোবাইল অ্যাসিস্ট্যান্টের মতো ফাংশন বিকাশ করতে পারে।
ধারণা থেকে কর্মে এই বিবর্তন বৃহৎ আকারের বাণিজ্যিক স্থাপনার ক্ষেত্রে বৈধতা পেয়েছে। মোবাইল টার্মিনাল বাজারে, লিপকে শীর্ষস্থানীয় এআই স্মার্টফোন প্রস্তুতকারক হিসেবে বিবেচনা করা হয়। APPSO-এর মতে, লিপ ইতিমধ্যেই চীনের শীর্ষস্থানীয় ৬০% মোবাইল ফোন ব্র্যান্ডের সাথে গভীর অংশীদারিত্ব প্রতিষ্ঠা করেছে, যার মধ্যে OPPO, Honor এবং ZTE-এর মতো ব্র্যান্ডের ফ্ল্যাগশিপ মডেলগুলি অন্তর্ভুক্ত রয়েছে।

আজ, বাণিজ্যিকভাবে উপলব্ধ মোবাইল ফোনের AI ফাংশনগুলি অনেক আগেই গত বছরের "ডায়ালগ বক্স"-এর পরিধি ছাড়িয়ে গেছে এবং সিস্টেম স্তরে প্রবেশ করতে শুরু করেছে। উদাহরণস্বরূপ, OPPO-এর "ওয়ান-ক্লিক স্ক্রিন প্রশ্ন", Honor-এর "ফটো প্রশ্ন", এবং ZTE-এর "এল্ডারলি AI সহকারী" হল AI ফাংশনগুলির উদাহরণ যা কেবল স্ক্রিন বুঝতে এবং কন্টেন্ট তৈরি করতে পারে না, বরং অ্যাপ্লিকেশন জুড়ে জটিল কাজগুলিও সম্পন্ন করতে পারে।
আইডিসির তথ্য অনুসারে, ২০২৬ সালে চীনা বাজারে এআই স্মার্টফোনের অনুপ্রবেশের হার ৫০% ছাড়িয়ে যাবে, যেখানে প্রতি দুটি স্মার্টফোনের মধ্যে একটিতে সিস্টেম-স্তরের নেটিভ এআই ক্ষমতা থাকবে।

"বৃহৎ আকারের মডেল প্রতিযোগিতা পরবর্তী পর্যায়ে প্রবেশ করেছে" এই শিল্পের ঐক্যমত্য সম্পর্কে, ইয়িন কিউ এবং জি ইউ আরও কঠিন কিন্তু আরও নির্দিষ্ট পথে বাজি ধরেছেন: দীর্ঘমেয়াদে টিকে থাকার জন্য কৃত্রিম বুদ্ধিমত্তাকে ভৌত জগতের কাঠামোর মধ্যে স্থাপন করতে হবে।
সিলিকন ভ্যালির মধ্যে একটি সমান্তরাল মহাবিশ্বে, মাস্ক অত্যাধুনিক মডেল থেকে শুরু করে ভৌত ডিভাইস পর্যন্ত একটি সম্পূর্ণ বন্ধ লুপ তৈরি করতে টেসলা/অপ্টিমাসের সাথে xAI সংহত করে। এই পথের জন্য ভারী সম্পদ, শক্তিশালী কার্যক্রম এবং শিল্প সম্পদের প্রয়োজন যা বেশিরভাগ মডেল কোম্পানির নেই। কিন্তু যারা অর্থনৈতিক চক্রের সাথে লড়াই করেছেন, তাদের কাছে এটি AGI (অ্যাসিঙ্ক্রোনাস জিনিয়াস) এর সঠিক পথ বলে মনে হয়।
একজন স্টেপারের সমস্ত কারখানার মালিকানা থাকা প্রয়োজন হয় না, তবে এটি অবশ্যই গভীরভাবে উপস্থিত থাকতে হবে।
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।
