৪.৬ মিলিয়ন ডলারে জিপিটি-৫ পেতে চান? কিমির দল প্রথমবারের মতো সবকিছুর জবাব দেয়, ইয়াং ঝিলিনও উপস্থিত হন।

গত সপ্তাহে, Kimi K2 Thinking মুক্তি পেয়েছে, এবং এর ওপেন-সোর্স মডেলটি OpenAI এবং Anthropic কে ছাড়িয়ে গেছে, যা সোশ্যাল মিডিয়ায় বেশ আলোড়ন সৃষ্টি করেছে। নেটিজেনরা বলছেন এটি অসাধারণ, এবং আমরা নিজেরাই এটি পরীক্ষা করে দেখেছি। এটি বুদ্ধিমান এজেন্ট, কোড এবং লেখার ক্ষমতার ক্ষেত্রে উল্লেখযোগ্য উন্নতি দেখায়।

কিমির দল, যার মধ্যে প্রতিষ্ঠাতা ইয়াং ঝিলিনও রয়েছেন, Reddit-এ তথ্যবহুল AMA (আস্ক মি এনিথিং) ইভেন্টের আয়োজন করেছেন।

▲ কিমির তিন সহ-প্রতিষ্ঠাতা, ইয়াং ঝিলিন, ঝো জিনইউ এবং উ ইউক্সিনের দল উত্তরে অংশগ্রহণ করেছিল।

সম্প্রদায়ের তীব্র প্রশ্নের মুখোমুখি হয়ে, কিমি কেবল পরবর্তী প্রজন্মের মডেল K3 এবং মূল প্রযুক্তি KDA-এর বিশদ বিবরণই প্রকাশ করেননি, বরং ৪.৬ মিলিয়ন ডলারের খরচ এবং প্রশিক্ষণ খরচ এবং পণ্য দর্শনের ক্ষেত্রে কিমি এবং ওপেনএআই-এর মধ্যে বিশাল পার্থক্য সম্পর্কেও খোলামেলাভাবে কথা বলেছেন।

  • ৪.৬ মিলিয়ন ডলারের এই অঙ্কটি কোনও সরকারি অঙ্ক নয়; প্রশিক্ষণের সঠিক খরচ নির্ণয় করা কঠিন।
  • K3 কখন আসবে? এটা নির্ভর করছে আল্ট্রাম্যানের ট্রিলিয়ন ডলারের ডেটা সেন্টার কখন সম্পন্ন হবে তার উপর।
  • K3 তে ব্যবহৃত প্রযুক্তি ব্যবহার অব্যাহত থাকবে, যার মধ্যে বর্তমানে অত্যন্ত কার্যকর KDA মনোযোগ ব্যবস্থাও অন্তর্ভুক্ত রয়েছে।
  • ভিজ্যুয়াল মডেলের জন্য আমাদের এখনও আরও তথ্য সংগ্রহ করতে হবে, কিন্তু আমরা ইতিমধ্যেই তা করছি…

আমরা এই AMA থেকে কিছু উল্লেখযোগ্য মূল বিষয় সংকলন করেছি, যাতে আপনি দেখতে পারেন যে এই AI ল্যাব, যা এখন দেশীয় ওপেন-সোর্স সমাধানের ক্ষেত্রে শীর্ষস্থানীয় বলে বিবেচিত, তাদের মডেল এবং AI এর ভবিষ্যত উন্নয়নকে কীভাবে দেখে।

ওপেনএআইকে চ্যালেঞ্জ জানিয়ে, "আমাদের নিজস্ব ছন্দ আছে।"

এই AMA-এর সবচেয়ে উত্তপ্ত অংশটি সম্ভবত OpenAI-এর প্রতি কিমির দলের প্রতিক্রিয়া ছিল।

সবচেয়ে বড় প্রশ্নগুলির মধ্যে একটি: K3 কখন আসবে? কিমির দলের উত্তরটি বেশ চতুর ছিল: " আল্ট্রাম্যানের ট্রিলিয়ন ডলারের ডেটা সেন্টার তৈরির আগে। "

এটি স্পষ্টতই আংশিক হাস্যকর, কারণ কেউ জানে না কখন OpenAI আসলে সেই ডেটা সেন্টার তৈরি করতে সক্ষম হবে, এবং আংশিকভাবে এটি বাইরের বিশ্বের প্রশংসার প্রতিক্রিয়া বলে মনে হচ্ছে যে কিমি কম সম্পদের সাথে GPT-5 এর সাথে তাল মিলিয়ে চলতে পারে।

যখন একজন নেটিজেন সরাসরি কিমিকে জিজ্ঞাসা করলেন যে ওপেনএআই প্রশিক্ষণে এত টাকা ব্যয় করার বিষয়ে তার কী ধারণা, তখন কিমি অকপটে উত্তর দিলেন, "আমরাও জানি না, কেবল আল্ট্রাম্যান নিজেই জানেন," এবং দৃঢ়ভাবে যোগ করলেন, " আমাদের নিজস্ব পদ্ধতি এবং গতি আছে। "

এই স্বাধীন ছন্দটি প্রথম এবং সর্বাগ্রে তাদের পণ্য দর্শনে প্রতিফলিত হয়। যখন জিজ্ঞাসা করা হয়েছিল যে তারা কি OpenAI এর মতো একটি AI ব্রাউজার প্রকাশ করবে, তখন দলটি স্পষ্টভাবে উত্তর দেয়, "না।"

আরও ভালো মডেল তৈরি করতে আমাদের আর একটি ক্রোমিয়াম র‍্যাপার (ব্রাউজার শেল) তৈরি করার দরকার নেই।

তারা জোর দিয়ে বলেন যে তাদের বর্তমান কাজ মডেল প্রশিক্ষণের উপর দৃষ্টি নিবদ্ধ করে এবং ক্ষমতার প্রদর্শন একটি বৃহৎ মডেল সহকারীর মাধ্যমে সম্পন্ন করা হবে।

কিমি প্রশিক্ষণ খরচ এবং হার্ডওয়্যারের ক্ষেত্রেও একটি মিতব্যয়ী দৃষ্টিভঙ্গি প্রদর্শন করেছিলেন। যখন সম্প্রদায়টি জিজ্ঞাসা করেছিল যে K2 এর জন্য ৪.৬ মিলিয়ন ডলারের প্রশিক্ষণ খরচের গুজব সত্যিই সঠিক কিনা, তখন কিমি স্পষ্ট করে বলেছিলেন যে এই পরিসংখ্যানটি ভুল, তবে তিনি বলেছিলেন যে বেশিরভাগ অর্থ গবেষণা এবং পরীক্ষা-নিরীক্ষার জন্য ব্যয় করা হয়েছে, যার ফলে সঠিকভাবে পরিমাপ করা কঠিন হয়ে পড়ে।

হার্ডওয়্যারের ক্ষেত্রে, কিমি স্বীকার করেছে যে তারা H800 GPU এবং Infiniband ব্যবহার করেছে, যা "মার্কিন যুক্তরাষ্ট্রের শীর্ষস্থানীয় GPU গুলির মতো ভালো নয় এবং সংখ্যায়ও কম নয়," তারা প্রতিটি কার্ডের পূর্ণ ব্যবহার করেছে।

মডেলের স্বতন্ত্রতা এবং AI এর আবর্জনার গন্ধ

একজন ভালো মডেলের জন্য কেবল বুদ্ধিমত্তাই নয়, ব্যক্তিত্বেরও প্রয়োজন।

অনেক ব্যবহারকারী কিমি কে২ ইন্সট্রাক্টের স্টাইল পছন্দ করেন, তারা বিশ্বাস করেন যে এটি "কম চাটুকার, তবুও অন্তর্দৃষ্টিপূর্ণ এবং অনন্য, একটি প্রবন্ধের মতো।"

কিমি ব্যাখ্যা করেছেন যে এটি "প্রাক-প্রশিক্ষণ (জ্ঞান প্রদান) + প্রশিক্ষণ-পরবর্তী (স্বাদ যোগ করা)" এর সংমিশ্রণের ফলাফল। বিভিন্ন শক্তিবৃদ্ধি শেখার সূত্র (অর্থাৎ পুরষ্কার মডেলের বিভিন্ন পছন্দ) বিভিন্ন শৈলী তৈরি করবে এবং তারা ইচ্ছাকৃতভাবে মডেলটিকে কম আপত্তিকর করার জন্য ডিজাইন করবে

▲ বৃহৎ ভাষা মডেল ব্যবহার করে মানসিক বুদ্ধিমত্তা মূল্যায়নের র‍্যাঙ্কিং। ছবির উৎস: https://eqbench.com/creative_writing.html

তবে, কিছু ব্যবহারকারী স্পষ্টভাবে বলেছেন যে কিমি কে২ থিঙ্কিংয়ের লেখার ধরণটি খুব বেশি "এআই স্লপ আবর্জনা"। বিষয় যাই হোক না কেন, স্টাইলটি খুব বেশি ইতিবাচক এবং আশাবাদী, যার ফলে একটি শক্তিশালী এআই অনুভূতি তৈরি হয়। একজন ব্যবহারকারী এমনকি একটি উদাহরণও দিয়েছেন: যখন হিংসাত্মক বা সংঘর্ষমূলক বিষয়বস্তু সম্পর্কে লিখতে বলা হয়, কিমি এখনও একটি ইতিবাচক এবং আশাবাদী সামগ্রিক স্টাইল বজায় রাখতে সক্ষম হয়।

কিমির দলের প্রতিক্রিয়া খুবই স্পষ্ট ছিল। তারা স্বীকার করেছে যে এটি বৃহৎ ভাষা মডেলগুলির একটি সাধারণ সমস্যা এবং উল্লেখ করেছে যে বর্তমান শক্তিবৃদ্ধি শেখা ইচ্ছাকৃতভাবে এই শৈলীকে প্রশস্ত করে।

ব্যবহারকারীর অভিজ্ঞতা এবং পরীক্ষার তথ্যের মধ্যে এই অসঙ্গতি বেঞ্চমার্ক স্কোর ঘিরে সংশয়বাদের মধ্যেও প্রতিফলিত হয় । একজন নেটিজেন স্পষ্টভাবে জিজ্ঞাসা করেছিলেন যে কিমি কে২ থিংকিং কি এত উচ্চ স্কোর অর্জনের জন্য এইচএলই-এর মতো বেঞ্চমার্কের জন্য বিশেষভাবে প্রশিক্ষিত ছিল, কারণ বাস্তব-বিশ্বের ব্যবহারে এত উচ্চ স্কোর এর প্রকৃত বুদ্ধিমত্তার সাথে অসঙ্গতিপূর্ণ বলে মনে হয়।

কিমির দল ব্যাখ্যা করেছে যে তারা স্বায়ত্তশাসিত যুক্তির উন্নতিতে কিছু সামান্য অগ্রগতি করেছে, যা কেবল HLE-তে K2 Thinking-এর উচ্চ স্কোরে অবদান রেখেছে। তবে, তারা অকপটে তাদের দিকনির্দেশনাও জানিয়েছে: সাধারণ ক্ষমতা আরও উন্নত করা যাতে এটি বাস্তব-বিশ্বের আরও অ্যাপ্লিকেশনগুলিতে এর বেঞ্চমার্ক স্কোরের মতো বুদ্ধিমান হতে পারে।

নেটিজেনরা আরও মন্তব্য করেছেন যে মাস্কের গ্রোক অনেক NSFW (অ-কাজ-নিরাপদ) কাজ করেছে, ছবি এবং ভিডিও তৈরি করেছে; কিমি কিছু NSFW লেখা সম্পূর্ণ করার জন্য তার লেখার শক্তি ব্যবহার করতে পারে, যা অবশ্যই কিমিকে অনেক ব্যবহারকারী আনবে।

কিমি কেবল হাসতে এবং নীরব থাকতে পেরে বললেন, এটি একটি ভালো পরামর্শ। ভবিষ্যতে NSFW কন্টেন্ট সমর্থিত হবে কিনা তা নির্ভর করতে পারে বয়স যাচাইকরণ পদ্ধতি খুঁজে বের করা এবং মডেল অ্যালাইনমেন্ট আরও উন্নত করার উপর।

এটা স্পষ্ট যে কিমি এই পর্যায়ে NSFW সমর্থন করতে পারবে না।

মূল প্রযুক্তিগুলি প্রকাশিত হয়েছে: কেডিএ, দীর্ঘ অনুমান এবং মাল্টিমোডাল

"ওপেন সোর্স পাইওনিয়ার ল্যাব" হিসেবে পরিচিত একটি কোম্পানি হিসেবে এবং রেডডিট নিজেই একটি খুব বড় এবং সক্রিয় প্রযুক্তিগত সম্প্রদায়, কিমি এই AMA-তে অনেক প্রযুক্তিগত বিবরণও ভাগ করে নিয়েছেন।

অক্টোবরের শেষের দিকে, কিমি তার "কিমি লিনিয়ার: অ্যান এক্সপ্রেসিভ, এফিশিয়েন্ট অ্যাটেনশন আর্কিটেকচার" প্রবন্ধে একটি অভিনব হাইব্রিড লিনিয়ার অ্যাটেনশন আর্কিটেকচার, কিমি লিনিয়ার সম্পর্কে বিস্তারিত আলোচনা করেন, যার মূল বিষয় হল কিমি ডেল্টা অ্যাটেনশন (KDA)।

▲KDA অ্যালগরিদম বাস্তবায়ন, কাগজের লিঙ্ক: https://arxiv.org/pdf/2510.26692

সাধারণ মানুষের ভাষায়, মনোযোগ হল সেই প্রক্রিয়া যার মাধ্যমে AI সিদ্ধান্ত নেয় যে চিন্তা করার সময় কোন প্রসঙ্গে কোন শব্দের উপর ফোকাস করা উচিত। সাধারণ পূর্ণ মনোযোগ এবং রৈখিক মনোযোগের বিপরীতে, KDA (কিমি ডেল্টা মনোযোগ) একটি বুদ্ধিমান এবং আরও দক্ষ মনোযোগ প্রক্রিয়া

এই AMA চলাকালীন, কিমি বেশ কয়েকবার উল্লেখ করেছেন যে KDA দীর্ঘ ক্রম পুনর্বহাল শেখার পরিস্থিতিতে কর্মক্ষমতা উন্নতি দেখিয়েছে, এবং KDA সম্পর্কিত ধারণাগুলি K3 তে প্রয়োগ করা হতে পারে।

তবে, কিমি স্বীকার করেছেন যে প্রযুক্তিতে কিছু বিনিময় রয়েছে। বর্তমানে, হাইব্রিড মনোযোগের মূল উদ্দেশ্য হল গণনার খরচ বাঁচানো, যুক্তি উন্নত করা নয়। দীর্ঘ ইনপুট এবং দীর্ঘ আউটপুট সহ কাজের জন্য, পূর্ণ মনোযোগ এখনও আরও ভাল কাজ করে।

তাহলে কিমি কে২ থিংকিং কীভাবে এত দীর্ঘ যুক্তির শৃঙ্খল অর্জন করে, যার মধ্যে ৩০০টি পর্যন্ত সরঞ্জাম বিবেচনা এবং আহ্বান জড়িত? কিছু নেটিজেন এমনকি বিশ্বাস করেন যে এটি GPT-5 Pro এর চেয়েও ভালো।

▲ কিমি লিনিয়ার মডেল স্ট্রাকচার

কিমি বিশ্বাস করেন যে এটি প্রশিক্ষণ পদ্ধতির উপর নির্ভর করে; তারা সর্বোত্তম ফলাফল অর্জনের জন্য তুলনামূলকভাবে বেশি সংখ্যক চিন্তাভাবনা টোকেন ব্যবহার করে । অধিকন্তু, K2 থিংকিং স্থানীয়ভাবে INT4 সমর্থন করে, যা যুক্তি প্রক্রিয়াকে আরও ত্বরান্বিত করে।

Kimi K2 Thinking-এর উপর আমাদের পূর্ববর্তী প্রবন্ধে, আমরা INT4 কোয়ান্টাইজেশন প্রশিক্ষণ কৌশলটিও শেয়ার করেছি, যা একটি দক্ষ কোয়ান্টাইজেশন কৌশল (INT4 QAT)। প্রশিক্ষণের পরে কিমি ডেটা সংকুচিত করেননি, তবে প্রশিক্ষণ প্রক্রিয়ার সময় নিম্ন-নির্ভুল গণনা মডেল বজায় রেখেছিলেন।

এর ফলে দুটি বিশাল সুবিধা পাওয়া যায়: উন্নত যুক্তির গতি এবং প্রশিক্ষণের পরে সংকোচন এবং কোয়ান্টাইজেশনের কারণে লজিক্যাল পতন ছাড়াই দীর্ঘ-শৃঙ্খল যুক্তি পরিচালনা করার ক্ষমতা।

অবশেষে, বহুল প্রত্যাশিত দৃশ্যমান ভাষা ক্ষমতা সম্পর্কে, কিমি স্পষ্টভাবে বলেছেন: "আমরা বর্তমানে এটি নিয়ে কাজ করছি।"

প্রথমে প্লেইন টেক্সট মডেল প্রকাশ করার কারণ হল, ডেটা অর্জন এবং ভিজ্যুয়াল ল্যাঙ্গুয়েজ মডেলকে প্রশিক্ষণ দেওয়ার জন্য অনেক সময় প্রয়োজন, এবং দলের সম্পদ সীমিত, তাই আমরা কেবল একটি দিককেই অগ্রাধিকার দিতে পারি।

বাস্তুশাস্ত্র, খরচ এবং উন্মুক্ততা: একটি ভবিষ্যৎ

কিমির দল ডেভেলপার এবং সাধারণ ব্যবহারকারীদের উদ্বিগ্ন প্রশ্নের উত্তরও একে একে দিয়েছে।

১ মিলিয়ন প্রসঙ্গ পরিচালনা করতে পারে এমন মডেলটি কেন অদৃশ্য হয়ে গেল? কিমির উত্তর ছিল সংক্ষিপ্ত: "ব্যয় খুব বেশি ছিল।" বৃহৎ কোডবেসগুলির সাথে কাজ করার সময় ২৫৬ কে প্রসঙ্গ এখনও অপর্যাপ্ত এই সমস্যার জন্য, দলটি বলেছে যে তারা ভবিষ্যতে প্রসঙ্গ দৈর্ঘ্য বাড়ানোর পরিকল্পনা করছে।

API মূল্য নির্ধারণের ক্ষেত্রে, কিছু ডেভেলপার প্রশ্ন তুলেছেন যে কেন টোকেনের পরিবর্তে API কলের সংখ্যার উপর ভিত্তি করে চার্জ করা হয়। ক্লাউড কোডের মতো অন্যান্য বুদ্ধিমান এজেন্ট টুল দিয়ে প্রোগ্রামিং করা ব্যবহারকারীদের জন্য, API অনুরোধের সংখ্যার উপর ভিত্তি করে বিলিং করা সবচেয়ে কম নিয়ন্ত্রণযোগ্য এবং অস্বচ্ছ পদ্ধতি।

প্রম্পট পাঠানোর আগে, ব্যবহারকারীর কোন ধারণা থাকে না যে টুলটি কতগুলি API কল করবে বা কাজটি কতক্ষণ স্থায়ী হবে।

▲কিমি সদস্যপদ প্রোগ্রাম

কিমি ব্যাখ্যা করেছেন যে তারা API কল ব্যবহার করেছেন ব্যবহারকারীদের কাছে খরচ কীভাবে করা হচ্ছে তা স্পষ্ট করার জন্য, একই সাথে তাদের দলের খরচ পরিকল্পনার সাথে সামঞ্জস্যপূর্ণ। তবে, তারা আরও ভাল গণনা পদ্ধতি অন্বেষণ করার ইঙ্গিতও দিয়েছেন।

যখন একজন নেটিজেন উল্লেখ করেন যে তাদের কোম্পানি অন্যান্য চ্যাট সহকারী ব্যবহারের অনুমতি দেয় না, তখন কিমি তাদের মূল দর্শন প্রকাশ করার সুযোগটি গ্রহণ করেন:

আমরা ওপেন সোর্সকে গ্রহণ করি কারণ আমরা বিশ্বাস করি যে সাধারণ কৃত্রিম বুদ্ধিমত্তা এমন একটি প্রচেষ্টা হওয়া উচিত যা ঐক্য আনে, বিভাজন নয়।

চূড়ান্ত প্রশ্ন হল – AGI কখন আসবে? কিমি বিশ্বাস করেন যে AGI সংজ্ঞায়িত করা কঠিন, কিন্তু মানুষ ইতিমধ্যেই AGI-এর পরিবেশ অনুভব করতে শুরু করেছে, এবং আরও শক্তিশালী মডেল আসছে।

গত বছর কিমির আক্রমণাত্মক বিজ্ঞাপন এবং বিপণন প্রচারণার বিপরীতে, এই AMA অধিবেশনে ইয়াং ঝিলিন এবং তার দলের উত্তরগুলি সত্যিই প্রমাণ করেছে যে, বিশ্বব্যাপী ওপেন-সোর্স ভাষা মডেল বাজারে দেশীয় ওপেন-সোর্স প্রযুক্তির ক্রমবর্ধমান আধিপত্যের পটভূমিতে, কিমি আরও আত্মবিশ্বাসী এবং তার নিজস্ব গতি সম্পর্কে আরও স্পষ্ট ধারণা রয়েছে।

অন্তর্নিহিত নীতিটি স্পষ্ট: এই অর্থ-পোড়া, এমনকি স্থান-দখল, কৃত্রিম বুদ্ধিমত্তার প্রতিযোগিতায়, ওপেন-সোর্স পথে এগিয়ে যাওয়াই প্রযুক্তিকে এগিয়ে নিয়ে যাওয়ার একমাত্র উপায়।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো