বছরের শুরুতে, ম্যাক মিনি স্টকের বাইরে ছিল, অপেক্ষার সময় দেড় মাস পর্যন্ত পৌঁছেছিল।
ম্যাক মিনি একটি দুর্দান্ত পণ্য, এটি সকলেই জানেন। দেশীয় চ্যানেলের মাধ্যমে প্রতিযোগিতামূলক মূল্য এবং এম চিপের দুর্দান্ত পারফরম্যান্সের সাথে, এন্ট্রি-লেভেল কনফিগারেশনটি 3,000 আরএমবি-রও কম দামে পাওয়া যেতে পারে, যা এটিকে সৃজনশীল নতুনদের জন্য একটি নিখুঁত প্রধান মেশিন করে তোলে।
তবে, ম্যাক মিনির সাম্প্রতিক জনপ্রিয়তার উত্থানের সাথে সৃজনশীল কাজ বা দৈনন্দিন ব্যবহারের খুব একটা সম্পর্ক নেই।
যারা টেক নিউজ ফলো করেন তাদের জানা উচিত কী ঘটছে: OpenClaw (পূর্বে Clawdbot নামে পরিচিত) হঠাৎ করেই জনপ্রিয় হয়ে উঠেছে।
OpenClaw একাধিক স্থাপনার বিকল্প প্রদান করে: আপনি এটি আপনার নিজস্ব কম্পিউটারে ইনস্টল করতে পারেন অথবা এটির জন্য একটি পৃথক কম্পিউটার উৎসর্গ করতে পারেন; এটিকে ক্লাউড-ভিত্তিক ভার্চুয়াল মেশিন/স্যান্ডবক্স পরিবেশে স্থাপন করাও ঠিক আছে; পরে, কিছু মূলধারার AI পরিষেবা ক্লাউড-ভিত্তিক এক-ক্লিক স্থাপনার বিকল্পও চালু করে, যা নবীন ব্যবহারকারীদের জন্য প্রবেশের বাধা উল্লেখযোগ্যভাবে কমিয়ে দেয়।
তবে, প্রাথমিক পর্যায়ে, সবচেয়ে সাধারণ স্থাপনার বিকল্প ছিল একটি একক ম্যাক মিনি কেনা।
কারণটি অবশ্যই সস্তা নয়, বরং আরও গুরুত্বপূর্ণ: OpenClaw অর্থবহ হওয়ার জন্য, এটিকে একটি "ভৌত বডি" দেওয়া প্রয়োজন যাতে এটি ফাইল অ্যাক্সেস করতে পারে এবং সফ্টওয়্যার পরিচালনা করতে পারে।
একটি ক্লাউড সার্ভার OpenClaw চালাতে পারে, কিন্তু এটি এখনও আপনার কম্পিউটার নয়। এতে আপনার ফাইল, সফ্টওয়্যার, অথবা আপনার ব্রাউজারে লগ ইন করা বিভিন্ন অ্যাকাউন্ট নেই, এবং কোন তথাকথিত "প্রসঙ্গ" নেই। একটি ম্যাক মিনি আপনার ডেস্কে 24/7 বন্ধ করার প্রয়োজন ছাড়াই বসে থাকতে পারে, এবং যদি আপনি একটি চ্যাটবটের মাধ্যমে এটি দূরবর্তীভাবে নিয়ন্ত্রণ করতে পারেন তবে আপনার আলাদা মনিটরেরও প্রয়োজন নেই।
আপনার নিজের কম্পিউটারে OpenClaw ব্যবহারের একমাত্র উল্লেখযোগ্য খরচ হল ব্যাকএন্ডে অ্যাক্সেস করা বৃহৎ মডেল API-এর টোকেন ফি; অনেক প্রাথমিক গ্রহণকারী এই কারণে ক্ষতির সম্মুখীন হয়েছেন। তবে, আপনি যদি একটি উচ্চ-স্পেক ম্যাক মিনি কিনে স্থানীয়ভাবে চালানোর জন্য যথেষ্ট বড় মডেল ডাউনলোড করেন, তাহলে এটি কার্যত বিদ্যুৎ এবং ইন্টারনেট খরচ বাদ দিয়ে বিনামূল্যে শ্রম পাওয়ার মতো…
টমস হার্ডওয়্যার এবং টেকরাডারের প্রতিবেদন অনুসারে, ওপেনক্ল জনপ্রিয়তা অর্জনের পর, 24GB এবং 32GB ম্যাক মিনি কনফিগারেশনের জন্য অপেক্ষার সময় 6 দিন থেকে 6 সপ্তাহের মধ্যে বৃদ্ধি পেয়েছে; আরও শক্তিশালী ম্যাক স্টুডিওর জন্য ডেলিভারি সময়ও দুই সপ্তাহ থেকে প্রায় দুই মাস বৃদ্ধি পেয়েছে।
এই অপেক্ষার সময়গুলো হলো আসল কেনাকাটা ব্যবহার করে প্রাথমিক OpenClaw খেলোয়াড়দের দেওয়া ভোট।
(বিঃদ্রঃ: কিছু মডেলের ঘাটতি অ্যাপলের সাম্প্রতিক নতুন ম্যাক ডেস্কটপ কম্পিউটার লঞ্চের সাথেও সম্পর্কিত। অতীতে, নতুন মডেল প্রকাশের সাথে সাথেই পুরোনো মডেলগুলি বিক্রি হয়ে যেত। OpenClaw-এর জনপ্রিয়তাই একমাত্র কারণ নয়।)
যেন ভাগ্যের কোন অদ্ভুত মোড়ের কারণে, ২০২৬ সালে ম্যাক পছন্দের " এআই পিসি" হয়ে উঠেছে; বিপরীতে, উইন্ডোজ পিসি শিল্প, যা বেশ কয়েক বছর ধরে "এআই পিসি" প্রচার করে আসছে, মোটেও লাভবান হয়নি।
ইন্টেল, এএমডি এবং কোয়ালকমের মতো চিপমেকাররা, মূলধারার পিসি ব্র্যান্ডগুলির সাথে, ২০২৩ সাল থেকে "এআই পিসি" ধারণাটি বাজারজাত করছে। এই সর্বশেষ উইন্ডোজ কম্পিউটারগুলির মধ্যে অনেকগুলিই সার্টিফাইড কোপাইলট+ পিসি, চিত্তাকর্ষক জিপিইউ এবং এনপিইউ কর্মক্ষমতা নিয়ে গর্ব করে, এবং কিছু এমনকি সমতুল্য ম্যাকের তুলনায় উল্লেখযোগ্যভাবে সস্তা।
কিন্তু প্রশ্ন হল, কেন মানুষ এখনও ম্যাকের দিকে ঝুঁকছে?
ম্যাক কেন?
উইন্ডোজ পিসি নাকি ম্যাক ভালো, এই বিতর্কের কোনও সুনির্দিষ্ট উত্তর কখনও পাওয়া যাবে না। তবে, যখন এআই ডেভেলপমেন্টের কথা আসে, তখন ম্যাক এখন অব্যক্ত পছন্দ হয়ে উঠেছে।
যদিও বৃহৎ মডেলের "মস্তিষ্ক" ক্লাউড সার্ভারে থাকে, ডেভেলপারদের হাত থাকে ম্যাকের উপর। ম্যাকের ফর্ম ফ্যাক্টর বা ব্যবহারকারীর অভিজ্ঞতার সাথে এর খুব একটা সম্পর্ক নেই: মূল কথা হল macOS-এর UNIX রুট রয়েছে।
একটি AI এজেন্টের মূল কাজগুলির মধ্যে রয়েছে ফাইল ম্যানিপুলেট করা, কমান্ড-লাইন টুল কল করা, API শিডিউল করা এবং এমনকি গ্রাফিক্যাল ইন্টারফেস নিয়ন্ত্রণ করা। আরও সহজভাবে বলতে গেলে, এজেন্ট হল একজন বুদ্ধিমান এবং স্বয়ংক্রিয় "স্ক্রিপ্ট ইঞ্জিনিয়ার", তবে স্ক্রিপ্টগুলি রিয়েল-টাইমে একটি বৃহৎ ভাষা মডেল দ্বারা তৈরি করা হয়। macOS, একটি UNIX-এর মতো সিস্টেম হওয়ায়, bash এবং zsh কমান্ডের জন্য চমৎকার নেটিভ সমর্থন রয়েছে।
এটি AI ডেভেলপমেন্টের সবচেয়ে মৌলিক পরিবেশ সেটআপ সমস্যার সমাধান করে। Windows-এ, আপনাকে প্রথমে একটি WSL2 ভার্চুয়াল মেশিন ইনস্টল করতে হতে পারে। কিন্তু Mac-এ, Python পরিবেশ থেকে জটিল C++ কম্পাইলেশন টুলচেইন পর্যন্ত সবকিছুই মূলত ব্যবহারের জন্য প্রস্তুত। Homebrew-এর মতো প্যাকেজ ম্যানেজাররা বিভিন্ন সরঞ্জাম এবং নির্ভরতা ইনস্টল করার কাজটিকে একটি মাত্র কমান্ডের মাধ্যমে সহজ করে তোলে।
অতিরিক্তভাবে, macOS POSIX স্ট্যান্ডার্ড মেনে চলে, ফাইল পাথ, মাল্টি-থ্রেডেড টাস্ক এবং নেটওয়ার্ক প্রোটোকল পরিচালনা করার সময় কিছুটা উচ্চ নির্ভরযোগ্যতা প্রদান করে। এজেন্টদের প্রায়শই ঘন ঘন ডেটা পড়তে এবং লিখতে হয় এবং API কল করতে হয়; দক্ষ সিস্টেম-স্তরের সময়সূচী এজেন্টদের Mac-এ দ্রুত গতিতে কাজ করতে দেয়।
এই স্থানীয় অনুভূতি এবং স্থিতিশীলতা ডেভেলপার এবং প্রাথমিক গ্রহণকারীদের আরও দ্রুত শুরু করতে এবং প্রকৃত এজেন্ট অর্কেস্ট্রেশনে আরও বেশি সময় ব্যয় করতে দেয়।
উইন্ডোজে WSL এবং PowerShell আছে, যা বেশিরভাগ কার্যকারিতা কভার করে। তবে, WSL হল উইন্ডোজের উপরে তৈরি একটি সামঞ্জস্য স্তর, এবং এটি পাথ কনভেনশন, রেজিস্ট্রি মেকানিজম এবং অনুমতি মডেলের মতো লিগ্যাসি সমস্যায় ভুগছে। অতএব, উইন্ডোজে চলমান AI মডেল এবং এজেন্ট প্রকল্পগুলির মধ্যে প্রকৃতপক্ষে আরও বেশি ঘর্ষণ হবে।
ওলাম এবং এলএম স্টুডিওর উদাহরণ নিলে, এই দুটি টুল বৃহৎ মডেলের এজ ইনফারেন্সের জন্য "ডাউনলোড, ইনস্টল এবং রান" করার মতোই সহজ করে তোলে। ওলামের উইন্ডোজ সংস্করণটি ম্যাকওএস সংস্করণের চেয়ে ছয় মাস পরে প্রকাশিত হয়েছিল; যদিও এলএম স্টুডিও শুরু থেকেই উভয় প্ল্যাটফর্মকে সমর্থন করে আসছে, ম্যাক সংস্করণটি সর্বদা সম্প্রদায়ের মধ্যে একটি ভাল খ্যাতি অর্জন করেছে; ওপেনক্লের ক্ষেত্রেও একই কথা প্রযোজ্য।
হার্ডওয়্যার স্তরের আরও গভীরে প্রবেশ করলে, বৃহৎ ভাষা মডেলগুলিতে যুক্তি এবং বাস্তবায়নের প্রাণশক্তি হল স্মৃতি।
আবারও OpenClaw-কে উদাহরণ হিসেবে নিলে, ব্যবহারকারীরা টোকেন দিয়ে অর্থ প্রদানের মাধ্যমে ক্লাউড মডেলগুলি অ্যাক্সেস করতে পারেন, তবে এর শক্তি ক্লায়েন্টের দিকে মডেল অনুমানের ড্রাইভিংয়ে নিহিত। সাধারণ গবেষণা অনুসারে, OpenClaw-কে স্বাভাবিক IQ সহ একজন ব্যক্তির মতো কাজ করার জন্য, ব্যাকএন্ড মডেল প্যারামিটারের সর্বনিম্ন সংখ্যা প্রায় 7 বিলিয়ন, এবং তুলনামূলকভাবে স্থিতিশীলভাবে কাজ করার জন্য প্রায়শই কমপক্ষে 32 বিলিয়ন প্যারামিটারে পৌঁছাতে হয়।
৪-বিট কোয়ান্টাইজেশনের পরেও, এত বড় মডেলের জন্য এখনও প্রায় ২০ গিগাবাইট মেমরির প্রয়োজন হয় (যার কিছু অংশ কনটেক্সট উইন্ডোর জন্য সংরক্ষিত রাখতে হয়)।
এই মুহুর্তে, উইন্ডোজ পিসির আর্কিটেকচার অপর্যাপ্ত হয়ে পড়ে। CPU মেমরি এবং ভিডিও মেমরির মধ্যে ভৌত বিচ্ছিন্নতা বিদ্যমান থাকে এবং PCIe বাসের মাধ্যমে ডেটা স্থানান্তরিত হয়, যা ব্যান্ডউইথ বাধার জন্য সংবেদনশীল করে তোলে। ঘন ঘন ডেটা স্থানান্তর অনুমান প্রক্রিয়ার গতিকে প্রভাবিত করতে পারে।
উল্লেখ করার মতো বিষয় হল, বড় মডেলগুলি সাধারণত ত্বরিত অনুমানের জন্য GPU-এর উপর নির্ভর করে, যার জন্য পর্যাপ্ত ভিডিও মেমোরির প্রয়োজন হয়। NVIDIA-এর কনজিউমার-গ্রেড গ্রাফিক্স কার্ডগুলির মধ্যে, শুধুমাত্র 24GB ভিডিও মেমোরি (90 সিরিজ) সহ গ্রাফিক্স কার্ডগুলি কনফিগারেশনের প্রয়োজনীয়তা পূরণ করে, তবে একটি সম্পূর্ণ সিস্টেম তৈরির মোট খরচ (শুধুমাত্র নতুন মেশিন বিবেচনা করে) কমপক্ষে 10,000 RMB হবে এবং একটি নতুন কার্ডের সাথে, এটি 40,000 থেকে 50,000 RMB পর্যন্ত বেড়ে যাবে।
অ্যাপলের ইউনিফাইড মেমোরি আর্কিটেকচার এম-সিরিজ চিপযুক্ত ম্যাকগুলিকে ডিভাইসে অনুমান করার সময় বৃহত্তর-স্কেল মডেলগুলি সহজেই পরিচালনা করতে দেয়।
সহজ ভাষায়, একটি ইউনিফাইড মেমোরি আর্কিটেকচারের প্রভাব হল যে CPU, GPU এবং নিউরাল কম্পিউটিং ইঞ্জিন একই মেমোরি পুল ভাগ করে নিতে পারে, যা ফিজিক্যাল বাস ট্রান্সফারের ওভারহেডকে বাদ দেয়। এটি ম্যাকগুলিকে অত্যন্ত উচ্চ মেমোরি ব্যান্ডউইথ অর্জন করতে দেয় এবং মাল্টি-মেশিন ইন্টারকানেকশনের জন্য আরও ভাল কর্মক্ষমতা প্রদান করে।
উদাহরণস্বরূপ, ম্যাক মিনি ব্যবহার করে, উচ্চ-পারফরম্যান্স M4 প্রো প্রসেসর, 48GB মেমরির সাথে যুক্ত, এবং বাকিগুলির জন্য মৌলিক কনফিগারেশন নির্বাচন করে, মেশিনটির মোট দাম প্রায় 13,000 ইউয়ান, যা সাধারণত OpenClaw সম্প্রদায় দ্বারা সুপারিশকৃত 32 বিলিয়ন প্যারামিটার মডেলের কনফিগারেশন স্তরে পৌঁছাতে পারে।
অবশ্যই, এটি শুধুমাত্র একটি পেশাদার কনফিগারেশন যার জন্য উচ্চ টোকেন থ্রুপুট প্রয়োজন। আপনি যদি একজন উৎসাহী হন এবং কেবল OpenClaw চেষ্টা করে দেখতে চান, তাহলে আপনি এটি একটি স্ট্যান্ডার্ড M4 চিপ এবং 32GB RAM দিয়ে চালাতে পারেন।
অবশ্যই, এই খরচের তুলনাটি এই ধারণার উপর ভিত্তি করে তৈরি যে এটি প্রাথমিক মেশিন হিসেবে ব্যবহার না করে, এজ ইনফারেন্স/ওপেনক্ল চালানোর জন্য নিবেদিত। একই দামের উইন্ডোজ পিসি গেমিং এবং ভিডিও এডিটিং এর জন্যও ব্যবহার করা যেতে পারে, যা আরও বহুমুখীতা প্রদান করে।
তদুপরি, ম্যাকের ইউনিফাইড মেমোরি এবং পিসি প্ল্যাটফর্মের গ্রাফিক্স কার্ডের ডেডিকেটেড ভিআরএএম এক জিনিস নয়। ইউনিফাইড মেমোরি সিস্টেম এবং মডেল দ্বারা ভাগ করা হয়; এমনকি 32 জিবি র্যাম সহ একটি ম্যাক মিনিতেও, ম্যাকওএস সিস্টেম এবং অন্যান্য সফ্টওয়্যারের জন্য এখনও বেশ কয়েকটি গিগাবাইট মেমোরি প্রয়োজন। অন্যদিকে, RTX 3090 এর ডেডিকেটেড ভিআরএএম মডেলটিকে এটির সমস্ত ব্যবহার করার অনুমতি দেয় এবং এটি সিপিইউ এবং মেমোরির সাথে একত্রে বৃহত্তর কোয়ান্টাইজেশন মডেলও চালাতে পারে।
যদি আপনি OpenClaw-এর মূল অংশ হিসেবে শুধুমাত্র ক্লাউড API ব্যবহার করেন এবং এজ ডিপ্লয়মেন্টের কথা বিবেচনা না করেন, তাহলে Mac-এর ব্যবহারের সহজতা এখনও একটি সুবিধা।
এছাড়াও, যদিও CUDA একটি ইউনিফাইড মেমোরি প্রোগ্রামিং ইন্টারফেস প্রদান করে, CPU মেমোরি এবং GPU মেমোরি এখনও শারীরিকভাবে পৃথক, এবং ডেটা ট্রান্সফার এবং ব্যান্ডউইথের বাধাগুলি দূর করা হয়নি।
এরপর, বিদ্যুৎ খরচের দিকে নজর দেওয়া যাক।
এজেন্টটি একটি অবিচ্ছিন্ন লুপে কাজ করে: টাস্ক ট্রিগারিং, রিজনিং, এক্সিকিউশন, অপেক্ষা, এবং তারপর আবার ট্রিগার করা। উপরে উল্লিখিত কনফিগারেশন সহ একটি উইন্ডোজ পিসি প্রায় 300-400W (স্থানীয় স্থাপনা) এ চলবে, এবং তাপ অপচয়, শব্দ এবং বিদ্যুতের খরচ কম নয়।
ম্যাক মিনি সাধারণত প্রায় ১০-৪০ ওয়াটের স্থিতিশীল বিদ্যুৎ খরচ করে, যার সর্বোচ্চ শক্তি ৬৫ ওয়াট (M4) অথবা ১৫৫ ওয়াট (M4 Pro)। এর তাপ অপচয় নিয়ন্ত্রণযোগ্য, প্রায় কোনও ফ্যানের শব্দ ছাড়াই, যার ফলে নীরব অপারেশন হয়। এই কম-বিলম্বিত, কম-শক্তির একটানা অপারেশন ব্যবহারকারীর অভিজ্ঞতায় একটি সূক্ষ্ম পার্থক্য তৈরি করে।
অবশ্যই, আমাদের আলোচনা OpenClaw-এর উপর বেশি আলোকপাত করবে, যা মূলত যুক্তি দ্বারা পরিচালিত একটি দৃশ্যকল্প। যদি কাজের ক্ষেত্রে স্থানীয় সূক্ষ্ম-টিউনিং জড়িত থাকে এবং দক্ষতা অগ্রাধিকার পায়, তাহলে macOS প্ল্যাটফর্মে, মৌলিক বিষয়গুলি বুঝতে শুরু করার জন্য আপনার প্রায়শই Mac Studio, অথবা অন্তত একটি শীর্ষ-স্তরের MacBook Pro-এর প্রয়োজন হবে।
একই সাথে, ম্যাকগুলি CUDA সমর্থন করে না এমন একটি বিষয় যা কখনও পরিবর্তন হতে পারে না। তবে, CUDA-এর আসল যুদ্ধক্ষেত্র হল মডেল প্রশিক্ষণ; অনুমানের পরিস্থিতিগুলি এর উপর অনেক কম নির্ভর করে, যেহেতু অ্যাপলের অনুমানের জন্য MLX তার ট্রাম্প কার্ড (যা পরে বিস্তারিত আলোচনা করা হবে)।
OpenClaw-এ ফিরে আসা: এর স্রষ্টা, পিটার স্টেইনবার্গার, প্রকাশ্যে বলেছেন যে তিনি উইন্ডোজ পছন্দ করেন এবং এটিকে আরও শক্তিশালী বলে মনে করেন। লেক্স ফ্রিডম্যান পডকাস্টে, তিনি বলেছেন যে ম্যাক মিনি একমাত্র "ভৌত" বিকল্প নয়, এবং WSL2 এর মাধ্যমে OpenClaw চালানো ইতিমধ্যেই খুব পরিণত; এমনকি তিনি প্রকাশ্যে অ্যাপলের AI ক্ষেত্রে "বিশৃঙ্খলা" করার জন্য সমালোচনা করেছেন এবং অ্যাপলের বাস্তুতন্ত্রের বন্ধ প্রকৃতির প্রতি অসন্তোষ প্রকাশ করেছেন।
বস্তুনিষ্ঠভাবে বলতে গেলে, সীমিত প্রযুক্তিগত দক্ষতা সম্পন্ন ব্যবহারকারীদের জন্য, ম্যাক মিনি প্রকৃতপক্ষে স্থাপনের জন্য সবচেয়ে উদ্বেগমুক্ত এবং ব্যবহারে সহজ সমাধান। এর প্রধান কারণ হল এর বিদ্যুৎ খরচ, নীরব অপারেশন এবং ছোট আকার, যা এটিকে একটি "সার্ভার নোড" এর মতো করে তোলে যা একটি কোণে প্লাগ করা যেতে পারে, 24 ঘন্টা স্ট্যান্ডবাই থাকে এবং কোনও রক্ষণাবেক্ষণের প্রয়োজন হয় না।
বিদ্যুৎ খরচ সম্পর্কিত আরেকটি উদাহরণ: কয়েকদিন আগে, মনজিৎ সিং নামে একজন প্রকৌশলী M4 প্রসেসরে নিউরাল ইঞ্জিন (ANE) সফলভাবে রিভার্স ইঞ্জিনিয়ারিং করেছিলেন এবং দেখেছিলেন যে ANE-এর অত্যন্ত উচ্চ শক্তি দক্ষতা রয়েছে: কম্পিউটিং শক্তি সম্পূর্ণরূপে ব্যবহার করা হলে এর দক্ষতা 6.6 TOPS/W পর্যন্ত বেশি।
অ্যাপলের M4 GPU-এর তুলনায়, যা প্রায় ১ TOPS/W, Nvidia-এর H100 প্রায় ০.১৩ এবং এর A100 ০.০৮ TOPS/W।
পরিপ্রেক্ষিতে বলতে গেলে, একটি একক A100 কার্ডের থ্রুপুট M4 ANE এর চেয়ে 50 গুণ বেশি, কিন্তু M4 ANE এর বিদ্যুৎ খরচ A100 এর চেয়ে 80 গুণ বেশি। মূল লেখক নিবন্ধে লিখেছেন: "প্রান্ত অনুমানের জন্য, ANE এর কর্মক্ষমতা অসাধারণ।"
স্নায়ু ইঞ্জিন দিয়ে শুরু করা যাক
২০১১ সালে, অ্যাপল প্রথম রিয়েল-টাইম ফেস ডিটেকশন এবং অন্যান্য ফাংশন বাস্তবায়ন করে যা পরবর্তীতে A5 প্রসেসরের ইমেজ প্রসেসিং ইউনিটে (ISP) হার্ড-রাইটিং দ্বারা AI টাস্ক হিসাবে বিবেচিত হয়।
২০১৪ সালে, অ্যাপল প্রাইমসেন্স অধিগ্রহণ করে এবং বিশেষ করে নিউরাল নেটওয়ার্ক কম্পিউটিংয়ের জন্য একটি নতুন কোপ্রসেসর তৈরি শুরু করে। এই কাজটি তিন বছর পরে আইফোন এক্স-এ বাস্তবায়িত হয়েছিল: A11 বায়োনিক প্রসেসরে ফেস আইডি এবং পোর্ট্রেট মোড চালানোর জন্য মাত্র 0.6 TOPS কম্পিউটিং শক্তি সহ উপরে উল্লিখিত নিউরাল ইঞ্জিন (ANE) অন্তর্ভুক্ত করা হয়েছিল।
সেই সময়ে, AI এখনও বৃহৎ আকারের মডেলের যুগে পৌঁছায়নি; এটি মূলত বিভিন্ন মেশিন লার্নিং অ্যালগরিদমের উপর নির্ভর করত। অ্যাপলের এই কোপ্রসেসর চালু করার পর বাজার খুব একটা প্রতিক্রিয়া দেখায়নি। কিন্তু অ্যাপল কখনও হাল ছাড়েনি এবং প্রচুর বিনিয়োগ অব্যাহত রেখেছে।
তিন বছর পর, M1 মুক্তি পায়, একটি ইউনিফাইড মেমোরি আর্কিটেকচার সহ, এবং ANE ম্যাকের সাথেও চালু হয়। ডেস্কটপ প্ল্যাটফর্মের জন্য আরও প্রশস্ত পাওয়ার বাজেট ANE-এর কম্পিউটিং পাওয়ারকে 11 TOPS-এ উন্নীত করে। পরবর্তী প্রজন্মগুলি আরও উন্নতি দেখেছে: M2 15.8 TOPS-এ, M3 18 TOPS-এ, M4 38 TOPS-এ, এবং 2025 সালের শেষ নাগাদ, M5 57 TOPS-এ পৌঁছেছে। M1 থেকে M5-এ, অ্যাপলের ANE কম্পিউটিং পাওয়ার পাঁচগুণেরও বেশি বৃদ্ধি পেয়েছে।
অন্যান্য পিসি নির্মাতারা এই প্রবৃদ্ধির পেছনের যুক্তিকে ঈর্ষা না করে পারছেন না। অ্যাপল ম্যাকগুলিতে এআই অ্যাক্সিলারেশন হার্ডওয়্যার যুক্ত করার আগে, লক্ষ লক্ষ, এমনকি কয়েক লক্ষ আইফোন ইতিমধ্যেই একই ANE আর্কিটেকচারে কাজ করছিল। বিদ্যুৎ খরচের কর্মক্ষমতা, স্থিতিশীলতা এবং চরম পরিস্থিতিতে এজ কেসগুলি ইতিমধ্যেই বাণিজ্যিকভাবে উপলব্ধ মডেলগুলিতে যাচাই করা হয়েছিল এবং তারপর ম্যাকগুলিতে স্থানান্তরিত করা হয়েছিল।
মোবাইল বাজারে ইন্টেল এবং এএমডির কার্যত কোনও গ্রাহক-গ্রেড উপস্থিতি নেই; যদিও কোয়ালকম লক্ষ লক্ষ অ্যান্ড্রয়েড ফোনে স্ন্যাপড্রাগন চিপ স্থাপন করেছে, এটি কেবল একটি চিপ সরবরাহকারী। অ্যান্ড্রয়েডে এআই গুগল (জেমিনি) এবং প্রধান ফোন নির্মাতারা তৃতীয় পক্ষের এআই ল্যাবগুলির সহযোগিতায় তৈরি করেছে; উইন্ডোজ এআই (কোপাইলট) তৈরি করেছে মাইক্রোসফ্ট।
অ্যাপলের পার্থক্য হলো এর উল্লম্ব ইন্টিগ্রেশন, যা হার্ডওয়্যার এবং সফ্টওয়্যার উভয়কেই নিয়ন্ত্রণ করে। অন্যান্য চিপ নির্মাতাদের এই একীভূত নিয়ন্ত্রণ নেই।
অবশ্যই, ম্যাকে বৃহৎ ভাষার মডেল অনুমান করার সাথে ANE-এর খুব একটা সম্পর্ক নেই; এটি ফেস আইডি এবং ফেসিয়াল রিকগনিশনের মতো স্থির-প্যাটার্ন AI কাজগুলি পরিচালনা করার জন্য আরও উপযুক্ত। GPU বেশিরভাগ গণনা পরিচালনা করে।
(দ্রষ্টব্য: সম্প্রতি পরিস্থিতির সামান্য পরিবর্তন হয়েছে। প্রথমত, M-সিরিজ চিপগুলিতে ANE এখন প্রম্পট ইনজেকশন প্রিফিল পর্যায় পরিচালনা করে; এবং পূর্বে উল্লিখিত M4 ANE রিভার্স ইঞ্জিনিয়ারিং সম্পর্কে , ইঞ্জিনিয়ার CoreML এড়িয়ে সরাসরি ANE কল করার জন্য একটি পদ্ধতিও বাস্তবায়ন করেছিলেন, যা থ্রুপুটকে উল্লেখযোগ্যভাবে উন্নত করেছিল । এই চিন্তাভাবনা অনুসরণ করে, অনুমান এবং এমনকি প্রশিক্ষণ ত্বরান্বিত করার জন্য ANE সরাসরি ব্যবহারের জন্য একটি সাধারণ পদ্ধতি খুঁজে পাওয়া সম্ভব হতে পারে।)
২০২৩ সালের শেষের দিকে, অ্যাপল ওপেন-সোর্সড এমএলএক্স ব্যবহার করে, ডেভেলপারদের এম-সিরিজ চিপগুলির জন্য বিশেষভাবে অপ্টিমাইজ করা একটি মডেল ইনফারেন্স ফ্রেমওয়ার্ক প্রদান করে। গত বছর, অ্যাপল স্মার্টের সাথে বেসিক মডেল ফ্রেমওয়ার্ক প্রকাশ করা হয়েছিল, যা অ্যাপ ডেভেলপারদের ইন্টারনেট সংযোগের প্রয়োজন ছাড়াই এবং ডিভাইস থেকে ডেটা ছাড়াই আইফোন এবং ম্যাকের সিস্টেমের অন্তর্নির্মিত বেসিক মডেলগুলি অ্যাক্সেস করার অনুমতি দেয়।
এআই তৈরিতে অ্যাপলের বারবার বিলম্ব অনস্বীকার্য। তবে, এটিও একটি অনস্বীকার্য সত্য যে অ্যাপল ১০ বছর আগে থেকেই এআই নিয়ে পরীক্ষা-নিরীক্ষা শুরু করে, বহু বছর আগে ডেস্কটপ এআই বিকাশের ভিত্তি স্থাপন করে।
উইন্ডোজের ক্ষেত্রে, " এআই পিসি" শব্দটি ২০২৩ সালের শেষ নাগাদ ইন্টেল, এএমডি এবং পিসি নির্মাতাদের প্রেস রিলিজ এবং উপস্থাপনায় প্রদর্শিত হবে না।
২০২৪ সালের মে মাসে, মাইক্রোসফট "Recall" নামক ফ্ল্যাগশিপ ফিচার সহ Copilot+ PC সার্টিফিকেশন সিস্টেম প্রকাশ করে। মূল যুক্তি হল যে সিস্টেমটি ক্রমাগত স্ক্রিন কন্টেন্টের স্ক্রিনশট নেয় এবং তারপরে উইন্ডোজের সিস্টেম-স্তরের AI আপনাকে অতীতে যা দেখেছেন তা মনে রাখতে সাহায্য করতে পারে।
প্রকাশের সময় এই বৈশিষ্ট্যটির প্রকৃত তাৎপর্য নির্বিশেষে, এর নিরাপত্তার ক্ষেত্রে প্রথমে গুরুতর সমস্যা দেখা দেয়: প্রকাশের মাত্র এক মাস পরে, গবেষকরা আবিষ্কার করেন যে রিকোল বৈশিষ্ট্যটি সমস্ত স্ক্রিনশট একটি আনএনক্রিপ্টেড স্থানীয় প্লেইনটেক্সট ডাটাবেসে সংরক্ষণ করে।
মাইক্রোসফট হঠাৎ করে রিকল ফিচারটি সরিয়ে দেয়। ছয় মাস পর, মাইক্রোসফট আবার একটি বিটা সংস্করণ প্রকাশ করে, কিন্তু নতুন নিরাপত্তা সমস্যার কারণে এটি আবার বিলম্বিত হয়। অবশেষে ২০২৫ সালের এপ্রিলে রিকল আনুষ্ঠানিকভাবে চালু করা হয়, কিন্তু এটি ডিফল্টরূপে নিষ্ক্রিয় করা হয় এবং সক্রিয় থাকা অবস্থায় ডেটা এনক্রিপ্ট করা আকারে সংরক্ষণ করা হয়।
প্রাথমিক ঘোষণা থেকে শুরু করে বাস্তব ব্যবহারযোগ্যতা পর্যন্ত, প্রায় এক বছর সময় লেগেছে। এটা বলাই বাহুল্য যে পুরো উইন্ডোজ ইকোসিস্টেমের এআই পিসির ফ্ল্যাগশিপ বৈশিষ্ট্যটি সম্পূর্ণরূপে পুনর্নির্মাণের মধ্য দিয়ে গেছে, যা অ্যাপলের এআই/নতুন সিরির বারবার উত্থানের মতো বিশ্রী নয়। তবে, সম্ভবত উইন্ডোজ ইকোসিস্টেমের কণ্ঠস্বর এত কম হওয়ার কারণে, খুব কম লোকই এআই পিসির দিকে মনোযোগ দিয়েছে, এবং অনেকেই এটি কখনও শুনেনি।
কোপাইলট+ পিসি সিস্টেমের সার্টিফিকেশন স্ট্যান্ডার্ড সম্পর্কে, মাইক্রোসফট প্রাথমিকভাবে নিউরাল প্রসেসিং ইঞ্জিন (NPU) কে লক্ষ্য করে, যার জন্য 40 টিওপিএস প্রয়োজন। তবে, এই কম্পিউটিং শক্তি রিয়েল-টাইম ক্যাপশনিং, ব্যাকগ্রাউন্ড ব্লারিং এবং ফটো বর্ধনের মতো সংকীর্ণ গ্রাহক-মুখী কাজের জন্য ব্যবহৃত হয়; বৃহৎ-স্কেল ল্যাঙ্গুয়েজ মডেল ইনফারেন্স কখনই এর আওতার মধ্যে থাকে না (অ্যাপলের ANE এর মতো)।
যখন ডেভেলপাররা ডিভাইসে বৃহৎ আকারের ভাষা মডেল অনুমান সম্পাদন করার চেষ্টা করে, তখন তারা দেখতে পায় যে যদিও এই কম্পিউটারগুলিকে AI PC বলা হয়, তবে এগুলি AI অনুমানের উদ্দেশ্যে অপ্টিমাইজ করা হয় না। Microsoft Copilot-এর মূল কম্পিউটিং শক্তি Azure ক্লাউড থেকে আসে এবং ডিভাইসের কম্পিউটিং শক্তির সাথে প্রায় সম্পর্কিত নয়। যারা Windows AI PC কিনেছেন তাদের জন্য, সবচেয়ে লক্ষণীয় AI উন্নতি সম্ভবত রিয়েল-টাইম ক্যাপশনিং এবং স্বয়ংক্রিয় ছবির শ্রেণিবিন্যাস।
যখন প্রান্ত অনুমানের কথা আসে, তখন আরেকটি গুরুত্বপূর্ণ বিষয় থাকে: উইন্ডোজ এআই ইকোসিস্টেমের অপ্টিমাইজেশন পাথগুলি খণ্ডিত।
NVIDIA GPU গুলি CUDA এবং TensorRT ব্যবহার করে, Intel NPU গুলি OpenVINO ব্যবহার করে, Qualcomm NPU গুলি QNN SDK ব্যবহার করে, এবং AMD NPU গুলি তাদের নিজস্ব ড্রাইভার স্ট্যাক ব্যবহার করে। মডেল স্টোরেজ ফর্ম্যাটগুলিও বেশ খণ্ডিত, CPU+GPU ইনফারেন্সের জন্য একটি সাধারণ ফর্ম্যাট (GGUF, আরও সঠিকভাবে CPU ইনফারেন্স + GPU হায়ারার্কিকাল অফলোডিং) এবং একটি GPU-কেবল ফর্ম্যাট (EXL2) সহ।
এর অর্থ হল, উইন্ডোজ এআই পিসিতে মডেল এবং মডেল-চালিত কার্যকারিতা চালানোর পদ্ধতি ইনফারেন্স ব্যাকএন্ডের ক্ষেত্রে আরও জটিল হবে। মাইক্রোসফটের ONNX রানটাইম এবং ডাইরেক্টএমএল (যা বর্তমানে পুনর্নবীকরণের অবস্থায় রয়েছে) একটি ইউনিফাইড অ্যাবস্ট্রাকশন লেয়ার হিসেবে রয়েছে, কিন্তু একীকরণের খরচ প্রতিটি বিক্রেতার সর্বোচ্চ কর্মক্ষমতাকে ক্ষুন্ন করছে। অ্যাপল বর্তমানে একমাত্র পিসি বিক্রেতা যারা তাদের নিজস্ব পিসি হার্ডওয়্যারের জন্য বিশেষভাবে একটি LLM ইনফারেন্স ফ্রেমওয়ার্ক তৈরি করেছে এবং ক্রমাগত বজায় রেখেছে; এই ফ্রেমওয়ার্কটি হল MLX।
হাগিং ফেসের মতো ওপেন-সোর্স মডেল প্ল্যাটফর্মগুলিতে, আপনি সহজেই MLX ফ্রেমওয়ার্ক ব্যবহার করে এমন প্রচুর মডেল খুঁজে পাবেন। যতক্ষণ পর্যন্ত তাদের MLX প্রত্যয় থাকে এবং আপনার মেমরি/প্রসেসর অনুমতি দেয়, ততক্ষণ পর্যন্ত সেগুলি "আউট অফ দ্য বক্স" ব্যবহার করা যেতে পারে।
তবে, সম্প্রতি MLX-এর অন্যতম প্রধান অবদানকারী আওনি হান্নুনের অ্যাপল থেকে প্রস্থান প্রকল্পের ভবিষ্যৎ উন্নয়নে কিছুটা অনিশ্চয়তার সৃষ্টি করেছে। হান্নুন আরও বলেন যে MLX টিমে এখনও অনেক চমৎকার কর্মী রয়েছে, তাই চিন্তার কোনও কারণ নেই।
আমাদের নিজস্ব অভিজ্ঞতা
গত এক বছরে, iFanr এজ ডিভাইসে AI মডেল স্থাপনের উপর অসংখ্য পরীক্ষা পরিচালনা করেছে এবং কিছু প্রাসঙ্গিক বহিরাগত ডেভেলপারদের সাক্ষাৎকারও নিয়েছে। দুটি উদাহরণ উল্লেখ করার মতো।
গত চীনা নববর্ষে, ডিপসিক ব্যাপকভাবে আলোড়ন তুলেছিল এবং এর কিছুক্ষণ পরেই নতুন ম্যাক স্টুডিও বাজারে আসে। আমরা ডিপসিক R1 671B মডেলটি ব্যবহার করেছিলাম (দ্রষ্টব্য: বাস্তবে, কেবল মেমোরির প্রয়োজন হয়, হার্ড ড্রাইভটি এত বড় হওয়ার প্রয়োজন হয় না; 70,000 RMB এর বেশি দামের 1TB SSD মডেলটি যথেষ্ট হবে) এবং M3 Ultra Mac Studio (512GB + 16TB) এর ডিস্টিল্ড 70B সংস্করণটি ব্যবহার করেছিলাম যার দাম প্রায় 100,000 RMB।
সেই সময় আমাদের সিদ্ধান্ত ছিল যে, প্রতিদিনের এজ-ডিপ্লয়েড সংলাপের জন্য একটি 70B প্রসেসরই যথেষ্ট, এবং শুধুমাত্র AI-এর সাথে চ্যাট করার জন্য একটি মেশিনে হাজার হাজার ডলার খরচ করা কেবল অর্থের অপচয়। সেই সময়ের মডেল ক্ষমতাগুলি আসলে খুব একটা ভালো ছিল না; পরেই নতুন মাল্টিমডাল মডেল এবং এজেন্ট ক্ষমতা আবির্ভূত হয়।
তবে, 671B মডেলের বিশাল সংখ্যক প্যারামিটার একটি ডেস্কটপ মেশিনে এজ ইনফারেন্সের জন্য ব্যবহার করা যেতে পারে তা এখনও একটি অসাধারণ কৃতিত্ব। 512GB ইউনিফাইড মেমোরিতে, 671B মডেলটি 400GB দখল করেছিল। প্রেক্ষাপট, macOS সিস্টেম এবং অন্যান্য কাজের ক্ষেত্রে, এটি প্রায় সম্পূর্ণ লোডে ছিল, কিন্তু মেশিনটি সর্বত্র নীরবে চলছিল, শব্দের মাত্রা স্বাভাবিক সীমার মধ্যে ছিল এবং কোনও অতিরিক্ত গরম ছিল না।
ঐতিহ্যবাহী এআই অবকাঠামোগত যুক্তিতে, এই প্যারামিটারের স্কেল ডেটা সেন্টার স্তরের অধীনে পড়ে এবং তাত্ত্বিকভাবে এই পরিস্থিতিতে গ্রাহক-গ্রেড হার্ডওয়্যার উপস্থিত হওয়া উচিত নয়। কিন্তু সেই M3 আল্ট্রা ম্যাক স্টুডিও আসলে নীরবে উপস্থিত হয়েছিল।
পরে, আমরা যুক্তরাজ্যের অক্সফোর্ড বিশ্ববিদ্যালয়ের একটি স্টার্টআপ টিম এক্সো ল্যাবসের সাক্ষাৎকার নিই। তারা ৫১২ গিগাবাইট ইউনিফর্ম মেমোরি সহ চারটি ম্যাক স্টুডিও ব্যবহার করে ১২৮টি সিপিইউ কোর, ৩২০টি জিপিইউ কোর, ২ টেরাবাইট ইউনিফর্ম মেমোরি এবং ৩ টেরাবাইট/সেকেন্ডের বেশি মোট মেমোরি ব্যান্ডউইথ সহ একটি কম্পিউটিং ক্লাস্টার তৈরি করে।
এই ম্যাক ক্লাস্টারের জন্য দলটি Exo V2 শিডিউলিং প্ল্যাটফর্ম তৈরি করেছে, যা একই সাথে দুটি DeepSeek মডেল (V3+R1, 8-বিট কোয়ান্টাইজেশন) লোড করতে পারে। দুটি মডেল কেবল সমান্তরালভাবে অনুমান করতে পারে না, গবেষকরা স্থানীয় সূক্ষ্ম-টিউনিং সম্পাদনের জন্য QLoRA প্রযুক্তিও ব্যবহার করতে পারেন, যা প্রশিক্ষণের সময় উল্লেখযোগ্যভাবে হ্রাস করে। পুরো সিস্টেমের বিদ্যুৎ খরচ 400W এর নিচে রাখা হয় এবং অপারেশন চলাকালীন কার্যত কোনও ফ্যানের শব্দ হয় না।
সমতুল্য কম্পিউটিং শক্তি সম্পন্ন ঐতিহ্যবাহী সমাধানের জন্য প্রায় ২০টি NVIDIA A100s প্রয়োজন হত, যার দাম তখন ২০ লক্ষ RMB-এরও বেশি ছিল; বিপরীতে, Exo Labs-এর সমাধানের মোট খরচ ছিল মাত্র ৪০০,০০০ RMB (একইভাবে, SSD উল্লেখযোগ্যভাবে অতিরিক্ত ছিল, তাই এটি আসলে ৩০০,০০০ RMB-এর নিচে হতে পারে)।
এক্সো ল্যাবসের প্রতিষ্ঠাতা সেই সময় আমাদের বলেছিলেন যে অক্সফোর্ডের নিজস্ব জিপিইউ ক্লাস্টার রয়েছে, কিন্তু আবেদনের জন্য মাসের পর মাস লাইনে অপেক্ষা করতে হয় এবং একবারে কেবল একটি কার্ডের জন্য আবেদন করা যেতে পারে। এই সীমাবদ্ধতাগুলি তাদের উদ্ভাবন করতে বাধ্য করে এবং তারা সঠিক সরঞ্জামগুলি খুঁজে পায়: একটি সমন্বিত মেমরি আর্কিটেকচার, এমএলএক্স এবং ম্যাক কম্পিউটার।
আমাদের সেই সময়ের প্রবন্ধে আমরা লিখেছিলাম: "যদি এনভিডিয়ার এইচ-সিরিজ গ্রাফিক্স কার্ডগুলি এআই ডেভেলপমেন্টের শীর্ষে থাকে, তাহলে ম্যাক স্টুডিও ছোট এবং মাঝারি আকারের দলগুলির হাতে সুইস আর্মি নাইফ হয়ে উঠছে।"
অ্যাপল আসলে অনেক আগেই এই বিষয়ে জানত।
একটি সত্যিকারের এআই পিসি কী?
গত বছর, অ্যাপল বেসিক মডেল ফ্রেমওয়ার্ক প্রকাশ করেছে, যা iOS এবং macOS ডেভেলপারদের ডিভাইসটি ছাড়াই শূন্য নেটওয়ার্ক ল্যাটেন্সি, শূন্য API ফি এবং ডেটা সহ সিস্টেমের অন্তর্নির্মিত বেসিক মডেলগুলিতে কল করার অনুমতি দেয়।
যদিও পরবর্তীতে অ্যাপলের মডেলিং টিম প্রায় ভেঙে পড়েছিল , তবুও অ্যাপল তার পুনরাবৃত্তিতে স্থবিরতা বরণ করেনি। এটি সর্বদা জানত ডেভেলপাররা কোথায় এবং তারা কী চায়। এর প্রতিক্রিয়া ছিল বৃহৎ-মডেল-চালিত AI ক্ষমতাগুলিকে অপারেটিং সিস্টেমের অবকাঠামোতে একীভূত করা, যা ডেভেলপারদের জন্য তাদের ব্যবহার সহজ করে তোলে।
গত সপ্তাহে, অ্যাপল python-apple-fm-sdk ওপেন-সোর্স করেছে। পূর্বে, অ্যাপলের মৌলিক মডিউলগুলির সম্পূর্ণ পরীক্ষা এবং অপ্টিমাইজেশনের জন্য একটি সুইফট পরিবেশের প্রয়োজন ছিল; এখন, এই SDK পথটি প্রশস্ত করে, যা পাইথন কর্মপ্রবাহে অভ্যস্ত ডেভেলপারদেরও অংশগ্রহণের সুযোগ করে দেয়।
অ্যাপলের গোপনীয়তা নকশার দর্শন সর্বত্র সামঞ্জস্যপূর্ণ: পাইথন-অ্যাপল-এফএম-এসডিকে দ্বারা ডাকা অন্তর্নিহিত মডেলগুলি সম্পূর্ণ স্থানীয়ভাবে চলে এবং ডেটা কখনই ডিভাইস থেকে বেরিয়ে যায় না। এমন পরিস্থিতিতে যেখানে অ্যাপলের সম্পূর্ণ এআই সিস্টেমকে ক্লাউডে স্থাপন করতে হয়, এটি প্রাইভেট ক্লাউড কম্পিউট ব্যবহার করে, যেখানে ডেটা প্রক্রিয়া করা হয় এবং তারপর মুছে ফেলা হয় এবং অ্যাপলের এতে কোনও অ্যাক্সেস থাকে না।
বিপরীতভাবে, Recall AI ব্যবহারকারীদের ব্যক্তিগত তথ্য অ্যাক্সেস করার সুযোগ করে দেয়, কিন্তু প্রথম সংস্করণটি এটি একটি আনএনক্রিপ্টেড প্লেইনটেক্সট ডাটাবেসে সংরক্ষণ করে। একটি পদ্ধতি তার আর্কিটেকচারের মাধ্যমে ফাঁস হওয়া রোধ করে, অন্যটি কেবল কোনও ঘটনা ঘটার পরে ডেটা প্যাচ করে।
তবে, AI ডেভেলপমেন্ট এবং ডিপ্লয়মেন্ট টুল হিসেবে ম্যাকের সুবিধা অনেকটা "অভিযোজনযোগ্যতা সুবিধা" বা অপ্রত্যাশিতভাবে অর্জিত কিছুর মতো।
এর অর্থ হল অ্যাপল প্রাথমিকভাবে ফেস আইডি এবং পোর্ট্রেট মোড পরিবেশন করার জন্য নিউরাল ইঞ্জিন তৈরি করেছিল; ইন্টেলের উপর দীর্ঘস্থায়ী নির্ভরতা থেকে মুক্তি পাওয়ার জন্য ইউনিফাইড মেমোরি আর্কিটেকচার ছিল একটি প্রয়োজনীয় পদক্ষেপ; এবং MLX-এর ওপেন-সোর্সিং ছিল ডেভেলপারদের দক্ষ ইনফারেন্স টুলের চাহিদার প্রতি সাড়া। AI এজেন্ট দৃশ্যপটের বিস্ফোরণ, যা ম্যাক পুঁজি করতে সক্ষম হয়েছিল, এই এবং আরও অনেক অপ্রত্যাশিত ইঞ্জিনিয়ারিং সিদ্ধান্তের একটি অপ্রত্যাশিত সুবিধা ছিল।
ম্যাক প্রথমে AI-এর জন্য ডিজাইন করা হয়নি; এর পণ্যের অবস্থান সবসময়ই "স্রষ্টার হাতিয়ার"-এর কাছাকাছি ছিল। অ্যাপলের দীর্ঘমেয়াদী লক্ষ্য ব্যবহারকারীরা হলেন ভিডিও সম্পাদক, শিল্পী এবং সফ্টওয়্যার ইঞ্জিনিয়ার। তাদের কম শব্দ, টেকসই কর্মক্ষমতা, বৃহৎ মেমোরি ক্ষমতা এবং চব্বিশ ঘন্টা চালানোর ক্ষমতা সম্পন্ন মেশিনের প্রয়োজন।
এআই মডেলের অনুমান এবং বর্তমানে জনপ্রিয় এজেন্ট স্থাপনার জন্য ঠিক একই জিনিসের প্রয়োজন হয়।
পিছনে ফিরে তাকালে, যখন এক দশকেরও বেশি সময় আগে অ্যাপল মেশিন লার্নিংয়ে ব্যাপক বিনিয়োগ করেছিল, তখন সম্ভবত ২০২৫ সালে ওপেনক্ল-এর বিস্ফোরক জনপ্রিয়তা তারা কল্পনাও করতে পারত না। আপনি এমনকি যুক্তি দিতে পারেন যে দশ বছর আগে, অ্যাপল সম্ভবত ওপেনক্ল পছন্দ করত না, এমন একটি প্ল্যাটফর্ম যা "উচ্চ রিটার্ন এবং আরও বেশি সুযোগ" প্রদান করে বলে মনে হয়েছিল, যেখানে ব্যবহারকারীদের গোপনীয়তা এবং ডেটা সুরক্ষা উপেক্ষা করা হয়েছিল, এবং বিভ্রম ধরা পড়ার পরে বিভিন্ন সফ্টওয়্যার ইঞ্জিনিয়ারিং নিয়ম উপেক্ষা করা হয়েছিল…
কিন্তু কিভাবে বলবো? অ্যাপল এখন পছন্দ না করলেও, তার আর কোন বিকল্প নেই। মারফির আইনের মতো, সম্ভবত কিছু জিনিস শুরু থেকেই নির্ধারিত ছিল । অ্যাপল বছরের পর বছর ধরে যে কার্ড খেলেছে, ইচ্ছাকৃত হোক বা দুর্ঘটনাক্রমে, এই বছরের এজেন্ট ইয়ারে (আশা করি এবার সত্যিই তাই) বিজয়ী হাত হয়ে উঠেছে।
২০২৩ সালে এআই পিসি তৈরি শুরু করা উইন্ডোজ শিবিরটি আসলে ২০২০ সালে এম১ বাজারে আনার সময় অ্যাপল যে স্থাপত্য সুবিধা অর্জন করেছিল, তার সাথে তাল মিলিয়ে চলার চেষ্টা করছে। অবশ্যই, ২০২৫ সালে এআই সম্পর্কে অ্যাপল যে ক্রমাগত খারাপ খবরের মুখোমুখি হয়েছে, তাতে এই ব্যবধান কমানো সম্ভব। কিন্তু অ্যাপল থামবে না এবং অপেক্ষা করবে না।
এই সপ্তাহে, অ্যাপল M5 Pro এবং M5 Max লঞ্চ করেছে, যার মধ্যে ডুয়াল-চিপ ফিউশন আর্কিটেকচার সহ চিপ রয়েছে, এবং তাদের প্রেস বিজ্ঞপ্তিতে LM স্টুডিওকে LLM পারফরম্যান্স বেঞ্চমার্ক হিসেবে বিশেষভাবে নামকরণ করা হয়েছে।
অতীতে, অ্যাপল তার হার্ডওয়্যার পণ্য লঞ্চের সময় "বড় ভাষার মডেল" সম্পর্কে খুব বেশি কথা বলত না, বিশেষ করে অন-ডিভাইস অনুমানের প্রেক্ষাপটে – কিন্তু এখন পরিস্থিতি ভিন্ন।
উপসংহারে
আমরা সর্বত্র অ্যাপলের প্রশংসা করেছি, কিন্তু আসুন আমরা শান্ত হই এবং শিরোনাম সম্পর্কে নিজেদেরকে একটি প্রশ্ন জিজ্ঞাসা করি: আজকের ম্যাক কি সত্যিকারের এআই পিসি?
iFanr বিশ্বাস করে যে অ্যাপল যথেষ্ট কিছু করেনি। আজ পর্যন্ত, আমরা এমন কোনও ব্যক্তিগত কম্পিউটিং পণ্য দেখিনি যাকে AI পিসি বলা যেতে পারে, অথবা সত্যিকার অর্থে "নেটিভ AI হার্ডওয়্যার"।
ওপেনক্ল-এ ফিরে আসা যাক, আজকের এজ-ডিপ্লয়মেন্ট এজেন্টদের কাছ থেকে একটি এআই পিসির আসল রূপ ইতিমধ্যেই স্পষ্ট হয়ে উঠছে।
অ্যাপ্লিকেশন স্তরে, মানুষের জন্য তৈরি "অ্যাপ্লিকেশন" ধারণাটি আংশিকভাবে গ্রাফিকাল ইন্টারফেস ছাড়াই এমন অবস্থায় ফিরে যেতে পারে। সর্বোপরি, মানুষের গ্রাফিকাল ইন্টারফেসের প্রয়োজন হয়, যখন এজেন্টদের তা হয় না। তাছাড়া, আপনি দেখতে পাবেন যে সম্প্রতি আরও বেশি সংখ্যক মানুষ সংলাপ এবং কমান্ড লাইনের উপর ভিত্তি করে মিথস্ক্রিয়া পদ্ধতিতে অভ্যস্ত হয়ে উঠছে।
আজ, এজেন্টদের প্রাথমিকভাবে গ্রহণকারীরা তাদের সজ্জিত করার জন্য সরঞ্জাম এবং দক্ষতা খুঁজে পাচ্ছেন; ভবিষ্যতে, এজেন্টরা নিজেরাই নিজেদের উন্নত করার জন্য পাবলিক কোড রিপোজিটরি থেকে নতুন সরঞ্জাম এবং প্লাগইনগুলি টেনে আনবে।
সিস্টেম স্তরে, অনুমতি ব্যবস্থা এজেন্টের কাজের নীতি পুনর্গঠন করবে, যার ফলে এজেন্ট সরাসরি বিভিন্ন ইন্টারফেস পরিচালনা করতে পারবে। অন্তর্নিহিত স্তরে, একটি মডেল অর্কেস্ট্রেশন এবং সময়সূচী প্রক্রিয়া থাকবে যা কাজের উপর ভিত্তি করে প্রয়োজন অনুসারে মডেলগুলির মধ্যে পরিবর্তন করবে।
স্থানীয় অনুমান এবং গোপনীয়তা-সংরক্ষণকারী ক্লাউড অনুমান একটি সম্পূর্ণ, সুরক্ষিত এবং গোপনীয়তা-সংরক্ষণকারী বন্ধ লুপ তৈরি করবে। ডেটা যেখানেই প্রেরণ করা হোক না কেন, এটি ভেক্টরাইজড, এনক্রিপ্ট করা এবং সংরক্ষণ করা হয় এবং ব্যবহারের সাথে সাথেই ধ্বংস হয়ে যায়…
অন্য কথায়, একটি সত্যিকারের এআই পিসি এমন একটি সিস্টেম হওয়া উচিত যা তার নকশার শুরু থেকেই, একেবারে শুরু থেকেই, এআইকে "প্রথম শ্রেণীর নাগরিক" হিসেবে বিবেচনা করে।
এই মানদণ্ড অনুসারে, ম্যাক এবং উইন্ডোজ উভয়ই বর্তমানে একটি পরিবর্তনশীল পর্যায়ে রয়েছে। ম্যাক আরও কাছাকাছি কারণ ইউনিক্স পরিবেশ, একীভূত হার্ডওয়্যার এবং পরিপক্ক ইকোসিস্টেম AI এজেন্টদের যুগ আসার আগেই ইতিমধ্যেই বিদ্যমান ছিল। উইন্ডোজ একটি ভারী ঐতিহাসিক বোঝা বহন করে, যা পরিবর্তনগুলিকে আরও কঠিন করে তোলে এবং এটি এখনও তা ধরে রাখছে।
কিন্তু নানান বৃত্তে ঘুরে দেখার পরও আমরা এখনও সবচেয়ে মৌলিক প্রশ্নটিতে পৌঁছাতে পারিনি: একটি সত্যিকারের এআই পিসি কি আসলেই "পিসি" হওয়া উচিত?
যদি আমরা আমাদের দৃষ্টিভঙ্গি পরিবর্তন করি, তাহলে সমস্ত এজেন্ট স্থাপন এবং পরিচালনা ক্লাউডে থাকবে; ব্যবহারকারী-সম্পর্কিত ডেটা, অর্থাৎ, "প্রসঙ্গ", ক্লাউডে নিরাপদে এবং ব্যক্তিগতভাবে সংরক্ষণ করা হবে; মানুষের কেবল "যোগাযোগকারী" হিসাবে একটি টার্মিনাল ডিভাইস এবং এজেন্টের কাছে প্রয়োজনীয় ডেটা আপলোড করার জন্য ছবি তোলা এবং অডিও রেকর্ড করার জন্য সেন্সর প্রয়োজন, এবং এই ডিভাইসটির খুব বেশি এজ কম্পিউটিং পাওয়ারেরও প্রয়োজন নেই।
ম্যাক আজকের সেরা এআই পিসি, কিন্তু ভবিষ্যতের "এআই পিসি" হয়তো… আইফোনের মতো হবে?
ডু চেন দ্বারা
#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।























