জেনসেন হুয়াং সবকিছুর জবাবে বলেন: এআই দেখে কাঠমিস্ত্রি ও প্লাম্বারদেরই সবচেয়ে বেশি উত্তেজিত হওয়া উচিত।

এই এআই বিস্ফোরণ কীভাবে ঘটল তা ব্যাখ্যা করার জন্য যদি আমাদের কাউকে খুঁজতে হয়, তাহলে জেনসেন হুয়াং নিঃসন্দেহে সবচেয়ে উপযুক্ত প্রার্থী হবেন।

ত্রিশ বছর আগে, তিনি গ্রাফিক্স প্রসেসরের উপর বাজি ধরে এবং গেমিং গ্রাফিক্স কার্ডে জোর করে CUDA অন্তর্ভুক্ত করে এনভিডিয়া প্রতিষ্ঠা করেন। এর বাজার মূল্য ৮ বিলিয়ন ডলার থেকে কমে ১.৫ বিলিয়ন ডলারে নেমে আসে, যা পুনরুদ্ধার হতে এক দশক সময় লেগেছিল। যখন সবাই ইনফারেন্স চিপগুলো নিম্ন-স্তরের বাজার হিসেবেই থাকবে কি না তা নিয়ে বিতর্ক করছিল, তিনি তখন থেকেই ইন্টেলিজেন্ট এজেন্টের যুগের জন্য র‍্যাক আর্কিটেকচার ডিজাইন করছিলেন।

এই ধরনের দূরদৃষ্টি স্পষ্টতই শুধু ভাগ্য নয়, বরং এটি এমন একটি কাজের সাথেও অবিচ্ছেদ্যভাবে জড়িত যা তিনি কয়েক দশক ধরে করে আসছেন: অন্য সবাই বিশ্বাস করার আগেই সবাইকে ভবিষ্যৎ সম্পর্কে বলে দেওয়া।

আজ প্রখ্যাত পডকাস্ট উপস্থাপক লেক্স ফ্রিডম্যান জেনসেন হুয়াং-এর একটি দুই ঘণ্টার বিশদ সাক্ষাৎকার প্রকাশ করেছেন।

এই সংলাপে CUDA-এর প্রতিযোগিতামূলক সুবিধা, চীনের প্রযুক্তি ইকোসিস্টেম, প্রোগ্রামিংয়ের ভবিষ্যৎ, DLSS5, এমনকি চেতনা ও মৃত্যু নিয়েও আলোচনা করা হয়। এটি সাম্প্রতিককালে জেনসেন হুয়াং-এর সবচেয়ে পূর্ণাঙ্গ প্রকাশ্য অভিব্যক্তি এবং এখন পর্যন্ত তাঁর প্রকৃত চিন্তাধারার সবচেয়ে কাছাকাছি একটি দলিল।

সাথে হুয়াং রেনশুনের সাক্ষাৎকারের প্রতিলিপি সংযুক্ত করা হলো। https://lexfridman.com/jensen-huang-transcript

একটি প্রশ্ন, একই সময়ে ৬০ জন বিশেষজ্ঞ উপস্থিত – এভাবেই এনভিডিয়া তাদের সভা পরিচালনা করে।

সাক্ষাৎকারের শুরুতে ফ্রিডম্যান উল্লেখ করেন যে, এনভিডিয়া তাদের ডিজাইনের পরিধি একক-চিপ থেকে র‍্যাক স্তর পর্যন্ত প্রসারিত করেছে, যার মধ্যে জিপিইউ, সিপিইউ, মেমরি, নেটওয়ার্কিং, এনভি-লিঙ্ক, ফাইবার ও কপার ইন্টারকানেক্ট, পাওয়ার সাপ্লাই, কুলিং, সফটওয়্যার এবং স্বয়ং র‍্যাকটিও অন্তর্ভুক্ত। তিনি জেনসেন হুয়াংকে জিজ্ঞাসা করেন: এই ধরনের একটি বহু-চলকবিশিষ্ট সহযোগিতামূলক ডিজাইনে সবচেয়ে চ্যালেঞ্জিং অংশটি কী?

জেনসেন হুয়াং সর্বপ্রথম প্রকৌশলগত যুক্তির দৃষ্টিকোণ থেকে ব্যাখ্যা করেছিলেন কেন চূড়ান্ত সহযোগিতামূলক নকশা অনিবার্য।

তিনি বলেন, সমস্যার মূল কারণ হলো এর পরিধি: যখন আপনি একটি কাজ ১০,০০০ কম্পিউটারের মধ্যে ভাগ করে দেন, তখন আপনি রৈখিক যোগফলের চেয়ে বহুগুণ বেশি গতিবৃদ্ধি আশা করেন, যেমন দশ লক্ষ গুণ বৃদ্ধি; অথচ শুধু কম্পিউটারের সংখ্যা বাড়ালে তা কেবল রৈখিক সুবিধাই নিয়ে আসে।

এটিই আমডালের সূত্রের সীমাবদ্ধতা, যার অর্থ হলো, যদি মোট কর্মভারের মাত্র ৫০% গণনার কাজে ব্যয় হয়, তবে গণনার গতি অসীম পর্যন্ত বাড়ানো হলেও সামগ্রিক গতি কেবল দুই গুণই বাড়ানো সম্ভব।

একবার সমস্যাটি ভাগ করে দিলে, সবকিছুই প্রতিবন্ধকতা হয়ে দাঁড়ায়। সিপিইউ একটি সমস্যা, জিপিইউ একটি সমস্যা, নেটওয়ার্ক একটি সমস্যা, সুইচ একটি সমস্যা। আমাদের এই পর্যায়ে, ডিস্ট্রিবিউটেড কম্পিউটিংয়ের জন্য প্রতিটি দিক একই সাথে মোকাবেলা করতে হয়।

সাংগঠনিক পর্যায়ে, হুয়াং প্রকাশ করেছেন যে তিনি ৬০ জনেরও বেশি লোকের কাছে সরাসরি রিপোর্ট করেন, যাদের মধ্যে মেমরি, সিপিইউ, অপটিক্স, জিপিইউ আর্কিটেকচার, অ্যালগরিদম এবং ডিজাইনসহ প্রায় সমস্ত প্রযুক্তিগত শাখার শীর্ষ বিশেষজ্ঞরা রয়েছেন—কেউই অনুপস্থিত নন। তিনি ইচ্ছাকৃতভাবে একের পর এক রিপোর্ট করার পদ্ধতিটি পরিত্যাগ করেছেন এবং এর পরিবর্তে যেকোনো নির্দিষ্ট বিষয় নিয়ে আলোচনার জন্য সবাইকে একই সময়ে উপস্থিত রাখেন।

যেহেতু আমরা অত্যন্ত সহযোগিতামূলকভাবে ডিজাইন করি, তাই কোনো আলোচনায় কেবল একজন ব্যক্তি উপস্থিত থাকেন না। আমরা একটি সমস্যা উপস্থাপন করি এবং সবাই মিলে তার সমাধান করার জন্য কাজ করে। যখন আমরা কুলিং নিয়ে আলোচনা করি, তখন নেটওয়ার্ক বিশেষজ্ঞরা শোনেন; যখন আমরা পাওয়ার সাপ্লাই নিয়ে আলোচনা করি, তখন মেমোরি বিশেষজ্ঞরা শোনেন। যদি কেউ এমন কোনো বিষয়ে মনোযোগ না দেয়, যেটাতে তার দেওয়া উচিত, আমি তাকে সরাসরি বলে দিই।

তিনি প্রাতিষ্ঠানিক কাঠামোকে একটি অপারেটিং সিস্টেমের সাথে তুলনা করেছেন এবং বিশ্বাস করতেন যে, একটি কোম্পানির সাংগঠনিক কাঠামো কোনো অভিন্ন 'হ্যামবার্গার' বা 'সফট' সাংগঠনিক চার্ট কিংবা কোনো মোটরগাড়ি কোম্পানির মতো চার্ট ব্যবহার না করে, বরং তার পরিবেশ এবং উৎপাদিত পণ্যের সরাসরি প্রতিফলন হওয়া উচিত।

গেমিং গ্রাফিক্স কার্ডে CUDA অন্তর্ভুক্ত করাটা ছিল সবচেয়ে কষ্টকর, কিন্তু একই সাথে সবচেয়ে গুরুত্বপূর্ণ সিদ্ধান্ত।

এনভিডিয়ার কৌশলগত বিবর্তন নিয়ে আলোচনা করার সময় জেনসেন হুয়াং গ্রাফিক্স অ্যাক্সিলারেটর থেকে কম্পিউটিং প্ল্যাটফর্মে রূপান্তরের পথটিও বিস্তারিতভাবে তুলে ধরেন।

তিনি বলেন যে, এনভিডিয়া মূলত গ্রাফিক্স প্রসেসিং-এর উপর দৃষ্টি নিবদ্ধকারী একটি অ্যাক্সিলারেটর কোম্পানি ছিল। বিশেষায়নের সুবিধা হলো চরম অপটিমাইজেশন, কিন্তু সমস্যা হলো বাজারের পরিধি স্বাভাবিকভাবেই সীমিত, এবং বাজারের আকার সরাসরি গবেষণা ও উন্নয়নে (R&D) বিনিয়োগের সক্ষমতা নির্ধারণ করে, যা আবার কম্পিউটিং ক্ষেত্রে একটি কোম্পানি কতটা প্রভাব বিস্তার করতে পারবে তা নির্ধারণ করে।

তাই, এনভিডিয়াকে তার পরিধি প্রসারিত করে সাধারণ-উদ্দেশ্যমূলক কম্পিউটিংয়ের দিকে অগ্রসর হতে হয়েছিল, কিন্তু সাধারণ-উদ্দেশ্যমূলক এবং বিশেষায়িত কম্পিউটিংয়ের মধ্যে প্রায়শই একটি অন্তর্নিহিত দ্বন্দ্ব থাকে: এটি সাধারণ-উদ্দেশ্যমূলক কম্পিউটিংয়ের যত কাছাকাছি আসে, এর বিশেষায়িত ত্বরণ ক্ষমতা ততই হ্রাস পায়।

আমি এই দুটি অন্তর্নিহিতভাবে পরস্পরবিরোধী শব্দকে জোর করে একত্রিত করেছি। কোম্পানিকে অবশ্যই সেই অত্যন্ত সংকীর্ণ পথটি ধাপে ধাপে এগোতে হবে, কম্পিউটিংয়ের সীমানা প্রসারিত করার পাশাপাশি এর সবচেয়ে গুরুত্বপূর্ণ বিশেষায়িত সক্ষমতাগুলোও সংরক্ষণ করতে হবে।

প্রথম ধাপটি ছিল প্রোগ্রামেবল পিক্সেল শেডার, যা প্রোগ্রামেবিলিটির দিকে প্রথম পদক্ষেপ চিহ্নিত করে। দ্বিতীয় ধাপটি ছিল শেডারে IEEE স্ট্যান্ডার্ড-সম্মত FP32 ফ্লোটিং-পয়েন্ট অপারেশন যুক্ত করা, যা সেইসব গবেষকদের আকৃষ্ট করেছিল যারা আগে সিপিইউ-তে স্ট্রিম প্রসেসিং এবং ডেটাফ্লো কম্পিউটেশন করতেন। তারা আবিষ্কার করেন যে জিপিইউ তাদের বিদ্যমান সফটওয়্যার লজিকের সাথে সামঞ্জস্যপূর্ণ থেকেও অত্যন্ত উচ্চ কম্পিউটেশনাল ঘনত্ব প্রদান করে। এর সরাসরি ফলস্বরূপ Cg প্রোগ্রামিং ভাষা এবং তারপর CUDA-এর বিকাশ ঘটে।

জিফোর্স কনজিউমার গ্রাফিক্স কার্ডে CUDA নিয়ে আসা ইতিহাসের অন্যতম গুরুত্বপূর্ণ এবং বেদনাদায়ক সিদ্ধান্ত ছিল।

জেনসেন হুয়াং বলেছেন যে, একটি কম্পিউটিং প্ল্যাটফর্মের মূল্য তার আর্কিটেকচারের নান্দনিকতার উপর নয়, বরং সম্পূর্ণরূপে তার ইনস্টলড বেসের উপর নির্ভর করে। তিনি উদাহরণ হিসেবে x86-এর কথা উল্লেখ করেছেন: এটি ইতিহাসের সবচেয়ে সমালোচিত আর্কিটেকচার, যা একই সময়ের শীর্ষ কম্পিউটার বিজ্ঞানীদের দ্বারা যত্নসহকারে ডিজাইন করা RISC আর্কিটেকচারগুলোর তুলনায় অনেক কম নান্দনিক, তবুও বেশিরভাগ RISC আর্কিটেকচার ব্যর্থ হলেও x86 টিকে গিয়েছিল। এর কারণটি সহজ: ইনস্টলড বেস।

তখন জিফোর্স প্রতি বছর লক্ষ লক্ষ গ্রাফিক্স কার্ড সরবরাহ করত। আমরা বলেছিলাম, ব্যবহারকারীরা CUDA ব্যবহার করুক বা না করুক, আমরা প্রতিটি পিসিতে এটি ইনস্টল করব এবং এটিকে আমাদের ব্যবহারকারীর সংখ্যা বাড়ানোর সূচনা বিন্দু হিসেবে ব্যবহার করব। একই সময়ে, আমরা বিশ্ববিদ্যালয়গুলোতে পাঠ্যবই লিখতে, কোর্স চালু করতে এবং সর্বত্র CUDA-এর প্রচার করতে যেতাম। সেই দিনগুলোতে পিসিই ছিল প্রধান কম্পিউটিং প্ল্যাটফর্ম এবং ক্লাউড ছিল না। আমরা মূলত প্রত্যেক ছাত্র এবং গবেষকের হাতে সুপারকম্পিউটিং তুলে দিচ্ছিলাম। একদিন, একটি চমক ঘটবে।

এর খরচ ছিল বিধ্বংসী। CUDA জিফোর্সের খরচ ব্যাপকভাবে বাড়িয়ে দেয়, যা এনভিডিয়ার গ্রস মার্জিনকে পুরোপুরি ধ্বংস করে দেয়। কোম্পানিটির গ্রস মার্জিন আগে থেকেই মাত্র ৩৫% ছিল, এবং খরচ ৫০% বেড়ে যাওয়ায় সমস্ত মুনাফা উবে যায়। এর বাজার মূলধন প্রায় ৮ বিলিয়ন ডলার থেকে কমে ১.৫ বিলিয়ন ডলারে নেমে আসে এবং দীর্ঘ সময় ধরে সর্বনিম্ন স্তরে অবস্থান করে।

কিন্তু আমরা সবসময়ই CUDA ব্যবহার করে এসেছি, সবসময়ই GeForce-এ এটি চালিয়েছি। Nvidia হলো GeForce-এর তৈরি একটি প্রতিষ্ঠান, এবং GeForce-ই CUDA-কে সকলের জন্য সহজলভ্য করেছে। গবেষক ও বিজ্ঞানীরা বিশ্ববিদ্যালয়ে CUDA আবিষ্কার করেছিলেন কারণ তাঁরা ছিলেন গেমার; তাঁরা পিসির যন্ত্রাংশ ব্যবহার করে নিজেদের কম্পিউটার ও ক্লাস্টার তৈরি করেছিলেন।

পরবর্তীতে, এটিই ডিপ লার্নিং বিপ্লবের অবকাঠামোতে পরিণত হয়। এই ধরনের ঝুঁকিপূর্ণ সিদ্ধান্ত কীভাবে নিতে হয়, সে প্রসঙ্গে জেনসেন হুয়াং বলেন যে, তার সিদ্ধান্ত গ্রহণ প্রক্রিয়া শুরু হয় কৌতূহল দিয়ে, এবং এরপর আসে যুক্তি। যখন যুক্তি ব্যবস্থাটি তার মনে স্পষ্টভাবে তুলে ধরে যে "এটি অবশ্যই ঘটবে," তখন তিনি তা বিশ্বাস করতে শুরু করেন, এবং একবার বিশ্বাস করলে, তিনি তা বাস্তবে পরিণত করতে এগিয়ে যান।

তবে আরও গুরুত্বপূর্ণ বিষয় হলো, তিনি সমষ্টিগত বিশ্বাসকে এমনভাবে পরিচালনা করেন যে, তা ঘোষণা করার জন্য সিদ্ধান্তের দিন পর্যন্ত অপেক্ষা করেন না। বরং, তিনি প্রতিটি বাহ্যিক বার্তা, প্রকৌশলগত মাইলফলক এবং শিল্পক্ষেত্রে নতুন কোনো আবিষ্কারের মধ্য দিয়ে পরিচালনা পর্ষদ, ব্যবস্থাপনা দল, কর্মচারী এবং অংশীদারদের জন্য ধীরে ধীরে জ্ঞানীয় ভিত্তি গড়ে তোলেন।

যেদিন এটি ঘোষণা করার দিন আসবে, আমি আশা করি সবার প্রতিক্রিয়া হবে: ‘জেনসেন, আপনি এই কথাটা এখন বলছেন কেন?’ মেলানক্স অধিগ্রহণের ক্ষেত্রেও এমনটাই হয়েছিল, ডিপ লার্নিং-এ আমাদের সর্বস্ব বাজি ধরার ক্ষেত্রেও এমনটাই হয়েছিল, এবং এখন গ্রোক-এর ক্ষেত্রেও তাই হচ্ছে। আমি গত আড়াই বছর ধরে এর ভিত্তি স্থাপন করে আসছি।

তিনি জিটিসি সম্মেলনকে শুধু কর্মীদের জন্যই নয়, বরং অংশীদার এবং সমগ্র ইকোসিস্টেমের জন্য শিল্পজুড়ে ভবিষ্যতের ধারণা তৈরির একটি মাধ্যম হিসেবে বর্ণনা করেছেন। "আমরা কম্পিউটার তৈরি করি না, বা ক্লাউডও নির্মাণ করি না। আমরা একটি কম্পিউটিং প্ল্যাটফর্ম কোম্পানি; কেউ সরাসরি আমাদের পণ্য কিনতে পারে না, কিন্তু আমরা আমাদের প্ল্যাটফর্মটি সব স্তরের জন্য উন্মুক্ত রাখি। আমার পণ্য প্রস্তুত হওয়ার আগে, আমাকে প্রথমে সবাইকে বোঝাতে হবে যে এটি আসছে।"

ইলিয়া বলেছিল যে তথ্য ফুরিয়ে গেছে, এবং হুয়াং রেনশুন বলেছিল যে সে ভুল পথে এগোচ্ছে।

স্কেলিং ল-এর জন্য জেনসেন হুয়াং একটি পদ্ধতিগত কাঠামো প্রস্তাব করেছিলেন, যার মধ্যে চারটি পরস্পর সংযুক্ত স্তর রয়েছে।

প্রথম নিয়মটি হলো প্রি-ট্রেনিং স্কেলিং ল। মডেল যত বড় হবে এবং ট্রেনিং ডেটা যত বেশি হবে, এআই তত বেশি স্মার্ট হবে।

যখন ইলিয়া সুটস্কেভার বলেছিলেন যে "প্রি-ট্রেনিং ডেটা নিঃশেষ হয়ে গেছে," তখন ইন্ডাস্ট্রি আতঙ্কিত হয়ে পড়েছিল, এই ভেবে যে এআই তার সর্বোচ্চ সীমায় পৌঁছে গেছে। জেনসেন হুয়াং যুক্তি দেন যে এই উদ্বেগটি ভ্রান্ত: যদিও মানুষের তৈরি ডেটা সত্যিই সীমিত, সিন্থেটিক ডেটার অনুপাত ক্রমাগত বাড়তে থাকবে, এবং এটি আশ্চর্যজনক নয়, কারণ মানুষের জ্ঞান স্বভাবতই "সিন্থেটিক", যা মানুষের মধ্যে আবর্তিত, পুনর্ব্যাখ্যাত, পুনর্সৃষ্ট এবং পুনঃব্যবহৃত হয়। এআই এখন বাস্তব-জগতের ডেটার উপর ভিত্তি করে বিপুল পরিমাণে সিন্থেটিক ট্রেনিং ডেটা তৈরি করতে সক্ষম; প্রি-ট্রেনিংয়ের প্রতিবন্ধকতা ডেটার পরিমাণ থেকে কম্পিউটিং শক্তিতে স্থানান্তরিত হয়েছে।

দ্বিতীয় নীতিটি হলো প্রশিক্ষণ-পরবর্তী সম্প্রসারণ সূত্র। সূক্ষ্ম নির্দেশাবলী সমন্বয়, রিইনফোর্সমেন্ট লার্নিং এবং অন্যান্য পদ্ধতির মাধ্যমে মডেলের সক্ষমতা আরও পরিমার্জন করার যথেষ্ট সুযোগ রয়েছে।

তৃতীয়টি হলো টেস্ট-টাইম সম্প্রসারণ সূত্র, যা ইনফারেন্স পর্বের সময়কার কম্পিউটেশনাল ইনপুটকে বোঝায়।

জেনসেন হুয়াং বলেন যে, শুরুতে অনেকেই ভবিষ্যদ্বাণী করেছিলেন যে ইনফারেন্স হবে "সরল"। তাদের বিশ্বাস ছিল যে, ইনফারেন্স চিপগুলোকে শুধু ছোট এবং সস্তা হলেই চলবে, যা এনভিডিয়ার মতো ব্যয়বহুল ও জটিল পণ্যের প্রয়োজনীয়তা পুরোপুরি দূর করে দেবে এবং ইনফারেন্সের বাজার একটি সাধারণ, নিম্ন-স্তরের বাজারে পরিণত হবে। "এর কোনো যৌক্তিক অর্থ হয় না। প্রি-ট্রেনিং-এ মুখস্থ করা এবং আরোহী যুক্তির ব্যবহার জড়িত, এটা অনেকটা পড়ার মতো; অন্যদিকে ইনফারেন্সে চিন্তা করা, যুক্তি দেওয়া, পরিকল্পনা করা, অনুসন্ধান করা, চেষ্টা করা এবং অপরিচিত সমস্যাকে ছোট ছোট অংশে ভাগ করার মতো বিষয় থাকে। চিন্তা করা কীভাবে কম্পিউটেশনালি হালকা হতে পারে?" তিনি সঠিক প্রমাণিত হন; পরীক্ষার সময় কম্পিউটেশনাল চাহিদা বাজারের প্রত্যাশাকে বহুগুণে ছাড়িয়ে গিয়েছিল।

চতুর্থ নীতিটি হলো এজেন্ট সম্প্রসারণ সূত্র। একটি বৃহৎ ল্যাঙ্গুয়েজ মডেল একটি এজেন্টে পরিণত হয়, যা টেস্টিংয়ের সময় ডেটাবেস কোয়েরি করে, টুল ব্যবহার করে এবং উপ-কাজ বণ্টন করে, এবং একই সাথে বিপুল সংখ্যক সাব-এজেন্ট তৈরি করে। "এনভিডিয়ার কার্যক্রমকে বড় করার সবচেয়ে সহজ উপায় হলো আরও লোক নিয়োগ করা, কিন্তু এজেন্ট বিভাজনের হার লোক নিয়োগের হারের চেয়ে অনেক বেশি দ্রুত।" এই এজেন্টগুলো পরিচালনার সময় প্রচুর মূল্যবান অভিজ্ঞতা ও ডেটা সঞ্চয় করে, যার সারমর্ম প্রি-ট্রেনিংয়ে ফিডব্যাক হিসেবে ফিরে আসে, পোস্ট-ট্রেনিংয়ের মাধ্যমে পরিমার্জিত হয় এবং টেস্টিংয়ের সময় আরও উন্নত হয়, যা একটি সম্পূর্ণ ক্লোজড-লুপ ফ্লাইহুইল গঠন করে।

পরিশেষে, বুদ্ধিমত্তার বিস্তার একটি বিষয়ের উপরই নির্ভর করে: কম্পিউটিং শক্তি।

হার্ডওয়্যার ডিজাইন পর্যায়ে এআই মডেলের গতিপথ কীভাবে অনুমান করা যায়, সে বিষয়ে হুয়াং রেনশুন স্বীকার করেছেন যে এটি সবচেয়ে কঠিন অংশগুলোর মধ্যে একটি। কারণ, এআই মডেলের আর্কিটেকচার প্রতি ছয় মাস অন্তর পুনরাবৃত্তি করা হয়, অথচ সিস্টেম এবং হার্ডওয়্যার আর্কিটেকচারের পুনরাবৃত্তি চক্র তিন বছর।

এনভিডিয়ার প্রতিক্রিয়া কৌশলের তিনটি দিক রয়েছে: অভ্যন্তরীণভাবে মৌলিক ও ফলিত গবেষণা পরিচালনা করা এবং সরাসরি অভিজ্ঞতা অর্জনের জন্য নিজস্বভাবে মডেল প্রশিক্ষণ দেওয়া; বিশ্বের একমাত্র প্ল্যাটফর্ম কোম্পানি হিসেবে যা একই সাথে সমস্ত এআই কোম্পানির সাথে সহযোগিতা করে, শিল্পের অগ্রভাগে থাকা চ্যালেঞ্জগুলো নিবিড়ভাবে শোনা; এবং স্থাপত্যগত নমনীয়তা বজায় রাখা যাতে CUDA অ্যালগরিদমের সাথে তাল মিলিয়ে বিকশিত হতে পারে।

তিনি হাইব্রিড এক্সপার্ট মডেল (MoE)-এর উদাহরণ দিয়ে বলেন: এনভিডিয়া যেহেতু MoE-এর উত্থান আগে থেকেই অনুমান করেছিল, ঠিক সে কারণেই তারা এনভি-লিঙ্ককে ৮-ওয়ে থেকে ৭২-ওয়েতে সম্প্রসারিত করে, যা ৪ ট্রিলিয়ন বা এমনকি ১০ ট্রিলিয়ন প্যারামিটারযুক্ত একটি সম্পূর্ণ মডেলকে একটি একক কম্পিউটিং ডোমেইনে চালানোর সুযোগ করে দেয় এবং এটি একটি বিশাল জিপিইউ-এর মতো আচরণ করে।

গ্রেস ব্ল্যাকওয়েল র‍্যাকের তুলনায় ভেরা রুবিন প্রথম প্রজন্মের র‍্যাকের সবচেয়ে উল্লেখযোগ্য পরিবর্তন হলো একটি স্টোরেজ অ্যাক্সিলারেটরের সংযোজন, একটি সম্পূর্ণ নতুন ভেরা সিপিইউ-এর প্রবর্তন এবং এজেন্ট টাস্কের জন্য বিশেষভাবে ডিজাইন করা একটি রক র‍্যাক। এর কারণ হলো, কাজ করার সময় এজেন্টদের প্রায়শই ফাইল সিস্টেম অ্যাক্সেস করতে, টুল কল করতে এবং কোড এক্সিকিউট করতে হয়, যা শুধুমাত্র এলএলএম ইনফারেন্স চালানোর চেয়ে সম্পূর্ণ ভিন্ন একটি ওয়ার্কলোড।

ক্লড কোড, কোডেক্স এবং ওপেনক্ল আসার আগেই আমরা কেন এই প্রজন্মের আর্কিটেকচার ডিজাইন করেছিলাম? কারণ ইনফারেন্সের জন্য কোনো নির্দিষ্ট পণ্যের আবির্ভাবের অপেক্ষা করার প্রয়োজন নেই। আপনাকে শুধু বসে মনোযোগ দিয়ে ভাবতে হবে: একটি সত্যিকারের ডিজিটাল কর্মী হতে হলে একটি বৃহৎ ল্যাঙ্গুয়েজ মডেলকে কী কী করতে হবে? এটিকে আসল ডেটা পাওয়ার জন্য ফাইল সিস্টেম অ্যাক্সেস করতে হবে, অনলাইনে তথ্য অনুসন্ধান করতে সক্ষম হতে হবে, টুলস ব্যবহার করতে জানতে হবে এবং সাবটাস্ক তৈরি করতে সক্ষম হতে হবে। এগুলো কোনো রহস্যময় ধারণা নয়, বরং মৌলিক যুক্তি।

তিনি একটি চমৎকার চিন্তন-পরীক্ষাও ব্যবহার করেছেন: কল্পনা করুন যে আজ থেকে দশ বছর পরের সবচেয়ে শক্তিশালী এআই এজেন্ট হলো একটি হিউম্যানয়েড রোবট, যা আপনার বাড়িতে দৈনন্দিন কাজ করতে প্রবেশ করে। এর কি আপনার বাড়িতে থাকা সরঞ্জাম, যেমন একটি মাইক্রোওয়েভ ওভেন, ব্যবহার করার সম্ভাবনা বেশি, নাকি যেকোনো মুহূর্তে এর আঙুলগুলো একটি হাতুড়ি, স্ক্যালপেল বা একটি মাইক্রোওয়েভ জেনারেটরে রূপান্তরিত হওয়ার সম্ভাবনা বেশি? উত্তরটি স্পষ্টতই প্রথমটি। "আমি যা বর্ণনা করছি তা আসলে ওপেনক্ল-এর প্রায় সমস্ত মূল বৈশিষ্ট্য।"

হুয়াংয়ের চোখে ইলন মাস্ক: এমন একজন ব্যক্তি যিনি নিজেকেই সবার সর্বোচ্চ অগ্রাধিকার দেন।

ফ্রিডম্যান উল্লেখ করেছেন যে, জেনসেন হুয়াং মেমফিসে মাত্র চার মাসে কলোসাস সুপারকম্পিউটারটি তৈরি করার জন্য মাস্কের ভূয়সী প্রশংসা করেছেন, যেটিতে এখন ২,০০,০০০ জিপিইউ রয়েছে। হুয়াং এর মধ্যে তিনি যে প্রকৌশল ও ব্যবস্থাপনা দর্শন দেখতে পেয়েছেন, সে বিষয়ে বিস্তারিত আলোচনা করেছেন।

তিনি বলেন যে, মাস্ক এমন একজন যিনি একই সাথে একাধিক উন্নত ক্ষেত্রে গভীর জ্ঞান বজায় রাখতে পারেন এবং তিনি একজন চমৎকার সিস্টেম থিঙ্কারও। তিনি অভ্যাসবশত সবকিছু সম্পর্কে তিনটি প্রশ্ন করেন: এটা কি প্রয়োজনীয়? এটা করা কি জরুরি? এতে এত সময় লাগা কি জরুরি? এই প্রশ্নগুলো স্তরে স্তরে করার পর, সিস্টেমটিকে তার ন্যূনতম প্রয়োজনীয় রূপে নামিয়ে আনা হয়, অথচ এর সক্ষমতাগুলো সম্পূর্ণরূপে সংরক্ষিত থাকে।

যেখানে সমস্যাটি ঘটত, তিনি ব্যক্তিগতভাবে সেখানে উপস্থিত হতেন। কোনো সমস্যা হলে, তিনি ঘটনাস্থলে গিয়ে ‘আমাকে সমস্যাটা দেখাতেন’। এই পদ্ধতিটি ‘আমরা সবসময় এভাবেই কাজ করি’—এই ধরনের গতানুগতিক ধারণাকে অনেকটাই ভেঙে দেয়। প্রত্যেক সরবরাহকারীর অনেক গ্রাহক ও প্রকল্প থাকে, এবং তার পদ্ধতি হলো প্রত্যেকের প্রকল্পে নিজেকে সর্বোচ্চ অগ্রাধিকার দেওয়া, এবং তিনি তা শুধু কথা বলে নয়, বরং ব্যক্তিগতভাবে করে দেখানোর মাধ্যমে করেন।

তিনি এমন একটি বিষয়ের বর্ণনা দিলেন যা ফ্রিডম্যানও প্রত্যক্ষ করেছিলেন: ভুলের সম্ভাবনা কমানোর জন্য মাস্ক র‍্যাকের পাশে উবু হয়ে বসে ইঞ্জিনিয়ারদের সাথে ক্যাবল কীভাবে লাগাতে ও খুলতে হয় তা বের করার চেষ্টা করতেন। "প্রতিটি খুঁটিনাটি বিষয় থেকে যে স্বজ্ঞা গড়ে ওঠে, তা আপনাকে ক্ষুদ্র পর্যায়ের অদক্ষতা এবং বৃহৎ পর্যায়ের পদ্ধতিগত সমস্যা—উভয়ই দেখতে সাহায্য করে, এবং তখন আপনি এটা বলার যোগ্যতা অর্জন করেন যে, ‘চলুন, কাজটি সম্পূর্ণ ভিন্ন উপায়ে করা যাক’।"

চীনা প্রযুক্তি সম্প্রদায় স্বাভাবিকভাবেই ওপেন সোর্সকে কেন সমর্থন করে?

তাঁর সাম্প্রতিক চীন সফর প্রসঙ্গে জেনসেন হুয়াং বলেন যে, বিশ্বব্যাপী কৃত্রিম বুদ্ধিমত্তা (এআই) গবেষকদের প্রায় ৫০ শতাংশই চীনা, এবং তাঁদের অধিকাংশই এখনও চীনে কর্মরত। চীনের প্রযুক্তি শিল্পের উত্থানের সময়টি মোবাইল ইন্টারনেট যুগের সাথে ঘনিষ্ঠভাবে মিলে যাওয়ায়, সফটওয়্যারকে একটি যুগান্তকারী পদক্ষেপ হিসেবে ব্যবহার করে তারা বৈশ্বিক প্রতিযোগিতায় প্রবেশ করতে সক্ষম হয়েছে।

তিনি বিশ্বাস করেন যে, চীনের প্রযুক্তি ইকোসিস্টেমের পক্ষে ক্রমাগত বিপুল সংখ্যক শীর্ষস্থানীয় কোম্পানি তৈরি করার পেছনে বেশ কিছু কাঠামোগত কারণ রয়েছে।

প্রথমত, প্রতিযোগিতার তীব্রতা। চীন কোনো একক বৃহৎ বাজার নয়, বরং এটি অগণিত প্রদেশ ও শহর নিয়ে গঠিত একটি প্রতিযোগিতামূলক ব্যবস্থা। এর ফলে প্রতিটি নির্দিষ্ট ক্ষেত্রে বিপুল সংখ্যক প্রতিযোগীর সৃষ্টি হয়েছে। এটি যেমন বৈদ্যুতিক যানবাহনের ক্ষেত্রে সত্য, তেমনি কৃত্রিম বুদ্ধিমত্তা (AI) কোম্পানিগুলোর ক্ষেত্রেও সত্য। পরিশেষে, এই তীব্র প্রতিযোগিতায় কেবল সবচেয়ে সেরা কোম্পানিগুলোই টিকে থাকবে।

দ্বিতীয়ত, রয়েছে উন্মুক্ততা ও আদান-প্রদানের সংস্কৃতি। চীনা প্রকৌশলী সম্প্রদায় শিক্ষা প্রতিষ্ঠান ও কোম্পানির অভ্যন্তরীণ পারস্পরিক সম্পর্কের ওপর ব্যাপকভাবে নির্ভর করে; সহপাঠীরা আজীবনের ভাই এবং বন্ধুরা সহকর্মী। হুয়াং রেনশুন বলেছেন যে, চীনা প্রকৌশলীরা পরিবারকে প্রথম, বন্ধুদের দ্বিতীয় এবং কোম্পানিকে তৃতীয় অগ্রাধিকার দেন। এই ক্রমটি জ্ঞানের প্রতি তাদের মনোভাবকে সরাসরি নির্ধারণ করে।

তাদের ইঞ্জিনিয়ারদের ভাই বা বন্ধুরা সেই কোম্পানিতে কাজ করে; তারা সবাই সহপাঠী। চীনে, 'সহপাঠী' মানে আজীবনের ভ্রাতৃত্ব। তাই, তারা অত্যন্ত দ্রুত জ্ঞান বিনিময় করে; তাদের প্রযুক্তি গোপন করার কোনো কারণ নেই—তারা কেবল তা ওপেন সোর্সে দিয়ে দেয়।

তৃতীয়ত, এখানে এমন একটি সামাজিক সংস্কৃতি রয়েছে যা প্রকৌশলকে মূল্য দেয়। এটি এমন একটি দেশ যা নির্মাণশিল্পকে অত্যন্ত শ্রদ্ধা করে।

এরপর তিনি এটিকে এনভিডিয়ার ওপেন-সোর্স কৌশল পর্যন্ত বিস্তৃত করেন এবং বিশেষভাবে নেমোট্রন ৩-এর কথা উল্লেখ করেন, যা হলো ১২০ বিলিয়ন প্যারামিটার বিশিষ্ট একটি ওপেন ওয়েটেড হাইব্রিড এক্সপার্ট মডেল, যার আর্কিটেকচার ট্রান্সফরমার এবং স্টেট স্পেস মডেল (এসএসএম)-এর সমন্বয়ে গঠিত।

ওপেন সোর্সকে উৎসাহিত করার পেছনে এনভিডিয়ার তিনটি উদ্দেশ্য রয়েছে: প্রথমত, নিজস্ব মডেলকে প্রশিক্ষণ দেওয়া তাদের চূড়ান্ত সহযোগিতামূলক নকশার একটি অংশ, যা হার্ডওয়্যার টিমকে মডেল আর্কিটেকচারের গতিপথ সরাসরি বুঝতে সাহায্য করে; দ্বিতীয়ত, মালিকানাধীন মডেল এবং ওপেন সোর্স মডেল উভয়ই প্রয়োজনীয়, এবং কৃত্রিম বুদ্ধিমত্তার প্রতিটি শিল্প, প্রতিটি দেশ, এবং প্রতিটি গবেষক ও শিক্ষার্থীর কাছে সত্যিকার অর্থে ছড়িয়ে পড়ার জন্য ওপেন সোর্স একটি অপরিহার্য শর্ত।

তৃতীয়ত, এআই শুধু ভাষার চেয়ে অনেক বেশি কিছু। জীববিজ্ঞান, পদার্থবিজ্ঞান, আবহাওয়াবিজ্ঞান এবং ফ্লুইড ডাইনামিক্সের মতো ক্ষেত্রগুলিতে বিশেষভাবে প্রশিক্ষিত মডেলের প্রয়োজন হয়। এনভিডিয়া নিশ্চিত করতে চায় যে প্রতিটি শিল্প যেন বিশ্বমানের এআই মৌলিক মডেলগুলিতে প্রবেশাধিকার পায়।

৪৩,০০০ ব্যক্তি এবং লক্ষ লক্ষ ডেভেলপার সম্মিলিতভাবে এনভিডিয়ার প্রতিযোগিতামূলক সুবিধা গড়ে তোলে।

এনভিডিয়ার সবচেয়ে গুরুত্বপূর্ণ প্রতিযোগিতামূলক সুবিধাগুলো সম্পর্কে জানতে চাওয়া হলে জেনসেন হুয়াং একটি সুস্পষ্ট ক্রমবিন্যাস তুলে ধরেন।

প্রথমটি হলো CUDA ইনস্টলেশনের সংখ্যা।

তিনি বলেন যে, বিশ বছর আগেও যদি কেউ প্রযুক্তিগতভাবে উন্নত কোনো বিকল্প আর্কিটেকচার, যেমন GUDA বা TUDA, তৈরি করত, তাহলেও সম্ভবত তা ব্যর্থ হতো। এর কারণ হলো, কোনো আর্কিটেকচারের সাফল্য বা ব্যর্থতা কখনোই শুধু প্রযুক্তি দ্বারা নির্ধারিত হয় না, বরং কতজন ডেভেলপার সেই প্ল্যাটফর্মে তাদের সফটওয়্যার তৈরি করছেন, তার ওপরই তা নির্ভর করে।

CUDA-এর বর্তমান অবস্থানটি এসেছে ৪৩,০০০ এনভিডিয়া কর্মীর কয়েক দশকের নিরলস নিষ্ঠা এবং লক্ষ লক্ষ ডেভেলপারের আস্থা থেকে, যারা তাদের সফটওয়্যার স্ট্যাক এই প্ল্যাটফর্মের উপর নির্ভর করে গড়ে তুলেছেন।

তিনি এনভিডিয়ার কার্য সম্পাদনের গতির গুরুত্বের ওপরও জোর দেন: যে কোনো ডেভেলপার যিনি CUDA বেছে নেবেন, তিনি প্রায় নিশ্চিতভাবেই আশা করতে পারেন যে ছয় মাসের মধ্যে এটি দশগুণ উন্নত হবে; তার সফটওয়্যার শত শত মিলিয়ন ডিভাইসে পৌঁছাতে পারবে, যা সমস্ত প্রধান ক্লাউড পরিষেবা প্রদানকারী, সমস্ত প্রধান শিল্প এবং সমস্ত প্রধান দেশকে অন্তর্ভুক্ত করে; এবং তিনি আত্মবিশ্বাসী যে এনভিডিয়া অদূর ভবিষ্যতে CUDA-কে রক্ষণাবেক্ষণ ও উন্নত করতে থাকবে। "এই সমস্ত বিষয় একসাথে বিবেচনা করলে, আমি যদি একজন ডেভেলপার হতাম, তবে আমি প্রথমেই CUDA বেছে নিতাম এবং এতে সর্বাধিক সম্পদ বিনিয়োগ করতাম।"

দ্বিতীয় সুরক্ষা প্রাচীরটি হলো ইকোসিস্টেমটির অনুভূমিক বিস্তৃতি। এনভিডিয়া অত্যন্ত জটিল সিস্টেমগুলোকে উল্লম্বভাবে একীভূত করে, কিন্তু একই সাথে প্রতিটি কোম্পানির কম্পিউটিং প্ল্যাটফর্মে অনুভূমিক প্রবেশাধিকার উন্মুক্ত করে দেয়; যেমন গুগল ক্লাউড, অ্যামাজন এডব্লিউএস, এবং মাইক্রোসফট অ্যাজুর থেকে শুরু করে কোরউইভ ও এনস্কেলের মতো উদীয়মান কম্পিউটিং কোম্পানি, ফার্মাসিউটিক্যাল কোম্পানিগুলোর সুপারকম্পিউটিং, এবং তারপর টেলিকম বেস স্টেশন, অটোমোবাইল, রোবট ও স্যাটেলাইটের এজ ডিভাইস পর্যন্ত।

একটি স্থাপত্যশৈলীই বিশ্বজুড়ে প্রায় সকল শিল্পকে অন্তর্ভুক্ত করে।

এনভিডিয়া ১০ ট্রিলিয়ন ডলারের বাজার মূলধনে পৌঁছাতে পারবে কিনা, সে প্রসঙ্গে জেনসেন হুয়াং-এর ভবিষ্যদ্বাণী দুটি মৌলিক পরিবর্তনের উপর ভিত্তি করে গড়ে উঠেছে: কম্পিউটিং-এর তথ্য সংগ্রহ থেকে উৎপাদনে স্থানান্তর, যার অর্থ কম্পিউটিং শক্তির চাহিদায় এক বিরাট উল্লম্ফন; এবং কম্পিউটারের স্টোরেজ ইউনিট থেকে উৎপাদন কেন্দ্রে রূপান্তর, যার অর্থ হলো এগুলি ব্যয় কেন্দ্র থেকে কর্পোরেট আয়ের সাথে সরাসরি যুক্ত লাভ কেন্দ্রে পরিণত হয়েছে। তিনি ভবিষ্যদ্বাণী করেছেন যে বৈশ্বিক জিডিপি প্রবৃদ্ধি ত্বরান্বিত হবে এবং জিডিপিতে কম্পিউটিং-এর অনুপাত অতীতের তুলনায় ১০০ গুণেরও বেশি হবে।

তিনি উল্লেখ করেছেন যে, তার দৃষ্টিতে এনভিডিয়ার ৩ ট্রিলিয়ন ডলার রাজস্বের পথ "অবশ্যই সম্ভব", এবং এই লক্ষ্যমাত্রা অর্জনে বাধা দেওয়ার মতো কোনো ভৌত নিয়ম নেই। আরও গুরুত্বপূর্ণ বিষয় হলো, এনভিডিয়ার প্রবৃদ্ধি বিদ্যমান প্রতিযোগীদের কাছ থেকে বাজার অংশ কেড়ে নেওয়ার ওপর নির্ভর করে না, বরং প্রায় শূন্য থেকে গড়ে ওঠা একটি সম্পূর্ণ নতুন বাজারের ওপর নির্ভর করে।

যখন এনভিডিয়া একটি ১০ বিলিয়ন ডলারের কোম্পানি ছিল, তখন বলা যেত না যে, ‘যদি তারা অন্য কারও কাছ থেকে বাজারের ১০% অংশ পায়, তাহলে তারা এতটা বৃদ্ধি পাবে।’ তাদের পরিকল্পনা একেবারে শূন্য থেকে গড়ে তুলতে হয়েছিল। কিন্তু আমার হাতে প্রচুর সময় আছে, এবং প্রতিটি জিটিসি এই বিষয়টিকে আরও বেশি বাস্তব করে তুলছে।

ইন্টেলিজেন্ট এজেন্ট নিয়ে আলোচনা করার সময় তিনি ওপেনক্ল-কে "টোকেনের আইফোন" হিসেবে তুলনা করেন: "ভোক্তারা এটি সরাসরি ব্যবহার করতে পারেন। এটি একটি আইফোন-স্তরের পণ্য; এটি এখন পর্যন্ত সবচেয়ে দ্রুত বর্ধনশীল অ্যাপ, এর জনপ্রিয়তা আকাশচুম্বী হয়েছে, ব্যস।"

এআই-এর মধ্যে সামঞ্জস্যের অভাব নিয়ে খেলোয়াড়দের ক্ষোভ আসলে একটি প্রতিচ্ছবি।

জেনসেন হুয়াং বলেছেন যে, জিফোর্স এনভিডিয়ার সবচেয়ে গুরুত্বপূর্ণ ব্র্যান্ড মার্কেটিং কৌশল হিসেবেই রয়ে গেছে: মানুষ কৈশোরে গেমের মাধ্যমে এনভিডিয়াকে চেনে এবং কলেজে ও কর্মজীবনে প্রবেশ করার পর স্বাভাবিকভাবেই কুডা (CUDA) ও পেশাদার টুলসের দিকে ঝুঁকে পড়ে।

ইতিহাসের সবচেয়ে গুরুত্বপূর্ণ গেম কোনটি, এই প্রশ্নের উত্তরে তিনি দুটি জবাব দেন: সাংস্কৃতিক ও শিল্পক্ষেত্রে প্রভাবের দিক থেকে সেটি ছিল ডুম, যা পিসিকে অফিসের সরঞ্জাম থেকে ঘরের বিনোদনের যন্ত্রে রূপান্তরিত করেছিল; আর গেম প্রযুক্তির দিক থেকে সেটি ছিল ভার্চুয়া ফাইটার। তাঁর সবচেয়ে সাম্প্রতিক শ্রেষ্ঠ সৃষ্টি ছিল সাইবারপাঙ্ক ২০৭৭, যেটিতে রে ট্রেসিং রেন্ডারিং সম্পূর্ণরূপে প্রয়োগ করা হয়েছিল।

DLSS 5 ঘিরে বিতর্ক নিয়ে আলোচনা করার সময়, তিনি 'ঝাপসা এআই' প্রভাবের প্রতি অনীহার কথা স্বীকার করেন এবং মেনে নেন যে এটি একটি প্রকৃত নান্দনিক সমস্যা ছিল।

তবে, তিনি ব্যাখ্যা করেছেন যে DLSS 5 ত্রিমাত্রিক জ্যামিতিক তথ্যের কঠোর সীমাবদ্ধতার অধীনে কাজ করে, যা নিশ্চিত করে যে প্রতিটি ফ্রেম শিল্পীর দ্বারা সংজ্ঞায়িত স্থানিক কাঠামো এবং টেক্সচার শৈলীর প্রতি সম্পূর্ণ বিশ্বস্ত থাকে এবং এটিকে মুছে ফেলার পরিবর্তে আরও উন্নত করে। "খেলোয়াড়রা ভুল করে মনে করেন যে DLSS চূড়ান্ত গেমে পোস্ট-প্রসেসিংয়ের জন্য ব্যবহৃত হয়। এটি সৃজনশীল প্রক্রিয়ার সাথে অঙ্গীভূত; শিল্পীই সিদ্ধান্ত নেন যে এটি ব্যবহার করবেন কি না।" এই সিস্টেমটি সম্পূর্ণ উন্মুক্ত, যা স্টুডিওগুলোকে স্বাধীনভাবে মডেল প্রশিক্ষণ দিতে এবং কার্টুন বা জলরঙের মতো যেকোনো শৈলী নির্দিষ্ট করার সুযোগ দেয়।

এরপর তিনি আরও বৃহত্তর পরিসরে একটি পর্যবেক্ষণ তুলে ধরেন: এআই-এর অস্পষ্টতার প্রতি খেলোয়াড়দের সংবেদনশীলতা স্পষ্টভাবে এটাই প্রমাণ করে যে, মানুষ আসলে নির্মাতাদের রেখে যাওয়া অসম্পূর্ণ ছাপগুলোকেই বেশি গুরুত্ব দেয়। "যতদিন এআই শিল্পীদের সহায়তার একটি হাতিয়ার হিসেবে কাজ করবে, ততদিন তা ভালো।"

তিনি গেম ডেভেলপারদের জন্য এনভিডিয়ার সাবসারফেস স্ক্যাটারিং স্কিন শেডারের কথাও উল্লেখ করেন। এই প্রযুক্তি ত্বকের উপরিভাগের স্তর ভেদ করার পর আলোর বিচ্ছুরণের ভৌত ঘটনাকে অনুকরণ করে, যা গেমের চরিত্রগুলোকে আরও বাস্তবসম্মত স্বচ্ছ একটি টেক্সচার দেয়। "এগুলো হলো সরঞ্জাম; শিল্পীরাই ঠিক করবেন কীভাবে এগুলো ব্যবহার করবেন। আমরা শুধু টুলবক্সটি সরবরাহ করি।"

এজিআই, প্রোগ্রামিংয়ের ভবিষ্যৎ এবং মানবজাতির স্থান

এজিআই-এর সংজ্ঞা নির্ধারণের প্রশ্নে, ফ্রিডম্যান পরীক্ষার মানদণ্ড হিসেবে "একেবারে শূন্য থেকে এক বিলিয়ন মার্কিন ডলারের বেশি বাজার মূল্যের একটি প্রযুক্তি সংস্থা তৈরি ও পরিচালনা করতে পারা"-কে ব্যবহার করেছিলেন। হুয়াং রেনশুনের উত্তর ছিল: আমি মনে করি এআই এখন এই সীমায় পৌঁছে গেছে।

তিনি এমন একটি এআই-এর কল্পনা করেন যা অল্প সময়ের মধ্যে কোটি কোটি ব্যবহারকারীকে আকর্ষণ করে একটি অ্যাপ তৈরি করবে, সেটিকে বাণিজ্যিকীকরণ করবে এবং তারপর অদৃশ্য হয়ে যাবে। এটি ইন্টারনেট যুগের স্বল্পস্থায়ী ভাইরাল ওয়েবসাইটগুলো থেকে মৌলিকভাবে ভিন্ন নয়, যেগুলোর প্রযুক্তিগত জটিলতা ওপেনক্ল (OpenClaw) আজ যা তৈরি করতে পারে তার চেয়ে অনেক কম। "আমি ঠিক জানি না এটি কী হবে, তবে ইন্টারনেট যুগে আমি ওই ধরনের কোনো কোম্পানির ভবিষ্যদ্বাণীও করিনি।" তিনি আরও জোর দিয়ে বলেন যে, ১ লক্ষ এআই এজেন্টের দ্বারা একটি নিরবচ্ছিন্নভাবে চলমান এনভিডিয়া (Nvidia) তৈরির সম্ভাবনা শূন্য, কিন্তু একটি স্বল্পস্থায়ী ভাইরাল অ্যাপ তৈরি করে তা থেকে লাভ করার বিষয়টি পুরোপুরি সম্ভব এবং তা ইতিমধ্যেই ঘটছে।

প্রোগ্রামিংয়ের ভবিষ্যৎ প্রসঙ্গে জেনসেন হুয়াং মনে করেন, প্রোগ্রামিংয়ের সংজ্ঞাটিই নতুন করে লেখা প্রয়োজন। প্রোগ্রামিংয়ের মূল ভিত্তি হলো স্পেসিফিকেশন—একটি কম্পিউটারকে বলে দেওয়া যে কী তৈরি করতে হবে। এই সংজ্ঞা অনুযায়ী, এই কাজটি করতে সক্ষম মানুষের সংখ্যা ৩০ মিলিয়ন থেকে বেড়ে ১ বিলিয়নে পৌঁছাবে। প্রত্যেক ছুতার, প্লাম্বার এবং হিসাবরক্ষক তাদের নিজ নিজ ক্ষেত্রে উদ্ভাবক হয়ে উঠবেন, কারণ এআই তাদের স্বাভাবিক ভাষায় নিজেদের উদ্দেশ্য প্রকাশ করতে এবং সেগুলোকে বাস্তব পণ্যে রূপান্তরিত করতে সক্ষম করবে। "আমি যদি একজন ছুতার হতাম এবং এআই দেখতাম, আমি খুব উত্তেজিত হতাম। আর যদি একজন প্লাম্বার হতাম, আমি পুরোপুরি পাগল হয়ে যেতাম।"

"এআই পেশা বিলুপ্ত করে দেবে" এই উদ্বেগ নিরসন করতে তিনি রেডিওলজিস্টদের উদাহরণ ব্যবহার করেন: ২০১৯ সালের দিকে কম্পিউটার ভিশন অতিমানবীয় পর্যায়ে পৌঁছেছিল, যার ফলে ব্যাপকভাবে ভবিষ্যদ্বাণী করা হয়েছিল যে রেডিওলজিস্টরা অপ্রচলিত হয়ে পড়বেন। তবে, সমস্ত রেডিয়েশন প্ল্যাটফর্ম এআই অন্তর্ভুক্ত করে নেয়, এবং রেডিওলজিস্টদের সংখ্যা কেবল কমেইনি, বরং বেড়েছে; এখন তো বিশ্বজুড়ে রেডিওলজিস্টদের ঘাটতিও দেখা দিয়েছে। কারণটি সহজ: দ্রুত ইমেজ রিডিংয়ের অর্থ হলো আরও বেশি ইমেজ পড়া যায়, আরও বেশি রোগীকে সেবা দেওয়া যায়, হাসপাতালের আয় বাড়ে, এবং আরও বেশি রেডিওলজিস্টের প্রয়োজন হয়।

সেই সতর্কবার্তাটি মাত্রাতিরিক্ত ছিল এবং এমন অনেককে দূরে সরিয়ে দিয়েছে যাদের এই শিল্পে প্রবেশ করা উচিত ছিল, যা একটি প্রকৃত ক্ষতি। এনভিডিয়াতে সফটওয়্যার ইঞ্জিনিয়ারের সংখ্যা কেবল বাড়বে, কমবে না। তাদের পেশাগত উদ্দেশ্য হলো সমস্যার সমাধান করা, এবং সমস্যা সমাধানের প্রতিটি উপাদান—ফলাফল মূল্যায়ন, দলবদ্ধ কাজ, সমস্যা নির্ণয়, উদ্ভাবন এবং বিভিন্ন ক্ষেত্রের মধ্যে সংযোগ স্থাপন—কখনোই বিলুপ্ত হবে না।

কর্মক্ষেত্রে ভেঙে পড়াই সর্বোত্তম পরিণতি।

নিজের মৃত্যু নিয়ে ভেবেছেন কিনা, এমন প্রশ্নের জবাবে হুয়াং জেন-হসুন অত্যন্ত অকপট উত্তর দিয়েছিলেন।

আমি সত্যিই মরতে চাই না। আমার একটি চমৎকার পরিবার এবং একটি অত্যন্ত গুরুত্বপূর্ণ চাকরি আছে। এটা শুধু 'জীবনে একবারের অভিজ্ঞতা' নয়, বরং সমগ্র মানব সভ্যতার জন্য এটি একটি বিরল অভিজ্ঞতা, এবং আমি এর অংশ। এনভিডিয়া ইতিহাসের অন্যতম গুরুত্বপূর্ণ প্রযুক্তি সংস্থা, এবং আমি এই বিষয়টিকে অত্যন্ত গুরুত্বের সাথে নিই।

উত্তরাধিকার পরিকল্পনা সংক্রান্ত প্রশ্নের জবাবে তাঁর উত্তরটি ছিল বেশ অপ্রত্যাশিত: তিনি বলেছিলেন যে তিনি "উত্তরাধিকার পরিকল্পনায় বিশ্বাস করেন না," কিন্তু এর কারণ ছিল ঠিক এটাই যে তিনি বিষয়টি গুরুত্ব সহকারে বিবেচনা করেছিলেন। আপনি যদি আপনার চলে যাওয়ার পর কোম্পানির ভবিষ্যৎ নিয়ে সত্যিই চিন্তিত হন, তাহলে আজই আপনার যা করা উচিত তা হলো, আপনার অর্জিত, অনুধাবন করা এবং সঞ্চিত সমস্ত জ্ঞান, অন্তর্দৃষ্টি এবং বিচারবুদ্ধি সর্বোচ্চ সম্ভাব্য হারে আপনার চারপাশের সকলের কাছে পৌঁছে দেওয়া।

প্রতিটি সভাই একটি আলোচনার সভা। আমি যা কিছু শিখি, তা এক সেকেন্ডের বেশি আমার ডেস্কে থাকে না; সাথে সাথেই তা কাউকে দেখিয়ে দেয়: যাও, এটা নিয়ে পড়াশোনা করো, এটা অসাধারণ, তুমি এটা বুঝতে চাইবে। আমি আমার চারপাশের প্রত্যেককে তাদের দক্ষতা উন্নত করার জন্য ক্রমাগত ক্ষমতায়ন করে চলেছি।

সে বলেছিল যে তার কাঙ্ক্ষিত ফল হলো কর্মস্থলে তাৎক্ষণিকভাবে, কোনো দীর্ঘ ও যন্ত্রণাদায়ক প্রক্রিয়া ছাড়াই, জ্ঞান হারানো।

মানবজাতির আগামী ১০০ বছর বিষয়ক আশা প্রসঙ্গে তিনি বলেন যে, মানব প্রকৃতির মঙ্গলের ওপর তাঁর বরাবরই অগাধ বিশ্বাস রয়েছে। যদিও তিনি মাঝে মাঝে হতাশ হয়েছেন, ফলাফল বারবার তাঁকে সঠিক প্রমাণ করেছে এবং প্রায়শই প্রত্যাশাকেও ছাড়িয়ে গেছে।

আমরা যে বহু সমস্যার সমাধান করতে চাই, বহু কিছু গড়তে চাই, বহু ভালো কাজ করতে চাই—সেগুলো আমাদের জীবদ্দশাতেই অর্জনযোগ্য হয়ে উঠছে। রোগ নির্মূল করা একটি যুক্তিসঙ্গত প্রত্যাশা। দূষণ উল্লেখযোগ্যভাবে হ্রাস করা একটি যুক্তিসঙ্গত প্রত্যাশা। এই সবকিছু কীভাবে অনুপ্রেরণাদায়ক না হয়ে পারে?

iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।