AI এর বিশ্বে, বৃহৎ ভাষার মডেলগুলি ইতিমধ্যেই মানুষকে বিস্মিত করেছে। তবে ফেই-ফেই লি বলেছেন যে আসল সাফল্য এখনও আসেনি। তিনি বিশ্বাস করেন যে AI যদি ত্রিমাত্রিক বিশ্বকে বুঝতে না পারে তবে এটি সম্পূর্ণ নয়। এটি তার পরবর্তী পাগল লক্ষ্য।
দুই দিন আগে, ওয়াই কম্বিনেটর সান ফ্রান্সিসকোর এআই স্টার্টআপ স্কুলে ফেই-ফেই লি-এর একটি সাক্ষাত্কারের ভিডিও সহ তার ইউটিউব চ্যানেল আপডেট করেছে। এই কথোপকথনে, Fei-Fei Li ইমেজনেট প্রকল্পের সৃষ্টি, অবজেক্ট রিকগনিশন থেকে আজকের জেনারেটিভ মডেলগুলিতে গভীর শিক্ষার দ্রুত বিকাশ পর্যালোচনা করেছেন এবং কৃত্রিম বুদ্ধিমত্তার সবচেয়ে কঠিন সীমানাগুলির একটি হাইলাইট করেছেন যেটিতে তিনি বর্তমানে কাজ করছেন: স্থানিক বুদ্ধিমত্তা।
ফেই-ফেই লি বর্তমানে ওয়ার্ল্ড ল্যাবসের প্রতিষ্ঠাতা এবং সিইও, একটি স্থানিক গোয়েন্দা সংস্থা যেটি 3D বিশ্বের উপলব্ধি, তৈরি এবং ইন্টারঅ্যাক্ট করার জন্য বৃহৎ মাপের বিশ্ব মডেল তৈরি করতে নিবেদিত৷ এই কথোপকথনে, তিনি সাধারণ কৃত্রিম বুদ্ধিমত্তার (AGI) জন্য কেন 3D ওয়ার্ল্ড মডেলিং গুরুত্বপূর্ণ এবং কেন ভাষার চেয়ে স্থানিক বুদ্ধিমত্তা অর্জন করা আরও কঠিন হতে পারে সে সম্পর্কে একাধিক প্রশ্নের উল্লেখ করেছেন।
সংস্করণ দেখতে প্রবাহ হার সংরক্ষণ করুন:
এটি মেশিন লার্নিং এর একটি দৃষ্টান্ত পরিবর্তন
ইমেজনেটের জন্ম শুধুমাত্র ফেই-ফেই লি-এর ব্যক্তিগত স্বপ্ন নয়, কম্পিউটার দৃষ্টি এবং গভীর শিক্ষার ক্ষেত্রে একটি দৃষ্টান্ত পরিবর্তনও। তিনি শেয়ার করেছেন যে তিনি সেই সময়ে "মেশিনগুলি দেখতে" নিয়ে আবিষ্ট ছিলেন, এবং এই অধ্যবসায় এবং কঠোর পরিশ্রম একটি গুরুত্বপূর্ণ মুহূর্ত তৈরি করেছিল যখন ডেটা, GPU এবং নিউরাল নেটওয়ার্কগুলি একত্রিত হয়েছিল ৷ এখন, তার একটি নতুন আবেশ রয়েছে এবং একটি নতুন এআই বিপ্লবের নেতৃত্ব দেওয়া চালিয়ে যাওয়ার পরিকল্পনা রয়েছে৷
আমরা স্থানিক বুদ্ধিমত্তাকে এআই-এর নতুন যুদ্ধক্ষেত্রে পরিণত করতে চাই
বস্তুর স্বীকৃতি থেকে দৃশ্য বোঝা পর্যন্ত, এআই ধীরে ধীরে জটিল চাক্ষুষ তথ্য বুঝতে শুরু করেছে। এজিআই-এর বর্তমান যুগে পরিবর্তনের একটি নতুন রাউন্ড এসেছে। তিনি বিশ্বাস করেন যে বিশ্ব সম্পূর্ণরূপে উৎপন্ন নয়, এবং শুধুমাত্র AI-কে ত্রিমাত্রিক বিশ্ব বোঝার অনুমতি দিয়ে আমরা সত্যিই AGI-এর দিকে যেতে পারি। বৃহৎ ভাষার মডেলগুলির জন্য ডেটা অধিগ্রহণ সহজ, এবং স্থানিক বুদ্ধিমত্তা মডেলগুলি হল পরবর্তী চ্যালেঞ্জ যা তাকে অতিক্রম করতে হবে।
আমি ওয়ার্ল্ড ল্যাবস সম্পর্কে খুব বেশি বিবরণ প্রকাশ করতে পারি না।
ওয়ার্ল্ড ল্যাবস দ্বারা পরিকল্পিত অ্যাপ্লিকেশন পরিস্থিতি এবং তারা বর্তমান এলএলএম আর্কিটেকচার থেকে কীভাবে আলাদা তা সম্পর্কে জিজ্ঞাসা করা হলে, লি ফিফেই বলেছিলেন যে সফ্টওয়্যার এবং হার্ডওয়্যারের একীকরণের পাশাপাশি মেটাভার্সের উপলব্ধির জন্য তাদের স্থানিক বুদ্ধিমত্তার প্রয়োজন হবে। এলএলএম-এর উপলব্ধির বিপরীতে, তিনি উল্লেখ করেছেন যে মানুষের 3D বিশ্বের একটি শক্তিশালী উপলব্ধি নেই, যা খুব কঠিন, তবে তিনি তার দলে বিশ্বাস করেন, যার কাছে বিশ্বের সবচেয়ে স্মার্ট মানুষ রয়েছে এবং তাদের সাথে একসাথে, তারা 2D জগতে এই সমস্যার সমাধান করতে পারে।
AI ক্ষেত্রে, ব্যর্থতার ভয় পাবেন না
সাক্ষাত্কারের শেষে, ফেই-ফেই লি তার নিজের বৃদ্ধির অভিজ্ঞতা শেয়ার করেছেন, পড়াশোনার জন্য মার্কিন যুক্তরাষ্ট্রে অভিবাসন থেকে শুরু করে, স্ট্যানফোর্ড আর্টিফিশিয়াল ইন্টেলিজেন্স ল্যাবরেটরির পরিচালক হওয়া, গুগলের ভাইস প্রেসিডেন্ট এবং এখন তার নিজের ব্যবসা শুরু করা, তিনি বলেছিলেন যে তিনি সর্বদা স্ক্র্যাচ থেকে শুরু করেছেন এবং কঠোর পরিশ্রম করেছেন । তিনি তরুণদের তাদের আগ্রহ এবং কৌতূহল অনুসরণ করতে, সাহসিকতার সাথে চ্যালেঞ্জ মোকাবেলা করতে এবং অসম্ভব সমস্যার সমাধান করতে উত্সাহিত করেছিলেন।

আসল ভিডিও: https://youtu.be/_PioN-CpOP0
অনুবাদে সামান্য সমন্বয় সহ সাক্ষাতকারের প্রতিলিপি নিচে দেওয়া হল
মেশিন লার্নিং এর ক্ষেত্রে একটি প্যারাডাইম পরিবর্তন প্রয়োজন
মডারেটর: ডক্টর ফেই-ফেই লিকে আমাদের সাথে পেয়ে আমি খুবই উচ্ছ্বসিত, যিনি AI-তে অনেক দীর্ঘ কর্মজীবন করেছেন। আমি বিশ্বাস করি অনেকেই তাকে চেনেন। আপনি "AI-এর গডমাদার" হিসাবেও পরিচিত এবং আপনার প্রতিষ্ঠিত প্রথম প্রকল্পগুলির মধ্যে একটি হল 2009 সালে, 16 বছর আগে ইমেজনেট৷ এই প্রকল্পটি 80,000 বারের বেশি উদ্ধৃত করা হয়েছে, এবং এটি আসলে AI-এর জন্য একটি গুরুত্বপূর্ণ ভিত্তি স্থাপন করেছে – ডেটা সমস্যা। আপনি এই প্রকল্প সম্পর্কে এসেছেন কিভাবে সম্পর্কে বলতে পারেন? সেই সময়ে কাজটি সত্যিই যুগান্তকারী ছিল।

ফেই-ফেই লি: হ্যাঁ, প্রথমেই, আপনাকে ধন্যবাদ ডায়ানা, গ্যারি এবং এখানে সবাইকে আমন্ত্রণ জানানোর জন্য। আমি এখানে এসে খুব উত্তেজিত কারণ আমি অন্য সবার মতো অনুভব করি। আমিও এখন একজন উদ্যোক্তা, আমি সবেমাত্র একটি কোম্পানি শুরু করেছি, তাই এখানে আসতে পেরে আমি খুবই উত্তেজিত।
হ্যাঁ, আপনি ঠিক বলেছেন, আসলে আমরা এই প্রকল্পটি প্রায় 18 বছর আগে কল্পনা করেছি, সময় সত্যিই উড়ে যায়। আমি প্রিন্সটন ইউনিভার্সিটির সহকারী অধ্যাপক হিসেবে প্রথম বর্ষে ছিলাম। তখনকার কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং এর জগৎ এখন যা আছে তার থেকে সম্পূর্ণ আলাদা ছিল। খুব কম ডেটা ছিল, এবং অন্তত কম্পিউটার ভিশনের ক্ষেত্রে, অ্যালগরিদমগুলি একেবারেই কাজ করেনি। সেই সময়ে কোন শিল্প ছিল না, এবং জনসাধারণ খুব কমই "কৃত্রিম বুদ্ধিমত্তা" শব্দটি জানত। কিন্তু তখনও কৃত্রিম বুদ্ধিমত্তার প্রতিষ্ঠাতা থেকে শুরু করে একদল লোক ছিল, যেমন জন ম্যাকার্থি এবং তারপরে জেফ হিন্টনের মতো মানুষ। আমি মনে করি আমাদের সকলেরই কৃত্রিম বুদ্ধিমত্তার স্বপ্ন আছে এবং আমরা সত্যিই মেশিনকে চিন্তা করার এবং কাজ করার ক্ষমতা তৈরি করতে চাই। এবং আমার ব্যক্তিগত স্বপ্ন মেশিনগুলিকে চাক্ষুষ ক্ষমতা দেওয়া, কারণ দৃষ্টি হল বুদ্ধিমত্তার ভিত্তি, এবং চাক্ষুষ বুদ্ধিমত্তা কেবল উপলব্ধি নয়, বিশ্বকে বোঝা এবং বিশ্বের জিনিসগুলিও করা।
তাই আমি "মেশিন দেখতে" সমস্যা নিয়ে খুব আচ্ছন্ন ছিলাম। মেশিন লার্নিং অ্যালগরিদম বিকাশের সাথে আমার আবেশের প্রক্রিয়ায়, আমরা নিউরাল নেটওয়ার্ক চেষ্টা করেছি, কিন্তু এটি কাজ করেনি। আমরা সমর্থন ভেক্টর মেশিনের মতো অন্যান্য পদ্ধতির দিকে ফিরেছি, কিন্তু একটি সমস্যা ছিল যা আমাকে সর্বদা বিরক্ত করত, সেটি হল, সাধারণীকরণ সমস্যা। আপনি যদি মেশিন লার্নিংয়ে কাজ করেন তবে আপনাকে অবশ্যই বুঝতে হবে যে সাধারণীকরণ হল মেশিন লার্নিং এর মূল গাণিতিক ভিত্তি এবং লক্ষ্য। এই অ্যালগরিদমগুলিকে সাধারণীকরণ করার জন্য, ডেটা অত্যন্ত গুরুত্বপূর্ণ, কিন্তু সেই সময়ে কম্পিউটারের দৃষ্টিভঙ্গির ক্ষেত্রে প্রায় কোনও ডেটা ছিল না। এবং আমি হলাম প্রথম প্রজন্মের স্নাতক ছাত্র যারা ডেটা নিয়ে কাজ শুরু করে, কারণ আমিই প্রথম প্রজন্মের স্নাতক ছাত্র যারা ইন্টারনেট এবং ইন্টারনেট অফ থিংসের উত্থান দেখেছিলাম।
2007 সালের দিকে, আমার ছাত্ররা এবং আমি সিদ্ধান্ত নিয়েছিলাম যে আমাদের একটি সাহসী পদক্ষেপ নিতে হবে। আমরা বাজি ধরেছি যে মেশিন লার্নিং এর ক্ষেত্রে একটি প্যারাডাইম শিফট প্রয়োজন, এবং এই পরিবর্তনটি ডাটা-চালিত পদ্ধতির দ্বারা পরিচালিত হতে হবে। কিন্তু সে সময় পর্যাপ্ত তথ্য ছিল না। তাই আমরা ভাবলাম, যেহেতু কোনো ডেটা নেই, আসুন ইন্টারনেটে যাই এবং কোটি কোটি ছবি ডাউনলোড করি, যা ইন্টারনেটে পাওয়া সবচেয়ে বড় সংখ্যা, এবং তারপর আমরা মেশিন লার্নিং অ্যালগরিদমগুলিকে প্রশিক্ষণ ও মূল্যায়ন করার জন্য একটি বিশ্বব্যাপী ভিজ্যুয়াল ক্লাসিফিকেশন সিস্টেম তৈরি করব। এই কারণেই ইমেজনেট প্রকল্পটি তৈরি হয়েছিল এবং বাস্তবে প্রয়োগ করা হয়েছিল।
ডেটা এবং ওপেন সোর্স গভীর শিক্ষার বসন্তের সূচনা করে
হোস্ট: প্রকৃতপক্ষে, কিছু প্রতিশ্রুতিশীল অ্যালগরিদম আবির্ভূত না হওয়া পর্যন্ত সাফল্যগুলি আবির্ভূত হতে শুরু করে। 2012 সালে অ্যালেক্সনেট প্রকাশিত না হওয়া পর্যন্ত এটি ছিল AI এর পথে দ্বিতীয় মূল ফ্যাক্টর, পর্যাপ্ত কম্পিউটিং শক্তি পাওয়া এবং এতে যথেষ্ট সংস্থান স্থাপন করা। এবং অ্যালগরিদমগুলি একটি গুরুত্বপূর্ণ মুহূর্ত প্রকাশ করেছে, যেটি হল যখন আপনি ডেটা সহ AI বীজ করেন, সম্প্রদায় ধীরে ধীরে আরও সমাধান খুঁজে পেতে শুরু করে, যা AI এর বিকাশের জন্য গতি প্রদান করে, তাই না?
Fei-Fei Li: 2009 সালে, আমরা শুধুমাত্র একটি CVPR পোস্টার হিসাবে একটি ছোট কাগজ প্রকাশ করেছি।
2009 থেকে 2012 পর্যন্ত, অ্যালেক্সনেটের আবির্ভাবের আগ পর্যন্ত, আমরা সত্যিই বিশ্বাস করতাম যে ডেটা AI চালাবে, কিন্তু আমাদের কাছে প্রায় কোনও স্পষ্ট সংকেত ছিল না যে এই পদ্ধতিটি কাজ করবে।
তাই আমরা কয়েকটি জিনিস করেছি, প্রথমত, আমরা এটিকে ওপেন সোর্স করার সিদ্ধান্ত নিয়েছি। আমরা শুরু থেকেই ভেবেছিলাম যে এটিকে ওপেন সোর্স হতে হবে যাতে সমগ্র গবেষণা সম্প্রদায় এটি ব্যবহার করতে পারে এবং এই সমস্যা সমাধানের জন্য একসাথে কাজ করতে পারে।
দ্বিতীয়ত, আমরা একটি চ্যালেঞ্জ তৈরি করেছি কারণ আমরা চেয়েছিলাম যে সারা বিশ্ব থেকে বুদ্ধিমান ছাত্র এবং গবেষকরা এসে এই সমস্যা নিয়ে কাজ করুক। এটাকেই আমরা ইমেজনেট চ্যালেঞ্জ বলি। প্রতি বছর আমরা একটি পরীক্ষার ডেটাসেট প্রকাশ করি, সমগ্র প্ল্যাটফর্মের ImageNet ডেটা প্রশিক্ষণের জন্য ব্যবহার করা হয়, কিন্তু আমরা একটি পৃথক পরীক্ষার ডেটাসেট প্রকাশ করি এবং সকলকে সর্বজনীনভাবে অংশগ্রহণের জন্য আমন্ত্রণ জানাই।
প্রথম কয়েক বছর সত্যিই বেঞ্চমার্ক সেট করার বিষয়ে ছিল। পারফরম্যান্স ত্রুটির হার ছিল প্রায় 30%, যা শূন্য ত্রুটি ছিল না, সম্পূর্ণ র্যান্ডম নয়, তবে দুর্দান্ত নয়। কিন্তু তৃতীয় বছরে, 2012 সালে, আমি আমার প্রকাশিত বইতেও এই অভিজ্ঞতার কথা লিখেছিলাম।

▲ ইমেজনেট চ্যালেঞ্জের প্রথম স্থান হল সুপারভিশন
আমার এখনও মনে আছে, গ্রীষ্মের শেষের দিকে, এবং আমরা আমাদের সার্ভারে সমস্ত ইমেজনেট চ্যালেঞ্জ ফলাফল চালাচ্ছিলাম। এক রাতে, আমি আমার স্নাতক ছাত্রের কাছ থেকে একটি বার্তা পেয়েছি যে আমাকে বলেছিল যে একটি ফলাফল যা সত্যিই অসাধারণ ছিল এবং আমাদের এটি পরীক্ষা করা উচিত। আমরা এটি দেখেছি এবং দেখতে পেয়েছি যে এটি একটি কনভোল্যুশনাল নিউরাল নেটওয়ার্ক। এটি তখন অ্যালেক্সনেট ছিল না, কিন্তু জিওফ্রে হিন্টনের দল "সুপারভিশন" নামে একটি কাজ করেছিল। এটি একটি খুব চতুর শব্দ খেলা ছিল, "সুপার" এবং "তত্ত্বাবধানে শেখার" সমন্বয়। আমরা সুপারভিশন দ্বারা করা কাজ দেখেছি, যা আসলে একটি পুরানো অ্যালগরিদম। কনভোল্যুশনাল নিউরাল নেটওয়ার্কগুলি 1980-এর দশকের প্রথম দিকে প্রকাশিত হয়েছিল, কিন্তু তারা অ্যালগরিদমের সাথে কিছু সমন্বয় করেছে, কিন্তু যখন আমরা এটি প্রথম দেখি, তখন আমরা সত্যিই অবাক হয়েছিলাম যে এত বড় সাফল্য ছিল।
অবশ্যই, পরবর্তী জিনিসটি আপনি জানেন যে আমরা সেই বছর ICCV (কম্পিউটার ভিশনের আন্তর্জাতিক সম্মেলন) ফ্লোরেন্সে ইমেজনেট চ্যালেঞ্জ কর্মশালায় এটি উপস্থাপন করেছি, এবং অ্যালেক্স ক্রিজেভস্কি এবং তার দল এসেছিলেন এবং অনেক লোক এসেছিলেন। আজ, সবাই এই মুহূর্তটিকে ইমেজনেট চ্যালেঞ্জের "আলেক্সনেট মুহূর্ত" বলে।
আমি এটাও যোগ করতে চাই যে এটি শুধুমাত্র কনভোলিউশনাল নিউরাল নেটওয়ার্কের সাফল্য নয়, এটিও প্রথমবার যে অ্যালেক্স এবং তার দল গভীর শিক্ষার গণনার জন্য দুটি জিপিইউ একত্রিত করেছে। ডেটা, জিপিইউ এবং নিউরাল নেটওয়ার্কগুলির সংমিশ্রণের জন্য এটি সত্যিই প্রথম প্রধান মুহূর্ত ছিল।
আমার ক্যারিয়ার শুধু দৃশ্য বলা নয়
মডারেটর: কম্পিউটার ভিশন ইন্টেলিজেন্সের বিকাশের প্রবণতা অনুসরণ করে, ইমেজনেট বস্তুর স্বীকৃতির সমস্যা সমাধানের ভিত্তি স্থাপন করেছে। তারপরে, কৃত্রিম বুদ্ধিমত্তা এমন পর্যায়ে পৌঁছেছে যেখানে এটি দৃশ্য বোঝার সমস্যা সমাধান করতে পারে। কারণ আপনি এবং আপনার ছাত্র, যেমন আন্দ্রে কারপাথি, দৃশ্যগুলি বর্ণনা করতে সক্ষম হতে শুরু করেছেন। আপনি কি বস্তুর স্বীকৃতি থেকে দৃশ্য বোঝার রূপান্তর সম্পর্কে কথা বলতে পারেন?
Fei-Fei Li: হ্যাঁ, ইমেজনেট আপনি যখন ছবি দেখেন তখন কীভাবে বস্তুগুলিকে শনাক্ত করতে হয় সেই সমস্যার সমাধান করে, যেমন "এটি একটি বিড়াল, এটি একটি চেয়ার", যা ভিজ্যুয়াল স্বীকৃতির একটি মৌলিক সমস্যা। কিন্তু যেহেতু আমি একজন স্নাতক ছাত্র হিসাবে কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে প্রবেশ করেছি, তখন আমার একটি স্বপ্ন ছিল। আমার মনে হয় এই স্বপ্ন বাস্তবে আসতে একশ বছর লেগে যেতে পারে, অর্থাৎ পৃথিবীর গল্প বলতে। কল্পনা করুন যে মানুষ যখন তাদের চোখ খোলে, আপনি কেবল আপনার চোখ খুলবেন এবং "মানুষ, চেয়ার, টেবিল" দেখতে পাচ্ছেন না, আপনি আসলে একটি সম্মেলন কক্ষ দেখতে পাচ্ছেন, পর্দা, মঞ্চ, দর্শক, ক্যামেরা ইত্যাদি দেখতে পাচ্ছেন। আপনি পুরো দৃশ্যটি বর্ণনা করতে পারেন, যা একটি মানুষের ক্ষমতা, ভিজ্যুয়াল বুদ্ধিমত্তার ভিত্তি এবং এটি আমাদের দৈনন্দিন জীবনের জন্য অত্যন্ত গুরুত্বপূর্ণ। অতএব, আমি সবসময় ভেবেছিলাম যে এই সমস্যাটি আমার জীবন দখল করবে। আমি যখন স্নাতক ছাত্র হিসাবে স্নাতক হয়েছিলাম, তখন আমি নিজেকে বলেছিলাম যে আমি যদি এমন একটি অ্যালগরিদম তৈরি করতে পারি যা একটি দৃশ্যের গল্প বলতে পারে, তবে আমি সফল হব। এই সময় আমার ক্যারিয়ারের আমার দৃষ্টি ছিল।
যাইহোক, সেই মুহূর্তটি সত্যিই গভীর শিক্ষার উত্থানের সাথে এসেছিল, এবং তারপরে আন্দ্রে এবং জাস্টিন জনসন আমার ল্যাবে যোগদান করেছিলেন, এবং আমরা প্রাকৃতিক ভাষা এবং দৃষ্টির মধ্যে সংঘর্ষের সংকেত দেখতে শুরু করি।
আন্দ্রে এবং আমি চিত্র বর্ণনা বা গল্প বলার সমস্যা নিয়ে এসেছি। এবং সংক্ষেপে, 2015 সালের দিকে, আন্দ্রে এবং আমি একটি সিরিজের কাগজপত্র প্রকাশ করেছি, যার মধ্যে কিছু ছিল যা আমাদের মতো একই সময়ে প্রকাশিত হয়েছিল, যেগুলি আসলে কম্পিউটারগুলিকে ইমেজ ক্যাপশন তৈরি করতে সক্ষম করার প্রথম দিকের কিছু কাজ ছিল৷ আমার প্রায় মনে হচ্ছিল, আমি কীভাবে আমার জীবন নিয়ে এগোব? এটা আমার সারাজীবনের স্বপ্ন। এটা আমাদের দুজনের জন্য সত্যিই একটি শক্তিশালী মুহূর্ত ছিল।

গত বছর, আমি একটি TED বক্তৃতা দিয়েছিলাম এবং আমি একটি টুইট ব্যবহার করেছি যেটি আন্দ্রে কয়েক বছর আগে পাঠিয়েছিল, তিনি ছবির ক্যাপশনিং এর কাজ শেষ করার ঠিক পরে। এটা ছিল তার পিএইচডি থিসিস। আমি মজা করে তাকে বললাম, "আরে, আন্দ্রে, কেন আমরা বিপরীতটা করব না? একটি বাক্য থেকে একটি চিত্র তৈরি করুন ।" অবশ্যই, তিনি জানতেন যে আমি রসিকতা করছি এবং তিনি "হাহা, আমি প্রথমে চলে যাচ্ছি।" বিশ্ব স্পষ্টতই এর জন্য প্রস্তুত ছিল না। কিন্তু এখন, আজকে দ্রুত এগিয়ে, আমরা সবাই জানি যে জেনারেটিভ এআই এখন একটি বাক্য থেকে সুন্দর ছবি তৈরি করতে পারে। সুতরাং গল্পের নৈতিকতা হল যে এআই একটি বিশাল বিবর্তনের মধ্য দিয়ে গেছে।
ব্যক্তিগতভাবে, আমি মনে করি আমি বিশ্বের সবচেয়ে ভাগ্যবান ব্যক্তি কারণ আমার পুরো ক্যারিয়ার শুরু হয়েছিল AI শীতের শেষ থেকে এবং AI এর উত্থানের শুরু থেকে, এবং আমার অনেক কাজ এবং ক্যারিয়ার এই পরিবর্তনের সাথে ঘনিষ্ঠভাবে জড়িত, বা কোনওভাবে এই পরিবর্তনকে চালিত করেছে। সুতরাং, আমি কিছু উপায়ে খুব ভাগ্যবান, কৃতজ্ঞ এবং গর্বিত বোধ করি।
হোস্ট: আমি মনে করি সবচেয়ে বিস্ময়কর জিনিসটি হল যে আপনি দৃশ্যগুলি বর্ণনা করার এবং এমনকি ডিফিউশন মডেলের মাধ্যমে দৃশ্য তৈরি করার স্বপ্ন অর্জন করলেও, আপনি এখনও বড় স্বপ্ন দেখছেন। কারণ কম্পিউটারের দৃষ্টিভঙ্গির পুরো ট্র্যাজেক্টোরি বস্তুর স্বীকৃতি থেকে দৃশ্য বোঝা এবং এখন "বিশ্ব" ধারণায় চলে গেছে। এবং আপনি একাডেমিয়া থেকে প্রফেসরশিপ থেকে উদ্যোক্তা হওয়ার সিদ্ধান্ত নিয়েছেন, বিশ্ব ল্যাবসের প্রতিষ্ঠাতা এবং সিইও হয়েছেন। আপনি "জগত" কি সম্পর্কে বলতে পারেন? এটা কি দৃশ্য এবং বস্তুর চেয়ে বেশি চ্যালেঞ্জিং?
ফেই-ফেই লি: হ্যাঁ, এটা সত্যিই পাগল। অবশ্যই, অতীতে কী ঘটেছিল তা সবাই জানে, এবং আমার জন্য, গত পাঁচ বা ছয় বছরে অগ্রগতি সংক্ষিপ্ত করা সত্যিই কঠিন। আমরা প্রযুক্তিগত অগ্রগতির একটি সভ্য মুহূর্তে আছি। একজন কম্পিউটার ভিশন বিজ্ঞানী হিসাবে, আমরা বিচ্ছুরণ কৌশল ব্যবহার করে ইমেজ থেকে ইমেজ বর্ণনা থেকে ইমেজ জেনারেশন পর্যন্ত অবিশ্বাস্য বৃদ্ধির সাক্ষী হয়েছি। যদিও এই অগ্রগতিগুলি উত্তেজনাপূর্ণ, একই সময়ে, আমরা আরেকটি অত্যন্ত উত্তেজনাপূর্ণ ক্ষেত্রও দেখতে পাচ্ছি, যা হল ভাষার ক্ষেত্র, বিশেষ করে এলএলএম (বড় ভাষার মডেল)। উদাহরণস্বরূপ, 2022 সালের নভেম্বরে, ChatGPT-এর উত্থান সত্যিই জেনারেটিভ মডেলগুলির দরজা খুলে দিয়েছে, যা মূলত টুরিং পরীক্ষায় উত্তীর্ণ হতে পারে এবং আরও অনেক কিছু। সুতরাং, এমনকি আমার মতো বয়স্ক ব্যক্তিরাও খুব উত্তেজিত বোধ করে এবং পরবর্তী লক্ষ্য কী তা নিয়ে সাহসের সাথে ভাবতে শুরু করে।

একজন কম্পিউটার ভিশন বিজ্ঞানী হিসাবে, আমার প্রায়ই বিবর্তন এবং মস্তিষ্ক বিজ্ঞান দ্বারা অনুপ্রাণিত হওয়ার অভ্যাস আছে। আমার ক্যারিয়ারে অনেকবার, আমি পরবর্তী "নর্থ স্টার" সমস্যার সমাধান খুঁজছি। আমি নিজেকে জিজ্ঞাসা করব, বিবর্তন বা মস্তিষ্কের বিকাশ কী করেছে? একটি বিষয় যা খুবই লক্ষণীয় এবং প্রশংসনীয় তা হল মানুষের ভাষার বিবর্তনে প্রায় 300 থেকে 500 মিলিয়ন বছর লেগেছে, এমনকি যদি আমরা খুব উদার হই, তবে এটি মাত্র এক মিলিয়ন বছরেরও কম। মানুষই একমাত্র প্রজাতি যার ভাষা জটিল। আমরা প্রাণী ভাষা সম্পর্কে কথা বলতে পারি, কিন্তু যোগাযোগ, যুক্তি এবং বিমূর্তকরণের একটি হাতিয়ার হিসাবে ভাষার কার্যকারিতার পরিপ্রেক্ষিতে, শুধুমাত্র মানুষের এই ক্ষমতা আছে। এই বিবর্তনীয় প্রক্রিয়াটি 500,000 বছরেরও কম সময় নেয়।
কিন্তু আপনি যদি দৃষ্টি সম্পর্কে চিন্তা করেন, ত্রিমাত্রিক বিশ্বকে বোঝার ক্ষমতা সম্পর্কে চিন্তা করুন, কীভাবে সেই ত্রিমাত্রিক বিশ্বে চলাফেরা করতে হবে, কীভাবে নেভিগেট করতে হবে, ইন্টারঅ্যাক্ট করতে হবে, বুঝতে হবে, এর সাথে যোগাযোগ করতে হবে, এই সমস্ত কিছুর বিকাশ হতে 540 মিলিয়ন বছর লেগেছে।
প্রায় 540 মিলিয়ন বছর আগে, প্রথম ট্রাইলোবাইটগুলি জলের নীচে চাক্ষুষ উপলব্ধি বিকাশ করতে শুরু করেছিল। সেই থেকে, দৃষ্টিশক্তি বিবর্তনীয় অস্ত্র প্রতিযোগিতার চাবিকাঠি হয়ে উঠেছে। দৃষ্টির আবির্ভাবের আগে, প্রায় 500 মিলিয়ন বছর ধরে প্রায় কোন জটিল পরিবর্তন ছাড়াই প্রাণীর জীবন গঠন তুলনামূলকভাবে সহজ ছিল। কিন্তু পরবর্তী 540 মিলিয়ন বছরে, বিশ্বকে বোঝার ক্ষমতার কারণেই বিবর্তনীয় অস্ত্র প্রতিযোগিতা শুরু হয়েছিল এবং প্রাণীদের বুদ্ধিমত্তা উন্নত হতে থাকে।

▲ iWorld Labs প্রতিষ্ঠাতা দল, Fei-Fei Li (ডান থেকে প্রথমে), জাস্টিন জনসন, ক্রিস্টোফ ল্যাসনার, বেন মিলডেনহল
তাই আমার কাছে, স্থানিক বুদ্ধিমত্তার সমস্যা সমাধান করা, 3D বিশ্ব বোঝা, 3D বিশ্ব তৈরি করা, 3D বিশ্ব সম্পর্কে যুক্তি করা, 3D বিশ্বে কাজ করা, AI এর জন্য একটি মৌলিক সমস্যা। আমার কাছে, AGI স্থানিক বুদ্ধিমত্তা ছাড়া অসম্পূর্ণ। আমি এই সমস্যার সমাধান করতে চাই। এবং এর মধ্যে "ওয়ার্ল্ড মডেল" তৈরি করা জড়িত যা ফ্ল্যাট পিক্সেলের বাইরে, ভাষার বাইরে, সত্যিই বিশ্বের 3D কাঠামো এবং স্থানিক বুদ্ধিমত্তা ক্যাপচার করতে। ভাগ্যক্রমে, আমার বয়স যতই হোক না কেন, আমি সর্বদা সবচেয়ে আশ্চর্যজনক তরুণদের সাথে কাজ করতে পারি। তাই এখন আমি তিনজন আশ্চর্যজনক তরুণ কিন্তু বিশ্বমানের প্রযুক্তিবিদ, জাস্টিন জনসন, বেন মিলডেনহল এবং ক্রিস্টোফ ল্যাসনারের সাথে এই কোম্পানিটি শুরু করছি। আমি এই মুহূর্তে AI-তে সবচেয়ে কঠিন সমস্যা বলে মনে করি তা সমাধান করার চেষ্টা করব।
ভাষা তথ্যের চেয়ে স্থানিক বুদ্ধিমত্তার তথ্য পাওয়া অনেক কঠিন।
হোস্ট: আসলে, এরা সবাই খুব প্রতিভাবান মানুষ। ক্রিস পালসারের প্রতিষ্ঠাতা, যেটি একটি ডিফারেন্সিয়েবল রেন্ডারিং প্রযুক্তি এবং এখন PyTorch3D-এর জন্য একটি গোলক-ভিত্তিক রেন্ডারিং ব্যাকএন্ড। এবং জাস্টিন জনসন, আপনার একজন প্রাক্তন ছাত্র হিসাবে, তার সত্যিই একটি শক্তিশালী সিস্টেম ইঞ্জিনিয়ারিং মানসিকতা রয়েছে এবং তিনি নিউরাল নেটওয়ার্কের উপর ভিত্তি করে রিয়েল-টাইম স্টাইল ট্রান্সফার বাস্তবায়ন করেছেন। এবং তারপর বেন, তিনি এনআরএফ (নিউরাল রেডিয়েন্স ফিল্ডস) কাগজের লেখক। তাই এটি সত্যিই একটি সুপার অভিজাত দল। আপনার এমন একটি অভিজাত দল দরকার কারণ আমরা এটি সম্পর্কে আগে কথা বলেছি, দৃষ্টি আসলে ভাষার চেয়ে কঠিন। হয়তো এটা বলা একটু বিতর্কিত কারণ এলএলএমগুলি মূলত এক-মাত্রিক, ঠিক আছে, কিন্তু আপনি অনেক 3D কাঠামো বোঝার কথা বলছেন। তাহলে এটা এত কঠিন কেন? কেন এটা এখন বড় ভাষার চেয়ে বেশি শক্তিশালী?
ফেই-ফেই লি: হ্যাঁ, আপনি আমাদের সমস্যার অসুবিধা বুঝতে পারেন। ভাষা সহজাতভাবে এক-মাত্রিক, এবং ব্যাকরণ ক্রমানুসারে আবির্ভূত হয়, যে কারণে ক্রম-থেকে-ক্রম মডেলিং এত ক্লাসিক। আরেকটি বিষয় হল যে ভাষা একটি সম্পূর্ণরূপে উৎপন্ন সংকেত, যা অনেক মানুষ উপলব্ধি করে না। প্রকৃতিতে কোন ভাষা নেই, আপনি ভাষাকে স্পর্শ করতে পারবেন না, আপনি ভাষা দেখতে পাবেন না, ভাষা সম্পূর্ণরূপে সবার মাথা থেকে উত্পন্ন হয়। ভাষা একটি সম্পূর্ণরূপে উৎপন্ন সংকেত. অবশ্যই, যখন আপনি এটি কাগজে লেখেন, এটি সেখানে আছে, তবে ভাষার প্রজন্ম, নির্মাণ এবং উপযোগিতা সহজাতভাবে খুব উৎপন্ন, এবং পৃথিবী তার চেয়ে অনেক বেশি জটিল।
প্রথমত, বাস্তব জগৎ ত্রিমাত্রিক। যদি আমরা সময় যোগ করি, তবে এটি চার-মাত্রিক, কিন্তু আমরা এখন শুধুমাত্র স্থান বিবেচনা করব। বাস্তব জগতটি মূলত ত্রিমাত্রিক, যা নিজেই একটি আরও সমন্বিতভাবে চ্যালেঞ্জিং সমস্যা।
দ্বিতীয়ত, আপনাকে বুঝতে হবে যে ভিজ্যুয়াল জগতকে একটি প্রজেকশন প্রক্রিয়া হিসাবে উপলব্ধি করা কতটা কঠিন, তা আপনার চোখ, রেটিনা বা ক্যামেরা, যা সর্বদা ত্রিমাত্রিক তথ্যকে দুই মাত্রায় সংকুচিত করে। গাণিতিকভাবে, এটি একটি অপরিবর্তনীয় প্রক্রিয়া, যার কারণে এই সমস্যাটি সমাধান করার জন্য মানুষ এবং প্রাণীদের একাধিক ইন্দ্রিয় রয়েছে।
তৃতীয়ত, পৃথিবী বিশুদ্ধভাবে উৎপন্ন নয়। হ্যাঁ, আমরা একটি ভার্চুয়াল 3D বিশ্ব তৈরি করতে পারি, তবে এটিকে এখনও পদার্থবিজ্ঞানের নিয়মগুলি অনুসরণ করতে হবে এবং বাস্তব বিশ্ব আমাদের বাইরে বিদ্যমান। আপনি আসলে এখন প্রজন্ম এবং পুনর্গঠনের মধ্যে তরলভাবে স্যুইচ করছেন। ব্যবহারকারীর আচরণ, ব্যবহারিকতা এবং প্রয়োগের পরিস্থিতি সম্পূর্ণ ভিন্ন। আপনি যদি সর্বত্র জেনারেটিভের উপর ফোকাস করেন, আমরা গেমস, মেটাভার্স এবং অন্যান্য জিনিস সম্পর্কে কথা বলতে পারি; আপনি যদি বাস্তব জগতে ফোকাস করেন, তাহলে আমরা রোবোটিক্স ইত্যাদি নিয়ে কথা বলি। তবে এটি সবই বিশ্ব মডেলিং এবং স্থানিক বুদ্ধিমত্তার ধারাবাহিকতায়।
অবশ্যই, এই মুহূর্তে বিশাল চ্যালেঞ্জ হল যে ইন্টারনেটে প্রচুর ভাষা ডেটা রয়েছে, এবং স্থানিক বুদ্ধিমত্তার ডেটা, যদিও এটি আমাদের মস্তিষ্কে রয়েছে, ভাষা ডেটার মতো অ্যাক্সেস করা ততটা সহজ নয়। তাই এই সব কারণ এই সমস্যা এত কঠিন কেন. কিন্তু সত্যি কথা বলতে কি, এটিই আমাকে উত্তেজিত করে, কারণ এই সমস্যাটি যদি সহজ হতো, তাহলে এর মানে অন্য কেউ এটি সমাধান করেছে। এবং আমার পুরো কর্মজীবন অত্যন্ত কঠিন, প্রায় ইচ্ছাকৃত চিন্তাভাবনার সমস্যাগুলি অনুসরণ করা হয়েছে। আমি মনে করি এটি সেই ইচ্ছাপূর্ণ চিন্তার সমস্যা। এই সমস্যা আপনার সমর্থনের জন্য আপনাকে ধন্যবাদ.
আমাদের ওয়ার্ল্ড ল্যাবগুলিতে বিশ্বের সবচেয়ে স্মার্ট মানুষ রয়েছে
হোস্ট: হ্যাঁ, এমনকি সবচেয়ে মৌলিক নীতি থেকেও, মানুষের মস্তিষ্কের ভিজ্যুয়াল কর্টেক্সে নিউরন প্রক্রিয়াকরণ ভাষার তুলনায় ভিজ্যুয়াল ডেটা প্রক্রিয়াকরণের অনেক বেশি নিউরন রয়েছে। এই পার্থক্য মডেলে কিভাবে প্রকাশ পায়? সহ, আপনি যে জিনিসগুলিতে কাজ করছেন তাও এলএলএম-এর তুলনায় আর্কিটেকচারে খুব আলাদা হবে, তাই না?
ফেই-ফেই লি: এটি একটি খুব ভাল প্রশ্ন। প্রকৃতপক্ষে, বর্তমানে এই প্রশ্নের দুটি ভিন্ন পদ্ধতি রয়েছে।
একটি হল এলএলএম পদ্ধতি, যেখানে আমরা এলএলএম-এ প্রচুর লেখা এবং লেখার এক্সটেনশন প্যাটার্ন দেখতে পাই, যতক্ষণ না একটি "সুখী সমাপ্তি" না হয় ততক্ষণ পর্যন্ত স্ব-তত্ত্বাবধানে শিক্ষার মাধ্যমে প্রায় সরাসরি অগ্রসর হতে পারে। যতক্ষণ না আপনি আপনার লক্ষ্যে পৌঁছান ততক্ষণ আপনি প্রায় জঘন্য আত্ম-তত্ত্বাবধান করতে পারেন।
অন্যটি হল একটি বিশ্ব মডেল তৈরি করা, যা আরও বিশদ এবং শ্রেণিবদ্ধ হতে পারে, কারণ বিশ্বটি কাঠামোগত, এবং এটিকে গাইড করার জন্য আমাদের কিছু সংকেতের প্রয়োজন হতে পারে। আপনি এটিকে পূর্বের জ্ঞান হিসাবে ভাবতে পারেন, বা ডেটাতে একটি তত্ত্বাবধায়ক সংকেত হিসাবে, যাইহোক, এটি শেখার গাইড করার একটি উপায়।
আমি মনে করি এইগুলি কিছু খোলা প্রশ্ন যা আমাদের সমাধান করতে হবে, কিন্তু আপনি ঠিক আছেন। আপনি যদি মানুষের উপলব্ধি সম্পর্কে চিন্তা করেন, প্রথমত, আমরা মানুষের দৃষ্টিভঙ্গির সমস্ত সমস্যার সম্পূর্ণ সমাধান করতে পারিনি, তাই না? কিভাবে 3D মানুষের দৃষ্টিতে খেলা করে? এটি এখনও একটি সমাধান সমস্যা নয়. আমরা জানি যে যান্ত্রিকভাবে, চোখকে ত্রিভুজকরণের মাধ্যমে তথ্য পেতে হবে, কিন্তু তবুও, আমাদের কাছে একটি নিখুঁত গাণিতিক মডেলের অভাব রয়েছে এবং বাস্তবে, মানুষ 3D উপলব্ধিতে বিশেষভাবে ভাল নয়। আমরা ত্রিমাত্রিক বিশ্বকে বোঝার এবং পরিচালনা করতে খুব ভাল নই, তাই উত্তর পাওয়ার জন্য অনেক প্রশ্ন অপেক্ষা করছে।

▲ ওয়ার্ল্ড ল্যাবের কিছু সদস্যের স্ক্রিনশট
সুতরাং, আমরা এখন সত্যিই "ওয়ার্ল্ড ল্যাবস" পর্যায়ে আছি। একমাত্র জিনিসটির উপর আমি নির্ভর করতে পারি যে আমি বিশ্বাস করি যে "পিক্সেল ওয়ার্ল্ড"-এ এই সমস্যাটি সমাধান করার জন্য আমাদের কাছে বিশ্বের সবচেয়ে বুদ্ধিমান মানুষ রয়েছে৷
হার্ডওয়্যার এবং সফ্টওয়্যারের মিলন শেষ পর্যন্ত আসবে
মডারেটর: আমরা কি বলতে পারি যে এই মৌলিক মডেলগুলির চূড়ান্ত আউটপুট যা ওয়ার্ল্ড ল্যাবস তৈরি করছে একটি 3D বিশ্ব? আপনি কোন অ্যাপ্লিকেশন পরিস্থিতিতে কল্পনা করছেন? আমি দেখেছি আপনি উপলব্ধি থেকে প্রজন্ম পর্যন্ত বিভিন্ন সম্ভাবনার কথা উল্লেখ করেছেন। জেনারেটিভ মডেল এবং বৈষম্যমূলক মডেলগুলির মধ্যে সর্বদা একটি উত্তেজনা থাকে, তাই এই 3D বিশ্বের ভূমিকা কী?
ফেই-ফেই লি: হ্যাঁ, আমি বিশ্ব ল্যাবগুলির নির্দিষ্ট বিবরণ সম্পর্কে খুব বেশি প্রকাশ করতে সক্ষম নাও হতে পারি, তবে স্থানিক বুদ্ধিমত্তার পরিপ্রেক্ষিতে, এটি সত্যিই এমন একটি জায়গা যা আমাকে উত্তেজিত করে। ভাষার মতোই, অ্যাপ্লিকেশনের দৃশ্যগুলিও খুব বিস্তৃত। সৃষ্টির শুরু থেকে, ডিজাইনার, স্থপতি, শিল্প ডিজাইনার এবং এমনকি শিল্পী, 3D শিল্পী এবং গেম ডেভেলপাররা এটি ব্যবহার করতে পারেন। তারপরে, রোবোটিক্স এবং রোবট শিক্ষাও একটি অত্যন্ত গুরুত্বপূর্ণ প্রয়োগের ক্ষেত্র এবং স্থানিক বুদ্ধিমত্তা মডেল বা বিশ্ব মডেলের ব্যবহারগুলি খুব বিস্তৃত। এছাড়াও, বিপণন, বিনোদন এবং এমনকি মেটাভার্সের মতো অনেক সম্পর্কিত শিল্প প্রভাবিত হবে। আমি মেটাভার্স সম্পর্কে সত্যিই উত্তেজিত. যদিও এটা এখনও পুরোপুরি উপলব্ধি করা যায় নি, আমি জানি এটা এখন খুব একটা পরিপক্ক নয়, কিন্তু ঠিক এই কারণেই আমি আরও উত্তেজিত। আমি মনে করি হার্ডওয়্যার এবং সফ্টওয়্যার একীকরণ শেষ পর্যন্ত আসবে, এবং ভবিষ্যতে সম্ভাবনা খুব বিশাল। এটি একটি খুব উত্তেজনাপূর্ণ অ্যাপ্লিকেশন দিক।

হোস্ট: আমি ব্যক্তিগতভাবে খুব উত্তেজিত যে আপনি মেটাভার্সের সমস্যাটি সমাধান করছেন। আমি আগেও আমার কোম্পানিতে এই দিকটি চেষ্টা করেছি, তাই আপনি এখন এটি করছেন দেখে আমি সত্যিই উত্তেজিত।
লি ফেইফেই: হ্যাঁ, আমি মনে করি এখন আরও সংকেত রয়েছে যে মেটাভার্স ধীরে ধীরে উপলব্ধি করা হচ্ছে। আমি মনে করি হার্ডওয়্যার প্রকৃতপক্ষে বাধাগুলির মধ্যে একটি, কিন্তু আরও গুরুত্বপূর্ণভাবে, আপনার সামগ্রী তৈরির প্রয়োজন, এবং মেটাভার্সের জন্য সামগ্রী তৈরির জন্য বিশ্ব মডেলের প্রয়োজন৷
স্ক্র্যাচ থেকে শুরু করে, এটি আমার কমফোর্ট জোন
মডারেটর: চলুন বিষয় পরিবর্তন করা যাক. কিছু দর্শকের জন্য, আপনার একাডেমিয়া থেকে একজন প্রতিষ্ঠাতা এবং সিইও হওয়াটা কিছুটা আকস্মিক মনে হতে পারে। কিন্তু প্রকৃতপক্ষে, আপনার সমগ্র জীবনের অভিজ্ঞতা খুবই অসাধারণ, এবং আপনি 0 থেকে 1 এর মধ্যে এই প্রথমবার যাননি। আপনি একবার আমাকে বলেছিলেন যে আপনি কীভাবে মার্কিন যুক্তরাষ্ট্রে অভিবাসিত হয়েছিলেন, শুরুতে কোনো ইংরেজি বলতে পারেননি, এবং বেশ কয়েক বছর ধরে আপনার দলের সাথে একটি লন্ড্রি ব্যবসা চালিয়েছেন। আপনি কি এই অভিজ্ঞতাগুলি আপনাকে আজকে কীভাবে গঠন করেছে সে সম্পর্কে বলতে পারেন?
ফেই-ফেই লি: ঠিক? আমি জানি আপনি এখানে আমার গল্প শুনতে এসেছেন কিভাবে আমি একটি লন্ড্রি ব্যবসা খুলেছিলাম। হাহাহা।
আমার বয়স 19 বছর এবং আমি সম্পূর্ণ মরিয়া ছিলাম। আমার পরিবারকে সমর্থন করার কোনো উপায় আমার ছিল না, আমার বাবা-মায়ের আমাকে কলেজে যাওয়ার প্রয়োজন ছিল এবং আমি প্রিন্সটনে পদার্থবিদ্যার প্রধান হতে চেয়েছিলাম। তাই আমি একটি ড্রাই ক্লিনিং স্টোর খুললাম। সিলিকন ভ্যালির পরিভাষায়, আমি ছিলাম একজন তহবিল সংগ্রহকারী, প্রতিষ্ঠাতা এবং সিইও, ক্যাশিয়ার এবং সমস্ত কাজ, এবং আমি অবশেষে সাত বছর পর "প্রস্থান" করেছিলাম।
ডায়ানার পয়েন্টে ফিরে যাওয়া, বিশেষ করে আপনাদের সবার জন্য, আমি আপনাকে দেখছি এবং এটি সত্যিই উত্তেজনাপূর্ণ কারণ আপনি অর্ধেক, এমনকি এক তৃতীয়াংশ, আমার চেয়ে ছোট এবং আপনি অনেক প্রতিভাবান, শুধু এটির জন্য যান, ভয় পাবেন না।
আমি আমার পুরো ক্যারিয়ারের মতোই আছি, অবশ্যই, লন্ড্রিতে কাজ করা এবং এমনকি একজন অধ্যাপক হিসাবেও আমি কয়েকটি পছন্দ করেছি। আমি একবার এমন কিছু বিভাগে যেতে বেছে নিয়েছিলাম যেখানে কম্পিউটার ভিশনের অধ্যাপক ছিল না, প্রথম হতে, যা অনেক পরামর্শের বিপরীত ছিল। একজন তরুণ অধ্যাপক হিসাবে, সবাই সুপারিশ করবে যে আপনি এমন একটি জায়গায় যান যেখানে একটি সম্প্রদায় এবং একজন সিনিয়র পরামর্শদাতা রয়েছে। অবশ্যই, আমি একজন সিনিয়র মেন্টরও আশা করি, তবে যদি না হয়, আমি এখনও নিজের পথে যাব। তাই এ নিয়ে আমি মোটেও ভয় পাই না। পরে আমি গুগলে গিয়েছিলাম এবং ব্যবসা সম্পর্কে, গুগল ক্লাউড এবং B2B সম্পর্কে অনেক কিছু শিখেছি এবং তারপরে আমি স্ট্যানফোর্ডে একটি স্টার্টআপ শুরু করি, কারণ 2018 সাল নাগাদ, AI আর কেবল একটি শিল্প সমস্যা নয়, এটি একটি মানব সমস্যা হয়ে দাঁড়িয়েছে।
মানুষ সবসময় প্রযুক্তিগত উন্নতি চালাবে, কিন্তু আমরা আমাদের মানবতা হারাতে পারি না। AI-এর অগ্রগতিতে কীভাবে আলোর রশ্মি তৈরি করা যায়, কীভাবে AI মানব-কেন্দ্রিক হতে পারে এবং কীভাবে AI মানুষকে সাহায্য করতে পারে সেদিকে আমি খুব মনোযোগী। তাই, আমি স্ট্যানফোর্ডে ফিরে গিয়েছিলাম এবং একটি মানব-কেন্দ্রিক এআই ইনস্টিটিউট প্রতিষ্ঠা করেছি এবং এটি পাঁচ বছর ধরে একটি স্টার্টআপ হিসাবে চালিয়েছি। কিছু লোক খুশি নাও হতে পারে যে আমি কলেজে এতদিন এটি একটি স্টার্টআপ হিসাবে চালিয়েছি, তবে আমি এটির জন্য খুব গর্বিত। তাই এক অর্থে, আমি মনে করি আমি একজন উদ্যোক্তা হতে পছন্দ করি। আমি স্ক্র্যাচ থেকে শুরু করার অনুভূতি পছন্দ করি, যেমন জিরো পয়েন্টে দাঁড়িয়ে থাকা, আপনি অতীতে যা করেছেন তা ভুলে যাওয়া, অন্যরা আপনার সম্পর্কে কী ভাবছে তা ভুলে যাওয়া এবং কেবল এটি করা। এটি আমার সান্ত্বনা অঞ্চল, এবং আমি সত্যিই এই অনুভূতি ভালোবাসি।
আমি যা চাই তা হল বুদ্ধিবৃত্তিক নির্ভীকতা।
হোস্ট: এটা সত্যিই দুর্দান্ত যে আপনি এই সমস্ত আশ্চর্যজনক জিনিসগুলি করেছেন, এবং আপনি অনেক কিংবদন্তি গবেষককে পরামর্শ দিয়েছেন, যেমন আন্দ্রেজ কার্পাথি, জিম ফ্যান (এখন এনভিডিয়াতে), জিয়া ডেং (ইমেজনেট প্রকল্পে সহযোগিতা)। তারা সবাই ইন্ডাস্ট্রিতে নেতা হয়ে উঠেছেন। যখন তারা এখনও ছাত্র ছিল, তখন কী আপনাকে দেখেছিল যে তারা ভবিষ্যতে অসাধারণ কিছু অর্জন করবে? এআই-এর ক্ষেত্র পরিবর্তন করবে এমন লোকদের কীভাবে চিহ্নিত করা যায় তা আমাদের বলার জন্য আপনি কী পরামর্শ দিতে পারেন?
ফেই-ফেই লি: প্রথমত, আমি নিজেকে খুব ভাগ্যবান মনে করি এবং মনে করি না যে আমি আমার ছাত্রদের জন্য তাদের চেয়ে বেশি অবদান রেখেছি। তারা সত্যিই আমাকে একজন ভালো মানুষ, একজন ভালো শিক্ষক এবং একজন ভালো গবেষক করে তোলে। আপনার মত এত কিংবদন্তি ছাত্রের সাথে কাজ করা সত্যিই আমার জীবনের গর্বের বিষয়। প্রতিটি ছাত্র খুব আলাদা। কিছু বিশুদ্ধ বিজ্ঞানী যারা বৈজ্ঞানিক সমস্যা সমাধানের দিকে মনোনিবেশ করেন; কিছু শিল্পের নেতা; এবং কিছু এআই জ্ঞানের মহান প্রচারক। কিন্তু আমি মনে করি তাদের সবার মধ্যে একটা জিনিস মিল আছে, এবং আমি এখানে প্রত্যেক শিক্ষার্থীকে এই প্রশ্নটি নিয়ে ভাবতে উৎসাহিত করি।
আমি উদ্যোক্তাদের জন্য বিশেষ করে নিয়োগের সময় এই মানদণ্ডটিও খুঁজি। আমি বুদ্ধিবৃত্তিক নির্ভীকতা খুঁজি।
আমি মনে করি এটি কেবলমাত্র আপনি কোথা থেকে এসেছেন বা আপনি কোন সমস্যা সমাধানের চেষ্টা করছেন তা নয়, বরং চ্যালেঞ্জ মোকাবেলা করার সাহস এবং এটি সমাধান করার প্রতিশ্রুতি। এই নির্ভীকতা সত্যিই সাফল্যের মূল গুণ। আমি এই ছাত্রদের কাছ থেকে এটি শিখেছি, এবং আমাদের ল্যাবের সিইও হিসাবে, আমি আমার নিয়োগ প্রক্রিয়ায় এটিকে খুব মূল্যবান বলে মনে করি।
হোস্ট: আপনি ওয়ার্ল্ড ল্যাবসের জন্য অনেক লোক নিয়োগ করছেন, তাই আপনি একই পদ খুঁজছেন?
ফেই-ফেই লি: হ্যাঁ, আমরা সত্যিই বড় পরিসরে নিয়োগ দিচ্ছি। আমরা ইঞ্জিনিয়ারিং প্রতিভা, পণ্য প্রতিভা, 3D প্রতিভা এবং জেনারেটিভ মডেলিং প্রতিভা নিয়োগ করছি। আপনি যদি নির্ভীক বোধ করেন এবং বুদ্ধিমান সমস্যাগুলি সমাধানের বিষয়ে উত্সাহী হন তবে দয়া করে আমার সাথে যোগাযোগ করুন বা আমাদের ওয়েবসাইটে আসুন।
শ্রোতাদের প্রশ্নোত্তর
প্রশ্নকর্তা 1: হাই, ফেইফি, আপনার কথা বলার জন্য ধন্যবাদ। আমি আপনার একটি বড় ভক্ত! আমার প্রশ্ন হল, আপনি 20 বছরেরও বেশি আগে ভিজ্যুয়াল স্বীকৃতিতে কাজ করেছেন। আমি এখন পিএইচডি শুরু করতে চাই, আপনার মতো কিংবদন্তি হওয়ার জন্য আমার কোন দিকে পড়াশোনা করা উচিত?
ফেই-ফেই লি: আমি আপনাকে একটি সুচিন্তিত উত্তর দিতে চাই কারণ আমি সবসময় বলতে পারি যা আপনাকে উত্তেজিত করে তাই করুন।
প্রথমত, আমি মনে করি এআই গবেষণা পরিবর্তিত হয়েছে কারণ আপনি যদি পিএইচডি করছেন, আপনি একাডেমিয়ায় আছেন। আজ, একাডেমিয়াতে আর বেশির ভাগ AI সংস্থান নেই, যা আমার পরিস্থিতি থেকে খুব আলাদা। কম্পিউটেশনাল পাওয়ার এবং ডেটা রিসোর্স একাডেমিয়ায় খুব সীমিত, যখন শিল্প অনেক দ্রুত গতিতে গবেষণা করতে পারে। অতএব, একজন পিএইচডি ছাত্র হিসাবে, আমি সুপারিশ করব যে আপনি এমন দিকনির্দেশগুলি সন্ধান করুন যা সমস্যাগুলির সাথে বিরোধপূর্ণ নয় যেগুলি শিল্প বৃহত্তর কম্পিউটিং শক্তি, সমৃদ্ধ ডেটা এবং টিমওয়ার্কের সুবিধা দিয়ে সমাধান করতে পারে। এখনও কিছু খুব মৌলিক সমস্যা রয়েছে যা একাডেমিয়া অন্বেষণ চালিয়ে যেতে পারে, এবং এমনকি যদি আপনার কাছে আরও চিপ থাকে, আপনি দুর্দান্ত অগ্রগতি করতে পারেন।
প্রথমত, আন্তঃবিভাগীয় AI আমার জন্য একাডেমিয়ায় একটি অত্যন্ত উত্তেজনাপূর্ণ ক্ষেত্র, বিশেষ করে বৈজ্ঞানিক আবিষ্কারের ক্ষেত্রে। AI এর সাথে ছেদ করতে পারে এমন অনেক শৃঙ্খলা রয়েছে। আমি মনে করি এটি এমন একটি এলাকা যা গভীরভাবে বিকাশ করা যেতে পারে। অন্যদিকে, তত্ত্বের পরিপ্রেক্ষিতে, আমি এটি খুব আকর্ষণীয় বলে মনে করি যে AI এর ক্ষমতা সম্পূর্ণরূপে তত্ত্বকে ছাড়িয়ে গেছে। আমরা জানি না কীভাবে এটি করতে হয়, ব্যাখ্যা করার ক্ষমতার অভাব রয়েছে এবং কীভাবে কার্যকারণ সম্পর্ক প্রকাশ করতে হয় তা আমরা জানি না। মডেল সম্পর্কে আমাদের বোঝার মধ্যে এখনও অনেক অজানা রয়েছে এবং ভবিষ্যতে এই ক্ষেত্রের উন্নয়নকে আরও প্রচার করার জন্য এখনও অনেক দিকনির্দেশ রয়েছে। কম্পিউটার দৃষ্টি ক্ষেত্রে, এখনও কিছু অমীমাংসিত সমস্যা আছে. এছাড়াও, ছোট ডেটাও সম্ভাবনায় পূর্ণ একটি খুব আকর্ষণীয় ক্ষেত্র।
প্রশ্নকর্তা 2: আপনাকে ধন্যবাদ, অধ্যাপক ফেই-ফেই লি, এবং ইয়েল বিশ্ববিদ্যালয় থেকে সম্মানসূচক ডক্টরেট প্রাপ্তির জন্য আবারও অভিনন্দন। আমি এক মাস আগে ব্যক্তিগতভাবে এই মুহূর্তটির সাক্ষী হয়ে সম্মানিত হয়েছিলাম। আমার প্রশ্ন হল, আপনার দৃষ্টিকোণ থেকে, AGI একটি ইউনিফাইড, একক মডেল বা "মডেল-এজেন্ট" সিস্টেম হিসাবে আবির্ভূত হওয়ার সম্ভাবনা বেশি?
Fei-Fei Li: আপনি যে প্রশ্নটি করেছেন তার জন্য দুটি সংজ্ঞা প্রস্তাব করা হয়েছে। একটি সংজ্ঞা আরও তাত্ত্বিক, AGI-কে বুদ্ধিমত্তা হিসাবে সংজ্ঞায়িত করে যা কোনো ধরনের IQ পরীক্ষার দ্বারা পরিমাপ করা হয়, এবং প্রশ্নের অন্য অংশটি আরও বাস্তবসম্মত, একজন বুদ্ধিমান এজেন্ট কী কাজগুলি সম্পাদন করতে পারে তার উপর ফোকাস করে। সত্যি কথা বলতে, আমি AGI এর সংজ্ঞা সম্পর্কে একটু বিভ্রান্ত।
এর কারণ হল, 1956 সালে ডার্টমাউথ সম্মেলনে, জন ম্যাকার্থি এবং মারভিন মিনস্কি সহ কৃত্রিম বুদ্ধিমত্তার প্রতিষ্ঠাতারা "চিন্তা" করতে পারে এমন মেশিনগুলির সমস্যা সমাধান করতে চেয়েছিলেন, যা আসলে তাদের আগে অ্যালান টুরিং দ্বারা প্রস্তাবিত হয়েছিল। অতএব, এই প্রস্তাবটি একটি সংকীর্ণ কৃত্রিম বুদ্ধিমত্তা সমস্যা নয়, কিন্তু বুদ্ধিমত্তা সম্পর্কে একটি বিস্তৃত প্রস্তাব। সুতরাং, আমি নিশ্চিত নই কিভাবে নতুন শব্দ "AGI" থেকে কৃত্রিম বুদ্ধিমত্তার এই প্রতিষ্ঠাতা সমস্যাটিকে আলাদা করা যায়।
আমার কাছে, এজিআই এবং এআই একই জিনিস, তবে আমি বুঝতে পারি যে শিল্পটি এজিআইকে এআইয়ের বাইরে কিছু হিসাবে দেখছে। আমি এই বোঝার সাথে লড়াই করছি কারণ এজিআই কী এবং এটি এআই থেকে কীভাবে আলাদা তা আমি ঠিক জানি না। যদি আমরা বলি যে আজকের "এজিআই-এর মতো" সিস্টেমগুলি 1970, 1980 এবং 1990 এর দশকের সংকীর্ণ এআই সিস্টেমগুলির চেয়ে নির্দিষ্ট কাজগুলিতে আরও ভাল পারফর্ম করে, আমি মনে করি এটি সঠিক, এবং এটি ক্ষেত্রের কেবল একটি প্রাকৃতিক অগ্রগতি। তবে মৌলিকভাবে, আমি মনে করি কৃত্রিম বুদ্ধিমত্তার সারমর্ম হ'ল এমন মেশিন তৈরি করা যা মানুষের মতো জিনিস ভাবতে এবং করতে পারে বা মানুষের চেয়ে স্মার্টও করতে পারে। সুতরাং, আমি এজিআইকে কীভাবে সংজ্ঞায়িত করতে জানি না এবং যেহেতু আমি এটি সংজ্ঞায়িত করতে পারি না, তাই এটি একটি একক সিস্টেম কিনা তা আমি বলতে পারি না।
যদি আমরা এটি মস্তিষ্কের দৃষ্টিকোণ থেকে দেখি তবে এটি সম্পূর্ণ, এবং আমরা এটিকে একটি একক সিস্টেম বলতে পারি, তবে এর কার্যকারিতাগুলি বৈচিত্র্যময়, এবং মস্তিষ্কে ব্রোকার অঞ্চলও রয়েছে যা ভাষার জন্য দায়ী, দৃষ্টিভঙ্গির জন্য ভিজ্যুয়াল কর্টেক্স, চলাচলের জন্য মোটর কর্টেক্স ইত্যাদি তাই আমি কীভাবে এই প্রশ্নের উত্তর দিতে পারি তা জানি না।
প্রশ্নকারী 3: হাই, আমার নাম ইয়াসনা। প্রথমত, আমি আপনাকে ধন্যবাদ বলতে চাই। কোনও মহিলা এই ক্ষেত্রে শীর্ষস্থানীয় ভূমিকা নিতে দেখে সত্যিই অনুপ্রেরণামূলক। একজন গবেষক, শিক্ষিকা এবং উদ্যোক্তা হিসাবে আমি জিজ্ঞাসা করতে চাই, আজকের দ্রুত বিকাশকারী কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে, আপনি কী ধরণের লোককে স্নাতক ডিগ্রি অর্জন করা উচিত বলে মনে করেন?
ফি-ফেই লি: এটি একটি দুর্দান্ত প্রশ্ন, এমনকি বাবা-মাও আমাকে এটি জিজ্ঞাসা করেছেন। স্নাতক স্কুল তীব্র কৌতূহলের চার থেকে পাঁচ বছরের সময়কাল।
আপনি কৌতূহল দ্বারা চালিত, এবং কৌতূহল এতটাই শক্তিশালী যে এখানে এর চেয়ে ভাল আর কোনও জায়গা নেই। এটি একটি স্টার্টআপ থেকে আলাদা কারণ একটি স্টার্টআপে, আপনি একা কৌতূহল দ্বারা চালিত হতে পারবেন না। আপনাকে সাবধানতা অবলম্বন করতে হবে যে একটি স্টার্টআপ কেবল কৌতূহল দ্বারা চালিত হয় না এবং বিনিয়োগকারীরা আপনার প্রতি অসন্তুষ্ট হবে। এটি ব্যবসায়ের লক্ষ্য অর্জনে আরও বেশি মনোনিবেশিত, এবং যদিও কৌতূহলের একটি উপাদান রয়েছে তবে এটি সম্পূর্ণ কৌতূহল-চালিত নয়। এবং স্নাতক শিক্ষার্থীদের জন্য, সমস্যাগুলি সমাধান করার কৌতূহল বা প্রশ্ন জিজ্ঞাসা করার ক্ষমতা এত গুরুত্বপূর্ণ, এবং আমি মনে করি যারা এই দৃ cours ় কৌতূহল নিয়ে স্নাতক বিদ্যালয়ে যান তারা সত্যই সেই চার বা পাঁচ বছর উপভোগ করবেন এবং এমনকি বাইরের বিশ্ব দ্রুত বিকাশ করলেও আপনি এখনও সন্তুষ্ট বোধ করবেন কারণ আপনি আপনার কৌতূহল অনুসরণ করেছেন।
প্রশ্নকারী 4: প্রথমত, আমি আপনার সাথে আপনার মতামত ভাগ করে নেওয়ার জন্য সময় দেওয়ার জন্য আপনাকে ধন্যবাদ জানাতে চাই। আপনি উল্লেখ করেছেন যে ওপেন সোর্স চিত্র বুদ্ধিমত্তার বিকাশে গুরুত্বপূর্ণ ভূমিকা পালন করেছে। এখন বৃহত ভাষার মডেলগুলির মুক্তি এবং বিকাশের সাথে আমরা বিভিন্ন সংস্থাগুলি ওপেন সোর্সের ক্ষেত্রে বিভিন্ন কৌশল অবলম্বন করতে দেখি। কিছু সংস্থা সম্পূর্ণরূপে বন্ধ উত্স, কিছু সংস্থাগুলি তাদের সম্পূর্ণ গবেষণা কাঠামো সম্পূর্ণরূপে উন্মুক্ত উত্স এবং কিছু সংস্থাগুলি একটি আপস পদ্ধতি গ্রহণ করে, ওপেন সোর্স মডেলের ওজন বা সীমাবদ্ধ লাইসেন্সগুলি গ্রহণ করে ইত্যাদি তাই আমি জিজ্ঞাসা করতে চাই, এই বিভিন্ন ওপেন সোর্স পদ্ধতির সম্পর্কে আপনি কী ভাবেন? আপনি কি মনে করেন সঠিক পদ্ধতির? এআই সংস্থা হিসাবে ওপেন সোর্স কীভাবে কাজ করা উচিত?
ফি-ফেই লি: আমি মনে করি যখন বাস্তুতন্ত্রের ওপেন সোর্সের বিভিন্ন উপায় থাকে তখন পুরো পরিবেশটি স্বাস্থ্যকর। এটি অবশ্যই ওপেন সোর্স বা বদ্ধ উত্স হতে হবে কিনা সে সম্পর্কে আমি দৃ ama ় নই। এটি কোম্পানির ব্যবসায়িক কৌশলের উপর নির্ভর করে। উদাহরণস্বরূপ, মেটা (পূর্বে ফেসবুক) কেন এটি ওপেন সোর্সটি বেছে নিয়েছে সে সম্পর্কে খুব স্পষ্ট। তাদের বর্তমান ব্যবসায়ের মডেল বিক্রয় মডেলগুলির মাধ্যমে লাভ করা নয়, তবে এই মডেলগুলি ব্যবহার করে বাস্তুতন্ত্রের বিকাশ করা এবং আরও বেশি লোককে তাদের প্ল্যাটফর্মটি ব্যবহার করতে আকর্ষণ করা। সুতরাং ওপেন সোর্স তাদের জন্য অনেক অর্থবোধ করে। এবং এই প্রযুক্তিগুলি থেকে সত্যই অর্থোপার্জনকারী কিছু অন্যান্য সংস্থার জন্য, আপনি ওপেন সোর্স এবং বদ্ধ উত্সের সংমিশ্রণ বিবেচনা করতে পারেন, স্তরগুলিতে পরিচালনা করতে পারেন। সুতরাং আমি এই পদ্ধতির জন্য উন্মুক্ত।

▲ মেটার লামা ওপেন সোর্স মডেলটি আলিঙ্গন ফেস ওপেন সোর্স বড় ভাষা মডেল র্যাঙ্কিংয়ে রয়েছে
উচ্চতর স্তরে, আমি মনে করি ওপেন সোর্সটি সুরক্ষিত করা উচিত, এটি পাবলিক সেক্টরে যেমন একাডেমিয়া বা বেসরকারী খাতের মধ্যে রয়েছে, যদি ওপেন সোর্স প্রচেষ্টা থাকে তবে এটি অত্যন্ত গুরুত্বপূর্ণ। এটি স্টার্টআপ ইকোসিস্টেমের জন্য গুরুত্বপূর্ণ এবং এটি সরকারী খাতের কাছে অত্যন্ত গুরুত্বপূর্ণ। আমি মনে করি এই প্রচেষ্টাগুলি সুরক্ষিত করা উচিত এবং উপেক্ষা করা উচিত নয়।
প্রশ্নকারী 5: হ্যালো, আমার নাম কার্ল, আমি এস্তোনিয়া থেকে এসেছি এবং ডেটা সম্পর্কে আমার একটি প্রশ্ন আছে। আপনি ডেটা-চালিত পদ্ধতির থেকে মেশিন লার্নিংয়ের পরিবর্তনের কথা উল্লেখ করেছেন, বিশেষত ইমেজেনেটে করা অগ্রগতি এবং এখন আপনি বিশ্ব মডেলগুলি অধ্যয়ন করছেন এবং আপনি উল্লেখ করেছেন যে আমাদের কাছে আমাদের মস্তিষ্কে, ইন্টারনেটে বিদ্যমান নেই এমন স্থানিক ডেটাগুলির অভাব রয়েছে। আপনি এই সমস্যাটি কীভাবে সমাধান করবেন? আপনার গবেষণার দিকটি কী? আপনি কি বাস্তব বিশ্ব থেকে ডেটা সংগ্রহ করছেন, বা সিন্থেটিক ডেটা তৈরি করছেন? আপনি কি সিন্থেটিক ডেটা বিশ্বাস করেন? বা আপনি কি traditional তিহ্যবাহী পূর্ববর্তী জ্ঞানে আরও বিশ্বাস করেন? ধন্যবাদ
ফি-ফেই লি: আপনার ওয়ার্ল্ড ল্যাবগুলিতে আমার সাথে যোগ দেওয়া উচিত এবং আমি আপনাকে বলব। একটি সংস্থা হিসাবে, আমি খুব বেশি ভাগ করতে পারি না, তবে আমি মনে করি যে আমরা একটি হাইব্রিড পদ্ধতির গ্রহণ করি তা স্বীকার করা গুরুত্বপূর্ণ। প্রচুর ডেটা থাকা সত্যিই গুরুত্বপূর্ণ, তবে উচ্চমানের ডেটা থাকা সমানভাবে গুরুত্বপূর্ণ। দিনের শেষে, আপনি যদি ডেটার মানের দিকে মনোযোগ না দেন তবে শেষ ফলাফলটি আবর্জনা, আবর্জনা আউট।
প্রশ্নকারী 6: হ্যালো, ডাঃ ফি-ফেই লি, আমার নাম অ্যানি, আমাদের সাথে কথা বলার জন্য আপনাকে অনেক ধন্যবাদ। আপনার বই, দ্য ওয়ার্ল্ডে আমি দেখেছি যে আপনি স্টেম ফিল্ডসে অভিবাসী মেয়ে এবং মহিলা হওয়ার চ্যালেঞ্জগুলি সম্পর্কে কথা বলেছেন। আমি জানতে চাই আপনি যদি কখনও অনুভব করেছেন যে আপনি কর্মক্ষেত্রে সংখ্যালঘু? যদি তা হয় তবে আপনি কীভাবে এই দ্বিধাটি কাটিয়ে উঠলেন বা অন্যকে বোঝাতে পেরেছেন?

ফি-ফেই লি: আপনার প্রশ্নের জন্য আপনাকে ধন্যবাদ। আমি উত্তর দেওয়ার ক্ষেত্রে সাবধানতা অবলম্বন করব কারণ আমাদের প্রত্যেকের আলাদা ব্যাকগ্রাউন্ড রয়েছে এবং আমাদের প্রত্যেকেরই খুব অনন্য অভিজ্ঞতা রয়েছে। আপনি জানেন, এটি প্রায় কিছু যায় আসে না। আমাদের সকলের এমন মুহুর্ত রয়েছে যখন আমাদের মনে হয় আমরা সংখ্যালঘুতে বা ঘরের একমাত্র ব্যক্তি। সুতরাং, অবশ্যই, আমি এই অনুভূতিগুলি পেয়েছি।
কখনও কখনও এটি আমি কে সে সম্পর্কে, কখনও কখনও এটি আমার মনে হয়, কখনও কখনও এটি আমি যে পোশাক পরেছি তার রঙ, সবসময় একটি কারণ থাকে। তবে আমি আপনাকে সে বিষয়ে উত্সাহিত করতে চাই না। সম্ভবত এটি কারণ আমি অল্প বয়সে এই দেশে এসেছি এবং আমার কিছু অভিজ্ঞতা ছিল। আমি স্বীকার করেছি যে আমি একজন অভিবাসী মহিলা। আমি এটিকে খুব বেশি গুরুত্ব সহকারে না নেওয়ার ক্ষমতা প্রায় বিকাশ করেছি। আমি এখানে আছি, ঠিক আপনার প্রত্যেকের মতো। আমি এখানে শিখতে, করতে, জিনিস তৈরি করতে এসেছি।
আমি আপনার প্রত্যেককে সত্যই বলতে চাই, আপনি কিছু শুরু করতে চলেছেন, বা আপনি ইতিমধ্যে কিছু করার প্রক্রিয়াতে রয়েছেন, আপনার দুর্বলতা বা বিভ্রান্তির মুহুর্তগুলি থাকবে, আমি প্রতিদিন এটি অনুভব করি, বিশেষত উদ্যোক্তা জীবনে। কখনও কখনও আমি মনে করি, ওহে আমার, শ্বর, আমি জানি না আমি কী করছি। এটি সম্পর্কে চিন্তা করবেন না, কেবল এটি করার দিকে মনোনিবেশ করুন। গ্রেডিয়েন্ট বংশোদ্ভূতের মতো, সর্বোত্তম সমাধানের দিকে ধাপে ধাপে সরান।
#iFanr: iFanr (WeChat ID: ifanr) এর অফিসিয়াল WeChat পাবলিক অ্যাকাউন্ট অনুসরণ করতে স্বাগতম, যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ বিষয়বস্তু আপনার কাছে উপস্থাপন করা হবে।
