আজ থেকে, লি ফেইফেইয়ের এআই “বিশ্ব-সৃষ্টির হাতিয়ার” সকলের জন্য উপলব্ধ, যা আপনাকে মাত্র একটি বাক্যে একটি 3D বিশ্ব তৈরি করতে দেয় বাস্তব-বিশ্ব পরীক্ষা অন্তর্ভুক্ত।

মার্বেল, অবশেষে এসে গেল।

ঠিকই বলেছেন, এটি 3D ওয়ার্ল্ড জেনারেশন মডেল যা দুই মাস আগে AI কমিউনিটিতে ভাইরাল হয়েছিল। Fei-Fei Li-এর অধীনে ওয়ার্ল্ড ল্যাবস আনুষ্ঠানিকভাবে ঘোষণা করেছে যে এটি সকল ব্যবহারকারীর জন্য উন্মুক্ত, এবং একসাথে বেশ কিছু নতুন বৈশিষ্ট্যও প্রকাশ করেছে।

  • মাল্টিমোডাল জেনারেশন: বিভিন্ন ইনপুট পদ্ধতি যেমন টেক্সট, সিঙ্গেল ইমেজ, মাল্টিপল ইমেজ/ভিডিও এবং 3D লেআউট সমর্থন করে।
  • এআই-নেটিভ এডিটিং: জেনারেটেড 3D ওয়ার্ল্ডে আংশিক প্রতিস্থাপন এবং কাঠামোগত সমন্বয় সক্ষম করে।
  • বিশ্ব সম্প্রসারণ এবং সমন্বয়: স্বয়ংক্রিয়ভাবে প্রান্ত অঞ্চলগুলি পূরণ করে এবং একাধিক দৃশ্য একসাথে সেলাই করে।
  • ছেনি: ব্লক দিয়ে একটি কাঠামো তৈরি করুন এবং AI-কে স্বয়ংক্রিয়ভাবে স্টাইলের বিবরণ পূরণ করতে দিন।
  • সকল ফরম্যাটে রপ্তানি করুন: গাউসিয়ান পয়েন্ট ক্লাউড, ত্রিভুজাকার জাল এবং ভিডিও সহ একাধিক ফরম্যাট সমর্থন করে, যা সরাসরি গেম ইঞ্জিনে আমদানি করা যেতে পারে।

প্রবেশের ক্ষেত্রে বাধা এখন বেশ কম। কেবল একটি বর্ণনামূলক লেখা ইনপুট করুন অথবা একটি ছবি আপলোড করুন, এবং AI একটি সম্পূর্ণ 3D জগৎ তৈরি করতে পারে। এই ধরণের শক্তিশালী কার্যকারিতার সাথে, ঐতিহ্যবাহী 3D মডেলারদের তাদের ক্যারিয়ারের পথগুলি পুনর্বিবেচনা করতে হতে পারে…

এটি চেষ্টা করার জন্য এখানে একটি লিঙ্ক রয়েছে: https://marble.worldlabs.ai/

লি ফেইফেই তার চূড়ান্ত পদক্ষেপটি প্রকাশ করেন: একটি বাক্য দিয়ে একটি সম্পূর্ণ ত্রিমাত্রিক জগৎ তৈরি করেন।

টেক্সট জেনারেশনে মার্বেল কতটা ভালো পারফর্ম করে তা দেখার জন্য একটি কেস স্টাডি দিয়ে শুরু করা যাক।

▲ টেক্সট প্রম্পট: একসময়ের জনবহুল হবিট রান্নাঘর, বোনা ঝুড়ি এবং তামার কেটলি দিয়ে ভরা, শান্ত, ফ্যাকাশে নীল সূর্যের আলোয় স্নান করা।

ছবিতে যেমন দেখানো হয়েছে, কাঠের আসবাবপত্র, তামার বাসনপত্র এবং আলো ও ছায়ার বিবরণ সহ একটি সম্পূর্ণ 3D রান্নাঘরের দৃশ্য আমাদের সামনে উপস্থাপন করা হয়েছে।

এখানে এমন কিছু আসে যা বোঝা আরও কঠিন। এই বিমূর্ত বর্ণনাটি একবার দেখুন:

▲টেক্সট প্রম্পট: একটি স্পেস স্টেশন রান্নাঘর যা মধ্যযুগীয় রেস্তোরাঁর নান্দনিকতার সাথে অরবিটাল প্রযুক্তির মিশ্রণ ঘটায়, যেখানে চেকারবোর্ড মেঝে এবং স্টেইনলেস স্টিলের ফিক্সচার রয়েছে, যা নরম, অ্যাকোয়ামেরিন আলোর নিচে ঝলমল করে।

এমনকি যখন এই সারগ্রাহী শৈলীর মুখোমুখি হয় যা স্থান এবং সময়কে অতিক্রম করে, তখনও কৃত্রিম বুদ্ধিমত্তা (এআই) এটিকে সঠিকভাবে উপলব্ধি করতে পারে।

আমি নিজেও একবার পরীক্ষা করেছিলাম। বনের দৃশ্য তৈরি করার চেষ্টা করার পর, আমি দেখতে পেলাম যে যদিও শ্যাওলার গঠন কিছুটা পুনরাবৃত্তিমূলক ছিল, গাছের গুঁড়ির গঠন স্পষ্ট এবং বিস্তারিত ছিল, এবং বনে যে কুয়াশা দেখা দিয়েছিল এবং অদৃশ্য হয়ে গিয়েছিল তা উপযুক্ত পরিবেশ তৈরি করেছিল।

প্লেইন টেক্সট ছাড়াও, মার্বেল আরও বিস্তৃত সৃষ্টি পদ্ধতি সমর্থন করে:

  • একক চিত্র তৈরি: একটি চিত্র ইনপুট করুন, এবং AI স্বয়ংক্রিয়ভাবে একটি 360-ডিগ্রি প্যানোরামিক দৃশ্য সম্পন্ন করবে।
  • মাল্টি-ইমেজ/ভিডিও জেনারেশন: বিভিন্ন কোণ থেকে বেশ কয়েকটি ছবি তুলুন, এবং AI স্বয়ংক্রিয়ভাবে সেগুলিকে একসাথে সেলাই করে একটি সম্পূর্ণ 3D স্পেস তৈরি করবে।
  • 3D লেআউট জেনারেশন: কাঠামোটি মৌলিক জ্যামিতি ব্যবহার করে তৈরি করা হয়েছে এবং AI সমস্ত বিবরণ পূরণ করার জন্য দায়ী।

আমি সিঙ্গেল-ইমেজ জেনারেশন ফাংশনটিও পরীক্ষা করেছিলাম। একটি সাধারণ ঘরের ছবি আপলোড করার পর, আমি প্রায় ৬ মিনিটের মধ্যে সমাপ্ত পণ্যটি পেয়েছিলাম। ঘনিষ্ঠভাবে পরিদর্শন করার পর, আমি দেখতে পেলাম যে, প্রিভিউ সংস্করণের মতো, প্রান্ত বিকৃতির সমস্যাটি এখনও বেশ গুরুতর। আমি আশা করি ভবিষ্যতে এটি অপ্টিমাইজ করা যাবে। তবে, একটি প্রাথমিক পণ্য হিসাবে, এর বর্তমান সমাপ্তির স্তর ইতিমধ্যেই বেশ চিত্তাকর্ষক।

নমনীয়তার দিক থেকে, এই মাল্টিমোডাল ইনপুট ডিজাইন ধারণাটি বাজারে থাকা বেশিরভাগ অনুরূপ সরঞ্জামকে ছাড়িয়ে গেছে।

জেনারেশন কেবল প্রথম ধাপ; পরবর্তী সম্পাদনা ক্ষমতা আরও উল্লেখযোগ্য।

মার্বেল হল শিল্পের প্রথম মডেল যা স্থানীয়ভাবে AI সম্পাদনা সরঞ্জামগুলিকে একীভূত করে, যা উৎপন্ন জগতের গভীর পরিবর্তনের অনুমতি দেয়। উদাহরণস্বরূপ, আংশিক প্রতিস্থাপনে, ট্র্যাশ ক্যানটি সরাতে চান? একটি বাক্যেই কাজটি করে; AI স্বয়ংক্রিয়ভাবে দৃশ্য এবং আলোর পরিবর্তনগুলি পরিচালনা করবে।

যদি আপনি কাঠামোর আমূল পরিবর্তন করতে চান, যেমন রেস্তোরাঁর পিছনের দেয়ালকে মঞ্চে রূপান্তরিত করা অথবা মঞ্চের দিকে মুখ করে নিচু স্টুল দিয়ে টেবিলগুলি প্রতিস্থাপন করা, তাহলেও এটি সহজেই অর্জন করা যেতে পারে। অন্য কথায়, এই ধরণের সম্পাদনা সহজ চিত্র প্রক্রিয়াকরণ নয়, বরং 3D স্থানিক কাঠামোর প্রকৃত বোঝার উপর ভিত্তি করে বুদ্ধিমান সমন্বয়।

এছাড়াও, "ওয়ার্ল্ড এক্সপ্যানশন" বৈশিষ্ট্যটিও সমানভাবে শক্তিশালী। জেনারেট করা দৃশ্যের প্রান্তগুলি কি একটু ঝাপসা? "এক্সপ্যান্ড" বোতামে ক্লিক করুন, এবং AI স্বয়ংক্রিয়ভাবে সেই জায়গাটি পূরণ করার জন্য আরও সামগ্রী তৈরি করবে। আরও বেশি জায়গা চান? একাধিক বিশ্ব একসাথে সেলাই করতে "কম্বিনেশন মোড" ব্যবহার করুন।

আনুষ্ঠানিক প্রদর্শনীতে একটি সম্পূর্ণ ট্রেনের বগি একত্রিত দেখানো হয়েছিল। এই টুলচেইন ব্যবহার করে সৃজনশীল ধারণা থেকে সমাপ্ত পণ্য সরবরাহের সময়কাল উল্লেখযোগ্যভাবে সংক্ষিপ্ত করা হয়েছে।

যদি জেনারেশন এবং এডিটিং ফাংশনগুলি কিছুটা প্রত্যাশিত ছিল, তাহলে চিসেল এমন একটি হাতিয়ার যা গেম-চেঞ্জারের মতো মনে হয়।

সহজ কথায়, চিসেল "কাঠামো" এবং "শৈলী" সম্পূর্ণরূপে পৃথক করেছে:

  • ধাপ ১: কিউব এবং প্লেনের মতো মৌলিক জ্যামিতিক আকার ব্যবহার করে একটি স্থানিক কাঠামো তৈরি করুন (যেমন লেগো দিয়ে খেলা)।
  • ধাপ ২: ভিজ্যুয়াল স্টাইল বর্ণনা করে একটি লেখা লিখুন (যেমন, "আধুনিক শিল্প জাদুঘর" বা "স্ক্যান্ডিনেভিয়ান-শৈলীর শয়নকক্ষ")।
  • ধাপ ৩: এআই স্বয়ংক্রিয়ভাবে ফ্রেমওয়ার্কটিকে একটি সম্পূর্ণ ত্রিমাত্রিক জগতে পূর্ণ করে।

আরও চিত্তাকর্ষক হল একই ফ্রেমওয়ার্ক কিন্তু ভিন্ন টেক্সট প্রম্পট ব্যবহার করে সম্পূর্ণ ভিন্ন দৃশ্য তৈরি করার ক্ষমতা। উদাহরণস্বরূপ, ফ্রেমওয়ার্ক একই রাখলে কিন্তু প্রম্পটটি "মিউজিয়াম অফ মডার্ন আর্ট" এ পরিবর্তন করলে বিমূর্ত চিত্রকর্মের সাথে একটি ন্যূনতম সাদা দেয়াল তৈরি হবে।

▲ কাঠের মেঝে সহ একটি সুন্দর আধুনিক শিল্প জাদুঘর, যেখানে রঙিন চিত্রকর্ম এবং মনোমুগ্ধকর ভাস্কর্য প্রদর্শিত হচ্ছে।

বিকল্পভাবে, কাঠামোটি একই থাকে, তবে প্রম্পটটি "নর্ডিক বেডরুম" এ পরিবর্তিত হয়, যা একটি উষ্ণ কাঠের আসবাবপত্র এবং হিমবাহের জানালার দৃশ্য উপস্থাপন করে।

▲ একটি শান্ত স্ক্যান্ডিনেভিয়ান-শৈলীর শোবার ঘর, জানালা থেকে অত্যাশ্চর্য হিমবাহের দৃশ্য দেখা যায়।

এই পদ্ধতিটি ফ্রন্ট-এন্ড ডেভেলপমেন্টে HTML দিয়ে কাঠামো এবং CSS দিয়ে স্টাইল সংজ্ঞায়িত করার যুক্তির সাথে কিছুটা মিল, তবে 3D মডেলিংয়ের ক্ষেত্রে এটি ব্যতিক্রমীভাবে কার্যকর। ওয়ার্ল্ড ল্যাবসের সহ-প্রতিষ্ঠাতা জাস্টিন জনসন একটি সাক্ষাৎকারে ডেমোনস্ট্রেশনে বলেছিলেন, "আমি সরাসরি সোফা প্রতিনিধিত্বকারী 3D ব্লকটি নির্বাচন করতে পারি এবং এটিকে অন্য স্থানে টেনে আনতে পারি।"

মার্বেলে, ঐতিহ্যবাহী মডেলিং সফ্টওয়্যারে দীর্ঘ সমন্বয়ের প্রয়োজন হয় এমন ক্রিয়াকলাপগুলি কেবল ব্লকগুলিকে টেনে আনা এবং ফেলে দেওয়ার বিষয়…

এই মুহূর্তে, মডেলাররা নিশ্চয়ই খুব জটিল বোধ করছেন।

তাহলে, আপনি কীভাবে তৈরি ত্রিমাত্রিক জগৎ ব্যবহার করবেন? মার্বেল তিনটি রপ্তানি বিকল্প অফার করে:

  • গাউসিয়ান স্প্ল্যাটস: সর্বোচ্চ বিশ্বস্ততার প্রতিনিধিত্ব, রিয়েল-টাইম রেন্ডারিংয়ের জন্য উপযুক্ত, এবং সরাসরি ব্রাউজারে চালানো যেতে পারে।
  • ত্রিভুজ জাল: নিম্ন-নির্ভুল সংঘর্ষ জাল এবং উচ্চ-নির্ভুল রেন্ডারিং জালে বিভক্ত, যা সরাসরি ইউনিটি এবং অবাস্তব ইঞ্জিনের মতো গেম ইঞ্জিনগুলিতে আমদানি করা যেতে পারে।
  • ভিডিও ফর্ম্যাট: পিক্সেল-স্তরের লেন্স নিয়ন্ত্রণ সমর্থন করে এবং AI দিয়ে "উন্নত" করা যেতে পারে – স্বয়ংক্রিয়ভাবে ধোঁয়া, আগুন এবং জল প্রবাহের মতো গতিশীল প্রভাব যুক্ত করে।

▲ মার্বেল উৎপন্ন বিশ্বকে গাউসিয়ান পয়েন্ট ক্লাউড বা ত্রিভুজাকার জাল মডেল হিসাবে রপ্তানি করতে পারে।

অফিসিয়াল প্রেস রিলিজের বেশিরভাগ ভিডিও সরাসরি মার্বেল রেন্ডারিং ব্যবহার করে তৈরি করা হয়েছে। এই সম্পূর্ণ টুলচেইনটি সংযুক্ত করার মাধ্যমে, ধারণা থেকে ব্যবহারযোগ্য সম্পদ পর্যন্ত প্রক্রিয়াটি অনেক সহজ করা হয়েছে।

▲ উন্নত ভিডিওটি চিত্রের শিল্পকর্মগুলি সরিয়ে দেয় এবং দৃশ্যে গতিশীল প্রভাব যোগ করে। চিমনির উপরে ধোঁয়া, ঝিকিমিকি করে জ্বলন্ত আগুন এবং প্রবাহিত জল লক্ষ্য করুন।

গেম ডেভেলপাররা মার্বেল ব্যবহার করে ব্যাকগ্রাউন্ড এনভায়রনমেন্ট তৈরি করতে পারে, ইঞ্জিনে এক্সপোর্ট করতে পারে এবং তারপর ইন্টারেক্টিভ লজিক যোগ করতে পারে; ফিল্ম এবং টেলিভিশন দলগুলি দ্রুত দৃশ্যের প্রিভিউ তৈরি করতে এবং শট পরিকল্পনা করতে এটি ব্যবহার করতে পারে; ভিআর কন্টেন্ট নির্মাতারা এমনকি অভিজ্ঞতার জন্য জেনারেটেড ওয়ার্ল্ডকে সরাসরি ভিশন প্রো বা কোয়েস্ট 3-এ রাখতে পারেন।

দুঃখের বিষয়, এত সময় পরে, আমরা আবার মেটাভার্সে ফিরে এসেছি।

মূল্য নির্ধারণের কৌশলের ক্ষেত্রে, মার্বেল একটি স্তরযুক্ত সাবস্ক্রিপশন মডেল গ্রহণ করেছে:

  • বিনামূল্যের সংস্করণ: প্রতি মাসে ৭০০০ পয়েন্ট, সর্বোচ্চ ৪টি বিশ্ব তৈরি করে, টেক্সট/ছবি/প্যানোরামিক ইনপুট সমর্থন করে। প্রাথমিক ব্যবহারকারীদের জন্য উপযুক্ত, তবে উন্নত বৈশিষ্ট্যগুলি লক করা আছে।
  • স্ট্যান্ডার্ড সংস্করণ ($২০/মাস): প্রতি মাসে ২০,০০০ ক্রেডিট, ১২টি ওয়ার্ল্ড, মাল্টি-ইমেজ/ভিডিও ইনপুট, চিসেল মোড এবং মৌলিক রপ্তানি কার্যকারিতা আনলক করে।
  • প্রো ভার্সন ($৩৫/মাস, প্রথম মাসের জন্য $১): ৪০,০০০ ক্রেডিট, ২৫টি ওয়ার্ল্ড, দৃশ্য সম্প্রসারণ, ভিডিও বর্ধন, উচ্চ-রেজোলিউশনের মেশ এক্সপোর্ট সমর্থন করে এবং একটি বাণিজ্যিক লাইসেন্সের সাথে আসে।
  • ফ্ল্যাগশিপ সংস্করণ ($95/মাস): 120,000 ক্রেডিট, 75টি বিশ্ব, সম্পূর্ণ কার্যকারিতা আনলক করা।

এটা স্পষ্ট যে বিনামূল্যের সংস্করণটিতে প্রবেশের ক্ষেত্রে বাধা কম, যা বিপুল সংখ্যক ব্যবহারকারীকে এটি ব্যবহার করার জন্য আকৃষ্ট করে। তবে, যদি আপনি এটি উৎপাদন পরিবেশে ব্যবহার করতে চান, তাহলে আপনাকে মূলত পেশাদার সংস্করণটি বেছে নিতে হবে। প্রথম মাসের জন্য $1 এর সীমিত সময়ের অফারটিও খুবই লোভনীয়, স্পষ্টতই আপনাকে বোর্ডে যোগদান এবং এটি সরাসরি অভিজ্ঞতা অর্জনের জন্য ডিজাইন করা হয়েছে।

মার্বেলের মুক্তি অত্যন্ত মেরুকৃত প্রতিক্রিয়ার জন্ম দেয়।

ওয়াই কম্বিনেটরের সিইও গ্যারি ট্যান টুইটারে বলেছেন: "ফেইফেই লি একজন কিংবদন্তি ব্যক্তিত্ব, এবং এই মুক্তি তাৎপর্যপূর্ণ।" কিছু স্বাধীন গেম ডেভেলপার এবং ভিআর নির্মাতারাও সোশ্যাল মিডিয়ায় তাদের মতামত প্রকাশ করেছেন, বিশ্বাস করে যে মার্বেল 3D কন্টেন্ট তৈরির জন্য প্রবেশের বাধা উল্লেখযোগ্যভাবে কমিয়ে এনেছে।

তবে, অনেক সন্দেহও দেখা দিয়েছে।

গেম ডেভেলপারস কনফারেন্স (GDC) এর সাম্প্রতিক এক জরিপে দেখা গেছে যে এক-তৃতীয়াংশ উত্তরদাতা বিশ্বাস করেন যে জেনারেটিভ এআই গেমিং শিল্পের উপর নেতিবাচক প্রভাব ফেলে, যা আগের বছরের তুলনায় ১২% বেশি। উদ্বেগগুলির মধ্যে রয়েছে: বৌদ্ধিক সম্পত্তি লঙ্ঘন, অতিরিক্ত শক্তি খরচ, এআই-উত্পাদিত সামগ্রীর মান হ্রাস এবং শিল্প ছাঁটাই।

ওয়্যার্ড পূর্বে রিপোর্ট করেছিল যে অ্যাক্টিভিশন ব্লিজার্ড সহ গেমিং কোম্পানিগুলি খরচ কমাতে এবং কর্মীদের টার্নওভার মোকাবেলায় AI ব্যবহার করছে।

এই প্রশ্নের উত্তরে, জাস্টিন জনসন বলেন, "মার্বেল গেম ডেভেলপমেন্ট প্রক্রিয়া সম্পূর্ণরূপে প্রতিস্থাপন করার উদ্দেশ্যে নয়, বরং আপনাকে এমন সম্পদ প্রদান করার জন্য যা আপনি সরাসরি ব্যবহার করতে পারেন।" তবে, প্রকৃত পরিস্থিতি তার দাবি অনুসারে হবে কিনা তা নির্ভর করে বাজার কীভাবে এটি ব্যবহার করে তার উপর।

লি ফেইফেইয়ের উত্তর তারকা: মহাকাশ গোয়েন্দা

মার্বেল মুক্তির মাত্র কয়েকদিন আগে, ফেই-ফেই লি তার দৃষ্টিভঙ্গি – স্থানিক বুদ্ধিমত্তা – সম্পর্কে একটি দীর্ঘ নিবন্ধ প্রকাশ করেছিলেন।

মূল দৃষ্টিভঙ্গিগুলি নিম্নরূপে সংক্ষেপিত করা যেতে পারে:

যদিও বৃহৎ ভাষা মডেলগুলির ভাষাগত ক্ষমতা শক্তিশালী, তারা ভৌত জগৎ সম্পর্কে প্রায় কিছুই জানে না। তারা দূরত্ব বা দিকনির্দেশনা সঠিকভাবে অনুমান করতে পারে না, তাদের মনে বস্তুগুলিকে "ঘোরাতে" পারে না এবং মৌলিক ভৌত আইনগুলির পূর্বাভাস দিতে পারে না।

বিপরীতে, মানুষের বুদ্ধিমত্তার মূল কথা ভাষা নয়, বরং ত্রিমাত্রিক স্থান বোঝার এবং পরিচালনা করার ক্ষমতা। গাড়ি চালানো থেকে শুরু করে চাবি ধরা, ভবন নকশা করা থেকে শুরু করে ডিএনএর দ্বৈত হেলিক্স কাঠামো আবিষ্কার করা – সবকিছুই স্থানিক বুদ্ধিমত্তার উপর নির্ভর করে।

লি ফেইফেইয়ের পরিকল্পনা অনুসারে, স্থানিক বুদ্ধিমত্তার প্রয়োগ তিনটি পর্যায়ে বিভক্ত হবে:

  • সাম্প্রতিক (সৃজনশীলতা): গেমস, সিনেমা, স্থাপত্য নকশা (মার্বেল বর্তমানে কাজ করছে)।
  • মধ্য-মেয়াদী (রোবোটিক্স): বাস্তব জগতে কাজ করতে শেখানোর জন্য সিমুলেটেড পরিবেশের মাধ্যমে রোবটদের প্রশিক্ষণ দেওয়া।
  • দীর্ঘমেয়াদী (বৈজ্ঞানিক সাফল্য): ওষুধ উন্নয়ন, উপকরণ বিজ্ঞান, চিকিৎসা রোগ নির্ণয়, নিমজ্জিত শিক্ষা

তার ব্লগ পোস্টে, ফেই-ফেই লি স্পষ্টভাবে বলেছেন: "স্থানিক বুদ্ধিমত্তা ছাড়া, সত্যিকারের বুদ্ধিমান মেশিনের আমাদের স্বপ্ন বাস্তবায়িত হতে পারে না।"

দৃষ্টিভঙ্গি বিশাল, কিন্তু বাস্তবতা আরও জটিল।

বিশ্ব মডেলিং অঙ্গনে প্রতিযোগিতাকারী একমাত্র কোম্পানি ওয়ার্ল্ড ল্যাবস নয়।

বর্তমানে, বাজারে আরও বেশ কিছু খেলোয়াড় রয়েছে: ডেকার্ট রিয়েল-টাইম জেনারেশনের উপর দৃষ্টি নিবদ্ধ করে একটি বিনামূল্যের ডেমো সংস্করণ চালু করেছে; ওডিসি একটি বিনামূল্যের ট্রায়ালও অফার করে, তবে এর কার্যকারিতা তুলনামূলকভাবে মৌলিক; গুগল জিনি এখনও গবেষণা এবং প্রিভিউ পর্যায়ে রয়েছে এবং এখনও বাণিজ্যিকীকরণ করা হয়নি।

তুলনা করলে, মার্বেলের মূল সুবিধাটি বেশ স্পষ্ট। এটি একটি স্থায়ী, সম্পূর্ণ ত্রিমাত্রিক জগৎ তৈরি করে, অন্বেষণের সময় তৈরি হওয়া মডেলের পরিবর্তে, যা বিকৃতি এবং অসঙ্গতির সমস্যাগুলি উল্লেখযোগ্যভাবে হ্রাস করতে পারে।

আরও গুরুত্বপূর্ণ বিষয় হল, মার্বেলই প্রথম বাণিজ্যিকীকরণ অর্জন করেছিল এবং এর বিনামূল্যের সংস্করণ এবং অর্থপ্রদানের সাবস্ক্রিপশন মডেল ইতিমধ্যেই রাজস্ব আয় করতে শুরু করেছে। এর টুলচেইনের সম্পূর্ণতার দিক থেকে, মার্বেলও সবচেয়ে ব্যাপক, প্রজন্ম থেকে সম্পাদনা এবং রপ্তানি পর্যন্ত সম্পূর্ণ প্রক্রিয়াটি নির্বিঘ্নে সম্পন্ন, যা একাধিক প্ল্যাটফর্মের মধ্যে স্যুইচ করার প্রয়োজনীয়তা দূর করে।

ইমেজনেট থেকে স্থানিক বুদ্ধিমত্তা পর্যন্ত, ফেই-ফেই লি-র শিক্ষাজীবন একই জিনিসের উপর কেন্দ্রীভূত: মেশিনগুলিকে দৃশ্যমান জগৎ বুঝতে সক্ষম করা। ইমেজনেট এআই-কে "এটি কী" তা শিখিয়েছে। মার্বেলের লক্ষ্য এআই-কে "এটি কোথায়, কীভাবে এটি চলে এবং কীভাবে এর সাথে যোগাযোগ করতে হয়" তা শেখানো।

প্রথমটি গভীর শিক্ষার বিপ্লবকে উৎসাহিত করেছিল। দ্বিতীয়টি কি পরবর্তী আদর্শ পরিবর্তনের সূত্রপাত করবে? এটা বলা খুব তাড়াতাড়ি। কিন্তু অন্তত আপাতত, এই দিকটি উত্তেজনাপূর্ণ এবং কঠোর উভয়ই বলে মনে হচ্ছে।

ওপেনএআই এলএলএম-এ তার অভিযান অব্যাহত রেখেছে, ফেই-ফেই লি স্থানিক বুদ্ধিমত্তার উপর বাজি ধরছে… প্রযুক্তিগত রুটে এই উচ্চ-বাজির ফলাফল আগামী কয়েক বছরের মধ্যে প্রকাশিত হতে পারে।

#iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট অনুসরণ করতে আপনাকে স্বাগতম: iFanr (WeChat ID: ifanr), যেখানে যত তাড়াতাড়ি সম্ভব আরও উত্তেজনাপূর্ণ কন্টেন্ট আপনার কাছে উপস্থাপন করা হবে।

ifanr | মূল লিঙ্ক · মন্তব্য দেখুন · সিনা ওয়েইবো