
মানুষ অর্ধ শতাব্দী ধরে টাইপরাইটার থেকে ওয়ার্ডে নথি স্থানান্তর করেছে এবং আরও বিশ বছর সেগুলোকে ক্লাউডে নিয়ে গেছে। তবুও, এআই যুগের সত্যিকারের সার্বজনীন ফরম্যাট হলো ২০০৪ সালে উদ্ভাবিত একটি প্লেইন টেক্সট ল্যাঙ্গুয়েজ—মার্কডাউন।
সম্প্রতি, ক্লড কোডের প্রকৌশলী থারিক একটি নতুন মতামত তুলে ধরেছেন। তিনি বলেছেন যে, তিনি আর মার্কডাউন ব্যবহার করেন না এবং এইচটিএমএল-ই ভবিষ্যৎ, যা ব্যাপক আলোচনার জন্ম দিয়েছে।

▲ ক্লড কোডের ইঞ্জিনিয়ার থারিকের লেখা মার্কডাউনকে এইচটিএমএল দিয়ে প্রতিস্থাপন বিষয়ক একটি আর্টিকেল, যা এক্স-এ ইতোমধ্যে লক্ষ লক্ষ ভিউ পেয়েছে।
প্রবন্ধটিতে তিনি প্রস্তাব করেছেন যে, মার্কডাউন টেক্সটের চেয়ে এইচটিএমএল আউটপুট একটি উন্নততর মাধ্যম। এআই-এর জন্য মার্কডাউন থেকে এইচটিএমএল-এ রূপান্তর প্রক্রিয়াটি মূলত ঝামেলাহীন, কিন্তু ব্যবহারকারীদের জন্য এটি ইউজার এক্সপেরিয়েন্সের ক্ষেত্রে একটি সুস্পষ্ট উন্নতি নিয়ে আসে।
কারপাথি আজ ভোরবেলা এইচটিএমএল (HTML) বিষয়ে তাঁর চিন্তাভাবনা জানিয়ে এই নিবন্ধটিও শেয়ার করেছেন।
তার মতে, বৃহৎ ভাষা মডেলের জন্য অডিও হলো সর্বোত্তম ইনপুট এবং ভিজ্যুয়াল হলো সর্বোত্তম আউটপুট। তার পরিকল্পিত পথের মধ্যে রয়েছে ইন্টারেক্টিভ অ্যানিমেশন, নিউরাল নেটওয়ার্ক দ্বারা সরাসরি তৈরি ভিডিও এবং পরিশেষে, মানুষ ও যন্ত্রের উপলব্ধির এক সত্যিকারের সংমিশ্রণ।

Vibe Coding এবং Agent-এর পণ্যগুলো মূলধারায় চলে আসায়, HTML এবং Markdown সম্ভবত বেশিরভাগ AI ব্যবহারকারীর কাছে অপরিচিত নয়।

▲ আপনি যখন DeepSeek-কে একটি ছোট গেম তৈরি করতে বলবেন, তখন এটি সরাসরি আপনাকে একটি কার্যকরী HTML কোড ফাইল সরবরাহ করবে।
আপনি যদি একটি ছোট গেম তৈরি করতে চান, তাহলে ChatGPT-কে বলতে পারেন, "Snake-এর জন্য আমার একটি এক-পৃষ্ঠার HTML ওয়েবপেজ তৈরি করে দাও।" ChatGPT কোডটিকে .html এক্সটেনশনসহ একটি ডকুমেন্টে প্যাকেজ করে দেবে। এটি খুলতে ডাবল-ক্লিক করলে, আপনি আপনার ব্রাউজারে একটি ইন্টারেক্টিভ, অ্যানিমেটেড এবং চমৎকারভাবে চিত্রিত ফলাফল দেখতে পাবেন।
এমনকি ব্রাউজারের ভেতরেও, যেকোনো ওয়েবপেজে, স্থানীয় ফাইল সংরক্ষণ করার জন্য CTRL+S চাপলে একটি .html ডকুমেন্ট তৈরি হয়।
যখন এআই-এর ওয়েবপেজের বিষয়বস্তু বের করার প্রয়োজন পড়ত, তখন থেকেই এমন অনেক টুল ছিল যা বিভিন্ন ফাইল টাইপের ডকুমেন্টকে সরাসরি মার্কডাউন ফরম্যাটে রূপান্তর করতে পারত।
তিনটি অফিস স্যুটের রাজা হিসেবে মাইক্রোসফট সাধারণত docx, pptx, এবং xlsx-এর মতো অফিস ফাইল ব্যবহার করে থাকে। এটি পূর্বে এই অফিস ডকুমেন্টগুলোকে মার্কডাউন ফরম্যাটে রূপান্তর করার জন্য একটি প্রজেক্ট ওপেন-সোর্স করেছিল, যা এখন গিটহাবে ১,২০,০০০-এরও বেশি স্টার অর্জন করেছে।

▲ প্রজেক্টের ঠিকানা: https://github.com/microsoft/markitdown
OpenClaw জনপ্রিয় হওয়ার পর, বিভিন্ন AGENT.md, SOUL.md, CLAUDE.md, MEMORY.md, এবং এমনকি Skills প্রোজেক্টের মধ্যেও প্রতিটি Skill একটি Skill.md ডকুমেন্ট হিসেবে তৈরি হয়েছে।
স্মৃতি সংরক্ষণ থেকে শুরু করে প্রম্পট এবং এজেন্ট নিয়ন্ত্রণ পর্যন্ত, সমৃদ্ধ প্রেক্ষাপট অর্জনের জন্য এআই-এর কাছে মার্কডাউন ফরম্যাট প্রায় একমাত্র পছন্দ হয়ে উঠেছে।

▲ ওপেনক্ল এআই চূড়ান্ত ওয়ার্কস্পেসটি তৈরি করতে একাধিক ভিন্ন মার্কডাউন ফাইল ব্যবহার করে | ছবিটি এআই দ্বারা তৈরি
পিডিএফ, ডক এবং পিপিটি, যেগুলো আমরা আমাদের দৈনন্দিন কাজে সবচেয়ে বেশি ব্যবহার করি, সেগুলোই এআই যুগে সবচেয়ে কম পছন্দের ফরম্যাটে পরিণত হয়েছে।
কিন্তু এখন এইচটিএমএল (HTML)-এর আবির্ভাবের কারণ কী? এটি কি এআই (AI) যুগের নতুন সার্বজনীন ভাষা হিসেবে মার্কডাউন (Markdown)-কে প্রতিস্থাপন করার সুযোগ পাবে?
কেন মার্কডাউন এআই-এর জন্য সবচেয়ে উপযুক্ত
চলুন প্রথমে আলোচনা করা যাক কেন মার্কডাউন এআই যুগের বহুল প্রচলিত শব্দে পরিণত হয়েছে। এআই-এর উত্তর হোক বা আমরা এআই-কে যে প্রেক্ষাপট দিই, তার বেশিরভাগই এখন মার্কডাউনের ওপর ভিত্তি করে তৈরি।
এই ভাষাটি ২০০৪ সালে তৈরি করা হয়েছিল, যা ২০০০-এর দশকের ইমেইলের টেক্সট ফরম্যাটিং রীতি—যেমন উল্লম্ব রেখা, ৮০-অক্ষরের লাইন ব্রেক এবং জোর দেওয়ার জন্য অ্যাস্টারিস্ক—থেকে অনুপ্রাণিত। এর লক্ষ্য ছিল "সাধারণ টেক্সটের মতো লেখা এবং এইচটিএমএল-এর মতো রেন্ডার করা"। এটি যথেষ্ট সহজ, সহজে বহনযোগ্য, কোনো টুলের প্রয়োজন হয় না এবং যেকোনো টেক্সট এডিটর দিয়ে এটি পরিচালনা করা যায়।

▲ মার্কডাউন সিনট্যাক্স চিট শিট | ছবিটি এআই দ্বারা তৈরি
এই ডিজাইন দর্শনটি ব্লগ যুগে নিখুঁত ছিল। প্রায় ২০০৮ সালের দিকে, গিটহাবের উত্থানের সাথে সাথে, মার্কডাউন সরাসরি প্রোগ্রামারদের জন্য লেখার আদর্শ ফরম্যাট হয়ে ওঠে। মার্কডাউন প্রায় এই সমস্ত ক্ষেত্রেই ভালোভাবে কাজ করে: টেকনিক্যাল ডকুমেন্টেশন, স্ট্যাক ওভারফ্লো-এর উত্তর, গিটহাব রিডমি (README), এবং টেকনিক্যাল ব্লগ।
এরপর এলো বৃহৎ ভাষা মডেল।
একদিকে, প্রশিক্ষণ ডেটাতে প্রচুর পরিমাণে মার্কডাউন-ফরম্যাট করা টেক্সট ছিল এবং মডেলটি কাঠামো প্রকাশ করার জন্য এটি ব্যবহার করতে শিখেছিল। অন্য কথায়, প্রশিক্ষণ ডেটাটি মূলত প্রযুক্তিগত ব্লগ এবং ফোরামে "স্মার্ট লোকেদের" লেখা মার্কডাউন দিয়ে গঠিত ছিল । মডেলটি কেবল ফরম্যাটটিই শেখেনি, বরং এই ধারণাটিও শিখেছিল যে " মার্কডাউনে লেখা মানেই গুরুগম্ভীর, কাঠামোগত এবং পেশাদার ।"
অন্যদিকে, মার্কডাউনের কাঠামোগত সংকেতগুলো অত্যন্ত সুনির্দিষ্ট; একটি শিরোনামের জন্য কেবল একটি #, একটি তালিকার জন্য কেবল একটি -, এবং ** বোল্ড নির্দেশ করে। বর্তমান টোকেনটির অর্থগত ভূমিকা নির্ধারণ করতে মডেলটিকে দূরবর্তী কোনো প্রেক্ষাপট দেখার প্রয়োজন হয় না।

▲ একই আর্টিকেলের ক্ষেত্রে, HTML বলতে বোঝায় অসংখ্য ট্যাগ, বিভিন্ন ব্লক বিভাজন, এবং স্টাইল কন্ট্রোল ইত্যাদি।
এইচটিএমএল হেডিং এবং লিস্টের (<h1>, </h1> বা <li>, </li>) তুলনায় এটি অনেক বেশি কার্যকর। তাছাড়া, এইচটিএমএল-এর `<div class="section">` ট্যাগটি `</div>` ট্যাগ পর্যন্ত বন্ধ হয় না, ফলে এর সিমান্টিক স্প্যান দীর্ঘতর হয় এবং জেনারেশনের সময় মডেলকে আরও আগের স্টেটগুলো "মনে রাখতে" হয়। এটি মডেলের উপর একটি অতিরিক্ত বোঝা চাপিয়ে দেয় এবং ত্রুটির সম্ভাবনা বাড়িয়ে তোলে।
সুতরাং, বৃহৎ ল্যাঙ্গুয়েজ মডেলের অ্যাটেনশন মেকানিজমের প্রযুক্তিগত দৃষ্টিকোণ থেকেই হোক, কিংবা টোকেন ইকোনমিক্সের দৃষ্টিকোণ থেকেই হোক, দীর্ঘ ডকুমেন্ট, একাধিক পর্বের সংলাপ এবং বিপুল সংখ্যক এপিআই কলের ক্ষেত্রে "সম্ভব হলে এইচটিএমএল-এর পরিবর্তে মার্কডাউন ব্যবহার করা" প্রকৌশলী এবং মডেল উভয়েরই পছন্দে পরিণত হয়েছে।
সংক্ষেপে, টোকেন-এর মূল বৈশিষ্ট্যগুলো—যেমন উচ্চ কার্যকারিতা, সুস্পষ্ট কাঠামো এবং সহজ পার্সিং—মডেলটিকে স্বাভাবিকভাবেই মার্কডাউন পছন্দ করতে শেখায়; এটি মার্কডাউন ইনপুট এবং মার্কডাউন আউটপুট উভয়কেই সমর্থন করে।
বৃহৎ ভাষা মডেল প্রশিক্ষণের ক্ষেত্রে এই পছন্দটি আরও বেশি স্পষ্ট হয়ে ওঠে।
যখন মডেলটি মানুষের মতামত ব্যবহার করে রিইনফোর্সমেন্ট লার্নিং (RLHF) করে, তখন অ্যানোটেটররা যে উত্তরগুলোকে উচ্চ স্কোর দেন, সেগুলোর শিরোনাম স্পষ্ট, বুলেট পয়েন্ট এবং কাঠামো সুস্পষ্ট হওয়ার সম্ভাবনাই বেশি থাকে। সাধারণ টেক্সট পরিবেশে, এই দৃশ্যমান কাঠামোটি হলো মার্কডাউন।
সুতরাং, মডেল দ্বারা শেখা পুরস্কার সংকেতটি হলো: মার্কডাউন ফরম্যাটিং ব্যবহার করলে তা আরও গুরুতর, আরও সম্পূর্ণ এবং উচ্চ স্কোর পাওয়ার জন্য আরও যোগ্য বলে মনে হয়। এমনকি প্রশ্নে তালিকার প্রয়োজন না থাকলেও, মডেলটি একটি তালিকা যোগ করার প্রবণতা দেখাবে।

▲ টাইপোরা, একটি সুপরিচিত মার্কডাউন এডিটর
সম্ভবত এই কারণেই যখন আমরা ChatGPT-কে কোনো প্রশ্ন করি, তখন এটি তিনটি মূল পয়েন্ট, বোল্ড করা কীওয়ার্ড এবং একটি সারসংক্ষেপ দেওয়ার চেষ্টা করে। আর বেশিরভাগ সময়, যখন আপনি এর ডায়ালগ ইন্টারফেস থেকে AI-এর উত্তরটি কপি করে অন্য ইনপুট বক্সে পেস্ট করেন, তখন দেখবেন যে এটি স্বয়ংক্রিয়ভাবে #, **, —, ইত্যাদির মতো মার্কডাউন মার্কার যোগ করে দেয়।
এআই প্রত্যুত্তর থেকে আমরা যে প্রতিটি টেক্সট মেসেজ দেখি, তা মার্কডাউন ফরম্যাটে প্রদর্শিত হয়।
পিডিএফ, ওয়ার্ড বা পিপিটি কেন নয়?
মার্কডাউন দরকারি হলেও, আমরা দৈনন্দিন জীবনে প্রধানত পিডিএফ এবং ওয়ার্ড ডকুমেন্ট ফরম্যাট ব্যবহার করি। যখন আমার বস আমাকে কোনো ফাইল পাঠান এবং আমি তা প্রসেস করার জন্য এআই-তে পাঠাই, তখন প্রায়শই নিজে কপি-পেস্ট করার চেয়ে বেশি সময় লাগে।
এর মূল কারণ হলো, মডেলটি শুধু টোকেন শনাক্ত করে, ফাইল নয়।
একটি বৃহৎ ল্যাঙ্গুয়েজ মডেলে ইনপুট দেওয়ার আগে, সেটিকে অবশ্যই টোকেনের একটি অনুক্রমে রূপান্তরিত করতে হয়। মডেলটি সরাসরি "একটি পিডিএফ" দেখে না; এটি পিডিএফ থেকে পার্স করা টেক্সট কন্টেন্ট দেখে, যা পরে টোকেনে বিভক্ত করা হয়। সুতরাং, প্লেইন টেক্সটে পার্স করার পর যে ফরম্যাটে তথ্যের ক্ষতি এবং নয়েজ সবচেয়ে কম থাকে, সেটিই উত্তম ফরম্যাট।

▲ ক্লডের অফিসিয়াল পিডিএফ স্কিল ব্যবহার করে পিডিএফ ফাইল পড়ার জন্য একটি বিশেষ টুল লাইব্রেরি প্রয়োজন।
পিডিএফ ডিজাইনের লক্ষ্য হলো "প্রিন্ট করার পর দেখতে সুন্দর লাগা," "মেশিনের জন্য সহজে পাঠযোগ্য হওয়া" নয়। একটি পিডিএফ অভ্যন্তরীণভাবে প্রতিটি অক্ষরের স্থানাঙ্ক সংরক্ষণ করে, পাঠ্যের যৌক্তিক ক্রম নয়। একটি দুই-কলাম বিন্যাসের পিডিএফে, পার্স করা পাঠ্যের ক্রম সহজেই বাম কলামের প্রথম লাইন, ডান কলামের প্রথম লাইন, বাম কলামের দ্বিতীয় লাইন, ডান কলামের দ্বিতীয় লাইন—এইরকম সম্পূর্ণ এলোমেলো হতে পারে।
টেবিলের অবস্থা আরও খারাপ। পিডিএফ-এর টেবিলগুলো সাধারণত অ্যাবসোলিউট কোঅর্ডিনেট দিয়ে সাজানো টেক্সট ব্লক হয়, যেখানে "এটি একটি সারি" বা "এটি একটি কলাম"-এর মতো কোনো অর্থগত তথ্য থাকে না। এআই পিডিএফ পার্সারগুলো কেবল অনুমানই করতে পারে।
স্ক্যান করা পিডিএফগুলো আরও বেশি সমস্যাযুক্ত, কারণ এগুলো সরাসরি ছবি এবং এগুলোর জন্য প্রথমে ওসিআর টেক্সট রিকগনিশন প্রয়োজন হয়। ওসিআর-এর ভুলের হার সরাসরি মডেল কনটেক্সটের মধ্যে অন্তর্ভুক্ত থাকে।

.docx এবং .pptx ফাইলগুলো মূলত ZIP আর্কাইভ, যার ভেতরে অনেকগুলো XML (এক্সটেনসিবল মার্কআপ ল্যাঙ্গুয়েজ) ফাইল থাকে। পার্স করা মূল কন্টেন্টে ফন্ট, রঙ, প্যারাগ্রাফ স্পেসিং, থিম এবং রিভিশন হিস্টোরির মতো প্রচুর স্টাইল ট্যাগ থাকে। এগুলো মডেলকে কন্টেন্ট বুঝতে কোনো সাহায্য করে না, কিন্তু প্রচুর টোকেন খরচ করে এবং সত্যিকারের দরকারি তথ্যকে দুর্বল করে দেয়।
পাওয়ারপয়েন্ট প্রেজেন্টেশনে তথ্যের ঘনত্ব স্বভাবতই কম থাকে। একটি স্লাইডে কেবল একটি বাক্য বা কয়েকটি মূলশব্দ থাকতে পারে, যার ফলে প্রাসঙ্গিক সংযোগবিহীন খণ্ডিত লেখা তৈরি হয় এবং মডেলের পক্ষে সম্পূর্ণ যুক্তিটি পুনর্গঠন করা কঠিন হয়ে পড়ে।
কেউ কেউ TXT সম্পর্কে জিজ্ঞাসা করতে পারেন। প্রকৃতপক্ষে, Markdown এবং Word-এর মতো টেক্সট ফরম্যাটগুলোকে মূলত TXT ডকুমেন্টে রূপান্তর করা যায়। এগুলোতে কোনো বাড়তি কোলাহল থাকে না, আবার কোনো কাঠামোগত সংকেতও থাকে না।
মডেলটি শিরোনাম, তালিকা, কোড ব্লক এবং উদ্ধৃতি চিহ্ন সঠিকভাবে চিহ্নিত করতে হিমশিম খায়। দীর্ঘ ডকুমেন্টের ক্ষেত্রে, এর অর্থ হলো কাঠামোটি অনুমান করার জন্য মডেলটিকে স্বাভাবিক ভাষার সংকেতের উপর নির্ভর করতে হয়, যার ফলে এর নির্ভুলতা অসঙ্গত হয়।

▲ এআই দ্বারা তৈরি ছবি
অনুরূপ ভাষাগুলোর মধ্যে রয়েছে JSON/XML, যেগুলো প্রকৃতপক্ষে মেশিনের জন্য বেশি উপযোগী, কিন্তু "মেশিন" বলতে ভাষার মডেলকে বোঝানো হয় না।
JSON এবং XML প্রোগ্রাম পার্সিংয়ের জন্য ডিজাইন করা হয়েছে, যেগুলোর বৈশিষ্ট্য হলো কী-ভ্যালু পেয়ার, শ্রেণিবদ্ধ কাঠামো এবং কঠোর সিনট্যাক্স। প্রচলিত সফটওয়্যার সহজেই JSON পড়তে পারে, কারণ এটি সরাসরি json.parse() ব্যবহার করে একটি কাঠামোবদ্ধ অবজেক্ট পেতে পারে।
ল্যাঙ্গুয়েজ মডেলের 'বোধগম্যতা' টোকেনগুলোর মধ্যে পরিসংখ্যানগত সংযোগের মাধ্যমে অর্জিত হয়। ল্যাঙ্গুয়েজ মডেলের জন্য, JSON পড়া আর স্বাভাবিক ভাষা পড়া একই ব্যাপার: টোকেন ধরে ধরে প্রক্রিয়াকরণ করা এবং অ্যাটেনশন মেকানিজমের মাধ্যমে সংযোগ স্থাপন করা। এই কঠোরভাবে কাঠামোগত ফরম্যাটটিকে ফাজি ইনপুটের জন্য ডিজাইন করা একটি সিস্টেমে সরবরাহ করা স্বভাবতই একটি অমিল।
মার্কডাউন এই দুইয়ের মাঝামাঝি অবস্থানে রয়েছে; এটি সাধারণ টেক্সট হলেও এতে হালকা কাঠামোগত সংকেত থাকে।


▲ জিনা রিডারের মতো কিছু টুল, ওয়েবপেজের URL-এর সাথে r.jina.ai প্রিফিক্সটি যোগ করে যেকোনো ওয়েবপেজকে LLM-বান্ধব মার্কডাউনে রূপান্তর করতে পারে।
মার্কডাউন পার্স করার জন্য কোনো বিশেষ টুলের প্রয়োজন হয় না; আপনি কেবল লেখাটি পড়তে পারেন। এটি পিডিএফ-এর স্থানাঙ্কগত বিশৃঙ্খলা এবং ওয়ার্ড ডকুমেন্টের এক্সএমএল-এর গোলমাল এড়িয়ে চলে। অধিকন্তু, #, **, এবং – এর মতো চিহ্নগুলো মডেলটিকে পর্যাপ্ত কাঠামোগত সূত্র প্রদান করে, যার ফলে এটি বিভিন্ন অংশকে শিরোনাম, তালিকা এবং কোড হিসেবে শনাক্ত করতে পারে।
এই প্রতীকগুলো ইতিমধ্যেই টোকেন শব্দভাণ্ডারে রয়েছে এবং মডেলটি কোনো প্রাক-প্রক্রিয়াকরণ ধাপ ছাড়াই সরাসরি সেগুলোকে প্রক্রিয়াকরণ করে।
মার্কডাউন কি অপ্রচলিত হয়ে পড়ছে?
ক্লড কোড প্রকল্পের নিবন্ধটিতে এইচটিএমএল-এর বেশ কিছু সুবিধা বিস্তারিতভাবে বর্ণনা করা হয়েছে।

▲ এআই দ্বারা তৈরি ছবি
উচ্চতর তথ্য ঘনত্বের কারণে, HTML মার্কডাউনের চেয়ে অনেক বেশি তথ্য প্রকাশ করতে পারে। এটি ডকুমেন্টের মৌলিক কাঠামো এবং শিরোনামের বিন্যাস পরিচালনা করতে পারার পাশাপাশি আরও বিভিন্ন তথ্য উপস্থাপন করতে পারে, যেমন CSS স্টাইল, SVG ছবি, ক্যানভাস স্পেসের ডেটা, ফ্লোচার্ট, `img` ট্যাগ ব্যবহার করে যুক্ত করা ছবি ইত্যাদি।
তিনি আরও উল্লেখ করেছেন যে, ক্লড ক্রমবর্ধমান জটিল কাজ সামলাতে সক্ষম, এবং এর লেখা রিকোয়ারমেন্টস ডকুমেন্ট ও প্ল্যানগুলো দিন দিন আরও দীর্ঘ হচ্ছে। ১০০ লাইনের বেশি মার্কডাউন ফাইলগুলো অন্যদের পড়ার কথা তো বাদই দিন, সেগুলো পড়াই যায় না।
তবে, এইচটিএমএল ডকুমেন্ট পড়া অনেক বেশি সহজ। ক্লড এর কাঠামোকে স্পষ্টভাবে সাজাতে পারে এবং ট্যাব, চিত্র, লিঙ্ক ও আরও অনেক কিছু ব্যবহার করে সহজে নেভিগেট করতে পারে। এটি এমনকি রেসপন্সিভ লেআউটও তৈরি করতে পারে, যা বিভিন্ন ডিভাইসে আরামদায়ক পাঠ নিশ্চিত করে।

শেয়ার করার বিষয়ে তিনি আরও মনে করেন যে, মার্কডাউনের চেয়ে এইচটিএমএল বিতরণ করা সহজ। কোনো বন্ধুকে লিঙ্কের মাধ্যমে একটি এইচটিএমএল ফাইল পাঠালে, একটি মার্কডাউন ডকুমেন্ট পাঠানোর চেয়ে সেই লিঙ্কে ক্লিক করে তা পড়ার সম্ভাবনা বেশি থাকে।
ঠিক যেমন কোনো প্রতিবেদন দেওয়ার সময় আপনি কয়েক ডজন পৃষ্ঠার একটি পাওয়ারপয়েন্ট প্রেজেন্টেশন উপস্থাপন করতে পারেন, অথবা কেবল একটি ওয়েবপেজ খুলতে পারেন, তেমনই বাজারে প্রচলিত গভীর গবেষণামূলক পণ্যগুলোও পাওয়ারপয়েন্ট প্রেজেন্টেশন তৈরি করার সময় এইচটিএমএল (HTML) ওয়েবপেজ রেন্ডার করার মাধ্যমে শুরু হয়।

এছাড়াও রয়েছে HTML-এর ইন্টারঅ্যাকটিভিটি; আমরা বিভিন্ন বোতামে ক্লিক করতে পারি, স্লাইডার বা নব ব্যবহার করে নানা তথ্যের প্রদর্শন সমন্বয় করতে পারি।
মার্কডাউন এইচটিএমএল-এর চেয়ে কম টোকেন আউটপুট করে এবং বেশি সময় নেয়, এই কথা উল্লেখ করে তিনি বলেন যে, এইচটিএমএল মার্কডাউনের চেয়ে ২-৪ গুণ ধীরগতির হতে পারে, কিন্তু তিনি মনে করেন এটি সার্থক; এইচটিএমএল-এর উন্নত প্রকাশভঙ্গি এবং এটি পড়ার সম্ভাবনা উল্লেখযোগ্যভাবে বেড়ে যাওয়ায় চূড়ান্ত আউটপুট আরও ভালো হয়।
আমরা থারিকের দীর্ঘ পোস্টটিকে এইচটিএমএল ফরম্যাটে রূপান্তর করারও চেষ্টা করেছি। এক্স-এর টুইটের দীর্ঘ স্ক্রিনশটের তুলনায় এইচটিএমএল উপস্থাপনাটি বেশি পাঠ-বান্ধব।

এইচটিএমএল যে মানুষের পড়ার জন্য বেশি উপযুক্ত, এই প্রসঙ্গে বলা যায়, প্রবন্ধে উল্লেখিত সুবিধাগুলো এমন যা মার্কডাউনের পক্ষে অর্জন করা কঠিন হবে। তবে, এইচটিএমএলকে এআই-এর নতুন সার্বজনীন ভাষা হিসেবে আখ্যা দেওয়ার সময় এখনও আসেনি।
এর মানে কি এই যে, ভবিষ্যতে আমাদের প্রতিটি কথোপকথনে, কৃত্রিম বুদ্ধিমত্তার তৈরি করা একটি তথাকথিত সুন্দর ও ব্যবহার-বান্ধব ওয়েবপেজের জন্য অপেক্ষা করতে হবে?
বন্ধুদের সাথে গল্প করার সময় আমরা আশা করি না যে তারা খুব সেজেগুজে থাকবে, এক ঘণ্টা ধরে মেকআপ করে আমাদের জন্য অপেক্ষা করানো তো দূরের কথা।
উল্লেখ্য যে, ব্যবহারকারীরা যেসব এআই-এর সম্মুখীন হন, তার বেশিরভাগই—অর্থাৎ, যে এআই বিশেষভাবে প্রোগ্রামিং, ডিজাইন বা অন্যান্য ক্ষেত্রের জন্য তৈরি করা হয়নি—সম্পূর্ণরূপে কথোপকথনের মাধ্যমেই যোগাযোগ করে। আমাদের কথোপকথনের জন্য কোনো অত্যাধুনিক এইচটিএমএল ডকুমেন্টের প্রয়োজন নাও হতে পারে; বিদ্যমান মার্কডাউনই যথেষ্ট।

ক্লড কোড ইঞ্জিনিয়ারের এই নিবন্ধে এইচটিএমএল কোন কোন প্রকল্পের জন্য উপযুক্ত, সে সম্পর্কেও উল্লেখ করা হয়েছে; যেমন—প্রকল্প পরিকল্পনা এবং বিভিন্ন ডিজাইন সমাধান অন্বেষণ সহ একটি বিশদ রিকোয়ারমেন্টস ডকুমেন্ট তৈরি করার জন্য এআই-এর প্রয়োজন, অথবা ভিজ্যুয়াল কোড পর্যালোচনা ও বোঝা, অ্যানিমেশন এবং মোশন ইফেক্টের মতো ইন্টারেক্টিভ প্রোটোটাইপ তৈরি, এবং গবেষণা প্রতিবেদন ইত্যাদি।
এই দৃশ্যকল্পগুলো ওয়েব পেজ উপস্থাপনার জন্য স্বভাবতই উপযুক্ত, তাই এগুলো ব্যবহার করে মার্কডাউনের আধিপত্যকে চ্যালেঞ্জ করা কিছুটা অন্যায্য।
লেখক এই সিদ্ধান্তে উপনীত হয়েছেন যে, এআই কর্তৃক মানুষের কাছে চূড়ান্তভাবে উপস্থাপিত পণ্য হিসেবে এইচটিএমএল (HTML) অধিক পাঠযোগ্য। তবে, তিনি এআই-এর ওয়ার্কিং মেমোরি বা কনটেক্সচুয়াল ফরম্যাট হিসেবে এইচটিএমএল ব্যবহারের পক্ষে নন, কারণ এই ক্ষেত্রে সকল এআই-এর জন্য বর্তমানে মার্কডাউনই একমাত্র সমাধান।

মার্কডাউন কি এআই যুগের শব্দ? মার্কডাউনের চূড়ান্ত গন্তব্য কোথায়?
মার্কডাউন হলো এআই-এর কার্যকরী ভাষা, প্রসঙ্গের বাহক এবং এজেন্টদের মধ্যে তথ্য আদান-প্রদানের ফরম্যাট, কিন্তু ব্যবহারকারী শেষ পর্যন্ত যা দেখবেন, তা হয়তো এটাই হওয়ার প্রয়োজন নেই। মার্কডাউন রেন্ডার হওয়ার পর এইচটিএমএল, বা ভবিষ্যতে আরও উন্নত কোনো ফরম্যাটই ইন্টারফেস হিসেবে কাজ করবে।
এইচটিএমএল-এর চ্যালেঞ্জের জন্য মার্কডাউনের অবস্থানকে চ্যালেঞ্জ করার প্রয়োজন নেই; এর কেবল সেই ভূমিকাটি পূরণ করা প্রয়োজন যা মার্কডাউনকে কখনও পালন করতে হয়নি।
মার্কডাউন এইচটিএমএল (HTML)-এর একটি অংশ হতে পারে। যখন আমরা কোনো ওয়েবপেজে এআই (AI)-এর সাথে চ্যাট করি, তখন এআই-এর উত্তরগুলো মার্কডাউনে থাকে, যা এইচটিএমএল (HTML)-এর মধ্যে এমবেড করা থাকে।
ভবিষ্যতে মার্কডাউন এইচটিএমএল (HTML), অথবা আরও উন্নত কোনো এক্সটিএমএল (XTML) ভাষার মধ্যে অন্তর্ভুক্ত একটি বিল্ডিং ব্লকের মতো হবে।

▲ এআই দ্বারা তৈরি ছবি
ফরম্যাটিং ক্রমাগত বিকশিত হতে থাকবে। এই মুহূর্তে এইচটিএমএল (HTML) অগ্রভাগে রয়েছে, কিন্তু শুধুমাত্র এই মুহূর্তের জন্যই। পরবর্তী পর্যায়টি হতে পারে একটি ইন্টারেক্টিভ ত্রিমাত্রিক স্থান, এবং তার পরের পর্যায়টি হতে পারে সরাসরি রেটিনায় লেখা একটি সংকেত প্রবাহ।
কিন্তু ফ্রন্ট-এন্ডে যা-ই পরিবর্তন আসুক না কেন, ব্যাক-এন্ডে ঠিকই মার্কডাউনই চলে। একে প্রতিস্থাপন করা হবে না, কেবল ভুলে যাওয়া হবে। আর প্রযুক্তির জগতে, সবার দ্বারা বিস্মৃত হওয়াই হলো একটি ফরম্যাটের চূড়ান্ত বিজয়ের উপায়।
প্রতিটি প্রজন্মই পরবর্তী ইন্টারফেস কী হবে তা নিয়ে তর্ক করে। কিন্তু যা সত্যিই টিকে থাকে তা কখনোই ইন্টারফেস নয়, বরং প্রোটোকল।
iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।
