
১৯৭৫ সালের শীতে, কোডাকের অ্যাপ্লায়েড ইলেকট্রনিক্স রিসার্চ সেন্টারের একজন প্রকৌশলী স্টিভেন স্যাসন গবেষণাগারে তড়িঘড়ি করে একটি অদ্ভুত যন্ত্র তৈরি করেছিলেন।
৮ পাউন্ড ওজনের এবং মাত্র ১০,০০০ পিক্সেলের এই যন্ত্রটিতে শাটার চাপার পর, একটি সাদাকালো ছবি ফিলিপস ক্যাসেট টেপে ধারণ করার জন্য যন্ত্রটির একঘেয়ে গুঞ্জন শুনতে হয় এবং দীর্ঘ ২৩ সেকেন্ড অপেক্ষা করতে হয়।
অত্যন্ত কম পিক্সেল সংখ্যা এবং ডেটা সংরক্ষণের গতির কারণে স্টিভেন স্যাসন মনে করেন, এই জিনিসটির পক্ষে চলচ্চিত্রের সঙ্গে সত্যিকারের প্রতিযোগিতা করতে আরও ১৫ থেকে ২০ বছর সময় লাগবে।

পরবর্তী দুই দশকে, ইমেজিং শিল্পে এক নাটকীয় পরিবর্তন ঘটে। ইমেজিং মাধ্যমগুলো দ্রুত ডিজিটাল হয়ে ওঠে, এবং একবিংশ শতাব্দীর প্রথম দশকে, স্টিভেন স্যাসনের আশানুরূপভাবেই, ফিল্ম যুগের অবশেষে অবসান ঘটে। কিন্তু সেই সময়ে, ক্যামেরা তখনও ছিল একটি "ভারী গৃহস্থালি সম্পদ", এবং মানুষ নিজেদের ইচ্ছামতো ছবি তুলতে পারত না, ভিডিও তৈরি করা তো দূরের কথা।
মোবাইল ইমেজিংয়ের যুগ আসার আগ পর্যন্ত।
পঞ্চম প্রজন্মের স্ন্যাপড্রাগন ৮ আল্ট্রা দ্বারা সজ্জিত সদ্য মুক্তিপ্রাপ্ত ভিভো এক্স৩০০ আল্ট্রা-তে রয়েছে এক চিত্তাকর্ষক স্পেসিফিকেশন: সকল ফোকাল লেংথে ৪কে ১২০এফপিএস ১০-বিট লগ ভিডিও।
এখন পেছনে ফিরে তাকালে আমরা উপলব্ধি করি যে, মানবজাতি পঞ্চাশ বছর ধরে একটি ডিজিটাল খাল নির্মাণ করেছে, যা দিয়ে সবাই যাতায়াত করতে পারে।
অন্তর্নিহিত সম্প্রসারণ, আলো ও ছায়াকে গ্রাস করছে
এই খালের তীব্র স্রোতের জল মূলত বিপুল পরিমাণ 'ঘন চিত্র সংকেত'।
এই আপাতদৃষ্টিতে পাণ্ডিত্যপূর্ণ এবং কিছুটা দূরবর্তী পরিভাষাটি আসলে তাদের সকলের সাথে ঘনিষ্ঠভাবে সম্পর্কিত, যারা শাটার বোতাম চাপার জন্য নিজেদের ফোন তুলে ধরেন।
শুরুর দিকের স্মার্টফোনগুলোর কথা মনে করলে, আপনি এই ধরনের ছবিগুলোর সাথে পরিচিত হবেন: অতিরিক্ত উজ্জ্বল অংশ, পুরোপুরি কালো ছায়া, রঙের স্তরবিন্যাস, কম ফ্রেম রেট এবং ক্রমাগত নয়েজ।

▲ আইফোন ৪এস দিয়ে তোলা রাতের দৃশ্য, সৌজন্যে @PhoneArena
দৃশ্যগত বিপর্যয়ের মূল কারণ হলো, অন্তর্নিহিত ইমেজ সিগন্যাল প্রসেসর (যে আইএসপি-র সাথে আমরা বেশি পরিচিত) বিপুল পরিমাণ সিগন্যাল গ্রহণ করতে অক্ষম হয়।
তখনকার মোবাইল ফোনগুলোতে কেবল ৮-বিট কোয়ান্টাইজেশন প্রিসিশন ছিল। পারিপার্শ্বিক আলোর পরিমাণ সেন্সরের ধারণক্ষমতা ছাড়িয়ে গেলেই, উজ্জ্বল অংশগুলোর মাত্রা অপরিবর্তনীয়ভাবে উপচে পড়ত এবং ছবিটি পুরোপুরি সাদা হয়ে যেত; অন্যদিকে, সিগন্যালের অন্ধকার অংশগুলো আইএসপি দ্বারা অমার্জিতভাবে মসৃণ হয়ে একটি কোলাহলপূর্ণ, কালো জগাখিচুড়িতে পরিণত হতো। অধিকন্তু, তথ্যের এই ভৌত ক্ষতি ছিল অপরিবর্তনীয় এবং কোনো পোস্ট-প্রসেসিং সফটওয়্যার দ্বারা তা পুনরুদ্ধার করা যেত না।
এই সমস্যাটি আমাদের কল্পনার চেয়েও বেশি স্থায়ী।
নির্মাতারা বৃহত্তর ডাইনামিক রেঞ্জের বিনিময়ে সেন্সরের ক্ষেত্রফল বাড়িয়ে এই সমস্যা সমাধানের চেষ্টা করেছেন। তবে, আজকের অত্যন্ত সীমাবদ্ধ অভ্যন্তরীণ কাঠামোতে, কেবল ভৌত মাত্রাগুলোকে স্তরে স্তরে সাজানোর বিষয়টি তার সীমায় পৌঁছে গেছে, যা ব্যাকএন্ড আইএসপি-কে ক্রমশ গুরুত্বপূর্ণ করে তুলছে।

▲ ফোনের ভেতরের জায়গা ক্যামেরা মডিউল এবং ব্যাটারির মধ্যে ভাগ করা হয়েছে। ছবি: @Notebookcheck
দীর্ঘদিন ধরে, ভৌত সীমাবদ্ধতার কারণে, মোবাইল ফোনের কম্পিউটিং ক্ষমতা ১৪-বিট ডুয়াল আইএসপি পর্যায়েই সীমাবদ্ধ ছিল। সেন্সর দ্বারা সংগৃহীত তথ্যের পরিমাণ ক্রমশ বিশাল হয়ে ওঠায়, আইএসপি-র ডেটা পাইপলাইনকেও সেই অনুযায়ী প্রসারিত করতে হবে।
২০২০ সালে স্ন্যাপড্রাগন ৮৮৮-এ যুগপৎ ডেটা সামলানোর জন্য ১৪-বিট ট্রিপল আইএসপি সংযোজন থেকে শুরু করে স্পেকট্রা আইএসপি-র পরবর্তী ১৮-বিট সংস্করণ পর্যন্ত, মোবাইল প্ল্যাটফর্মগুলো ইমেজ ডেটার জন্য প্রসেসিং ব্যান্ডউইথ ৪০৯৬ গুণ বাড়িয়েছে। এখন, আরও ঘন ইমেজ সিগন্যাল সামলানোর জন্য, ভিভো এক্স৩০০ আল্ট্রা-তে থাকা পঞ্চম প্রজন্মের স্ন্যাপড্রাগন ৮ আল্ট্রা কোয়ালকম স্পেকট্রা আইএসপি স্বাভাবিকভাবেই ২০-বিট এআই ট্রিপল আইএসপি-র যুগে প্রবেশ করেছে।

এই সামান্য ২ বিটকে অবমূল্যায়ন করবেন না। ডিজিটাল স্তরে, এই এককের যেকোনো পরিবর্তনে একটি সূচকীয় সুনামি প্রভাব পড়ে: একটি একক-চ্যানেল রঙের কোয়ান্টাইজেশন স্তর মসৃণভাবে ২৬০,০০০ থেকে ১,০৪০,০০০-এ রূপান্তরিত হয়, যা অন্তর্নিহিত ডেটার জন্য চারগুণ ডায়নামিক রেঞ্জ মার্জিন প্রদান করে।
এই শক্তিশালী ভৌত ভিত্তিকে কাজে লাগিয়ে, ভিভো এবং কোয়ালকম অন্তর্নিহিত ইমেজিং পাইপলাইনের গভীর অপ্টিমাইজেশনের জন্য যৌথভাবে কাজ করেছে।
ফলাফল ছিল চিত্তাকর্ষক: X300 Ultra সম্পূর্ণ ফোকাল লেংথ জুড়ে 14EV ডাইনামিক রেঞ্জ অর্জন করেছে।
এই বিপুল পরিমাণ ডেটা দুটি অত্যন্ত চাহিদাপূর্ণ পেশাদারী স্পেসিফিকেশনে—লগ ফরম্যাট এবং ডলবি ভিশনে—ঢেলে দেওয়া হয়েছিল।
লগ মোডে, ২০-বিট এআই ট্রিপল আইএসপি সেন্সর দ্বারা ধারণ করা লিনিয়ার সিগন্যালগুলোকে রিয়েল টাইমে একটি লগারিদমিক কার্ভে রূপান্তর করার দায়িত্বে থাকে। অন্তর্নিহিত স্তরে উন্নত স্যাম্পলিং নির্ভুলতার কারণে, ফোনটি আরও সমৃদ্ধ মূল তথ্য ধরে রাখে, ফলে পোস্ট-প্রসেসিংয়ের সময় কালার ব্যান্ডিং কার্যকরভাবে দমন করে এবং পোস্ট-প্রসেসিংয়ের পরিধি প্রসারিত করে। ডলবি ভিশন স্ট্যান্ডার্ডের অধীনে, ডায়নামিক মেটাডেটা এনক্যাপসুলেট করার নির্ভুলতার মধ্যে কম্পিউটিং শক্তি প্রতিফলিত হয়। এটি প্রতিটি ফ্রেমের ব্রাইটনেস এবং কনট্রাস্ট তথ্যকে আরও নির্ভুলভাবে সমন্বয় করতে পারে, যার ফলে হাইলাইট এবং শ্যাডোর এইচডিআর লেভেলগুলো বিশ্বস্তভাবে উপস্থাপন করা সম্ভব হয়।

বাস্তব অভিজ্ঞতার দিক থেকেও এর প্রভাব বেশ সুস্পষ্ট — আমরা একটি ‘ট্রপিক্যাল অরোরা’র ছবি তোলার জন্য X300 আল্ট্রা ক্যামেরাটি নিয়েছিলাম। লগ ফরম্যাটের চমৎকার ডাইনামিক রেঞ্জ এবং ল্যাটিটিউডের কল্যাণে, আমরা মধ্যরাতে দ্বীপের কাছের মাছ ধরার নৌকাগুলোকে আকাশ আলোকিত করতে ক্যামেরাবন্দী করতে পেরেছিলাম।
পোস্ট-প্রসেসিং পুনরুদ্ধারের পর, গ্রেডিয়েন্ট আকাশের রূপান্তরটি কোনো রঙের স্তরবিন্যাস ছাড়াই মসৃণ ও স্বাভাবিক হয়ে ওঠে এবং নয়েজ দমনের কার্যকারিতা চমৎকার।

এইভাবে, মূলত চলচ্চিত্র ও টেলিভিশন শিল্পের অন্তর্গত সহনশীলতার নির্দিষ্টকরণগুলো মোবাইল চিপে একীভূত করা হয়েছে, যা একেবারে অন্তর্বর্তী স্তরে একটি ডিজিটাল পথ তৈরি করেছে। সাধারণ মানুষ এখন তাদের মোবাইল ফোন ব্যবহার করে যেকোনো সময়, যেকোনো স্থানে পোস্ট-প্রোডাকশনের নমনীয়তাসহ আরও উন্নত মানের ভিডিও ধারণ করতে পারে, যার ফলে আরও সৃজনশীল সম্ভাবনার দ্বার উন্মোচিত হচ্ছে।
একাধিক ক্যামেরার যুগপৎ ব্যবহার, মসৃণ জুম
একটিমাত্র লেন্সের ডায়নামিক রেঞ্জ সমাধান করলে কেবল স্থির চিত্রের পুনর্গঠনই সম্পন্ন হয়।
তবে, ভিডিওর মূল ভিত্তি হলো কাহিনির ধারাবাহিকতা, যা মোবাইল ভিডিওর আরেকটি দীর্ঘদিনের সমস্যাকে সামনে নিয়ে আসে: জুম স্টাটারিং।
ভিডিও ধারণ করার সময় দৃষ্টিকোণ বদলানোর জন্য আমাদের প্রায়ই জুম ইন ও আউট করতে হয়। কিন্তু, জুম রিংটি নাড়াচাড়া করার সময় ছবিতে প্রায়ই একটি মৃদু কাঁপুনি দেখা যায় এবং রঙ ও হোয়াইট ব্যালেন্সও হঠাৎ করে বদলে যেতে পারে।
হার্ডওয়্যারের ধীরগতির কারণে ভিজ্যুয়ালের আখ্যানধর্মী গুণটি মুহূর্তেই ছিন্নভিন্ন হয়ে গেল।
সমস্যাটি হলো, ফোনের ভেতরের লেন্সগুলো স্বাধীনভাবে কাজ করে। এগুলোর মান ভিন্ন এবং এগুলো স্বতন্ত্র ক্লক দ্বারা নিয়ন্ত্রিত হয়, আর প্রচলিত আইএসপি-র 'কোল্ড স্টার্ট' কৌশলটি কেবল জুম করার সময়ই তাড়াহুড়ো করে সুইচ করতে পারে। একবার টাইমস্ট্যাম্পগুলোর মধ্যে অসামঞ্জস্য দেখা দিলে, ফ্রেম স্কিপিং এবং কালার ব্যান্ডিং অনিবার্য হয়ে ওঠে।

▲ প্রথাগত পেশাদার ফটোগ্রাফিতে, টাইমস্ট্যাম্প অ্যালাইনমেন্ট বৈশ্বিক সময়ের ওপর ভিত্তি করে হওয়া প্রয়োজন।
মোবাইল ডিভাইসে মসৃণ জুম এবং স্লাইড-ইন কার্যকারিতা অর্জনের জন্য, এই স্বতন্ত্র হার্ডওয়্যার উপাদানগুলোকে অন্তর্নিহিত স্তরে একীভূত করতে বাধ্য করা প্রয়োজন।
vivo X300 Ultra-এর সকল ফোকাল লেংথে উচ্চ-মানের ভিডিও রেকর্ডিং অর্জনের পেছনে, পঞ্চম প্রজন্মের Snapdragon 8 Ultra হার্ডওয়্যারকে নির্বিঘ্নে সমন্বিত করতে দুটি পরস্পর সংযুক্ত অন্তর্নিহিত কৌশল ব্যবহার করে—
২০-বিট এআই ট্রিপল আইএসপি বিপুল পরিমাণ ডেটা থ্রুপুট সমর্থন করে, যা তিনটি লেন্সকে ব্যাকগ্রাউন্ডে একটি সক্রিয় ও যুগপৎ অবস্থা বজায় রাখতে সাহায্য করে। এমনকি যখন রেকর্ডিংয়ের জন্য শুধু মূল ক্যামেরাটি ব্যবহৃত হয়, তখনও আলট্রা-ওয়াইড-অ্যাঙ্গেল এবং টেলিফটো লেন্সের আইএসপি চ্যানেলগুলো ব্যাকগ্রাউন্ডে ৩এ (অটোফোকাস, অটো এক্সপোজার, অটো হোয়াইট ব্যালেন্স) অ্যালগরিদম চালাতে থাকে, যা যেকোনো সময় ব্যবহারের জন্য প্রস্তুত থাকে।

একই সময়ে, পঞ্চম প্রজন্মের স্ন্যাপড্রাগন ৮ আল্ট্রা-এর কোয়ালকম মাল্টি-ক্যামেরা সিনক্রোনাইজেশন সিস্টেম (MSCC) সর্বনিম্ন স্তরের হার্ডওয়্যার বাস ভেদ করে, মূলত স্বাধীনভাবে পরিচালিত এই লেন্সগুলিতে জোরপূর্বক একটি সমন্বিত 'গ্লোবাল ক্লক' জারি করে।
ওয়াইড-অ্যাঙ্গেল, আল্ট্রা-ওয়াইড-অ্যাঙ্গেল, টেলিফোটো।
তাদের ভৌতিক দূরত্ব বা সেন্সরের মানের পার্থক্য নির্বিশেষে, একটিই মৌলিক নির্দেশ রয়েছে:
একই মাইক্রোসেকেন্ডের মধ্যে এক্সপোজার যুগপৎভাবে ঘটে; ডেটা একই মুহূর্তে পঠিত হয়।
টাইমলাইনটি সম্পূর্ণরূপে লক করা আছে।

যখন ভিভো এক্স৩০০ আল্ট্রা-কে বিভিন্ন লেন্স জুড়ে জুম ইন এবং জুম আউট করা হয়, তখন দুটি প্রক্রিয়া একযোগে কাজ করে বিভিন্ন সেন্সরের মধ্যে মসৃণ ডেটা স্থানান্তর নিশ্চিত করে, যার ফলে ফ্রেম স্কিপিং এবং হোয়াইট ব্যালেন্স ড্রিফটের মতো দীর্ঘস্থায়ী সমস্যাগুলো দূর হয়।
পেশাদার ইমেজিং ক্ষেত্রটি অন্তঃস্রোতযুক্ত একটি নদীর মতো; অবলম্বন হিসেবে একটি মজবুত ও শক্তিশালী জাহাজ এবং সহযোগিতার জন্য একটি সুসমন্বিত দল ছাড়া এর স্রোতে পথ চলা সম্ভব নয়।
আজ, অন্তর্নিহিত চিপের কম্পিউটিং শক্তি একটি ছোট ডিভাইসের মধ্যে সীমাবদ্ধ থাকে, যা ডিজিটাল লজিক ব্যবহার করে ভৌত শৃঙ্খলা পরিচালনা করে এবং অর্থায়ন বা দল ছাড়াই নির্মাতাদের এই বিশ্বে বিচরণ করার সুযোগ করে দেয়।
এনকোডিং ও ডিকোডিং, এবং কম্পিউটিং শক্তি উভয় দিকেই প্রবাহিত হচ্ছে।
ইমেজিংয়ের ক্ষেত্রে, দীর্ঘদিন ধরে একটি স্বজ্ঞাবিরোধী "কম্পিউটিং পাওয়ার প্যারাডক্স" বিদ্যমান রয়েছে:
সাধারণত, ক্যামেরা প্রসেসরগুলোকে খুব শক্তিশালী বলে মনে করা হয় না, কিন্তু এগুলো বিপুল পরিমাণ অতি-উচ্চ স্পেসিফিকেশনের ভিডিও ডেটা সামলাতে পারে। আমাদের স্মার্টফোনগুলো, যেগুলো শক্তিশালী এসওসি (SoC) দিয়ে সজ্জিত এবং উচ্চ ফ্রেম রেটে চাহিদাপূর্ণ গেম রেন্ডার করতে সক্ষম, সেগুলো একটানা উচ্চ-পারফরম্যান্সের ভিডিও রেকর্ড করার সময় হিমশিম খায়।
মূলত, একটি ক্যামেরার প্রসেসর (ASIC) শুধুমাত্র ছবি প্রক্রিয়াকরণের জন্যই ডিজাইন করা হয়; অন্যদিকে, একটি মোবাইল ফোন, একটি জটিল ডিজিটাল হাব হওয়ায়, ছবি প্রক্রিয়াকরণের জন্য এতে আসলে খুব বেশি কম্পিউটিং ক্ষমতা থাকে না।
সীমিত কম্পিউটিং ক্ষমতার কারণে পুরোনো মোবাইল ফোনগুলোকে স্টোরেজ স্পেসের ক্ষেত্রে আপোস করতে হতো—সাধারণত H.264 বা H.265-এর মতো ইন্টার-ফ্রেম কম্প্রেশন (লং জিওপি) ফরম্যাট ব্যবহার করে শুধু কীফ্রেম এবং ডিফারেন্স ইনফরমেশন রেকর্ড করা হতো। এই পদ্ধতি ফাইলের আকার ব্যাপকভাবে সংকুচিত করলেও, ছবির ভৌত স্থানিক তথ্যকে সম্পূর্ণরূপে নষ্ট করে দিত।

▲ H.264 এনকোডিং এবং ডিকোডিং নীতিমালা, ছবিটি @ResearchGate থেকে নেওয়া।
পোস্ট-প্রসেসিং থেকে অর্জিত আত্মবিশ্বাস ছাড়া, সমস্ত প্রাথমিক শাটার স্পিডগুলো ভাগ্যের ব্যাপার ছাড়া আর কিছুই নয়।
সেকেন্ডারি কালার গ্রেডিংয়ের জন্য এই ফুটেজটি এডিটিং সফটওয়্যারে ইম্পোর্ট করার পর, শ্যাডো বা হাইলাইট কার্ভে সামান্য পরিবর্তন আনলেই সাথে সাথে মোজাইক কালার ব্লকের বড় বড় অংশ এবং মারাত্মক কালার ব্যান্ডিং প্রকাশ পাবে।
পোস্ট-প্রোডাকশনে কালার গ্রেডিংয়ের সুযোগ পুরোপুরি বন্ধ থাকে, যার ফলে সৃজনশীল ধারণা বাস্তবায়ন করা বা সৃষ্টিকে বাস্তবসম্মত করে তোলা অসম্ভব হয়ে পড়ে।
vivo X300 Ultra বাজারে আসার সাথে সাথে দীর্ঘদিনের প্রচলিত ধারণাগুলো সেকেলে হয়ে যাচ্ছে, কারণ 4K 120fps Log-এর মতো প্রফেশনাল ফরম্যাটগুলো এখন আপনার হাতের মুঠোয়।
২০-বিট এআই থ্রি-আইএসপি-এর নিরন্তর প্রচেষ্টার পাশাপাশি, যা উচ্চ পোস্ট-প্রোডাকশন স্পেস এবং সৃজনশীল সম্ভাবনাসহ ফরম্যাটটিকে আমাদের হাতে এনে দিয়েছে, কোডেকটিও একটি অপরিহার্য ভূমিকা পালন করেছে। ভিভো এক্স৩০০ আল্ট্রা-তে, ভিভো এবং কোয়ালকম যৌথভাবে এটিকে চীনের প্রথম স্মার্টফোন হিসেবে তৈরি করেছে, যেখানে এপিভি ৪২২ এনকোডিং প্রয়োগ করা হয়েছে।
APV বিশেষভাবে নন-লিনিয়ার এডিটিং (NLE)-এর জন্য ডিজাইন করা "ইন্ট্রা-ফ্রেম কম্প্রেশন" ব্যবহার করে, যা প্রতিটি ফ্রেমের কালার ডেপথ এবং ব্রাইটনেসের তথ্যকে স্বাধীনভাবে ও সম্পূর্ণরূপে সংরক্ষণ করে। DaVinci Resolve-এ APV 422 ফরম্যাটের ফুটেজ কালার গ্রেডিং করার সময়, ছবিটি অসাধারণ স্থিতিস্থাপকতা প্রদর্শন করে। নোড-ভিত্তিক অপারেশন বা জটিল LUT ম্যাপিং পরিচালনা করার সময় এটি শ্যাডো ডিটেইলস এবং হাইলাইট ট্রানজিশনকে কার্যকরভাবে সাপোর্ট করে, যা মোবাইল ভিডিওতে কার্ভ অ্যাডজাস্ট করার সময় প্রায়শই ঘটে যাওয়া পিক্সেলেশন এবং কালার ব্যান্ডিং-এর অস্বস্তিকর পরিস্থিতিকে উল্লেখযোগ্যভাবে হ্রাস করে।

আরও ভালো ব্যাপার হলো, চলচ্চিত্র ও টেলিভিশনের মানদণ্ড ProRes-এর প্রায় সমান চূড়ান্ত ছবির গুণমান প্রদান করার পাশাপাশি, APV-এর অন্তর্নিহিত এনকোডিং পদ্ধতি ফাইলের আকার আরও প্রায় ১০% কমিয়ে দেয়।
ক্রমবর্ধমান মেমোরির দামের এই পরিবেশে, কোডিং দক্ষতা উন্নত করা নির্মাতাদের কাজের পরিমাণ বাড়িয়ে অর্থ সাশ্রয় করতে সাহায্য করতে পারে।
পারফরম্যান্স এবং কোডেক প্রযুক্তির যুগপৎ সাধনা এই গ্র্যান্ড ক্যানালের জন্য একটি উচ্চ-মানের "ডিজিটাল কন্টেইনার" তৈরি করেছে, যা পোস্ট-প্রোডাকশন ওয়ার্কফ্লোতে সংকেতগুলোকে সম্পূর্ণ ও সাবলীলভাবে পৌঁছে দেয়। এর ফলে, পুরো ক্লোজড-লুপ চেইন জুড়ে মোবাইল ফোনগুলো এমন সৃজনশীল সম্ভাবনা অর্জন করে যা পেশাদার ডিজিটাল সিনেমা ক্যামেরার চেয়ে কোনো অংশে কম নয়।
মোবাইল থেকে তোলা ছবি মোহনায় এসে পৌঁছায়
২০১৪ সালে ভিভো এক্সশট নামে একটি ফ্ল্যাগশিপ ক্যামেরা ফোন বাজারে আনে, যা এক্স আল্ট্রা-থিন এবং এক্সপ্লে বড় স্ক্রিনের মডেলগুলোর সাথে মিলে একটি থ্রি-ইন-ওয়ান প্রোডাক্ট লাইন তৈরি করে।
এই ফোনটিতে রয়েছে একটি ১৩-মেগাপিক্সেল সনি দ্বিতীয় প্রজন্মের স্ট্যাকড সেন্সর, একটি বড় F1.8 অ্যাপারচার, অপটিক্যাল ইমেজ স্ট্যাবিলাইজেশন এবং একটি ডুয়াল-টোন এলইডি ফ্ল্যাশ। এর আরেকটি কম আকর্ষণীয় ফিচার হলো এক্সশট-এর স্ন্যাপড্রাগন ৮০১ প্রসেসর, যা শাটার ল্যাগ মোকাবেলা করতে এবং বহুল ব্যবহৃত OIS অপটিক্যাল ইমেজ স্ট্যাবিলাইজেশনের জন্য ক্ষতিপূরণ কোণ গণনার ক্ষেত্রে কম্পিউটেশনাল সাপোর্ট দিতে একটি ডুয়াল ISP আর্কিটেকচার অন্তর্ভুক্ত করে।

▲ ভিভো এক্সশট, ছবিটি @vivo থেকে নেওয়া।
ফিজিক্যাল ইমেজ স্টেবিলাইজেশনে সহায়তা করার জন্য অন্তর্নিহিত কম্পিউটিং শক্তি ব্যবহারের ইঞ্জিনিয়ারিং প্রোটোটাইপটি পঞ্চম প্রজন্মের স্ন্যাপড্রাগন ৮ আল্ট্রা-এর ফুল-ফোকাল-লেংথ ইমেজ স্টেবিলাইজেশন লিঙ্কে রূপান্তরিত হয়েছে, যা অত্যন্ত উচ্চ-ফ্রিকোয়েন্সির ডেটা হ্যান্ডশেকের মাধ্যমে যোগাযোগের জন্য OIS এবং EIS ব্যবহার করে।
খুব চতুর একটি প্রতিধ্বনি।
পরবর্তী দশকে, মোবাইল ফোনের চিত্রগ্রহণের ক্ষমতা অভাবনীয় গতিতে উন্নত হতে থাকে, যার ফলে তথ্যের স্রোত প্রবল ধারার মতো বইতে শুরু করে। এই বিপুল তথ্য বহনকারী মাধ্যমগুলোও ক্রমাগত প্রসারিত হতে থাকে।
এক্স১০০ আল্ট্রা-এর সময়ে, যখন ক্যামেরা ইন্ডাস্ট্রি প্রথমবারের মতো একটি সীমিত আকারের বডিতে ২০০-মেগাপিক্সেলের টেলিফটো লেন্স যুক্ত করেছিল, তখন এর তাৎক্ষণিক শাটার স্পিডের কারণে ব্যাপক ডেটা জট তৈরি হয়েছিল। কোয়ালকম একটি কগনিটিভ আইএসপি (Cognitive ISP) চালু করে, যা হার্ডওয়্যার-স্তরের রিয়েল-টাইম সিমান্টিক সেগমেন্টেশন এবং অন্তর্নিহিত স্তরে কম্পিউটিং রিডানডেন্সি প্রদান করে। এর ফলে, উচ্চ-পিক্সেল ডেটা থ্রুপুটের সাথে আর দীর্ঘ প্রসেসিং ব্ল্যাকআউট ঘটত না, যার ফলস্বরূপ একটি পরিচ্ছন্ন ও কার্যকর প্রসেসিং সম্ভব হতো।

এক্স২০০ আল্ট্রা, যা একটি পেশাদার ইমেজিং ভিত্তি স্থাপন করেছিল, তার মাধ্যমে প্রতিযোগিতার ক্ষেত্রটি আরও কঠিন স্বল্প-আলোর ৪কে ভিডিও রেকর্ডিংয়ের দিকে এগিয়ে যায়। অত্যন্ত কম সিগন্যাল-টু-নয়েজ অনুপাতের পরিবেশের সম্মুখীন হয়ে, স্ন্যাপড্রাগনের কোরে থাকা হেটেরোজেনাস কম্পিউটিং প্ল্যাটফর্মের উপর নির্ভর করে, ইমেজিং আর্কিটেকচারটি প্রচলিত আইএসপি (ISP) থেকে এনপিইউ (NPU) বা নিউরাল প্রসেসিং ইউনিটে একটি গভীর রূপান্তর সম্পন্ন করে। ফ্রেম-স্তরের নয়েজ কমানোর জন্য র (RAW) ডোমেইনে এআই (AI) কম্পিউটিং শক্তি প্রয়োগ করে, ফোনটি অবশেষে তার ছোট সেন্সর আকারের কারণে রাতের দৃশ্যের ভিডিওতে আলো গ্রহণের সীমাবদ্ধতা কাটিয়ে ওঠে এবং পরিষ্কার ও ব্যবহারযোগ্য ডাইনামিক রেকর্ডিং অর্জন করে।
ফ্রন্ট-এন্ড মডিউল এবং সেন্সরগুলির প্রতিটি আমূল অন্বেষণ অন্তর্নিহিত থ্রুপুট ক্ষমতার উপর কঠোর চাহিদা তৈরি করে।
এখন, X300 Ultra-এর মাধ্যমে, একেবারে গোড়া থেকেই আরও বেশি ডাইনামিক রেঞ্জের দাবি জানানোর এই দীর্ঘমেয়াদী প্রকল্পটি অবশেষে শিল্প-মানের ইমেজিং স্ট্যান্ডার্ডের সীমানায় পৌঁছেছে।

পেছনে তাকালে, ‘ধারণ করা’ থেকে ‘ভালোভাবে ধারণ করা’ পর্যন্ত চলমান ছবির নদীটি এঁকেবেঁকে দীর্ঘ পথ পাড়ি দেয়; সামনে তাকালে, ‘রেকর্ডিং’ থেকে ‘সৃষ্টি করা’ পর্যন্ত সুবিশাল মহাসাগরটি আমাদের চোখের সামনেই রয়েছে।
তথ্যের প্রবল স্রোত যখন প্রবল বেগে ছুটে এসে একত্রিত হয়, তখন স্ন্যাপড্রাগন দ্বারা নির্মিত নদীখাতটি প্রশস্ত হতে থাকে।
চলমান চিত্রগুলো অবশেষে এই মুহূর্তে মোহনায় এসে পৌঁছালো।
iFanr-এর অফিসিয়াল WeChat অ্যাকাউন্ট iFanr (WeChat ID: ifanr) ফলো করুন, যেখানে যত তাড়াতাড়ি সম্ভব আপনার জন্য আরও আকর্ষণীয় কন্টেন্ট উপস্থাপন করা হবে।
