মাইক্রোসফ্ট এক্সেল এতগুলি দিন-দিন কাজগুলিতে দুর্দান্ত। তবে এখন এবং এর পরে, আপনি এর একটির ত্রুটিগুলির মুখোমুখি হন: একটি স্প্রেডশিটের আকার। কীভাবে একটি এক্সেল স্প্রেডশিটটি ছোট করা যায় বা একটি বৃহত সিএসভি ফাইলকে একাধিক ফাইলে বিভক্ত করা যায় তা জানতে পড়ুন।
একাধিক ফাইলে একটি বৃহত সিএসভি বিভক্ত কেন?
আপনি হয়ত ভাবছেন, "কেন আমার বড় এক্সেল ফাইলটি একাধিক ছোট ফাইলগুলিতে ভাগ করা দরকার?" এটি একটি আকর্ষণীয় প্রশ্ন, বিশেষত এক্সেলের স্প্রেডশিটের সারি সীমা 1,048,576 রয়েছে।
1 মিলিয়নেরও বেশি সারি অসাধারণ বলে মনে হচ্ছে। তবে সারি সীমাটি আঘাত করা আপনার চিন্তাভাবনা থেকে সহজ, বিশেষত নির্দিষ্ট কিছু কাজের সময়।
উদাহরণস্বরূপ, আপনি যদি ইমেলের মাধ্যমে বিপণন করেন তবে আপনি লক্ষ লক্ষ ইমেল ঠিকানা সম্বলিত একটি সিএসভি ফাইল আমদানি করতে পারেন। একমাত্র সমস্যা হ'ল আপনি কীভাবে সেই অনেকগুলি ঠিকানা সহ একটি স্প্রেডশিট পরিচালনা করবেন? তদুপরি, কেউ যদি আপনাকে এমন কোনও সিএসভি প্রেরণ করে যা ইতিমধ্যে সীমা ছাড়িয়ে গেছে (অন্য কোনও প্রোগ্রাম থেকে)?
যদি আপনি এমন সমস্যার মুখোমুখি হয়ে থাকেন যা সম্ভবত আপনি মুখোমুখি হচ্ছেন তবে কোনও বৃহত সিএসভি বা এক্সেল ফাইলকে একাধিক ছোট ফাইলগুলিতে বিভক্ত করার জন্য নিম্নলিখিত পাঁচটি উপায় পরীক্ষা করে দেখুন।
কোনও বড় সিএসভি ফাইল হাতে পাওয়া যায় না তবে ঘরে বসে খেলতে চান? আমি উদাহরণগুলিতে COVID-19 ওপেন গবেষণা ডেটাসেট ব্যবহার করছি, যা আপনি ডাউনলোড করেও ব্যবহার করতে পারেন।
1. একটি প্রোগ্রাম ব্যবহার করে সিএসভি ফাইলগুলি ব্রেক আপ করুন
সেখানে বেশ কয়েকটি দরকারী সিএসভি বিভাজন প্রোগ্রাম রয়েছে। এখানে সেরা দুটি। যদিও এই প্রোগ্রামগুলি কাজ করছে যথাযথ সতর্কতা, তারা কখনও কখনও মেমরির সমস্যার মধ্যে চলে যায়, যা সিএসভি বিভাজন প্রোগ্রামগুলির জন্য একটি সাধারণ সমস্যা।
বিনামূল্যে বিশাল সিএসভি বিভাজন

ফ্রি হিউজ সিএসভি বিভাজন একটি প্রাথমিক সিএসভি বিভাজন সরঞ্জাম। আপনি যে সিএসভি ফাইলটি বিভক্ত করতে চান তা ইনপুট করুন, আপনি যে লাইনের গণনাটি ব্যবহার করতে চান তা এবং তারপরে স্প্লিট ফাইলটি নির্বাচন করুন। লাইন গণনাটি আপনার দ্বারা শেষ হওয়া আউটপুট ফাইলের সংখ্যা নির্ধারণ করে।
সিএসভি বিভাজন

সিএসভি স্প্লিটার দ্বিতীয় সরঞ্জাম। এটি ফ্রি হিউজ সিএসভি স্প্লিটারের মতো অনেকগুলি একই কার্যকারিতা সরবরাহ করে, যদিও এটি কিছুটা স্লিকার ডিজাইনযুক্ত। এটি আপনার সিএসভিটিকে দ্রুত ছোট ছোট খণ্ডে বিভক্ত করে, আপনাকে ব্যবহার করতে চাইছে এমন লাইন গণনা নির্ধারণের জন্য।
2. একটি ব্যাচ ফাইল ব্যবহার করুন
পরবর্তী, একটি প্রোগ্রামেবল ব্যাচ ফাইল তৈরি করুন । আপনি সিএসভিকে ছোট অংশগুলিতে প্রক্রিয়া করতে একটি ব্যাচ ফাইল ব্যবহার করতে পারেন, বিভিন্ন খণ্ড সরবরাহ করার জন্য ফাইলটি কাস্টমাইজ করে।
একটি নতুন পাঠ্য দস্তাবেজ খুলুন, তারপরে নিম্নলিখিতটি অনুলিপি করুন এবং আটকে দিন:
@echo off
setlocal ENABLEDELAYEDEXPANSION
REM Edit this value to change the name of the file that needs splitting. Include the extension.
SET BFN=HCAHPSHospital.csv
REM Edit this value to change the number of lines per file.
SET LPF=2500
REM Edit this value to change the name of each short file. It will be followed by a number indicating where it is in the list.
SET SFN=HosptialSplitFile
REM Do not change beyond this line.
SET SFX=%BFN:~-3%
SET /A LineNum=0
SET /A FileNum=1
For /F "delims==" %%l in (%BFN%) Do (
SET /A LineNum+=1
echo %%l >> %SFN%!FileNum!.%SFX%
if !LineNum! EQU !LPF! (
SET /A LineNum=0
SET /A FileNum+=1
)
)
endlocal
Pause
দৌড়ানোর আগে আপনার ব্যাচ ফাইলটি কনফিগার করতে হবে। প্রতিটি কমান্ড কী করে তা আমি আপনাকে বলব এবং আপনি এটি আপনার ব্যাচের ফাইলের আকারের পাশাপাশি প্রয়োজনীয় আউটপুট অনুসারে পরিবর্তন করতে পারবেন।
- "SET BFN =" আপনার যে সিএসভিটি ভেঙে যেতে হবে তা নির্দেশ করা উচিত
- " SET LPF =" হল এমন সারিগুলির সংখ্যা যা আপনি নিজের নতুন ফাইলটিতে সীমাবদ্ধ রাখতে চান
- " স্পষ্ট এসএফএন =" হ'ল আপনার বিভক্ত ফাইলগুলির জন্য নতুন নামকরণের পরিকল্পনা
একবার আপনি আপনার ভেরিয়েবলগুলি প্রবেশ করিয়ে নিলে ফাইল> সেভ করুন to একটি ফাইলের নাম চয়ন করুন এবং সংরক্ষণ করুন নির্বাচন করুন । তারপরে, আপনার নতুন সংরক্ষিত পাঠ্য ফাইলটি নির্বাচন করুন এবং এটির পুনরায় নামকরণ করতে F2 টিপুন। .Txt এক্সটেনশনটি .bat এর সাথে প্রতিস্থাপন করুন এবং সতর্কতা উপস্থিত হলে ঠিক আছে টিপুন। এখন, আপনি আপনার বড় সিএসভি ফাইলকে ছোট আউটপুট ফাইলগুলিতে ভাগ করতে পারেন।
৩. একটি সিএসভি ফাইল ব্রেকআপ করার জন্য পাওয়ারশেল স্ক্রিপ্ট ব্যবহার করুন
প্রতিদিন ব্যাপী কাজের জন্য আপনি ব্যাচের ফাইলগুলি ব্যবহার করতে পারেন । তবে পাওয়ারশেল স্ক্রিপ্টগুলি দ্রুততর হয়, বিশেষত এই ধরণের প্রক্রিয়াকরণ এবং বিভাগের জন্য।
নিম্নলিখিত স্ক্রিপ্টটি আপনার বড় সিএসভি দ্রুত ছোট ফাইলগুলিতে কাটবে।
প্রথমে উইন্ডোজ পাওয়ার মেনু খুলতে CTRL + X টিপুন , তারপরে পাওয়ারশেল নির্বাচন করুন। পাওয়ারশেল যদি কোনও বিকল্প না হয় তবে আপনার স্টার্ট মেনু অনুসন্ধান বারটিতে পাওয়ার ইনশক্তি ইনপুট করুন এবং সেরা ম্যাচটি নির্বাচন করুন।
এখন, নিম্নলিখিত স্ক্রিপ্টটি অনুলিপি করুন এবং আটকান:
$InputFilename = Get-Content 'C:filelocation'
$OutputFilenamePattern = 'output_done_'
$LineLimit = 50000
$line = 0
$i = 0
$file = 0
$start = 0
while ($line -le $InputFilename.Length) {
if ($i -eq $LineLimit -Or $line -eq $InputFilename.Length) {
$file++
$Filename = "$OutputFilenamePattern$file.csv"
$InputFilename[$start..($line-1)] | Out-File $Filename -Force
$start = $line;
$i = 0
Write-Host "$Filename"
}
$i++;
$line++
}
আপনার সিএসভি ফাইলের সাথে প্রথম লাইনে ফাইলের অবস্থানটি প্রতিস্থাপন করুন, তারপরে স্ক্রিপ্টটি চালান। স্ক্রিপ্টটি আপনার ব্যবহারকারী ডিরেক্টরিতে ছোট সিএসভি ফাইলগুলি আউটপুট করে। উদাহরণস্বরূপ, আমার সিএসভি ফাইলগুলি সি: ব্যবহারকারীদের ফাইল নাম আউটপুট_ডোন_1 . csv সহ গ্যাভিনে পাওয়া যায় । আপনি $ আউটপুটফাইলেমনপ্যাটার্ন = 'আউটপুট_ডোন_' লাইনটি পরিবর্তন করে আউটপুট নাম পরিবর্তন করতে পারেন।

আপনি আসল স্ক্রিপ্টটি এসপিজেফে পাবেন ।
৪. পাওয়ার পাইভট ব্যবহার করে একটি বৃহত্তর সিএসভি বিচ্ছেদ করুন
একটি বড় সিএসভি ফাইলকে ছোট ছোট বিটগুলিতে ভাঙ্গার জন্য আপনার পেনাল্টিমেট সমাধান আসলে এটি ভেঙে যায় না। বরং এটি আপনাকে আপনার বিশাল সিএসভি ফাইল এক্সেলে লোড করতে এবং এটিকে খোলার জন্য পাওয়ার পিভট সরঞ্জামটি ব্যবহার করতে দেয়। সেটা ঠিক; আপনি কার্যকরভাবে এক্সেল লাইনের সীমাটি উপেক্ষা করতে পারেন এবং প্রোগ্রামের মধ্যে ফাইলটি পরিচালনা করতে পারেন।

আপনি সিএসভি ফাইলে একটি ডেটা লিঙ্ক তৈরি করে এবং এরপরে সামগ্রীগুলি পরিচালনা করার জন্য পাওয়ার পিভট ব্যবহার করে এটি অর্জন করেছেন। সম্পূর্ণ ব্যাখ্যা এবং টিউটোরিয়াল জন্য, প্রক্রিয়া বিশদ বিবরণ জোসে বারেটোর ব্লগ পড়ুন ।
সংক্ষেপে, ব্যারেটো "8.5 মিলিয়ন সারি পর্যন্ত কোনও সমস্যা ছাড়াই" ব্যবহার করে একটি পিভট টেবিল তৈরি করে। উপরের চিত্রটি ব্লগ পোস্ট থেকে এসেছে, এক্সেলে মোট 2 মিলিয়ন সারি দেখানো হয়েছে।
মনে রাখবেন, এই প্রক্রিয়াটি সিএসভিকে ছোট অংশগুলিতে ভাগ করে না। যাইহোক, এর অর্থ এই নয় যে আপনি এক্সেলের সিএসভি হেরফের করতে পারেন, এটি একটি খুব সহজ বিকল্প। আপনার আরও টিপসের প্রয়োজন হলে ডেটা বিশ্লেষণের জন্য কীভাবে পিভট সারণীটি ব্যবহার করবেন তা সন্ধান করুন ।
৫. বিভক্ত সিএসভি ব্যবহার করে বৃহত সিএসভি অনলাইন ব্রেক করুন
এছাড়াও অনলাইন পরিষেবা রয়েছে যা আপনার বড় সিএসভি ফাইলকে ছোট ছোট বিটগুলিতে বিভক্ত করে। এর মধ্যে একটি বিকল্প হ'ল স্প্লিট সিএসভি , একটি ফ্রি অনলাইন সিএসভি বিভক্তকরণ।

স্প্লিট সিএসভি COVID-19 ডেটাসেট জরিমানা পরিচালনা করে, এটি সহজে কাজগুলিতে ভাগ করে। অন্যান্য সরঞ্জামগুলির মতো, আপনি প্রতিটি ফাইলের জন্য লাইন গণনাটি সংজ্ঞায়িত করেন এবং এটিকে আলাদা করতে দিন। তবে, পরীক্ষা করার জন্য আমার কাছে কোনও বৃহত্তর সিএসভি ফাইল নেই, এবং এর মতো আপনার অভিজ্ঞতাও ভিন্ন হতে পারে।
বিভক্ত সিএসভিতে প্রিমিয়াম বিকল্পগুলিও অন্তর্ভুক্ত রয়েছে। সাবস্ক্রিপশন ফির জন্য, আপনি একটি কাস্টম ডিলিমিটার ব্যবহার করতে পারেন , আউটপুট ফাইলের ধরণের একটি নির্বাচন চয়ন করতে পারেন , আউটপুট ফাইলগুলি থেকে নির্দিষ্ট অক্ষর মুছে ফেলতে এবং সদৃশ লাইনগুলি মুছতে পারেন।
আপনার সিএসভি ফাইলগুলি সহজেই পরিচালনাযোগ্য অংশগুলিতে ভেঙে দিন
আপনার সিএসভি ফাইলগুলি ছোট বিটগুলিতে ভাঙ্গার জন্য এখন পাঁচটি সমাধান রয়েছে যাতে এগুলি পরিচালনা করা সহজ করে তোলে। সমাধানগুলি গতিতে এবং তারা যে সিএসভি ফাইলগুলি পরিচালনা করতে পারে তার আকারের পরিমাণে পরিবর্তিত হয়, তাই আপনার পক্ষে সবচেয়ে কার্যকর যে সমাধানটি সন্ধান করে তা খুঁজতে আপনাকে পরীক্ষা করতে হতে পারে।
চিত্র ক্রেডিট: লুকাডপ / ডিপোজিটফোটোস