fdupes का उपयोग करके लिनक्स पर डुप्लिकेट फ़ाइलें कैसे खोजें और निकालें

बड़ी मात्रा में मीडिया और दस्तावेज़ों के साथ काम करते समय, आपके कंप्यूटर पर एक ही फ़ाइल की कई प्रतियां जमा करना काफी सामान्य है। अनिवार्य रूप से, अनावश्यक फ़ाइलों से भरा एक अव्यवस्थित भंडारण स्थान निम्नानुसार है, जो आपके सिस्टम पर डुप्लिकेट फ़ाइलों के लिए समय-समय पर जांच को उत्तेजित करता है।

इसके लिए, आपको डुप्लिकेट फ़ाइलों को पहचानने और हटाने के लिए विभिन्न प्रोग्राम मिलेंगे। और fdupes Linux के लिए ऐसा ही एक प्रोग्राम होता है। इसलिए अनुसरण करें जब हम fdupes पर चर्चा करते हैं और लिनक्स पर डुप्लिकेट फ़ाइलों को खोजने और हटाने के चरणों के माध्यम से आपका मार्गदर्शन करते हैं।

fdupes क्या है?

Fdupes Linux पर डुप्लिकेट फ़ाइलों को खोजने और हटाने के लिए एक CLI-आधारित प्रोग्राम है। इसे GitHub पर MIT लाइसेंस के तहत जारी किया गया है

अपने सरलतम रूप में, प्रोग्राम अपनी फाइलों के MD5 हस्ताक्षरों की तुलना करने के लिए निर्दिष्ट निर्देशिका को md5sum के माध्यम से चलाकर काम करता है। फिर यह डुप्लिकेट फ़ाइलों की पहचान करने के लिए उन पर बाइट-बाय-बाइट तुलना चलाता है और सुनिश्चित करता है कि कोई डुप्लिकेट नहीं छोड़ा गया है।

एक बार fdupes डुप्लिकेट फ़ाइलों की पहचान कर लेता है, तो यह आपको या तो उन्हें हटाने या उन्हें हार्ड लिंक (मूल फ़ाइलों के लिंक) से बदलने का विकल्प देता है। तो आपकी आवश्यकताओं के आधार पर, आप तदनुसार एक ऑपरेशन के साथ आगे बढ़ सकते हैं।

लिनक्स पर fdupes कैसे स्थापित करें?

Fdupes अधिकांश प्रमुख Linux डिस्ट्रोज़ जैसे कि Ubuntu, Arch, Fedora, आदि पर उपलब्ध है। आपके द्वारा अपने कंप्यूटर पर चलाए जा रहे डिस्ट्रो के आधार पर, नीचे दिए गए कमांड जारी करें।

उबंटू या डेबियन-आधारित सिस्टम पर:

 sudo apt install fdupes

फेडोरा/सेंटोस और अन्य आरएचईएल-आधारित डिस्ट्रोस पर fdupes स्थापित करने के लिए:

 sudo dnf install fdupes

आर्क लिनक्स और मंज़रो पर:

 sudo pacman -S fdupes

Fdupes का उपयोग कैसे करें?

अपने कंप्यूटर पर प्रोग्राम स्थापित करने के बाद, डुप्लिकेट फ़ाइलों को खोजने और निकालने के लिए नीचे दिए गए चरणों का पालन करें।

Fdupes के साथ डुप्लिकेट फ़ाइलें ढूँढना

सबसे पहले, आइए एक निर्देशिका में सभी डुप्लिकेट फ़ाइलों की खोज करके प्रारंभ करें। इसके लिए मूल सिंटैक्स है:

 fdupes path/to/directory

उदाहरण के लिए, यदि आप दस्तावेज़ निर्देशिका में डुप्लिकेट फ़ाइलें ढूंढना चाहते हैं, तो आप चलाएंगे:

 fdupes ~/Documents

आउटपुट:

यदि fdupes को निर्दिष्ट निर्देशिका में डुप्लिकेट फ़ाइलें मिलती हैं, तो यह सेट द्वारा समूहीकृत सभी अनावश्यक फ़ाइलों की एक सूची लौटाएगा, और फिर आप आवश्यकतानुसार उन पर आगे की कार्रवाई कर सकते हैं।

हालाँकि, यदि आपके द्वारा निर्दिष्ट निर्देशिका में उपनिर्देशिकाएँ हैं, तो उपरोक्त आदेश उनके अंदर डुप्लिकेट की पहचान नहीं करेगा। ऐसी स्थितियों में, आपको उपनिर्देशिकाओं के अंदर मौजूद सभी डुप्लिकेट फ़ाइलों को खोजने के लिए एक पुनरावर्ती खोज करने की आवश्यकता है।

Fdupes में पुनरावर्ती खोज करने के लिए, -r ध्वज का उपयोग करें:

 fdupes -r path/to/directory

उदाहरण के लिए:

 fdupes -r ~/Documents

आउटपुट:

जबकि उपरोक्त दो आदेश आसानी से निर्दिष्ट निर्देशिका (और इसकी उपनिर्देशिका) के भीतर डुप्लिकेट फ़ाइलें ढूंढ सकते हैं, उनके आउटपुट में शून्य-लंबाई (या खाली) डुप्लिकेट फ़ाइलें भी शामिल हैं।

हालाँकि यह कार्यक्षमता तब भी काम आ सकती है जब आपके सिस्टम पर बहुत अधिक खाली डुप्लिकेट फ़ाइलें हों, यह तब भ्रम पैदा कर सकता है जब आप किसी निर्देशिका में केवल गैर-रिक्त डुप्लिकेट का पता लगाना चाहते हैं।

सौभाग्य से, fdupes आपको -n विकल्प का उपयोग करके इसके खोज परिणामों से शून्य-लंबाई वाली फ़ाइलों को बाहर करने की अनुमति देता है, जिसका उपयोग आप अपने आदेशों में कर सकते हैं।

नोट: आप गैर-रिक्त डुप्लिकेट फ़ाइलों को सामान्य और साथ ही पुनरावर्ती खोजों दोनों में बाहर कर सकते हैं।

अपनी मशीन पर केवल गैर-रिक्त डुप्लिकेट फ़ाइलें खोजने के लिए:

 fdupes -n ~/Documents

आउटपुट:

यदि आप डुप्लिकेट फ़ाइलों के कई सेटों के साथ काम कर रहे हैं, तो भविष्य के संदर्भ के लिए परिणामों को टेक्स्ट फ़ाइल में आउटपुट करना बुद्धिमानी है।

ऐसा करने के लिए, दौड़ें:

 fdupes path/to/directory > file_name.txt

…जहां पथ/से/निर्देशिका वह निर्देशिका है जिसमें आप खोज करना चाहते हैं।

दस्तावेज़ निर्देशिका में डुप्लिकेट फ़ाइलों की खोज करने के लिए और फिर आउटपुट को फ़ाइल में भेजने के लिए:

 fdupes /home/Documents > output.txt

अंतिम लेकिन कम से कम, यदि आप किसी निर्देशिका में डुप्लिकेट फ़ाइलों से संबंधित सभी सूचनाओं का सारांश देखना चाहते हैं, तो आप अपने आदेशों में -m ध्वज का उपयोग कर सकते हैं:

 fdupes -m path/to/directory

दस्तावेज़ निर्देशिका के लिए डुप्लिकेट फ़ाइल जानकारी प्राप्त करने के लिए:

 fdupes -m ~/Documents

आउटपुट:

fdupes के आपके उपयोग के दौरान किसी भी समय, यदि आप किसी कमांड या फ़ंक्शन के लिए सहायता चाहते हैं, तो कमांड-लाइन सहायता प्राप्त करने के लिए -h विकल्प का उपयोग करें:

 fdupes -h

लिनक्स में fdupes के साथ डुप्लिकेट फ़ाइलें हटाना

एक निर्देशिका में डुप्लिकेट फ़ाइलों की पहचान करने के बाद, आप अव्यवस्था को दूर करने और संग्रहण स्थान खाली करने के लिए अपने सिस्टम से इन फ़ाइलों को हटाने/हटाने के साथ आगे बढ़ सकते हैं।

डुप्लिकेट फ़ाइल को हटाने के लिए, -d ध्वज को कमांड के साथ निर्दिष्ट करें और एंटर दबाएं :

 fdupes -d path/to/directory

डाउनलोड फ़ोल्डर में डुप्लिकेट फ़ाइलें निकालने के लिए:

 fdupes -d ~/Downloads

Fdupes अब आपको उस निर्देशिका में सभी डुप्लिकेट फ़ाइलों की एक सूची के साथ प्रस्तुत करेगा और आपको उन फ़ाइलों को संरक्षित करने का विकल्प देगा जिन्हें आप अपने कंप्यूटर पर रखना चाहते हैं।

उदाहरण के लिए, यदि आप सेट 1 में पहली फ़ाइल को संरक्षित करना चाहते हैं, तो आप fdupes खोज के आउटपुट के बाद 1 दर्ज करेंगे और एंटर दबाएंगे।

इसके अलावा, यदि आवश्यक हो, तो आप लौटाई गई डुप्लिकेट फ़ाइलों के एक सेट में कई फ़ाइल इंस्टेंस को भी सहेज सकते हैं। इसके लिए, आपको कॉमा से अलग की गई सूची में डुप्लिकेट फ़ाइलों से संबंधित नंबर दर्ज करने होंगे और एंटर दबाएं

उदाहरण के लिए, यदि आप 1, 3 और 5 फ़ाइलों को सहेजना चाहते हैं, तो आपको दर्ज करना होगा:

 1,3,5

यदि आप डुप्लिकेट फ़ाइलों के प्रत्येक सेट में फ़ाइल की पहली आवृत्ति को संरक्षित करना चाहते हैं और प्रॉम्प्ट को अनदेखा करना चाहते हैं, तो आप -N स्विच को शामिल करके ऐसा कर सकते हैं, जैसा कि निम्न कमांड में दिखाया गया है:

 fdupes -d -N path/to/directory

उदाहरण के लिए:

 fdupes -d -N ~/Documents

लिनक्स में डुप्लीकेट फाइलों को सफलतापूर्वक हटाना

फाइलों को व्यवस्थित करना अपने आप में एक कठिन काम है। इसमें डुप्लिकेट फ़ाइलों के कारण होने वाली परेशानी को जोड़ें, और आप अपने अव्यवस्थित भंडारण को व्यवस्थित करने में कुछ घंटों का समय और प्रयास बर्बाद कर रहे हैं।

लेकिन fdupes जैसी उपयोगिताओं के लिए धन्यवाद, डुप्लिकेट फ़ाइलों की पहचान करना और उन्हें हटाना बहुत आसान और कुशल है। और उपरोक्त मार्गदर्शिका को आपकी Linux मशीन पर इन कार्यों में आपकी सहायता करनी चाहिए।

डुप्लिकेट फ़ाइलों की तरह, डुप्लिकेट शब्द और फ़ाइल में दोहराई गई पंक्तियाँ भी निपटने के लिए निराशाजनक हो सकती हैं और उन्हें हटाने के लिए उन्नत टूल की आवश्यकता होती है। यदि आप भी इस तरह के मुद्दों का सामना करते हैं, तो आप टेक्स्ट फ़ाइल से डुप्लिकेट लाइनों को हटाने के लिए uniq का उपयोग कर सकते हैं।