Empfohlene Werkzeuge zur Datei-Deduplizierung
Ich empfehle diese beiden Werkzeuge für die allgemeine Deduplizierung von Dateien:
Czkawa: GUI-basiertes Deduplizierungswerkzeug
Czkawka-Homepage - direkter Download-Link
Dieses Open-Source-Werkzeug unterstützt sowohl hashbasierte Deduplizierung (die byte-für-byte identische Dateien findet) als auch Ähnlichkeitsbasierte Bilddeduplizierung mit visuellem Vergleich. Es ist recht einfach zu bedienen, daher ist Czkawka das Werkzeug, das ich jedem als Einstieg empfehle – dennoch unterstützt es viele Funktionen, die Deduplizierung effizient machen.
rmlint - Kommandozeilen-Deduplizierung
rmlint ist ein vollwertiges Kommandozeilen-Deduplizierungswerkzeug, das extrem funktionsreich ist. Soweit ich weiß hat es keine GUI, daher ist es nur für Benutzer geeignet, die mit der Kommandozeile vertraut sind. Ich verwende es für Deduplizierung auf Servern etc. und nutze regelmäßig einige seiner Funktionen wie markierte Dateien, sodass Duplikate aus bestimmten Ordnern nicht gelöscht werden:
rmlint -k folder_where_to_remove_files // original_folder