📜  python 查找重复的 zip 文件 - Python (1)

📅  最后修改于: 2023-12-03 14:46:16.459000             🧑  作者: Mango

Python 查找重复的 zip 文件

在文件夹中找到重复文件是一个常见的问题。在这篇文章中,我们将探讨如何使用 Python 找到重复的 zip 文件。

首先,我们需要安装 os 模块来访问文件系统。

import os

接下来,我们需要指定要搜索的文件夹。在本例中,我们将搜索名为 folder_name 的文件夹,并将搜索的 zip 文件的扩展名设置为 .zip

folder_name = 'path/to/folder'
extension = '.zip'

现在,我们可以遍历文件夹,并将每个 zip 文件的大小和路径存储在一个字典中,以便稍后比较。

zip_files = {}

for root, dirs, files in os.walk(folder_name):
    for file in files:
        if file.endswith(extension):
            file_path = os.path.join(root, file)
            file_size = os.path.getsize(file_path)
            if file_size in zip_files:
                zip_files[file_size].append(file_path)
            else:
                zip_files[file_size] = [file_path]

最后,我们可以遍历字典中的条目,并找到具有相同大小的 zip 文件。

for file_size, file_paths in zip_files.items():
    if len(file_paths) > 1:
        print(f'Duplicate Zip Files with size {file_size}:')
        for file_path in file_paths:
            print(f'\t{file_path}')

完整代码:

import os

folder_name = 'path/to/folder'
extension = '.zip'

zip_files = {}

for root, dirs, files in os.walk(folder_name):
    for file in files:
        if file.endswith(extension):
            file_path = os.path.join(root, file)
            file_size = os.path.getsize(file_path)
            if file_size in zip_files:
                zip_files[file_size].append(file_path)
            else:
                zip_files[file_size] = [file_path]

for file_size, file_paths in zip_files.items():
    if len(file_paths) > 1:
        print(f'Duplicate Zip Files with size {file_size}:')
        for file_path in file_paths:
            print(f'\t{file_path}')

现在,您可以在 Python 中使用此代码来查找重复的 zip 文件。