指定多个文件夹进行文件MD5获取和去重
#找重复的图片MD5
import glob
import hashlib
from collections import Counter
md5List = []
filenames = glob.glob("H:/Python/众包采集/zd/zd/images/附件1/*.jpg")
for filename in filenames:
with open(filename, 'rb') as inputfile:
data = inputfile.read()
md5List.append(hashlib.md5(data).hexdigest())
print(filename, hashlib.md5(data).hexdigest())
filenames = glob.glob("H:/Python/众包采集/zd/zd/images/附件2/*.jpg")
for filename in filenames:
with open(filename, 'rb') as inputfile:
data = inputfile.read()
md5List.append(hashlib.md5(data).hexdigest())
print(filename, hashlib.md5(data).hexdigest())
# md5List.append("7989b444fa8b51ff8f30f69c2caa2aa6")
print(len(md5List))
res = dict(Counter(md5List))
print ({key:value for key,value in res.items()if value > 1}) #展现重复元素和重复次数
3 条评论
2025年10月新盘 做第一批吃螃蟹的人coinsrore.com
新车新盘 嘎嘎稳 嘎嘎靠谱coinsrore.com
新车首发,新的一年,只带想赚米的人coinsrore.com
新盘 上车集合 留下 我要发发 立马进裙coinsrore.com
做了几十年的项目 我总结了最好的一个盘(纯干货)coinsrore.com
新车上路,只带前10个人coinsrore.com
新盘首开 新盘首开 征召客户!!!coinsrore.com
新项目准备上线,寻找志同道合 的合作伙伴coinsrore.com
新车即将上线 真正的项目,期待你的参与coinsrore.com
新盘新项目,不再等待,现在就是最佳上车机会!coinsrore.com
新盘新盘 这个月刚上新盘 新车第一个吃螃蟹!coinsrore.com
内容的丰富性和深度让人仿佛置身于知识的海洋,受益匪浅。
323