Amazon验证码识别 在破解Amazon的验证码的时候,利用机器学习得到验证码破解精度超过70%,主要是训练样本不够,如果在足够的样本下达到90%是非常有可能的。 update后,样本数为2800多,破解精度达到90%以上,perfect! 文档结构为 -- iconset1 -- ... -- jpg -- img -- jpg -- ... -- error.txt -- py -- crack.py 需要的库 pip3 install pillow or easy_install Pillow 必须文件下载地址 Amazon验证码识别 1.读取图片,打印图片的结构直方图 遍历出所有的jpg文件, import os # 找出文件夹下所有xml后缀的文件 def listfiles(rootdir, prefix='.xml'): file = [] for parent, dirnames, filenames in os.walk(rootdir): if parent == rootdir: for filename in filenames: if filename.endswith(prefix): file.append(rootdir + filename) return file else: pass if __name__ == '__main__':