机器学习项目实战:图片验证码识别
文章目录 项目分析 代码实现 生成训练使用的验证码图片(150张) 生成的图片效果展示 生成图片代码 图线清洗并切割 清洗效果展示 切割效果展示 图片清洗切割代码实现 数据处理,建模及测试 建模效果展示 测试效果展示 数据处理,建模及测试代码实现 项目分析 基于逻辑回归和图像处理的项目 输入:一个验证码图像 输出:这个验证码图像中的数字(字母) 步骤 对图像进行处理 (1)二值化:首先把图像从RGB3通道转化成Gray1通道,然后把灰度图(0~255)转化成二值图(0,1) (2)降噪:通过处理孤立点,对二值化的图进行降噪 (3)图片切割:根据像素格,把图片中的所有(5个)数字,分别保存到对应的0~9文件夹下 至此:数据处理就完成了 把数据带入逻辑回归进行建模 (1)把切割好的数据,按照X(二位数组),Y(一维数组)的方式传入logisticRegression.fit()函数进行拟合,我们可以通过网格搜索(GridSearch)来进行调参 (2)通过joblib包,把模型保存到本地 得到模型后,进行图像验证 (1)根据步骤1,重复操作新的图像 (2)对切割好的每个图像,独立的进行预测 (3)把最后预测结果进行拼接 用到的技术: 分类:逻辑回归 模型选择:网格搜索, 查准率 查全率, 混淆矩阵,准确率(score) 图像处理的技术:RGB转灰度转二值,8位降噪,图像切割 代码实现