Python破解验证码技术,识别率高达百分之八十!

96
妄心xyx
3.0 2019.03.09 21:16 字数 336
Python破解验证码技术,识别率高达百分之八十!

本文将具体介绍如何利用Python的图像处理模块pillow和OCR模块pytesseract来识别上述验证码(数字加字母)。

我们识别上述验证码的算法过程如下:

image.png
Python破解验证码技术,识别率高达百分之八十!

将原图像进行灰度处理,转化为灰度图像;

获取图片中像素点数量最多的像素(此为图片背景),将该像素作为阈值进行二值化处理,将灰度图像转化为黑白图像(用来提高识别的准确率);

去掉黑白图像中的噪声,噪声定义为:以该点为?#34892;?#30340;九宫格的黑点的数量小于等于4;

利用pytesseract模块识别,去掉识别结果中的特殊字符,获得识别结果。

我们的图片如下(共66张图片):

Python破解验证码技术,识别率高达百分之八十!

完整的Python代码如下:

Python破解验证码技术,识别率高达百分之八十!
Python破解验证码技术,识别率高达百分之八十!

运行结果如下:

Python破解验证码技术,识别率高达百分之八十!
Python破解验证码技术,识别率高达百分之八十!
Python破解验证码技术,识别率高达百分之八十!

我们可以看到图片识别的正确率为80%以上,其中数字类图片的识别正确率为100%.

我们可以在图片识别方面的算法再加改进,以提高图片识别的正确率。当然,以上算法并不是?#36816;?#26377;验证码都适用,不同的验证码需要用不同的图片处理算法。

日记本
东京食尸鬼unravel原唱
排列三走势图专业版带连线 三分时时彩开奖预测 福建快3号码推荐号码推荐号码 七星彩大乐透走势图带坐标走势图 3d中国象棋真人游戏 六和彩一码中特玄机 福彩6十1开奖结果今天 qq五子棋最新下载 极速快3是哪个彩票公司 教职工羽毛球比赛方案 11选5技巧论坛乐彩 老牌四肖中特网 36选7福建体彩论坛 河北20选5走势图近30期 七乐彩走势图网易