本站所列毕业设计(论文)资料均属于原创者所有,初衷是为大家在毕业设计(论文)过程中参考和学习交流之用。

毕业设计我帮你

验证码识别技术研究与实现

验证码识别技术研究与实现

本论文研究的是数字字符型验证码的识别,对数字字符型验证码的识别采用的是模拟OCR技术,本文的研究过程大体分为以下几个步骤:第一步:准备需要被识别的数字字符型验证码素材;第二步:对素材图片进行图片预处理操作;第三步:对进行预处理操作后素材进行二

如需购买请QQ扫描右边二维码或者加QQ 3449649974 咨询 毕业设计(论文)代做请加QQ 2269757180 微信号:bylwwwww


  • 详细描述

    验证码识别技术研究与实现
    摘要:随着我们慢慢的进入了互联网时代,现今人们对互联网依赖程度的日益增高,互联网技术已经开始更多的融入了我们的日常生活,吃饭,打车,购物,学习,网上银行还有更多涉及到我们个人财产和资料的服务都在使用互联网技术,所以网络的安全问题也日益突出,网站方面为防止使用机器人程序自动化批量注册、登陆、发送垃圾广告、恶意尝试密码等情况和消耗、威胁到服务器安全的问题的发生,大量使用了验证码技术,而且根据验证码技术简单,易于实现,数据传输量少的特点,被广泛使用在区别人机操作,强制人机交互上,可以说是网络安全的第一道防火墙,基于验证码技术的重要地位,对验证码识别技术的研究就显得至关重要,对验证码技术的研究可以及时的排查出验证码的漏洞对于增强网络的安全性和防止恶意攻击上有着重要的意义。本文利用OCR(Optical Character Recognition,光学字符识别)的技术来识别数字字符型验证码,并选取了多个网站的不同种验证码进行分析研究,揭示了其可能的不安全性。
    关键词:验证码;验证码识别;数字字符型验证码;OCR;
     
    目 录
    一、绪论 5
    (一)验证码的由来 5
    (二)验证码的作用 5
    (三)研究验证码识别的目的和意义 5
    (四)验证码的种类
    1、图片验证码
    2、数字字符型验证码 6
    3、基于数学的算数型验证码 6
    4、其它类型验证码
    (五)本文的工作 7
    二、验证码识别的理论
    (一)关于验证码的识别
    (二)验证码识别的流程 9
    (三)验证码识别中遇到的问题 10
    1、背景色问题 10
    2、干扰素问题
    3、三维扭曲问题
    三、验证码识别系统的开发
    (一)所用语言
    1、Python
    (二)所用工具
    1、Pillow与PIL
    2、Tesseract-OCR
    3、Pytesser
    4、Image类
    (三)关于Python的 GUI
    1、Tkinter
    2、PyQt
    3、wxPython
    (四)识别操作的步骤与算法
    1、验证码素材的预处理
    2、二值化
    3、去除噪点
    4、字符切割
    5、字符取样
    6、识别并返回识别结果
    四、验证码识别系统与操作
    (一)系统初始界面与操作
    (二)系统执行界面与操作 19
    (三)点错按钮时执行提示界面与操作 19
    (四)无法点击上一张时执行提示界面与操作
    (五)无法点击下一张时执行提示界面与操作
    (六)输入错误文件路径时执行提示界面与操作
    (七)无法识别时执行界面与操作
    (八)识别成功时界面与操作
    五、小结与致谢
    六、参考文献 28
     
    毕业设计小结
    随着越来越发达的科技,网络生活渐渐成了人们的中心,越来越多的事情可以通过网络上进行;越来越多的事情方便在网络上进行;越来越多的事情越来越多的事情只能在网络上进行,没有了网络就会与世界脱轨,我们能从网络中得到的有太多,网络能从我们身上带走的也太多,网络的发展也来越倾向于透明化,越发的透明变越发的透露着网络的弊端,网络的安全问题也开始越发的突显,如何守护好网络安全的大门,验证码的存在尤为的重要。
    本文在研究了图片预处理、去除噪点、二值化、字符切割、取样比对等等一系列数字字符型验证码识别流程之后,可以更清楚的意识到验证码的识别是没有通用算法的,每个系统制造的验证码都不尽相同,看似小小的差异,却在识别算法上大相径庭,没有捷径可走。世界上没有一个程序可以识别所有的验证码,甚至两种看似相似的验证码用同一个程序识别起来准确率会相去甚远。数字字符型验证码是字符类验证码中比较容易识别的一种,其实整套识别操作下来也没有那么的简单。取样、调样、整改、设计等等一系列问题环环相扣,在这期间就算一切都准备好了,但如果生成验证码的程序改动了一点点,那么识别的核心算法几乎要全部推翻,验证码的存在就像是一个易守难攻的堡垒,可以极其简单却十分有效的瓦解或削弱敌人的攻击,这也是验证码能沿用至今而且越来越普及的根本原因,可以用最小的成本换取更为安全网络环境,验证码是最好的选择。本文举例了很多种形式的验证码图片,其中有几种验证码连人类都无法解答,这就有些本末倒置了,有这样的验证码的存在,网络是安全了,可是人类进入不了网络世界,那么网络就会变得完全没有意义,其实那样复杂的验证码完全没有必要放在公众的平台上,现在比起图片类型的验证码更加方便的是短信验证码,快捷、简单又方便,更加的私人和安全。
    总之,验证码的安全性还是很高的,字符的分割和识别算法都是比较难以突破的瓶颈,验证码没有统一的识别算法,这验证码一直是有效的网络安全的手段的原因。
     
    参考文献
    [1] 郭峰 汉语语音验证码技术及应用[D].浙江:浙江大学,2010. 
    收缩