win10安装tesserocr配置 Python使用tesserocr识别字母数字验证码
链接:https://pan.baidu.com/s/1l2yiba7ZTPUTf41ZnJ4PYw
提取码:t3bq
win10安装tesserocr
首先需要下载tesseract,它为tesserocr提供底层支持。具体下载官方路径:https://github.com/UB-Mannheim/tesseract/wiki,选择对应的系统版本,可以选择一个相对不带dev的稳定版本下载,如:tesseract-ocr-setup-3.05.02-20180621.exe。然后一路安装,唯一记得勾选Additionallanguagedata(download),勾选可能会用到的语言tessdata,如简体、繁体中文,数学模块等,不需要全选,下载tessdata的时间会比较长。
安装python对应的tesserocr库
使用原始的whl文件方式安装。tesserocr的whl官方文件下载路径:https://github.com/simonflueckiger/tesserocr-windows_build/releases,下载本地环境对应的whl文件,如我的是window64位系统,python版本是3.5。下载完后,使用cd跳转到whl文件所在目录,然后执行”pipinstalltesserocr-2.2.2-cp35-cp35m-win_amd64.whl“,即可轻松完成安装。
tesserocr报错UnicodeDecodeError系统问题用下面的模块替代
pytesseract:pipinstallpytesseract
pipinstallpytesseract
首次运行总是不顺利,相信我遇到的坑大多数人都会遇到,大抵错误类似:
Traceback(mostrecentcalllast):File"G:\pythonSources\my12306/obtain_message\test.py",line4,inprint(tesserocr.image_to_text(image)) File"tesserocr.pyx",line2400,intesserocr._tesserocr.image_to_text RuntimeError:FailedtoinitAPI,possiblyaninvalidtessdatapath:“本地某个路径”
有个比较简单粗暴的解决方法是把安装好的Tesseract-OCR下的tessdata文件夹整个拷贝到提示的那个路径中,亲测有效。
测试代码
importtesserocr fromPILimportImage image=Image.open('image.jpg') print(tesserocr.image_to_text(image))
总结
以上所述是小编给大家介绍的win10安装tesserocr配置Python使用tesserocr识别字母数字验证码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对毛票票网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。