简介
pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。
安装
安装引擎
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
一般是Windows 64位系统最新版:
如果要识别中文,注意选中中文模块。
把tesseract.exe目录加入Path,如D:\Program Files\Tesseract-OCR
。
安装pytesseract包
pip install Pillow
pip install pytesseract
测试代码
from PIL import Image
import pytesseract
res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)
相关链接
本站资源均来自互联网,仅供研究学习,禁止违法使用和商用,产生法律纠纷本站概不负责!如果侵犯了您的权益请与我们联系!
转载请注明出处: 免费源码网-免费的源码资源网站 » 基于pytesseract的OCR图片识别
发表评论 取消回复