資源簡介
python高概率OCR圖像識別案例,python使用tesseract和PIL模塊提高圖片和文字轉化的概率,通過此案例得到的ocr程序腳本識別概率達90%以上!
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
import?sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)
import?os
os.environ[‘NLS_LANG‘]?=?‘SIMPLIFIED?CHINESE_CHINA.UTF8‘
#檢查OCR庫和工具
try:
????from?pyocr?import?pyocr
????from?PIL?import?Image
????from?PIL?import?ImageEnhance
except?ImportError:
????print?‘模塊導入錯誤請使用pip安裝pytesseract依賴以下庫:‘
????print?‘http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil‘
????print?‘http://code.google.com/p/tesseract-ocr/‘
????raise?SystemExit
tools?=?pyocr.get_available_tools()[:]
if?len(tools)?==?0:
????print(“No?OCR?tool?found“)
????sys.exit(1)
#裁剪圖片
FOLDER?=?“.\saved\\“?#處理后的圖片文件夾
FIN_IMAGE?=?‘x.png‘?#處理后的圖片文件名
_CONTENT_TYPES?=?{‘image/png‘:?‘.png‘?‘image/gif‘:?‘.gif‘?‘image/jpeg‘:?‘.jpg‘?‘image/jpeg‘:?‘.jpeg‘}
FIN_IMAGE_PATH?=?FOLDER?+?FIN_IMAGE
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件????????1837??2017-01-09?14:09??imgcrop.py
?????目錄???????????0??2017-01-11?14:23??saved\
?????文件???????28544??2017-01-09?12:00??test.png
?????文件???????47213??2017-01-09?14:41??Python圖像識別.docx
評論
共有 條評論