資源簡介
VS2010調(diào)用tesseract步驟
先說明一下,我的tesseract安裝路徑為D:\Tesseract-OCR,如果你的安裝路徑和我不一樣,將這份文檔里所有的D:\Tesseract-OCR改為你的安裝路徑即可。
查了下資料,VS2012的調(diào)用方法和2010類似,可以試一下,出了問題再說。
1. 下載lib和dll(所有需要下載的東西在附件里下載)
? 首先安裝tesseract-ocr-setup-3.02.02.exe文件,我的安裝路徑為D:\Tesseract-OCR;
? 安裝完成后解壓tesseract-3.02.02-win32-lib-include-dirs.zip文件,將里面的lib和include文件夾復(fù)制到Tesseract-OCR目錄下;
? 最后解壓縮 liblept168和VS2010編譯出的libtesseract302.rar 文件,將該壓縮文件里的三個dll文件復(fù)制到Tesseract-OCR\lib目錄下,替換該目錄下的文檔
(原因:該目錄下被替換的文檔時在VS2008平臺下編譯生成的,替換的文檔則是VS2010平臺下生成的,這個事從網(wǎng)上直接找的)
? 將chi_sim.traineddata.gz解壓縮,然后將chi_sim.traineddata復(fù)制到D:\Tesseract-OCR\tessdata下,這是已經(jīng)有的簡體中文訓(xùn)練集
2. 檢查并修改環(huán)境變量
一般情況下環(huán)境安裝好tesseract后環(huán)境變量就自動配置好了,但是為了確保后面不出錯,最好還是檢查一下,在環(huán)境變量Path中增加指向安裝目錄下lib的路徑,比如D: \Tesseract-OCR\lib ,以便exe運(yùn)行時能找到所需要的dll。
? 還有一步特別重要,就是一定要查看環(huán)境變量TESSDATA_PREFIX,將其路徑改到D:\Tesseract-OCR\下。
3. 新建一個C 工程,我建的是一個空的win3程序。建好后新建一個CPP文件,添加這幾行代碼:
#include "strngs.h"
#include "baseapi.h"
#include <iostream>
using namespace std;
#pragma comment(lib,"libtesseract302d.lib")
然后需要添加包含的庫和目錄,如下:(我新建的工程名為test)
(1) 在工程(不是解決方案)上單擊右鍵,選擇屬性,依次單擊配置屬性——C/C ——常規(guī),在右側(cè)找到附加包含目錄,該目錄下添加D: \Tesseract-OCR\include\tesseract;
(2) 配置屬性——鏈接器——常規(guī),找到附加庫目錄,添加D: \Tesseract-OCR\lib
4、在前面新建的CPP中加入如下代碼:
int main()
{
char * str = "D:\\0_1326268060c8r8.gif"; //這是要識別圖像的絕對路徑
tesseract::TessBaseAPI api;
api.Init(NULL, "chi_sim", tesseract::OEM_DEFAULT); //初始化,設(shè)置語言包,中文簡體:chi_sim;英文:eng;也可以自己訓(xùn)練語言包
STRING text_out; //定義輸出的變量
if (!api.ProcessPages(str, NULL, 0, &text_out))
{
return 0;
}
cout<<text_out.string(); //輸出到命令行中
}
然后運(yùn)行文件,可以發(fā)現(xiàn)將識別出的文字顯示在了命令行中。
代碼片段和文件信息
-----------?---------??----------?-----??----
?????文件???19732398??2015-10-19?11:04??tesseract_ocr資料\chi_sim.traineddata.gz
?????文件???13524653??2015-10-30?15:49??tesseract_ocr資料\tesseract-ocr-setup-3.02.02.rar
?????文件???16341676??2015-10-30?15:46??tesseract_ocr資料\tesseract_ocr?include&lib?vs2010下.rar
?????文件??????18140??2015-10-29?14:32??tesseract_ocr資料\VS2010調(diào)用tesseract-OCR_API步驟.docx
?????目錄??????????0??2015-10-30?15:49??tesseract_ocr資料
-----------?---------??----------?-----??----
?????????????49616867????????????????????5
- 上一篇:OpenCV圖像拼接項目
- 下一篇:opencv查找二值圖像最大連通區(qū)域
評論
共有 條評論