1.安装tesseract
window下,要先安装为tesserocr提供支持的tesseract,下载地址:
https://digi.bib.uni-mannheim.de/tesseract/
这里我们一般下载不带dev的稳定版本,以我下载的3.05版本为例:
安装完成后双击
之后点击下一步直至安装完成
2.配置环境变量
(1)path变量:添加tesseract的安装路径,如下地址栏:
(2)再新建一个tesseract变量,添加如下地址:
3.通过wheel来安装tesserocr
(1)首先安装wheel
在python源文件的scripts路径下执行如下命令:
pip install wheel
(2)安装tesserocr对应的 .whl 文件
https://github.com/simonflueckiger/tesserocr-windows_build/releases
cp后边的数字代表版本,我安装的310
这里我安装在 scripts 目录下
(3)安装tesserocr
用管理员身份打开cmd,切换到刚才的 .whl 文件目录下,执行如下命令:
pip install tesserocr-2.5.2-cp310-cp310-win_amd64.whl
注:install后边的部分就是你刚才下载的 .whl 文件的全称