📅  最后修改于: 2023-12-03 15:25:07.422000             🧑  作者: Mango
Tesseract 是一个免费开源的 OCR (光学字符识别) 引擎。在 Ubuntu 上,你可以使用以下命令安装:
sudo apt install tesseract-ocr
这会安装 Tesseract 4。但如果你需要安装 Tesseract 5,你需要按照以下步骤进行操作。
在安装 Tesseract 5 之前,你需要先安装以下依赖项:
sudo apt update
sudo apt install -y g++
sudo apt install -y autoconf automake libtool pkg-config
sudo apt install -y libpng-dev libjpeg8-dev libtiff5-dev zlib1g-dev libicu-dev libpango1.0-dev libcairo2-dev
下载 Tesseract 5 文件:
wget https://github.com/tesseract-ocr/tesseract/archive/5.0.0-alpha.tar.gz
解压文件并进入目录:
tar -zxvf 5.0.0-alpha.tar.gz
cd tesseract-5.0.0-alpha
编译和安装:
./autogen.sh
./configure
make -j
sudo make install
sudo ldconfig
Tesseract 5 就安装成功了!你可以使用以下命令测试是否安装成功:
tesseract --version
应该会输出以下版本信息:
tesseract 5.0.0-alpha-188-g7711f
leptonica-1.80.0
libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.37 : libtiff 4.1.0 : zlib 1.2.11 : libicu 66.1 : libcairo 1.16.0 : libpango 1.44.7 : libicu 66.1