📜  安装 tesseract 5 ubuntu - Shell-Bash (1)

📅  最后修改于: 2023-12-03 15:25:07.422000             🧑  作者: Mango

安装 Tesseract 5 Ubuntu

Tesseract 是一个免费开源的 OCR (光学字符识别) 引擎。在 Ubuntu 上,你可以使用以下命令安装:

sudo apt install tesseract-ocr

这会安装 Tesseract 4。但如果你需要安装 Tesseract 5,你需要按照以下步骤进行操作。

步骤 1: 安装依赖项

在安装 Tesseract 5 之前,你需要先安装以下依赖项:

sudo apt update
sudo apt install -y g++
sudo apt install -y autoconf automake libtool pkg-config
sudo apt install -y libpng-dev libjpeg8-dev libtiff5-dev zlib1g-dev libicu-dev libpango1.0-dev libcairo2-dev
步骤 2: 下载和编译 Tesseract 5

下载 Tesseract 5 文件:

wget https://github.com/tesseract-ocr/tesseract/archive/5.0.0-alpha.tar.gz

解压文件并进入目录:

tar -zxvf 5.0.0-alpha.tar.gz
cd tesseract-5.0.0-alpha

编译和安装:

./autogen.sh
./configure
make -j
sudo make install
sudo ldconfig

Tesseract 5 就安装成功了!你可以使用以下命令测试是否安装成功:

tesseract --version

应该会输出以下版本信息:

tesseract 5.0.0-alpha-188-g7711f
 leptonica-1.80.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.37 : libtiff 4.1.0 : zlib 1.2.11 : libicu 66.1 : libcairo 1.16.0 : libpango 1.44.7 : libicu 66.1