linux系统如何使用tess4j(java)进行ocr图片文字识别

摘要:
1、安装GCC开发环境,从而支持后续程序的编译安装:yumgroupinstall"DevelopmentTools"2、安装tesseract所需的依赖库yum-yinstalllibjpeg*libpng*freetype*gd*giflib*libtiff*zlib*3、安装tesseract和leptonica(1)首先安装依赖的leptonica库:wgethttp://www.lept

1、安装GCC开发环境,从而支持后续程序的编译安装:
yum groupinstall "Development Tools"

2、安装tesseract所需的依赖库
yum -y install libjpeg* libpng* freetype* gd* giflib* libtiff* zlib*

3、安装tesseract和leptonica
(1)首先安装依赖的leptonica库:
wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure && make && make install
(2)编译tesseract了,所用版本 3.04,编译需要automake、libtool,直接用yum安装就可以了。
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./autogen.sh
./configure
make && make install
(3)下载安装英文,中文繁体,中文简体 识别库。
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
cp/mv *.traineddata /usr/local/share/tessdata/

(4)测试

tesseract card.jpg ./b -psm 3 -l chi_sim+eng

cat b.txt

注意: 安装完成后,将/usr/local/lib/ 目录下的so文件拷贝到 /usr/lib64/
cp /usr/local/lib/*.so.* /usr/lib64/

免责声明:文章转载自《linux系统如何使用tess4j(java)进行ocr图片文字识别》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇C# Win32控制台应用程序忽略 Ctrl + C,阻止程序退出APK Crack下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

谷歌chrome浏览器本地文件跨域配置不生效

- 最近下载easyui的demo到本地看看效果,查看grid时页面加载不出数据,报错; Access to XMLHttpRequest at 'file:///E:/ExtendPlugIn/EasyUI/jquery-easyui-1.8.6/demo/datagrid/datagrid_data1.json' from origin 'null'...

使用Phabricator进行代码审查

使用Phabricator进行代码审查Pharicator 是FB的代码审查工具,主要开发者为Evan Priestley,是一个开源软件,可在Apache许可证第2版下作为自由软件分发。详细信息可查看官方文档。这里从应用的角度,一步一步来谈怎么使用Pharicator进行代码审查。 1.安装 安装分为两部分:服务端和客户端。服务端的这里不介绍了,大家可参...

Linux之telnet详解

telnet命令通常用来远程登录。telnet程序是基于TELNET协议的远程登录客户端程序。Telnet协议是TCP/IP协议族中的一员,是Internet远程登陆服务的标准协议和主要方式。它为用户提供了在本地计算机上完成远程主机工作的 能力。在终端使用者的电脑上使用telnet程序,用它连接到服务器。终端使用者可以在telnet程序中输入命令,这些命令...

LINUX-文件的特殊属性

chattr +a file1 只允许以追加方式读写文件 chattr +c file1 允许这个文件能被内核自动压缩/解压 chattr +d file1 在进行文件系统备份时,dump程序将忽略这个文件 chattr +i file1 设置成不可变的文件,不能被删除、修改、重命名或者链接 chattr +s file1 允许一个文件被安全地删除 cha...

【学习总结】快速上手Linux玩转典型应用-第5章-远程连接SSH专题

课程目录链接 快速上手Linux玩转典型应用-目录 目录 1. 认识SSH 2. 服务器安装SSH服务 3. 客户端安装SSH工具 4. 客户端链接SSH服务 5. SSH config 6. SSH免密登录 ============================================================== =====...

Linux中使用mysqldump对MySQL数据库进行定时备份

#!/bin/bash PATH=/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin:~/bin export PATH export LANG=en_US.UTF-8 savedir=/log/database_ba...