javatess4j中文_java截图后怎么用tesseract 文字识别

㈠ java 怎么调用tess4j

网上传的代码示例大多是在Windows下安装Tesseract ORC后通过CMD命令操作进行图识别操作.而 Tess4j 针对Tesseract 提供了JNI支持,同时还提供了一些图片操作的工具类,提供比如图片放大,旋转,黑白处理,锐化等用来提高识别率的操作.操作十分方便. Tess4j 简单到超乎想象,只是自己在使用环境比较特殊,遇到很多问题,这里一一道来.

1 依赖包.

tess4j.jar Tess4j的本尊,用于Tesseract 的JNA支持,并提供相关操作工具类

jna.jar 看到Tesseract 的第一反应是要用cmd或JNI来操作它,了解了一下 Tess4j 使用的JNA,有点JNI高级版的感觉,CMD什么的,玩蛋蛋去吧.

jai_imageio.jar 图片操作的工具类,支持Tiff就靠它了. 它的 META-INF 里有文章,这个后面详说.

还有其它几个包,是用于操作PDF用的吧,没有引用,也没有发生错误.所以的包可以在 Tess4j 的文件目录里面找到.

2 操作代码.

官方的示例中给出了一个超级简单有效的示例,不足20行代码!!!我和小伙伴们都被震惊了!!!关键代码如下:

Java代码收藏代码

File imageFile = new File("eurotext.tif");

Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping

String result = instance.doOCR(imageFile);

实际使用中为了提高识别率还要对图片作一些处理来提高识别率,使用Tess4j 自带的工具类即可完成,这样识别率就大大的提高了.( 这里无法解决验证码中干扰线问题,干扰线的清理,网上有其它方式处理 )

Java代码收藏代码

// 这里对图片黑白处理,增强识别率.这里先通过截图,截取图片中需要识别的部分

BufferedImage textImage = ImageHelper.convertImageToGrayscale(ImageHelper.getSubImage(panel.image, startX, startY, endX, endY));

// 图片锐化,自己使用中影响识别率的主要因素是针式打印机字迹不连贯,所以锐化反而降低识别率

// textImage = ImageHelper.convertImageToBinary(textImage);

// 图片放大5倍,增强识别率(很多图片本身无法识别,放大5倍时就可以轻易识,但是考滤到客户电脑配置低,针式打印机打印不连贯的问题,这里就放大5倍)

textImage = ImageHelper.getScaledInstance(textImage, endX * 5, endY * 5);

3 使用中遇到的问题

3.1 相关DLL文件,相关字库文件

liblept168.dll,libtesseract302.dll 其中 liblept168.dll 要先加载.

tessdata 存放的是字库文件,如果需要数字,英文以外的支持需要 Tesseract 页面下载相关字库.

因为公司使用时是将文件打成Jar布署,然后提供客户端下载,所以就把以上两个文件一起打进tess4j.jar里面,然后客户端使用时 tessdata 直接可用,而 liblept168.dll,libtesseract302.dll 需要释放到临时目录然后加载.相关代码:

㈡ linux 版本tess4j怎么使用

最近要用java实现一个验证码识别系统，选了半天之后最终决定用Tesseract-OCR作为识别引擎。既然是java+Tesseract-OCR，自然就首选Tess4J。由于Tess4J直接且仅提供了编译成dll的3.02版本的Tesseract-OCR，而我的最终目标Linux下使用且想自己更换T...

㈢ java截图后怎么用tesseract 文字识别

网上传的代码示例大多是在Windows下安装Tesseract ORC后通过CMD命令操作进行图识别操作.而 Tess4j 针对Tesseract 提供了JNI支持专,同时还提供了一些图片属操作的工具类,提供比如图片放大,旋转,黑白处理,锐化等用来提高识别率的操作.操作十分方便. T

热点内容

二级开发者还有哪些app 发布：2025-04-29 15:44:19 浏览：241

app充值请联系itunes 发布：2025-04-29 15:22:35 浏览：678

矢量app和cdr哪个好发布：2025-04-29 15:20:18 浏览：85

系统文件坏了如何修复发布：2025-04-29 15:17:09 浏览：20

键盘系统文件误删发布：2025-04-29 15:04:46 浏览：738

白金英雄坛所有版本发布：2025-04-29 15:03:20 浏览：842

ps文件转hsj 发布：2025-04-29 15:02:39 浏览：382

哪个网站电影发布：2025-04-29 14:39:01 浏览：490

ps4游戏文件格式名称发布：2025-04-29 14:33:12 浏览：290

caxa教程2007 发布：2025-04-29 14:29:28 浏览：832

新点是什么小说网站发布：2025-04-29 14:24:24 浏览：753

魔兽世界冰封王座3版本转换器发布：2025-04-29 14:07:15 浏览：418

苹果3dtouch软件发布：2025-04-29 14:06:20 浏览：979

qq视频在哪个文件夹里面发布：2025-04-29 13:59:43 浏览：740

请帖制作网站java源码发布：2025-04-29 13:32:06 浏览：257

自己的网站怎么做兼职发布：2025-04-29 13:31:14 浏览：608

医院基础数据是什么发布：2025-04-29 13:31:11 浏览：744

为什么数据线没有typec接口发布：2025-04-29 13:25:06 浏览：39

苹果手机文件管家发布：2025-04-29 13:24:16 浏览：187

qq头像男生水里发布：2025-04-29 13:19:41 浏览：633

导航:首页 > 编程语言 > javatess4j中文

javatess4j中文

与javatess4j中文相关的资料

友情链接