该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

ocr4j

ocr4j是一个Java基于Tesseract-ocr实现的工具包ocr4j.jar,可以通过这个实现OCR(光学字符识别)🔥。

特性:

  • 不需要额外安装Tesseract
  • 不需要tesseract.dll
  • 不需要网络
  • 平台支持:✅Mac❎Linux❎Windows

使用示例:

package test;

import me.ibyte.ocr4j.model.Tesseract;
import me.ibyte.ocr4j.standard.OpticalCharacterRecognition;
import org.junit.Test;

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;

/**
 * @Author: SDing <br/>
 * <p>
 *  测试OCR 支持Mac Linux Windows
 *  必须是64位操作系统。
 * </p>
 */

public class TestOCR {
    @Test
    public void Test() throws IOException {
        // 创建tesseract
        Tesseract tesseract = new Tesseract();
        // 设置语言
        tesseract.setLanguage(new String[]{"chi_sim","eng"});
        // 设置字符模型目录
        tesseract.setTessData("/Users/ding/Desktop/tessdata");
        // 创建ocr
        OpticalCharacterRecognition ocr = tesseract.newOCR();
        // 需要识别的图片
        String text = ocr.scanText("/Users/ding/Desktop/test.png");
        // 打印识别结果内容
        System.out.println(text);
        // 你也可以通过writer来实现其他类型的存储
        ocr.writer(new FileWriter(new File("/Users/ding/Documents/ocr4j/src/main/resources/1.txt")));
    }
}

使用其他开源项目

空文件

简介

ocr4j is a Java toolkit ocr4j.jar based on Tesseract-ocr. 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化