两周年 & 两万星星撒花！

Celebrating the two-year anniversary of this project and reaching 20k stars!

作者的话

两年前，有个人试图寻找一个免费的、无需注册、开箱即用、支持批量处理且不限制数量的OCR软件。可惜，当时没有软件满足他的需求。于是，他一拍脑袋，花了几个日夜，自己写了个软件原型。那就是 Umi-OCR v1.0 。

没想到这个项目还挺受大家欢迎，于是他就一直维护更新下去。在用户的建议下，Umi 的功能越来越丰富，有了截图，现代化UI，二维码，PDF识别，HTTP接口……从1k行代码的小demo，历经两年迭代，到如今20k+行；Umi 逐渐变成一个较为成熟完整的项目。

未来，Umi 会继续完善现有功能、开发新的功能。受限于作者的业余时间和精力，项目更新的速度可能不会很快，还请给予耐心。本项目始终在稳步前进，历史上大多数Issues反馈和请求，最终都落到了实处。

（下一步，我将对软件底层的插件机制做出较大的调整和重构，以便为表格识别、图片翻译、原生Linux支持等大型功能铺平道路。）

感谢各位用户、开发者、翻译者的支持。感谢我自己的坚持。

—— by hiroi-sora

v2.1.1 主要更新 / Changelog

修复：Windows7 及 核心数<=2的CPU 无法进行文档识别的Bug。
新增：批量文档识别允许指定忽略区域的页数范围。
新增：命令行--path允许传入多个图片或文件夹。👉命令行手册
新增：新的命令行、HTTP接口：识别/生成二维码图像。👉HTTP手册
优化：双栏面板会记忆左右折叠状态。
完善繁+英+日界面本地化翻译。感谢翻译人员。

次要更新：（点击展开）

新增：命令行新指令 --output, --output_append, --clip 。
新增：清空全部识别记录的快捷键。 (#420)
新增：截图预览删除图片显示的选项和快捷键。 (#427)
优化：开始菜单/开机自启快捷方式，默认放置于用户目录下，避免请求管理员权限。 (#428)
优化：保存双层PDF，在没有新文本写入时的处理逻辑。 (#416)
优化：PDF解析时，提取原有文本行的逻辑更准确。
修复：Esc取消截图的消息传递错误。 (#402)
修复：文档整页强制OCR模式下，提高小尺寸页面的渲染精度。
UI：优化一些提示，修复一些渲染问题，美化一些视觉效果。

Windows7 用户注意：常见问题及修复方法

配置文件迁移 / Configuration file migration

Umi-OCR v2 用户升级时，将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

Copy the UmiOCR-data/.settings from the old version of the software to the same location in the new version.

下载说明 / Download Instructions

不同版本仅OCR引擎插件不同，其它功能完全一致。
均支持 win7 x64 及以上的系统，附带多国语言识别库。

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

重要提示：如果执行OCR时报错 0xc0000142、[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0.7z.exe （129MB）
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

Umi-OCR_Rapid_v2.1.0.7z.exe （97.1MB）
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6

重大更新：

批量文档识别。支持 pdf, epub, mobi 等多种格式的文档，对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。
更强大的 排版解析 功能，代替之前的段落合并。基于间隙树排序算法，解析多栏布局图片与文档时有较好的精度。
HTTP接口参数作出了部分改动，并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md 。

⚠ Windows 7 及低配电脑用户注意：

文档识别可能在Win7、或极低配电脑（如双核CPU）中出现异常，如无法识别PDF文件。已在 v2.1.1 版本中修复。

其它更新内容：

新增：允许隐藏托盘图标。 (#338)
新增：重复上一次截图区域的快捷键。 (#357)
新增：用本地图片浏览器打开图片的快捷按钮。 (#335)
修复：避免系统环境变量QMLSCENE_DEVICE的影响。 (#270)
修复一些小问题，优化一些UI表现与提示语。

Help us translate / 帮助我们翻译！

We warmly invite translators to join us in our project's localization efforts!
You can review existing translations or contribute new ones.
Please visit the online platform Weblate at:
https://hosted.weblate.org/engage/umi-ocr/

配置文件迁移

Umi-OCR v2 用户升级时，将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同，其它功能完全一致。
均支持 win7 x64 及以上的系统，附带多国语言识别库。

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

重要提示：如果执行OCR时报错[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0.7z.exe （128MB）
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

Umi-OCR_Rapid_v2.1.0.7z.exe （97MB）
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac

`v2.1.0 alpha` 大版本前的测试版

经过一段时间的爆肝高强度开发，“批量PDF文档识别”功能已基本完成。不过，仍有一些繁琐的辅助功能没写完，仍有一些代码待优化。这些将在v2.1.0正式版中完善。

考虑到有不少用户急需批量文档识别，故提前发布测试版。大家可以用自己的文件来检测这个新功能的稳定性与兼容性。

我要摸鱼一段时间，休息一下。祝用户朋友们，新年快乐~🎉🎉🎉

协助翻译！

如果您擅长简体中文和另外一门语言，可参与本项目翻译，或校对当前翻译！

在线翻译平台： https://hosted.weblate.org/engage/umi-ocr/

`v2.1.0` 主要更新

更新：批量文档标签页。支持导入pdf, xps, epub, mobi, fb2, cbz格式的文件，识别图片或提取原有文字。支持生成可搜索双层PDF。
更新：完全重写的排版解析功能（代替原来的段落合并）。基于自研的间隙树排序算法，能有效解析多栏布局图片与文档。
更新一些辅助功能，修复一些Bug，优化一些UI表现。

注意

目前仅支持通过原PDF文档生成双层PDF。xps等格式不支持生成PDF，仅支持生成txt等文本文件。未来可能补全该功能。
为了适应排版解析等新功能，HTTP接口的参数作出了对应调整，但文档我还没写。HTTP接口用户请暂时不要更新到测试版。

与测试版PDF识别相关的问题，可以在 Issue #333 中提出。

配置文件迁移

v2.0.x 用户升级时，将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同，其它功能完全一致。
均支持 win7 x64 及以上的系统，附带多国语言识别库。

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

重要提示：如果执行OCR时报错[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0_alpha_1.7z.exe （128MB）
SHA256: a654aef09ca4f8ea71d5d498de79140f206786915b473134753503da3a5c01b9

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

Umi-OCR_Rapid_v2.1.0_alpha_1.7z.exe （97MB）
SHA256: 61d3fb8ac95af0d63b45829104dfa8e2cfa141f1bc6386cbf15b217ffb0995ab

`v2.0.2` 日常修Bug，小迭代版本。

更新：全局设置可调节图片文字叠加层开启/关闭默认显示状态。 (#264)
优化：输出为txt 单独文件时，将应用指定路径参数。 (#269)
优化：段落合并-多行-代码段 去除结尾多余换行符。 (#292)
优化：渲染器不兼容时，减少渲染层级错误的影响。 (#259)
修复：清理图片缓存前进行检查，避免空图错误。 (#279)
修复：记录面板中，光标无法移到第1个字符前面。 (#264)
修复：系统语言非简体中文时，软件启动异常。 (#274) (#306)
修复：csv输出的字符编码兼容性问题。 (#284)
修复：段落合并参数不存在 的误报。
修复：组件DefaultTips不生效。

预告：批量文档识别功能（支持PDF、epub、mobi等文件）正在火热开发中，将于下个大版本 v2.1.0 中发布。预计一个月左右推出。

配置文件迁移

v2.0.x 用户升级时，将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同，其它功能完全一致。
均支持 win7 x64 及以上的系统，附带多国语言识别库。

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

重要提示：如果执行OCR时报错[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本。

Umi-OCR_Paddle_v2.0.2.7z.exe （118.5MB）
SHA256: 28875194a3c78d2d88ad7f2cb44a4da4a1976e372b84e7dd5864dddf220eba63

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

Umi-OCR_Rapid_v2.0.2.7z.exe （86.5MB）
SHA256: fbca7e0f6fa8b560a15548d5a6fe4549a13a428eeee3b2aa68b508a0094c9ea8

`v2.0.1` 更新内容：

【HTTP接口用户注意】 重新设计了HTTP接口。允许省略参数，允许设定段落合并。见HTTP使用手册。
命令行增加指令-->和-->>，将结果输出到文件。见命令行使用手册。
优化：调整图像数据的内部编码，减少英文空格丢失的几率。
优化：调整部分UI文本和布局。
优化：csv默认保存为ansi编码，以兼容Office Excel。 (#237)
优化：Rapid插件移除了旧的简中-v3语言库，默认使用v4版。
修复：开启“禁用美化效果”后，外部通知弹窗无法关闭。 (#234)
修复：别的程序通过命令行调用Umi-OCR时，无法获取stdout输出。

配置文件迁移

v2.0.0 用户升级时，将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同，其它功能完全一致。
均支持 win7 x64 及以上的系统，附带多国语言识别库。

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

重要提示：如果执行OCR时报错[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本。

Umi-OCR_Paddle_v2.0.1.7z.exe （118MB）
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

Umi-OCR_Rapid_v2.0.1.7z.exe （86MB）
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f

额外：数学公式识别插件

测试中，详见这里。

经过近7个月的开发工作，全新的 Umi-OCR v2.0正式版 终于与大家见面。

v2重构了大部分代码，改用更先进的基层架构，添加更丰富的功能，UI界面焕然一新。希望能为大家带来更好的使用体验~

v2功能介绍请见 README ；更新日志请见 CHANGE_LOG 。

本项目将会长期维护、迭代更新。个人业余时间开发，产能有限，请多包涵~~

有任何问题或建议，请提 Issue 。

协助翻译！

如果您擅长简体中文和另外一门语言，可参与本项目翻译，或校对当前翻译！

在线翻译平台： https://hosted.weblate.org/engage/umi-ocr/

下载说明

以下的不同版本，仅OCR引擎插件不同，其它功能完全一致。均支持 win7 x64 及以上的系统。
均附带 简中/繁中/英/日/韩/俄 多国语言识别库。

.7z.exe为自解压包，可以用压缩软件打开，也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

（性能好，速度快，占用率高，适合高配机器。不兼容奔腾、赛扬、凌动CPU）

重要提示：如果执行OCR时报错[Error] OCR init fail，大概率是CPU不兼容Paddle，请换用Rapid版本。

Umi-OCR_Paddle_v2.0.0.7z.exe （125MB）
SHA256: 141f9a9bd82666862335e71d20743b43e3d231738f255012c1cb1c39aa83f976

Rapid 引擎插件版

（速度稍慢，内存占用低，适合低配机器，兼容性好）

Umi-OCR_Rapid_v2.0.0.7z.exe （95MB）
SHA256: de850eb92c23306f57ad07eb9a35e5d11cba966de4f97d680c5f7e84febce921

额外：数学公式识别插件

测试中，详见这里。

@vector090

开发重心转向v2，v1.x 版本将停止维护。

`v1.3.7` 主要更新：

兼容 Win7 x64 。
（若 Win7 报错计算机中丢失 VCOMP140.DLL ，请安装 VC运行库）

感谢 @vector090 提供的协助！

文件说明：

软件本体：Umi-OCR.v1.3.7.7z（67.3 MB），内置简体中文&英文通用识别库。

SHA256: 8aff9198a5c1328c986fd13d9c17491727e994908f722cdea661dfcc01970587

软件（多国语言整合版）：Umi-OCR.v1.3.7_ALL_languages.7z（118 MB），内置多国语言识别库。

SHA256: 5fcfbffce0148ff09ce58eea15a52c4d49c99903c7b5afd712f45862ba4026e1

多国语言扩展包：Umi-OCR.v1.3_DLC_languages.7z（50.5 MB），可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

SHA256: 709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974

公告： `v2.0.0` 预览版开放测试！

经过数月的工作，Umi-OCR v2.0.0 完成了主要功能的开发，已开放预览版本。v2重构了整个项目，提供焕然一新的界面和更强大的功能。

如果有兴趣，请前往 Umi-OCR_v2 下载体验。

测试阶段的 v2 可能含Bug。注重稳定的用户可继续使用 v1.3 版本。

`v1.3.6` 主要更新：

优化了段落合并的功能：
- 单行 方案的文本排序更准确。
- 多行-自然段 方案更加智能，支持自动判断中/英文段落，采取不同的合并规则。
- 新增多行-代码段方案，支持还原图中的缩进与空格，适合用来识别代码片段。
- 移除了 西文、左对齐、模糊匹配等方案，它们可以用现有方案代替。
功能调整：截图联动 划分为独立的功能，以单独快捷键触发，不受常规截图OCR影响。

文件说明：

软件本体：Umi-OCR.v1.3.6.7z（67MB），内置简体中文&英文通用识别库。

SHA256: 7dd686f84437df6add5f276019d067c52674d463000ac7d7622c5fcd38649efd

软件（多国语言整合版）：Umi-OCR.v1.3.5_ALL_languages.7z（117.5MB），内置多国语言识别库。

SHA256: 829c815905c695db262e1101b4b2af3929e4779d1c4b4e3a2db7136096d4aeff

多国语言扩展包：Umi-OCR.v1.3_DLC_languages.7z（50.5MB），可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

SHA256: 709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974

`v1.3.5` 主要更新：

新功能：复制识别结果后，可发送指定按键，以便联动唤起翻译器等工具。👉使用说明
新功能：命令行增加切换识别语言的指令。👉使用说明（指令7）
修Bug：修复了低配置机器上有概率误报超时 OCR init timeout: 5s 的问题。
调整：默认停止任务30秒后释放一次内存。

文件说明

软件本体：Umi-OCR.v1.3.5.7z（67MB），内置简体中文&英文通用识别库。
软件（多国语言整合版）：Umi-OCR.v1.3.5_ALL_languages.7z（118MB），内置多国语言识别库。

多国语言扩展包：Umi-OCR.v1.3_DLC_languages.7z（50MB），可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

Umi-OCR.Rapid 是内置全新 RapidOCR 引擎的版本。

与以前的 Paddle 引擎相比，Rapid 拥有这些优劣势：
✅ 支持 win7 x64
✅ 不依赖AVX指令集，支持凌动、赛扬、奔腾处理器
✅ 体积更小，内存占用更低
❌ 速度比默认开启mkldnn的Paddle版更慢

Umi-OCR.Rapid v1.3.4 测试版本暂不支持的功能：
❌ 暂不支持多国语言
❌ 可能不稳定或含有Bug

更多信息详见 Umi-OCR.Rapid分支的Readme 。

若遇到任何问题，或运行良好，都欢迎在 issue #133 下反馈。

文件说明

软件本体：Umi-OCR.Rapid.v1.3.4.alpha.1.zip（33MB），内置简体中文&英文通用识别库。

（请不要使用这个release里自动生成的Source code。若需源代码，请用rapid分支里的。）

Releases: hiroi-sora/Umi-OCR

Umi-OCR v2.1.1

两周年 & 两万星星撒花！

v2.1.1 主要更新 / Changelog

Windows7 用户注意： 常见问题及修复方法

配置文件迁移 / Configuration file migration

下载说明 / Download Instructions

Paddle 引擎插件版

Rapid 引擎插件版

更多插件 / Plugins

Umi-OCR v2.1.0

重大更新：

⚠ Windows 7 及低配电脑用户注意：

其它更新内容：

Help us translate / 帮助我们翻译！

配置文件迁移

下载说明

Paddle 引擎插件版

Rapid 引擎插件版

更多插件

Umi-OCR v2.1.0 alpha

v2.1.0 alpha 大版本前的测试版

协助翻译！

v2.1.0 主要更新

注意

配置文件迁移

下载说明

Paddle 引擎插件版

Rapid 引擎插件版

Umi-OCR v2.0.2

v2.0.2 日常修Bug，小迭代版本。

配置文件迁移

下载说明

Paddle 引擎插件版

Rapid 引擎插件版

Umi-OCR v2.0.1

v2.0.1 更新内容：

配置文件迁移

下载说明

Paddle 引擎插件版

Rapid 引擎插件版

额外：数学公式识别插件

Umi-OCR v2.0.0

协助翻译！

下载说明

Paddle 引擎插件版

Rapid 引擎插件版

额外：数学公式识别插件

Umi-OCR 文字识别工具 v1.3.7

v1.3.7 主要更新：

文件说明：

Contributors

Umi-OCR 文字识别工具 v1.3.6

公告： v2.0.0 预览版开放测试！

v1.3.6 主要更新：

文件说明：

Umi-OCR 文字识别工具 v1.3.5

v1.3.5 主要更新：

文件说明

【测试】Umi-OCR.Rapid v1.3.4 alpha 新引擎适配

Umi-OCR.Rapid 是内置全新 RapidOCR 引擎的版本。

文件说明

Windows7 用户注意：常见问题及修复方法

`v2.1.0 alpha` 大版本前的测试版

`v2.1.0` 主要更新

`v2.0.2` 日常修Bug，小迭代版本。

`v2.0.1` 更新内容：

`v1.3.7` 主要更新：

公告： `v2.0.0` 预览版开放测试！

`v1.3.6` 主要更新：

`v1.3.5` 主要更新：