Skip to content

Releases: hiroi-sora/Umi-OCR

Umi-OCR v2.1.1

29 Mar 13:29
8c5605e
Compare
Choose a tag to compare

两周年 & 两万星星撒花!

Celebrating the two-year anniversary of this project and reaching 20k stars!

作者的话

两年前,有个人试图寻找一个免费的、无需注册、开箱即用、支持批量处理且不限制数量的OCR软件。可惜,当时没有软件满足他的需求。于是,他一拍脑袋,花了几个日夜,自己写了个软件原型。那就是 Umi-OCR v1.0

没想到这个项目还挺受大家欢迎,于是他就一直维护更新下去。在用户的建议下,Umi 的功能越来越丰富,有了截图,现代化UI,二维码,PDF识别,HTTP接口……从1k行代码的小demo,历经两年迭代,到如今20k+行;Umi 逐渐变成一个较为成熟完整的项目。

未来,Umi 会继续完善现有功能、开发新的功能。受限于作者的业余时间和精力,项目更新的速度可能不会很快,还请给予耐心。本项目始终在稳步前进,历史上大多数Issues反馈和请求,最终都落到了实处。

(下一步,我将对软件底层的插件机制做出较大的调整和重构,以便为表格识别、图片翻译、原生Linux支持 等大型功能铺平道路。)

感谢各位用户、开发者、翻译者的支持。感谢我自己的坚持。

—— by hiroi-sora


v2.1.1 主要更新 / Changelog

  • 修复:Windows7核心数<=2的CPU 无法进行文档识别的Bug。
  • 新增:批量文档识别允许指定忽略区域的页数范围。
  • 新增:命令行--path允许传入多个图片或文件夹。👉命令行手册
  • 新增:新的命令行、HTTP接口:识别/生成二维码图像。👉HTTP手册
  • 优化:双栏面板会记忆左右折叠状态。
  • 完善 繁+英+日 界面本地化翻译。感谢 翻译人员
次要更新:(点击展开)
  • 新增:命令行新指令 --output, --output_append, --clip
  • 新增:清空全部识别记录的快捷键。 (#420)
  • 新增:截图预览 删除图片显示的选项和快捷键。 (#427)
  • 优化:开始菜单/开机自启快捷方式,默认放置于用户目录下,避免请求管理员权限。 (#428)
  • 优化:保存双层PDF,在没有新文本写入时的处理逻辑。 (#416)
  • 优化:PDF解析时,提取原有文本行的逻辑更准确。
  • 修复:Esc取消截图的消息传递错误。 (#402)
  • 修复:文档整页强制OCR模式下,提高小尺寸页面的渲染精度。
  • UI:优化一些提示,修复一些渲染问题,美化一些视觉效果。

Windows7 用户注意: 常见问题及修复方法


配置文件迁移 / Configuration file migration

Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

Copy the UmiOCR-data/.settings from the old version of the software to the same location in the new version.

下载说明 / Download Instructions

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错 0xc0000142[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0.7z.exe (129MB)
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.0.7z.exe (97.1MB)
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6

更多插件 / Plugins

前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别等附加功能。

Visit the Umi-OCR_Plugins to download more OCR plugins and acquire additional features such as Offline Mathematical Formula Recognition.


更多下载途径: 蓝奏云 | SourceForge | Scoop

Download Umi-OCR

Umi-OCR v2.1.0

28 Feb 16:06
Compare
Choose a tag to compare

重大更新:

  • 批量文档识别。支持 pdf, epub, mobi 等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF
  • 更强大的 排版解析 功能,代替之前的段落合并。基于 间隙树排序算法 ,解析多栏布局图片与文档时有较好的精度。
  • HTTP接口参数作出了部分改动,并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md

⚠ Windows 7 及低配电脑用户注意:

文档识别可能在Win7、或极低配电脑(如双核CPU)中出现异常,如无法识别PDF文件。已在 v2.1.1 版本中修复。

其它更新内容:

  • 新增:允许隐藏托盘图标。 (#338)
  • 新增:重复上一次截图区域的快捷键。 (#357)
  • 新增:用本地图片浏览器打开图片的快捷按钮。 (#335)
  • 修复:避免系统环境变量QMLSCENE_DEVICE的影响。 (#270)
  • 修复一些小问题,优化一些UI表现与提示语。

Help us translate / 帮助我们翻译!

We warmly invite translators to join us in our project's localization efforts!
You can review existing translations or contribute new ones.
Please visit the online platform Weblate at:
https://hosted.weblate.org/engage/umi-ocr/

配置文件迁移

Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac

更多插件

前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别等附加功能。

Download Umi-OCR

Umi-OCR v2.1.0 alpha

26 Jan 15:46
Compare
Choose a tag to compare
Umi-OCR v2.1.0 alpha Pre-release
Pre-release

v2.1.0 alpha 大版本前的测试版

经过一段时间的 爆肝 高强度开发,“批量PDF文档识别”功能已基本完成。不过,仍有一些繁琐的辅助功能没写完,仍有一些代码待优化。这些将在v2.1.0正式版中完善。

考虑到有不少用户急需批量文档识别,故提前发布测试版。大家可以用自己的文件来检测这个新功能的稳定性与兼容性。

我要摸鱼一段时间,休息一下。祝用户朋友们,新年快乐~🎉🎉🎉

协助翻译!

如果您擅长简体中文和另外一门语言,可参与本项目翻译,或校对当前翻译!

在线翻译平台: https://hosted.weblate.org/engage/umi-ocr/

v2.1.0 主要更新

  • 更新:批量文档标签页。支持导入pdf, xps, epub, mobi, fb2, cbz格式的文件,识别图片或提取原有文字。支持生成可搜索双层PDF
  • 更新:完全重写的排版解析功能(代替原来的段落合并)。基于自研的 间隙树排序算法 ,能有效解析多栏布局图片与文档。
  • 更新一些辅助功能,修复一些Bug,优化一些UI表现。

注意

  • 目前仅支持通过原PDF文档生成双层PDF。xps等格式不支持生成PDF,仅支持生成txt等文本文件。未来可能补全该功能。
  • 为了适应排版解析等新功能,HTTP接口的参数作出了对应调整,但文档我还没写。HTTP接口用户请暂时不要更新到测试版

与测试版PDF识别相关的问题,可以在 Issue #333 中提出。

配置文件迁移

v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.0_alpha_1.7z.exe (128MB)
SHA256: a654aef09ca4f8ea71d5d498de79140f206786915b473134753503da3a5c01b9

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.0_alpha_1.7z.exe (97MB)
SHA256: 61d3fb8ac95af0d63b45829104dfa8e2cfa141f1bc6386cbf15b217ffb0995ab

Download Umi-OCR

Umi-OCR v2.0.2

15 Jan 08:03
Compare
Choose a tag to compare

v2.0.2 日常修Bug,小迭代版本。

  • 更新:全局设置可调节 图片文字叠加层开启/关闭默认显示状态。 (#264)
  • 优化:输出为txt 单独文件时,将应用指定路径参数。 (#269)
  • 优化:段落合并-多行-代码段 去除结尾多余换行符。 (#292)
  • 优化:渲染器不兼容时,减少渲染层级错误的影响。 (#259)
  • 修复:清理图片缓存前进行检查,避免空图错误。 (#279)
  • 修复:记录面板中,光标无法移到第1个字符前面。 (#264)
  • 修复:系统语言非简体中文时,软件启动异常。 (#274) (#306)
  • 修复:csv输出的字符编码兼容性问题。 (#284)
  • 修复:段落合并参数不存在 的误报。
  • 修复:组件DefaultTips不生效。

预告:批量文档识别功能(支持PDF、epub、mobi等文件)正在火热开发中,将于下个大版本 v2.1.0 中发布。预计一个月左右推出。

配置文件迁移

v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.0.2.7z.exe (118.5MB)
SHA256: 28875194a3c78d2d88ad7f2cb44a4da4a1976e372b84e7dd5864dddf220eba63

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.0.2.7z.exe (86.5MB)
SHA256: fbca7e0f6fa8b560a15548d5a6fe4549a13a428eeee3b2aa68b508a0094c9ea8

Umi-OCR v2.0.1

08 Dec 12:51
Compare
Choose a tag to compare

v2.0.1 更新内容:

  • 【HTTP接口用户注意】 重新设计了HTTP接口。允许省略参数,允许设定段落合并。见HTTP使用手册
  • 命令行增加指令-->-->>,将结果输出到文件。见命令行使用手册
  • 优化:调整图像数据的内部编码,减少英文空格丢失的几率。
  • 优化:调整部分UI文本和布局。
  • 优化:csv默认保存为ansi编码,以兼容Office Excel。 (#237)
  • 优化:Rapid插件移除了旧的简中-v3语言库,默认使用v4版。
  • 修复:开启“禁用美化效果”后,外部通知弹窗无法关闭。 (#234)
  • 修复:别的程序通过命令行调用Umi-OCR时,无法获取stdout输出。

配置文件迁移

v2.0.0 用户升级时,将旧版软件的UmiOCR-data/.settings拷贝到新版相同位置即可。

下载说明

不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.0.1.7z.exe (118MB)
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.0.1.7z.exe (86MB)
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f

额外:数学公式识别插件

测试中,详见这里


Download Umi-OCR

Umi-OCR v2.0.0

19 Nov 07:30
Compare
Choose a tag to compare

经过近7个月的开发工作,全新的 Umi-OCR v2.0正式版 终于与大家见面。

v2重构了大部分代码,改用更先进的基层架构,添加更丰富的功能,UI界面焕然一新。希望能为大家带来更好的使用体验~

v2功能介绍请见 README ;更新日志请见 CHANGE_LOG

本项目将会长期维护、迭代更新。个人业余时间开发,产能有限,请多包涵~~

有任何问题或建议,请提 Issue

协助翻译!

如果您擅长简体中文和另外一门语言,可参与本项目翻译,或校对当前翻译!

在线翻译平台: https://hosted.weblate.org/engage/umi-ocr/

下载说明

以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
均附带 简中/繁中/英/日/韩/俄 多国语言识别库。

.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.0.0.7z.exe (125MB)
SHA256: 141f9a9bd82666862335e71d20743b43e3d231738f255012c1cb1c39aa83f976

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.0.0.7z.exe (95MB)
SHA256: de850eb92c23306f57ad07eb9a35e5d11cba966de4f97d680c5f7e84febce921

额外:数学公式识别插件

测试中,详见这里

Umi-OCR 文字识别工具 v1.3.7

10 Oct 14:13
Compare
Choose a tag to compare

开发重心转向v2,v1.x 版本将停止维护。


v1.3.7 主要更新:

  • 兼容 Win7 x64 。
  • (若 Win7 报错计算机中丢失 VCOMP140.DLL ,请安装 VC运行库

感谢 @vector090 提供的协助

文件说明:

软件本体:Umi-OCR.v1.3.7.7z(67.3 MB),内置简体中文&英文通用识别库。

  • SHA256: 8aff9198a5c1328c986fd13d9c17491727e994908f722cdea661dfcc01970587

软件(多国语言整合版):Umi-OCR.v1.3.7_ALL_languages.7z(118 MB),内置多国语言识别库。

  • SHA256: 5fcfbffce0148ff09ce58eea15a52c4d49c99903c7b5afd712f45862ba4026e1

多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z(50.5 MB),可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

  • SHA256: 709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974

Download Umi-OCR

Umi-OCR 文字识别工具 v1.3.6

26 Sep 08:05
Compare
Choose a tag to compare

公告: v2.0.0 预览版开放测试!

经过数月的工作,Umi-OCR v2.0.0 完成了主要功能的开发,已开放预览版本。v2重构了整个项目,提供焕然一新的界面和更强大的功能。

Umi-OCR_v2_dev_20230925.png

如果有兴趣,请前往 Umi-OCR_v2 下载体验。

测试阶段的 v2 可能含Bug。注重稳定的用户可继续使用 v1.3 版本。


v1.3.6 主要更新:

  • 优化了段落合并的功能:
    • 单行 方案的文本排序更准确。
    • 多行-自然段 方案更加智能,支持自动判断中/英文段落,采取不同的合并规则。
    • 新增多行-代码段方案,支持还原图中的缩进与空格,适合用来识别代码片段。
    • 移除了 西文左对齐模糊匹配等方案,它们可以用现有方案代替。
  • 功能调整:截图联动 划分为独立的功能,以单独快捷键触发,不受常规截图OCR影响。

文件说明:

软件本体:Umi-OCR.v1.3.6.7z(67MB),内置简体中文&英文通用识别库。

  • SHA256: 7dd686f84437df6add5f276019d067c52674d463000ac7d7622c5fcd38649efd

软件(多国语言整合版):Umi-OCR.v1.3.5_ALL_languages.7z(117.5MB),内置多国语言识别库。

  • SHA256: 829c815905c695db262e1101b4b2af3929e4779d1c4b4e3a2db7136096d4aeff

多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z(50.5MB),可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

  • SHA256: 709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974

Umi-OCR 文字识别工具 v1.3.5

20 Jun 09:07
Compare
Choose a tag to compare

v1.3.5 主要更新:

  • 新功能:复制识别结果后,可发送指定按键,以便联动唤起翻译器等工具。👉使用说明
  • 新功能:命令行增加切换识别语言的指令。👉使用说明(指令7)
  • 修Bug:修复了低配置机器上有概率误报超时 OCR init timeout: 5s 的问题。
  • 调整:默认停止任务30秒后释放一次内存。

文件说明

软件本体:Umi-OCR.v1.3.5.7z(67MB),内置简体中文&英文通用识别库。
软件(多国语言整合版):Umi-OCR.v1.3.5_ALL_languages.7z(118MB),内置多国语言识别库。

多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z(50MB),可向软件本体导入繁中,英,日,韩,俄,德,法 多国语言识别库。

【测试】Umi-OCR.Rapid v1.3.4 alpha 新引擎适配

29 Apr 03:54
Compare
Choose a tag to compare

Umi-OCR.Rapid 是内置全新 RapidOCR 引擎的版本。

与以前的 Paddle 引擎相比,Rapid 拥有这些优劣势:
✅ 支持 win7 x64
✅ 不依赖AVX指令集,支持凌动、赛扬、奔腾处理器
✅ 体积更小,内存占用更低
❌ 速度比默认开启mkldnn的Paddle版更慢

Umi-OCR.Rapid v1.3.4 测试版本暂不支持的功能:
❌ 暂不支持多国语言
❌ 可能不稳定或含有Bug

更多信息详见 Umi-OCR.Rapid分支的Readme

若遇到任何问题,或运行良好,都欢迎在 issue #133 下反馈。

文件说明

软件本体:Umi-OCR.Rapid.v1.3.4.alpha.1.zip(33MB),内置简体中文&英文通用识别库。

(请不要使用这个release里自动生成的Source code。若需源代码,请用rapid分支里的。)