Releases: hiroi-sora/Umi-OCR
Umi-OCR v2.1.1
两周年 & 两万星星撒花!
Celebrating the two-year anniversary of this project and reaching 20k stars!
作者的话
两年前,有个人试图寻找一个免费的、无需注册、开箱即用、支持批量处理且不限制数量的OCR软件。可惜,当时没有软件满足他的需求。于是,他一拍脑袋,花了几个日夜,自己写了个软件原型。那就是 Umi-OCR v1.0 。
没想到这个项目还挺受大家欢迎,于是他就一直维护更新下去。在用户的建议下,Umi 的功能越来越丰富,有了截图,现代化UI,二维码,PDF识别,HTTP接口……从1k行代码的小demo,历经两年迭代,到如今20k+行;Umi 逐渐变成一个较为成熟完整的项目。
未来,Umi 会继续完善现有功能、开发新的功能。受限于作者的业余时间和精力,项目更新的速度可能不会很快,还请给予耐心。本项目始终在稳步前进,历史上大多数Issues反馈和请求,最终都落到了实处。
(下一步,我将对软件底层的插件机制做出较大的调整和重构,以便为表格识别、图片翻译、原生Linux支持 等大型功能铺平道路。)
感谢各位用户、开发者、翻译者的支持。感谢我自己的坚持。
—— by hiroi-sora
v2.1.1 主要更新 / Changelog
- 修复:
Windows7
及核心数<=2的CPU
无法进行文档识别的Bug。 - 新增:批量文档识别允许指定忽略区域的页数范围。
- 新增:命令行
--path
允许传入多个图片或文件夹。👉命令行手册 - 新增:新的命令行、HTTP接口:识别/生成二维码图像。👉HTTP手册
- 优化:双栏面板会记忆左右折叠状态。
- 完善 繁+英+日 界面本地化翻译。感谢 翻译人员 。
次要更新:(点击展开)
Windows7 用户注意: 常见问题及修复方法
配置文件迁移 / Configuration file migration
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
Copy the UmiOCR-data/.settings
from the old version of the software to the same location in the new version.
下载说明 / Download Instructions
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错 0xc0000142
、[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (129MB)
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97.1MB)
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6
更多插件 / Plugins
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
Visit the Umi-OCR_Plugins to download more OCR plugins and acquire additional features such as Offline Mathematical Formula Recognition
.
更多下载途径: 蓝奏云 | SourceForge | Scoop
Umi-OCR v2.1.0
重大更新:
- 批量文档识别。支持
pdf, epub, mobi
等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。 - 更强大的 排版解析 功能,代替之前的段落合并。基于 间隙树排序算法 ,解析多栏布局图片与文档时有较好的精度。
- HTTP接口参数作出了部分改动,并提供了一些更方便的选项。有需要的用户请重新参考 README_HTTP.md 。
⚠ Windows 7 及低配电脑用户注意:
文档识别可能在Win7、或极低配电脑(如双核CPU)中出现异常,如无法识别PDF文件。已在 v2.1.1 版本中修复。
其它更新内容:
- 新增:允许隐藏托盘图标。 (#338)
- 新增:重复上一次截图区域的快捷键。 (#357)
- 新增:用本地图片浏览器打开图片的快捷按钮。 (#335)
- 修复:避免系统环境变量
QMLSCENE_DEVICE
的影响。 (#270) - 修复一些小问题,优化一些UI表现与提示语。
Help us translate / 帮助我们翻译!
We warmly invite translators to join us in our project's localization efforts!
You can review existing translations or contribute new ones.
Please visit the online platform Weblate at:
https://hosted.weblate.org/engage/umi-ocr/
配置文件迁移
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac
更多插件
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
Umi-OCR v2.1.0 alpha
v2.1.0 alpha
大版本前的测试版
经过一段时间的 爆肝 高强度开发,“批量PDF文档识别”功能已基本完成。不过,仍有一些繁琐的辅助功能没写完,仍有一些代码待优化。这些将在v2.1.0正式版中完善。
考虑到有不少用户急需批量文档识别,故提前发布测试版。大家可以用自己的文件来检测这个新功能的稳定性与兼容性。
我要摸鱼一段时间,休息一下。祝用户朋友们,新年快乐~🎉🎉🎉
协助翻译!
如果您擅长简体中文
和另外一门语言,可参与本项目翻译,或校对当前翻译!
在线翻译平台: https://hosted.weblate.org/engage/umi-ocr/
v2.1.0
主要更新
- 更新:批量文档标签页。支持导入
pdf, xps, epub, mobi, fb2, cbz
格式的文件,识别图片或提取原有文字。支持生成可搜索双层PDF。 - 更新:完全重写的排版解析功能(代替原来的段落合并)。基于自研的 间隙树排序算法 ,能有效解析多栏布局图片与文档。
- 更新一些辅助功能,修复一些Bug,优化一些UI表现。
注意
- 目前仅支持通过原PDF文档生成双层PDF。xps等格式不支持生成PDF,仅支持生成txt等文本文件。未来可能补全该功能。
- 为了适应排版解析等新功能,HTTP接口的参数作出了对应调整,但文档我还没写。HTTP接口用户请暂时不要更新到测试版。
与测试版PDF识别相关的问题,可以在 Issue #333 中提出。
配置文件迁移
v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0_alpha_1.7z.exe (128MB)
SHA256: a654aef09ca4f8ea71d5d498de79140f206786915b473134753503da3a5c01b9
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0_alpha_1.7z.exe (97MB)
SHA256: 61d3fb8ac95af0d63b45829104dfa8e2cfa141f1bc6386cbf15b217ffb0995ab
Umi-OCR v2.0.2
v2.0.2
日常修Bug,小迭代版本。
- 更新:全局设置可调节 图片文字叠加层
开启/关闭
默认显示状态。 (#264) - 优化:输出为
txt 单独文件
时,将应用指定路径
参数。 (#269) - 优化:
段落合并-多行-代码段
去除结尾多余换行符。 (#292) - 优化:渲染器不兼容时,减少渲染层级错误的影响。 (#259)
- 修复:清理图片缓存前进行检查,避免空图错误。 (#279)
- 修复:记录面板中,光标无法移到第1个字符前面。 (#264)
- 修复:系统语言非简体中文时,软件启动异常。 (#274) (#306)
- 修复:csv输出的字符编码兼容性问题。 (#284)
- 修复:
段落合并参数不存在
的误报。 - 修复:组件
DefaultTips
不生效。
预告:批量文档识别功能(支持PDF、epub、mobi等文件)正在火热开发中,将于下个大版本 v2.1.0 中发布。预计一个月左右推出。
配置文件迁移
v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.2.7z.exe (118.5MB)
SHA256: 28875194a3c78d2d88ad7f2cb44a4da4a1976e372b84e7dd5864dddf220eba63
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.2.7z.exe (86.5MB)
SHA256: fbca7e0f6fa8b560a15548d5a6fe4549a13a428eeee3b2aa68b508a0094c9ea8
Umi-OCR v2.0.1
v2.0.1
更新内容:
- 【HTTP接口用户注意】 重新设计了HTTP接口。允许省略参数,允许设定段落合并。见HTTP使用手册。
- 命令行增加指令
-->
和-->>
,将结果输出到文件。见命令行使用手册。 - 优化:调整图像数据的内部编码,减少英文空格丢失的几率。
- 优化:调整部分UI文本和布局。
- 优化:csv默认保存为ansi编码,以兼容Office Excel。 (#237)
- 优化:Rapid插件移除了旧的简中-v3语言库,默认使用v4版。
- 修复:开启“禁用美化效果”后,外部通知弹窗无法关闭。 (#234)
- 修复:别的程序通过命令行调用Umi-OCR时,无法获取stdout输出。
配置文件迁移
v2.0.0 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
下载说明
不同版本仅OCR引擎插件不同,其它功能完全一致。
均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.1.7z.exe (118MB)
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.1.7z.exe (86MB)
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f
额外:数学公式识别插件
测试中,详见这里 。
Umi-OCR v2.0.0
经过近7个月的开发工作,全新的 Umi-OCR v2.0正式版 终于与大家见面。
v2重构了大部分代码,改用更先进的基层架构,添加更丰富的功能,UI界面焕然一新。希望能为大家带来更好的使用体验~
v2功能介绍请见 README ;更新日志请见 CHANGE_LOG 。
本项目将会长期维护、迭代更新。个人业余时间开发,产能有限,请多包涵~~
有任何问题或建议,请提 Issue 。
协助翻译!
如果您擅长简体中文
和另外一门语言,可参与本项目翻译,或校对当前翻译!
在线翻译平台: https://hosted.weblate.org/engage/umi-ocr/
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
均附带 简中/繁中/英/日/韩/俄
多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.0.7z.exe (125MB)
SHA256: 141f9a9bd82666862335e71d20743b43e3d231738f255012c1cb1c39aa83f976
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.0.7z.exe (95MB)
SHA256: de850eb92c23306f57ad07eb9a35e5d11cba966de4f97d680c5f7e84febce921
额外:数学公式识别插件
测试中,详见这里 。
Umi-OCR 文字识别工具 v1.3.7
开发重心转向v2,v1.x 版本将停止维护。
v1.3.7
主要更新:
- 兼容 Win7 x64 。
- (若 Win7 报错
计算机中丢失 VCOMP140.DLL
,请安装 VC运行库 )
感谢 @vector090 提供的协助!
文件说明:
软件本体:Umi-OCR.v1.3.7.7z
(67.3 MB),内置简体中文&英文
通用识别库。
- SHA256:
8aff9198a5c1328c986fd13d9c17491727e994908f722cdea661dfcc01970587
软件(多国语言整合版):Umi-OCR.v1.3.7_ALL_languages.7z
(118 MB),内置多国语言识别库。
- SHA256:
5fcfbffce0148ff09ce58eea15a52c4d49c99903c7b5afd712f45862ba4026e1
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z
(50.5 MB),可向软件本体导入繁中,英,日,韩,俄,德,法
多国语言识别库。
- SHA256:
709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974
Umi-OCR 文字识别工具 v1.3.6
公告: v2.0.0
预览版开放测试!
经过数月的工作,Umi-OCR v2.0.0 完成了主要功能的开发,已开放预览版本。v2重构了整个项目,提供焕然一新的界面和更强大的功能。
如果有兴趣,请前往 Umi-OCR_v2 下载体验。
测试阶段的 v2 可能含Bug。注重稳定的用户可继续使用 v1.3 版本。
v1.3.6
主要更新:
- 优化了
段落合并
的功能:单行
方案的文本排序更准确。多行-自然段
方案更加智能,支持自动判断中/英文段落,采取不同的合并规则。- 新增
多行-代码段
方案,支持还原图中的缩进与空格,适合用来识别代码片段。 - 移除了
西文
、左对齐
、模糊匹配
等方案,它们可以用现有方案代替。
- 功能调整:
截图联动
划分为独立的功能,以单独快捷键触发,不受常规截图OCR影响。
文件说明:
软件本体:Umi-OCR.v1.3.6.7z
(67MB),内置简体中文&英文
通用识别库。
- SHA256:
7dd686f84437df6add5f276019d067c52674d463000ac7d7622c5fcd38649efd
软件(多国语言整合版):Umi-OCR.v1.3.5_ALL_languages.7z
(117.5MB),内置多国语言识别库。
- SHA256:
829c815905c695db262e1101b4b2af3929e4779d1c4b4e3a2db7136096d4aeff
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z
(50.5MB),可向软件本体导入繁中,英,日,韩,俄,德,法
多国语言识别库。
- SHA256:
709c867a610346217fc19a2251ead2a27d9dd0cf25e26ce05af007dbfc492974
Umi-OCR 文字识别工具 v1.3.5
v1.3.5
主要更新:
- 新功能:复制识别结果后,可发送指定按键,以便联动唤起翻译器等工具。👉使用说明
- 新功能:命令行增加切换识别语言的指令。👉使用说明(指令7)
- 修Bug:修复了低配置机器上有概率误报超时
OCR init timeout: 5s
的问题。 - 调整:默认停止任务30秒后释放一次内存。
文件说明
软件本体:Umi-OCR.v1.3.5.7z
(67MB),内置简体中文&英文
通用识别库。
软件(多国语言整合版):Umi-OCR.v1.3.5_ALL_languages.7z
(118MB),内置多国语言识别库。
多国语言扩展包:Umi-OCR.v1.3_DLC_languages.7z
(50MB),可向软件本体导入繁中,英,日,韩,俄,德,法
多国语言识别库。
【测试】Umi-OCR.Rapid v1.3.4 alpha 新引擎适配
Umi-OCR.Rapid 是内置全新 RapidOCR 引擎的版本。
与以前的 Paddle 引擎相比,Rapid 拥有这些优劣势:
✅ 支持 win7 x64
✅ 不依赖AVX指令集,支持凌动、赛扬、奔腾处理器
✅ 体积更小,内存占用更低
❌ 速度比默认开启mkldnn的Paddle版更慢
Umi-OCR.Rapid v1.3.4 测试版本暂不支持的功能:
❌ 暂不支持多国语言
❌ 可能不稳定或含有Bug
更多信息详见 Umi-OCR.Rapid分支的Readme 。
若遇到任何问题,或运行良好,都欢迎在 issue #133 下反馈。
文件说明
软件本体:Umi-OCR.Rapid.v1.3.4.alpha.1.zip
(33MB),内置简体中文&英文
通用识别库。
(请不要使用这个release里自动生成的Source code。若需源代码,请用rapid分支里的。)