Umi-OCR是一款OCR离线批量图片文字识别软件,带界面。可排除视频图片中的水印、游戏图片中的UI等干扰,提取干净的文本。基于 PaddleOCR

OCR图片文字识别软件有很多,软件版或者网页版的都有,离线版的好处就是识别速度快、没有网络限制、隐私更安全。

测试文字识别结果正确率还是相当可以的。

Umi-OCR

Umi-OCR下载Github蓝奏云(密码:1111)

系统支持

  • 支持 win10 x64 。
  • 不建议使用 win7 ,核心c++模块 PaddleOCR-json基本无法运行。如果想尝试,win7 x64 sp1 打满系统升级补丁+安装vc运行库后有小概率能跑起来……

简介

本软件用于读取剪贴板图片 / 批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能:

类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。

当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(兼容v2和v3版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。

使用方法比较简单,直接把图片拖拽到软件窗口,点开始任务就OK了。

Umi-OCR:离线批量图片文字识别软件

Umi-OCR:离线批量图片文字识别软件
Umi-OCR:离线批量图片文字识别软件

测试

软件作者批量图片测试

用它跑完了我~珍藏的10000多张~各类截图文件,效果十分满意。 跟以前使用百度云在线OCR接口(标准文字识别)跑的对比:

  • Umi-OCR使用轻量模型时速度很快,平均识别耗时<1s(使用笔记本低压u)。在线OCR受限于网络,耗时>1s。
  • Umi-OCR对符号的正确识别率更高,比如能正确识别中文逗号。在线OCR的结果中,很大一部分中文逗号被识别为英文。
  • 对于文字内容,Umi-OCR与在线OCR的准确度几乎没有差异。都能满足所需。
  • 排除UI与水印干扰,是Umi-OCR的独有技能。理论上在线OCR的高精度识别接口也能做到, ~不过那玩意死贵死贵~ 。

本站单文件测试

Umi-OCR:离线批量图片文字识别软件
Umi-OCR:离线批量图片文字识别软件
Umi-OCR:离线批量图片文字识别软件

如果觉得我的文章对你有用,请随意赞赏