Skip to content

Releases: HaujetZhao/CapsWriter-Offline

支持无限时长语音、支持文件转录字幕

08 Jan 04:20
Compare
Choose a tag to compare

功能更新:

  1. 通过分段识别和去重,实现了支持无限时长语音的转写
  2. 现在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可

Windows 端打包说明:

  1. 服务端载入模型所用的 onnxruntime 只能在 Windows 10 及以上版本的系统使用
  2. 服务端载入模型需要系统内存 4G,只能在 64 位系统上使用
  3. 额外打包了 32 位系统可用的客户端,在 Windows 7 及以上版本的系统可用
  4. 模型文件较大,单独打包,解压模型后请放入软件目录的 models 文件夹中

因此:

  1. Win10 64 位以上系统,可以使用服务端、客户端,请下载 CapsWriter-Offline-Windows-64bit.zipmodels.zip
  2. Win7 及以上的 32 位系统,只能使用客户端,只需要下载 CapsWriter-Offline-Windows-32bit-Client.zip ,可以通过连接到局域网内其它机器上正在运行的服务端使用。

新增日记功能,将每日的录音结果保存在一个 Markdown 文件中

06 Jun 10:00
Compare
Choose a tag to compare

模型下载:models-Paraformer-and-Punctuation.zip

为 Win10 64 位和 MacOS ARM 都做了打包,其中,由于系统限制,MacOS 需要 sudo 运行客户端,且默认快捷键为 right shift

新功能:

  1. 新增日记功能,将每日的录音结果保存在一个 Markdown 文件中
  2. 新增关键词日记功能,每日的以关键词开头的录音结果会保存在特别的 Markdown 文件中
  3. 新建录音文件夹的时候,会复制一个 Python 辅助脚本,用于清理没有被 Markdown 文件引用的附件,这样一来,通过编辑 Markdown 日记就可以清理不需要保存的录音
  4. 新增定义录音文件保存目录
  5. 默认保存48000采样率高品质录音录音,如果用户安装了 FFmpeg 则保存为 mp3 格式,否则保存为 wav 格式
  6. 输入方式改为模拟 Ctrl + V 粘贴,粘贴完后恢复剪贴板内容
  7. 使用 rich 库输出彩色文字,尽量在各种终端达到一致的显示效果
  8. 优化打包体积
  9. 适配 MacOS

image-20230604144824341

新增功能:动态更新热词

01 Jun 01:35
Compare
Choose a tag to compare

修改热词文件后,不用重启客户端,就可以动态更新热词了。

新增功能:自定义热词

31 May 15:10
Compare
Choose a tag to compare

为客户端加入了三种热词功能:中文、英文、自定义

改进了对中文数字的搜索,当数字的左侧或者右侧有英文时,就一定会被选中。

改进了中英空格排版,能够正常输出 iPhone 4s 这样的词语。

提升中英混输的排版,增加可方便修改的配置项

30 May 09:48
Compare
Choose a tag to compare

已打包 Win10 64 位版,为了便于打包和上传,模型和打包软件是分开的,请分别下载上,把模型解压后放入软件的 models 文件夹中,方可使用。

以后的 release 就只更软件包,不更新模型了,模型来这里个 release 下载就可以了。

更新内容:

  • 客户端当音频设备名不可 utf-8 解码时,不再闪退
  • 客户端添加配置可以编辑修改,要消除识别结果末尾哪些标点
  • 客户端添加配置可以修改快捷键
  • 客户端添加配置可以修改快捷键触发的时间阈值
  • 客户端连接中断会自动进行重试
  • 客户端提示当前所用的快捷键
  • 服务端对识别结果,中英文混排进行空格校正
  • 当地址无法被绑定时提示问题,而不是直接闪退