这是 CapsWriter-Offline ,一个 PC 端的语音输入工具。|同时也支持 macOS M芯片 CPU 机器。

运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。

CapsWriter-Offline,可能是最好用的 PC 端语音输入工具(离线识别) 

早在 2020 年,小众软件就推荐过当时还需要联网使用的:

  • Caps Writer 2.0 – 比讯飞和搜狗更快的语音输入法[Win]

而在去年的时候,开发者 @HaujetZhao 将其升级为离线版,并且「支持无限时长语音、支持文件转录字幕」,就很赞。来自发现频道:https://meta.appinn.net/t/topic/44043

CapsWriter-Offline

视频

特性

  1. 完全离线、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔
  2. 热词功能:可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三种热词,客户端动态载入
  3. 日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets
  4. 关键词日记:识别结果若以关键词开头,会被额外记录在 年份/月份/日期-关键词.md,关键词在 keywords.txt 中定义
  5. 服务端、客户端分离,可以让一台主机为局域网内的电脑提供识别服务
  6. 用文本编辑器打开 core_client.py ,可以编辑服务端地址、快捷键、录音开关……

懒人包

  • 对于 Windows10 64 位用户,我打包了 exe 版本
  • 对于 MacOS ARM 用户,我也做了打包版本(由于系统限制,客户端需要 sudo 启动,且默认快捷键为 right shift

由于模型文件太大,为了方便更新,打包版本中没有包含模型文件,所以需要分别手动下载软件和模型。

打包版本里有一个 models 文件夹,请把模型文件解压后放到 models 里,之后双击 exe,分别打开 Server 和 Client 即可使用。

获取

  • GitHub
  • 百度盘(开发者提供,提取码: eu4c)
  • 模型搬运

实际上模型搬运,我还传了阿里云盘,但提示不支持分享 ZIP 格式…这个就很尴尬了。

更多细节

开发者还分享了很多技术细节、使用方式,就不转过来了,详见:

  • https://meta.appinn.net/t/topic/44043

原文:https://xbcpy.com/