电脑端离线语音输入工具懒人包!

电脑端离线语音输入工具懒人包!

内容预览

image.png

**软件介绍**


**CapsWriter-Offline**是一款功能强大的离线语音输入及字幕转录工具,专为需要长时间录音的用户设计。这款软件不仅提供了大写锁定键触发录音的功能,还支持自动转录生成.srt格式的字幕文件。

image.png

**主要功能**


1. **离线使用**:无需联网即可使用,确保隐私安全。

2. **无限时长录音**:不受时间限制,满足长时间录音需求。

3. **低延迟体验**:优化后的识别流程保证了输入的即时性。

4. **高准确率识别**:准确捕捉语音细节,提升文字转换质量。

5. **中英文混输支持**:无缝识别中英文混合语音输入。

6. **自动数字识别**:将语音中的数字自动转换为阿拉伯数字形式。

7. **智能中英文间隔调整**:自动处理中英文间的空格间隔,优化阅读体验。


**其他特性**


1. **热词功能**:在指定的文本文件中添加专有名词或短语,实现动态替换。

2. **日记功能**:自动将每次的录音识别结果按日期保存为Markdown文件,并将录音文件归档。

3. **关键词日记**:根据keywords.txt中定义的关键词,将特定记录分类存储。

4. **转录功能**:支持音视频文件转录为字幕文件,支持后续编辑和时间戳校正。

5. **客户端/服务端架构**:支持多台客户端连接到同一个服务端,实现资源共享。

6. **灵活配置**:通过编辑config.py文件,自定义服务端地址、快捷键等配置项。


**安装说明**


1、运行库:确保安装了 Microsoft Visual C++ Redistributable 运行库。

2、服务端要求:需要至少 4G 系统内存,且只能在 64位 操作系统上运行。

3、客户端兼容性:另外提供 32位 系统兼容的客户端版本,适用于 Windows 7 及以上版本。

4、模型文件:由于模型文件较大,需单独下载并解压到软件目录下的 models 文件夹中。

image.png


总的来说,**CapsWriter-Offline**是一款非常实用的离线语音输入工具,适合那些需要长时间录音并需要将录音转换为文字的用户使用。无论是中文还是英文,它都能提供高准确率的识别和转换,而且还有热词替换、日记功能、关键词分类等功能,让用户在使用过程中更加方便和高效。


常见问题解答:


1. 闪退怎么办:首先,确保电脑安装了C++运行时库;其次,确保电脑设置 隐私 麦克风 允许桌面应用访问你的麦克风

2. 游戏里用不了:首先,确保以管理员身份启动;其次,可以尝试把 config.py 中的 paste = True 改为 paste = False

3. 转字幕不成功:可以尝试到 Github 更新 util/srt_from_txt.py 文件

4. 老旧电脑运行太慢:尝试把 config.py 中的 num_threads = 6 改为 num_threads = 1 或 num_threads = 2

5. 关于内存占用:Windows 服务端启动后,常驻内存部分约为 300MB

6. 识别结果总是「对,嗯,没有」:检查麦克风是否正常

7. 按键没反应:杀软阻止了,检查杀软,尤其是 360

8. 能不能自启动:在资源管理器地址栏中输入 shell:start 回车,将快捷方式放进去

9. 能不能隐藏前台:不能。但你可以把它放到一个虚拟桌面里,这样也不碍眼

10. 能不能支持中英以外的其它语言:两年内无望


会员区

对不起,会员才可查看!请注册
已注册,请登录
返回顶部