常见问题

找不到答案?欢迎在 GitHub Issues 提问。

安装与启动
请依次排查:
1. 模型是否已下载:在设置 → ASR 模型 中确认模型状态为"已加载"。
2. 麦克风权限:系统设置 → 隐私与安全性 → 麦克风,确认闪记已获得授权。
3. 录音设备:在设置 → 音频 中确认选择了正确的输入设备。
4. 快捷键冲突:尝试在设置中修改快捷键,看是否与其他应用冲突。
模型文件托管在 GitHub,国内访问速度可能受限。建议:
· 在设置中配置网络代理;
· 或手动下载模型文件后放置到应用数据目录(路径见设置 → ASR 模型)。
下载支持断点续传,中断后重新点击下载即可继续。
· macOS:12.0 及以上,支持 Apple Silicon(推荐)和 Intel。
· Windows:Windows 10 / 11,64-bit。
· Linux:Ubuntu 22.04 / Debian 12 及兼容发行版,提供 .deb、.rpm、.tar.gz 格式。
使用与输出
部分系统或应用限制了输入模拟权限。
· macOS:需要在系统设置 → 隐私与安全性 → 辅助功能 中授权闪记。
· 授权后如仍失败,在设置 → 输出 中开启"剪贴板回退",文字会自动复制到剪贴板,手动 Cmd+V 粘贴即可。
在设置 → 快捷键 中修改为任意其他组合键。推荐使用不常用的修饰键组合,例如 ⌃⌥ + 字母。
可以从以下几个方向改善:
· 开启热词库中与你使用场景匹配的词库,或添加自定义热词;
· 开启 LLM 润色的"轻度整理"预设,可自动修正常见错字;
· 确认麦克风质量和录音环境,背景噪音会明显影响准确率。
· Toggle 模式:按一次开始录音,再按一次停止并输出。适合连续说较长内容。
· Push-to-Talk:按住快捷键说话,松开后立即输出。适合偶发性输入,不用担心误触。
可在设置 → 录音模式 中切换。
LLM 润色
兼容所有 OpenAI API 风格的接口,包括 OpenAI、DeepSeek、阿里云百炼、月之暗面(Kimi)、智谱 AI、Ollama 等。在设置中填写对应的 Base URL 和 API Key 即可。
不会。音频始终在本地处理,发送给 LLM 的只有语音识别后的文字内容。详见 隐私政策
完全可以。LLM 润色默认关闭,不配置 API Key 时识别结果直接输出,全程不需要联网。
隐私与数据
不会。语音识别完全在本地通过 ONNX Runtime 完成,音频数据不会离开你的设备。
· config.json:应用配置(不含 API Key 明文)
· history.db:历史识别记录(SQLite)
· models/:下载的 ONNX 模型文件
· 音频片段(如开启录音保存功能)
API Key 保存在系统钥匙串(Keychain),不写入配置文件。
本地语音识别完全离线,无需联网。以下情况需要网络:
· 首次下载模型文件;
· 使用 LLM 润色功能(调用远程 API);
· 使用 Ollama 等本地服务时无需联网。

没找到你的问题?

在 GitHub 提问