常见问题 - 闪记 (Shanji)

安装与启动

请依次排查：
1. 模型是否已下载：在设置 → ASR 模型中确认模型状态为"已加载"。
2. 麦克风权限：系统设置 → 隐私与安全性 → 麦克风，确认闪记已获得授权。
3. 录音设备：在设置 → 音频中确认选择了正确的输入设备。
4. 快捷键冲突：尝试在设置中修改快捷键，看是否与其他应用冲突。

模型文件托管在 GitHub，国内访问速度可能受限。建议：
· 在设置中配置网络代理；
· 或手动下载模型文件后放置到应用数据目录（路径见设置 → ASR 模型）。
下载支持断点续传，中断后重新点击下载即可继续。

· macOS：12.0 及以上，支持 Apple Silicon（推荐）和 Intel。
· Windows：Windows 10 / 11，64-bit。
· Linux：Ubuntu 22.04 / Debian 12 及兼容发行版，提供 .deb、.rpm、.tar.gz 格式。

使用与输出

部分系统或应用限制了输入模拟权限。
· macOS：需要在系统设置 → 隐私与安全性 → 辅助功能中授权闪记。
· 授权后如仍失败，在设置 → 输出中开启"剪贴板回退"，文字会自动复制到剪贴板，手动 Cmd+V 粘贴即可。

在设置 → 快捷键中修改为任意其他组合键。推荐使用不常用的修饰键组合，例如 ⌃⌥ + 字母。

可以从以下几个方向改善：
· 开启热词库中与你使用场景匹配的词库，或添加自定义热词；
· 开启 LLM 润色的"轻度整理"预设，可自动修正常见错字；
· 确认麦克风质量和录音环境，背景噪音会明显影响准确率。

· Toggle 模式：按一次开始录音，再按一次停止并输出。适合连续说较长内容。
· Push-to-Talk：按住快捷键说话，松开后立即输出。适合偶发性输入，不用担心误触。
可在设置 → 录音模式中切换。

LLM 润色

兼容所有 OpenAI API 风格的接口，包括 OpenAI、DeepSeek、阿里云百炼、月之暗面（Kimi）、智谱 AI、Ollama 等。在设置中填写对应的 Base URL 和 API Key 即可。

不会。音频始终在本地处理，发送给 LLM 的只有语音识别后的文字内容。详见隐私政策。

完全可以。LLM 润色默认关闭，不配置 API Key 时识别结果直接输出，全程不需要联网。

隐私与数据

不会。语音识别完全在本地通过 ONNX Runtime 完成，音频数据不会离开你的设备。

· config.json：应用配置（不含 API Key 明文）
· history.db：历史识别记录（SQLite）
· models/：下载的 ONNX 模型文件
· 音频片段（如开启录音保存功能）
API Key 保存在系统钥匙串（Keychain），不写入配置文件。

本地语音识别完全离线，无需联网。以下情况需要网络：
· 首次下载模型文件；
· 使用 LLM 润色功能（调用远程 API）；
· 使用 Ollama 等本地服务时无需联网。