DuckType 的全部功能
支持100余种语言、CJK 罗马化、地区拼写纠正、AI 技能链式调用等更多功能。
100+ 种语言
从英语、西班牙语到日语、阿拉伯语和印地语,部分引擎支持多达 100 种语言,具体支持情况因服务商而异。
自带密钥
连接您自己的 OpenAI、Groq、Deepgram 或 ElevenLabs 账户,以解锁 Deepgram Nova 3 Medical 和 ElevenLabs Scribe v2 等专业模型。API 费用无额外加价。您的密钥仅存储在本地,不会发送到我们的服务器。
或交由我们处理
DuckType 托管转录和技能起步为每月 200,000 词,Pro 方案提供 600,000 词以应对高强度使用,并支持自动切换备用提供商。若云端服务不可用,DuckType 将自动切换至本地模型,无需管理 API key。
云端服务商
DuckType Cloud
托管
OpenAI
Whisper
Groq
Whisper
Deepgram
Nova 3, Nova 3 Medical
Mistral
Voxtral Mini, Voxtral Small
Cloudflare
Workers AI
Baseten
使用自己的模型
ElevenLabs
Scribe v2
本地模型(离线)
Whisper
100 种语言,多种模型大小
Parakeet TDT
英语,高精度
SenseVoice
中文、日语、韩语、英语、粤语
按住说话
按住键开始录音,松开后转录。经典模式,精准可控。
点击录音
点击或使用快捷键切换录音,适合较长的听写会话。
双击
双击修饰键开始录音,快速激活,无需组合快捷键。
按住 Fn 键
按住 Fn 键开始录音。原生体验,无需自定义快捷键。
自动模式
始终开启的语音活动检测监听。句子按静音间隔进行分段,麦克风会在首选设备可用时自动切换。
即时录音
在录音之间复用麦克风流,激活延迟几乎为零,无蓝牙预热延迟,开口即录。
系统音频采集
从 Zoom、Google Meet、Teams 或任何播放声音的应用中录制音频。可单独采集麦克风或系统音频,也可同时录制两者。无需安装额外软件。
实时转录
会议进行时,语音实时转录。语音活动检测自动分段,让您随时跟上会议进度。
AI 摘要
会议结束后,自动生成包含关键决策、待办事项和未解决问题的摘要。使用您配置的 LLM 提供商,可自动运行或按需触发。
会议笔记
在转录文本旁撰写和编辑 Markdown 笔记。笔记以纯文本文件保存在本地,可用任意编辑器打开。
导入录音
拖入音频或视频文件,即可转录并总结现有录音。支持多次暂停和恢复录制,不丢失任何上下文。
搜索与整理
跨所有会议和转录内容的全文搜索。通过文件夹整理并浏览完整的会议历史记录。
自定义 AI 技能
使用自定义提示词创建技能。修正语法、翻译语言、总结会议记录、调整文风,或任何您能用提示词描述的操作。技能可在每次转录后自动运行,也可手动触发。
技能链
按顺序串联多个技能,前一个的输出作为下一个的输入。一次完成转录、翻译、格式化为要点等所有操作。
7+ 家 LLM 服务商
技能支持您选择的语言模型。可使用云端 API,或通过 Ollama 在本地运行,实现完全离线的 AI 处理。
导入音频和视频
拖放、粘贴或选取任意音视频文件。支持 MP4、MOV、MP3、WAV、FLAC、OGG、WebM 等 25 种以上格式。DuckType 自动提取音频并转为文字,技能处理与实时听写完全一致。
CJK 罗马音
用日语、中文或韩语听写,同时获得原文与拉丁字母转写输出。适合语言学习者、字幕制作者及跨文字系统工作的用户。
東京
tōkyō
使用 Lindera 分词器精准识别汉字读音
你好世界
nǐ hǎo shì jiè
字符级拼音及声调标注
한국
han gug
使用标准系统进行韩文字母分解
地区拼写校正
大多数转录引擎默认输出美式英语或巴西葡萄牙语。DuckType 会自动将拼写更正为您所在地区的变体。
英式英语
欧洲葡萄牙语
瑞士德语
词典与快捷方式
词典
为不同场景创建多个词典列表:技术术语、产品名称、医学词汇,按需开启或关闭。
文本替换
定义可展开为长文本的快捷缩写。输入缩写、邮件签名、代码片段或常用短语。
1,900+ 表情符号和快捷方式
内置 Unicode 表情符号库和文本快捷方式。说出触发词,DuckType 自动为您插入表情符号或扩展文本。
粘贴到光标处
转录文本会直接粘贴到光标所在位置,适用于任何应用:文本编辑器、浏览器、聊天窗口、终端等。可与其他录音应用同时运行,互不冲突。
统计与等级
追踪每分钟字数、每日字数统计和连续听写天数。达成里程碑、提升等级,让您的小鸭从"雏鸭"一路晋升到"海军上将"。
技能预设
将多个技能组合为可复用的预设,一键快捷切换工作流:邮件模式、代码注释模式、会议记录模式……
CLI
从终端转录音频和视频文件。将输出传送至其他工具、批量处理任务,或将 DuckType 集成到 Shell 脚本和自动化工作流中。
Claude Code 技能
直接在 Claude Code 中转录音频和视频文件。无需切换上下文,即可对录音提问、获取摘要或搜索转录内容。
深度自定义
自定义 AI 提示词、可配置的静音阈值、按应用设置的录制配置文件,以及对每项设置的精细控制。将 DuckType 调整为最适合您工作方式的状态。
不读取屏幕
DuckType 从不读取您的无障碍树、捕获窗口内容或检查屏幕上的信息。无障碍访问权限为可选项,仅用于光标定位。
不记录网址
DuckType 不会追踪您使用的应用、访问的网站或听写时的行为,不收集任何行为数据。
自动离线切换
当网络断开或云端服务出现故障时,DuckType 自动切换到本地模型。您也可以主动选择完全离线运行,数据不会离开您的设备。
独立运营,非风险投资支持
DuckType 独立开发,没有投资方推动增长指标或数据收集。您的订阅费用用于产品开发,仅此而已。
Tauri + Rust
原生 Rust 后端搭配轻量 webview 前端,不捆绑 Chromium,内存与 CPU 占用极低。
轻量级下载包
macOS 版约 55 MB。Windows 版约 80 MB,因包含 ffmpeg 媒体组件。基于 Electron 的竞品约为 238 MB。
永不丢失您的工作
所有转录内容均以 SQLite 格式保存在本地。可对完整历史记录进行搜索、编辑和重新执行技能。若转录失败或录制途中应用崩溃,音频将被保留,并在下次启动时自动恢复。
macOS 和 Windows
支持 macOS 11 Big Sur 及更新版本,以及 Windows 10 或更新版本。Linux 和移动端支持已在规划中。
试用 DuckType
支持 macOS 11 Big Sur 及更新版本,或 Windows 10 或更新版本。使用本地模型或自己的 API key 可无限制转写。无需账号或信用卡。
下载 DuckType