DuckTypeDuckType

DuckType 的全部功能

支持100余种语言、CJK 罗马化、地区拼写纠正、AI 技能链式调用等更多功能。

转录

转录会议、讲座、采访等内容

支持本地模型离线使用,也可连接云端获得更高精度。AI技能可修正语法、翻译、摘要,或根据您的自定义提示词执行任意操作。

100+ 种语言

从英语、西班牙语到日语、阿拉伯语和印地语,部分引擎支持多达 100 种语言,具体支持情况因服务商而异。

自带密钥

连接您自己的 OpenAI、Groq、Deepgram 或 ElevenLabs 账户,以解锁 Deepgram Nova 3 MedicalElevenLabs Scribe v2 等专业模型。API 费用无额外加价。您的密钥仅存储在本地,不会发送到我们的服务器。

或交由我们处理

DuckType 托管转录和技能起步为每月 200,000 词,Pro 方案提供 600,000 词以应对高强度使用,并支持自动切换备用提供商。若云端服务不可用,DuckType 将自动切换至本地模型,无需管理 API key。

云端服务商

DuckType Cloud

托管

OpenAI

Whisper

Groq

Whisper

Deepgram

Nova 3, Nova 3 Medical

Mistral

Voxtral Mini, Voxtral Small

Cloudflare

Workers AI

Baseten

使用自己的模型

ElevenLabs

Scribe v2

本地模型(离线)

Whisper

100 种语言,多种模型大小

Parakeet TDT

英语,高精度

SenseVoice

中文、日语、韩语、英语、粤语

录音模式

以您的方式开始录制

从快速编辑的按住说话模式,到持续听写的全程自动模式,每种模式均可全局使用,即使 DuckType 最小化也同样有效。

按住说话

按住键开始录音,松开后转录。经典模式,精准可控。

点击录音

点击或使用快捷键切换录音,适合较长的听写会话。

双击

双击修饰键开始录音,快速激活,无需组合快捷键。

按住 Fn 键

按住 Fn 键开始录音。原生体验,无需自定义快捷键。

自动模式

始终开启的语音活动检测监听。句子按静音间隔进行分段,麦克风会在首选设备可用时自动切换。

即时录音

在录音之间复用麦克风流,激活延迟几乎为零,无蓝牙预热延迟,开口即录。

会议

录制、转录并总结会议

实时转录并自动生成 AI 摘要,记录每一次对话。支持视频通话、线下会议或设备上的任意音频。

系统音频采集

从 Zoom、Google Meet、Teams 或任何播放声音的应用中录制音频。可单独采集麦克风或系统音频,也可同时录制两者。无需安装额外软件。

实时转录

会议进行时,语音实时转录。语音活动检测自动分段,让您随时跟上会议进度。

AI 摘要

会议结束后,自动生成包含关键决策、待办事项和未解决问题的摘要。使用您配置的 LLM 提供商,可自动运行或按需触发。

会议笔记

在转录文本旁撰写和编辑 Markdown 笔记。笔记以纯文本文件保存在本地,可用任意编辑器打开。

导入录音

拖入音频或视频文件,即可转录并总结现有录音。支持多次暂停和恢复录制,不丢失任何上下文。

搜索与整理

跨所有会议和转录内容的全文搜索。通过文件夹整理并浏览完整的会议历史记录。

AI 处理

转录后对文本进行处理

AI 技能对转录结果进行处理,可修正语法、翻译、摘要,或执行任何您能用提示词描述的操作。

自定义 AI 技能

使用自定义提示词创建技能。修正语法、翻译语言、总结会议记录、调整文风,或任何您能用提示词描述的操作。技能可在每次转录后自动运行,也可手动触发。

技能链

按顺序串联多个技能,前一个的输出作为下一个的输入。一次完成转录、翻译、格式化为要点等所有操作。

7+ 家 LLM 服务商

技能支持您选择的语言模型。可使用云端 API,或通过 Ollama 在本地运行,实现完全离线的 AI 处理。

OpenAI (GPT)Anthropic (Claude)Google (Gemini)GroqOpenRouterOllama (local)Any OpenAI-compatible

导入音频和视频

拖放、粘贴或选取任意音视频文件。支持 MP4、MOV、MP3、WAV、FLAC、OGG、WebM 等 25 种以上格式。DuckType 自动提取音频并转为文字,技能处理与实时听写完全一致。

语言智能

超越转录准确性

DuckType 能识别地区拼写变体、对 CJK 文字进行罗马化处理,并学习您的专属词汇。其他听写应用无法做到这些。

CJK 罗马音

用日语、中文或韩语听写,同时获得原文与拉丁字母转写输出。适合语言学习者、字幕制作者及跨文字系统工作的用户。

東京

tōkyō

日语Romaji

使用 Lindera 分词器精准识别汉字读音

你好世界

nǐ hǎo shì jiè

中文Pinyin

字符级拼音及声调标注

한국

han gug

韩语Revised Romanization

使用标准系统进行韩文字母分解

地区拼写校正

大多数转录引擎默认输出美式英语或巴西葡萄牙语。DuckType 会自动将拼写更正为您所在地区的变体。

英式英语

colorcolour
analyzeanalyse
centercentre

欧洲葡萄牙语

bebêbebé
abdômenabdómen

瑞士德语

straßestrasse

词典与快捷方式

词典

为不同场景创建多个词典列表:技术术语、产品名称、医学词汇,按需开启或关闭。

文本替换

定义可展开为长文本的快捷缩写。输入缩写、邮件签名、代码片段或常用短语。

1,900+ 表情符号和快捷方式

内置 Unicode 表情符号库和文本快捷方式。说出触发词,DuckType 自动为您插入表情符号或扩展文本。

生产力

专为全天听写用户打造

全局快捷键、深度自定义,以及让您保持动力的成长系统。

粘贴到光标处

转录文本会直接粘贴到光标所在位置,适用于任何应用:文本编辑器、浏览器、聊天窗口、终端等。可与其他录音应用同时运行,互不冲突。

统计与等级

追踪每分钟字数、每日字数统计和连续听写天数。达成里程碑、提升等级,让您的小鸭从"雏鸭"一路晋升到"海军上将"。

技能预设

将多个技能组合为可复用的预设,一键快捷切换工作流:邮件模式、代码注释模式、会议记录模式……

CLI

从终端转录音频和视频文件。将输出传送至其他工具、批量处理任务,或将 DuckType 集成到 Shell 脚本和自动化工作流中。

Claude Code 技能

直接在 Claude Code 中转录音频和视频文件。无需切换上下文,即可对录音提问、获取摘要或搜索转录内容。

深度自定义

自定义 AI 提示词、可配置的静音阈值、按应用设置的录制配置文件,以及对每项设置的精细控制。将 DuckType 调整为最适合您工作方式的状态。

隐私

您的数据归您所有

DuckType 的设计确保您的数据绝不会流向您未选择的地方。默认无监控、无遥测、不收集数据。

不读取屏幕

DuckType 从不读取您的无障碍树、捕获窗口内容或检查屏幕上的信息。无障碍访问权限为可选项,仅用于光标定位。

不记录网址

DuckType 不会追踪您使用的应用、访问的网站或听写时的行为,不收集任何行为数据。

自动离线切换

当网络断开或云端服务出现故障时,DuckType 自动切换到本地模型。您也可以主动选择完全离线运行,数据不会离开您的设备。

独立运营,非风险投资支持

DuckType 独立开发,没有投资方推动增长指标或数据收集。您的订阅费用用于产品开发,仅此而已。

技术

基于 Rust 构建,而非 Electron

DuckType 采用 Tauri 和 Rust 实现原生性能,资源占用仅为 Electron 方案的一小部分。

Tauri + Rust

原生 Rust 后端搭配轻量 webview 前端,不捆绑 Chromium,内存与 CPU 占用极低。

轻量级下载包

macOS 版约 55 MB。Windows 版约 80 MB,因包含 ffmpeg 媒体组件。基于 Electron 的竞品约为 238 MB。

永不丢失您的工作

所有转录内容均以 SQLite 格式保存在本地。可对完整历史记录进行搜索、编辑和重新执行技能。若转录失败或录制途中应用崩溃,音频将被保留,并在下次启动时自动恢复。

macOS 和 Windows

支持 macOS 11 Big Sur 及更新版本,以及 Windows 10 或更新版本。Linux 和移动端支持已在规划中。

试用 DuckType

支持 macOS 11 Big Sur 及更新版本,或 Windows 10 或更新版本。使用本地模型或自己的 API key 可无限制转写。无需账号或信用卡。

下载 DuckType