DuckTypeDuckType

Tất cả những gì DuckType có thể làm

Hơn 100 ngôn ngữ, phiên âm CJK, sửa chính tả theo vùng miền, kết hợp kỹ năng AI, và nhiều tính năng khác.

Chuyển giọng nói thành văn bản

Chuyển lời thành văn bản cho các cuộc họp, bài giảng, phỏng vấn và nhiều hơn nữa

Hoạt động ngoại tuyến với các mô hình cục bộ, hoặc kết nối đám mây để có độ chính xác cao hơn. Các kỹ năng AI sẽ sửa ngữ pháp, dịch thuật, tóm tắt, hoặc thực hiện bất cứ điều gì bạn mô tả trong lệnh nhắc.

100+ ngôn ngữ

Từ tiếng Anh và tiếng Tây Ban Nha đến tiếng Nhật, tiếng Ả Rập, và tiếng Hindi. Hỗ trợ ngôn ngữ khác nhau tùy nhà cung cấp, với tới 100 ngôn ngữ trên một số công cụ.

Tự mang API key

Kết nối tài khoản OpenAI, Groq, Deepgram hoặc ElevenLabs của bạn để mở khóa các mô hình chuyên biệt như Deepgram Nova 3 MedicalElevenLabs Scribe v2. Không tính phí thêm trên chi phí API. Các khóa của bạn được lưu trữ cục bộ, không bao giờ gửi đến máy chủ của chúng tôi.

Hoặc để chúng tôi xử lý

Chép lời và kỹ năng do DuckType lưu trữ bắt đầu từ 200.000 từ/tháng, với gói Pro 600.000 từ cho nhu cầu sử dụng cao hơn và tự động chuyển đổi nhà cung cấp dự phòng. Nếu các nhà cung cấp đám mây không khả dụng, DuckType tự động chuyển sang mô hình cục bộ. Không cần quản lý API key.

Nhà cung cấp đám mây

DuckType Cloud

Được quản lý

OpenAI

Whisper

Groq

Whisper

Deepgram

Nova 3, Nova 3 Medical

Mistral

Voxtral Mini, Voxtral Small

Cloudflare

Workers AI

Baseten

Sử dụng mô hình của riêng bạn

ElevenLabs

Scribe v2

Mô hình cục bộ (ngoại tuyến)

Whisper

100 ngôn ngữ, nhiều kích thước

Parakeet TDT

Tiếng Anh, độ chính xác cao

SenseVoice

Tiếng Trung, Nhật, Hàn, Anh, Quảng Đông

Chế độ ghi âm

Bắt đầu ghi âm theo cách của bạn

Từ push-to-talk để chỉnh sửa nhanh đến chế độ tự động luôn bật cho đọc chính tả liên tục. Mọi chế độ đều hoạt động toàn cục, ngay cả khi DuckType được thu nhỏ.

Nhấn giữ để nói

Giữ phím để ghi âm, thả ra để chuyển thành văn bản. Chế độ cổ điển cho khả năng kiểm soát chính xác.

Nhấp để ghi âm

Bật/tắt ghi âm bằng một cú nhấp hoặc phím tắt. Phù hợp cho các phiên đọc chính tả dài.

Nhấn đúp

Nhấn đúp một phím điều chỉnh để bắt đầu ghi âm. Kích hoạt nhanh mà không cần tìm phím tắt.

Giữ phím Fn

Giữ phím Fn để ghi âm. Cảm giác tự nhiên, không cần phím tắt tùy chỉnh.

Chế độ tự động

Luôn lắng nghe với tính năng phát hiện hoạt động giọng nói. Các câu được phân đoạn theo khoảng lặng. Micrô tự động chuyển sang thiết bị ưa thích của bạn khi thiết bị đó sẵn sàng.

Ghi âm tức thì

Tái sử dụng luồng micrô giữa các lần ghi âm để độ trễ kích hoạt gần bằng không. Không có độ trễ khởi động Bluetooth. Ghi âm bắt đầu ngay khi bạn nói.

Cuộc họp

Ghi âm, chuyển ngữ và tóm tắt cuộc họp

Ghi lại mọi cuộc trò chuyện với chuyển ngữ trực tiếp và tóm tắt do AI tạo ra. Hoạt động với cuộc gọi video, cuộc họp trực tiếp hoặc bất kỳ âm thanh nào trên máy bạn.

Ghi âm hệ thống

Ghi âm từ Zoom, Google Meet, Teams hoặc bất kỳ ứng dụng nào đang phát âm thanh. Ghi micro, âm thanh hệ thống hoặc cả hai cùng lúc. Không cần phần mềm bổ sung.

Chuyển ngữ trực tiếp

Giọng nói được chuyển ngữ theo thời gian thực khi cuộc họp diễn ra. Tính năng phát hiện hoạt động giọng nói tự động phân đoạn lời nói để bạn có thể theo dõi ngay khi nó xảy ra.

Tóm tắt bằng AI

Khi cuộc họp kết thúc, tạo bản tóm tắt với các quyết định chính, hành động cần thực hiện và câu hỏi còn mở. Sử dụng nhà cung cấp LLM bạn đã cấu hình. Có thể chạy tự động hoặc theo yêu cầu.

Ghi chú cuộc họp

Viết và chỉnh sửa ghi chú markdown cùng với bản chuyển ngữ. Ghi chú được lưu cục bộ dưới dạng tệp văn bản thuần mà bạn có thể mở bằng bất kỳ trình soạn thảo nào.

Nhập bản ghi âm

Thả tệp âm thanh hoặc video để chuyển ngữ và tóm tắt bản ghi âm có sẵn. Tạm dừng và tiếp tục các bản ghi âm nhiều phiên mà không mất ngữ cảnh.

Tìm kiếm và sắp xếp

Tìm kiếm toàn văn bản trên tất cả các cuộc họp và bản chuyển ngữ. Sắp xếp theo thư mục và duyệt toàn bộ lịch sử cuộc họp của bạn.

Xử lý AI

Biến đổi văn bản sau khi chuyển giọng nói thành văn bản

Các kỹ năng AI chạy trên bản phiên âm để sửa ngữ pháp, dịch, tóm tắt hoặc làm bất cứ điều gì bạn có thể mô tả bằng câu lệnh.

Kỹ năng AI tùy chỉnh

Tạo kỹ năng với các câu lệnh tùy chỉnh. Sửa ngữ pháp, dịch sang ngôn ngữ khác, tóm tắt ghi chú họp, viết lại theo giọng văn hoặc bất cứ điều gì khác. Kỹ năng có thể chạy tự động trên mỗi bản phiên âm hoặc được kích hoạt thủ công.

Kết hợp kỹ năng

Kết hợp nhiều kỹ năng theo trình tự. Đầu ra của kỹ năng này trở thành đầu vào của kỹ năng tiếp theo. Chuyển ngữ, rồi dịch, rồi định dạng thành danh sách điểm — tất cả trong một lần.

7+ nhà cung cấp LLM

Kỹ năng hoạt động với mô hình ngôn ngữ do bạn chọn. Sử dụng API đám mây hoặc chạy cục bộ với Ollama để xử lý AI hoàn toàn ngoại tuyến.

OpenAI (GPT)Anthropic (Claude)Google (Gemini)GroqOpenRouterOllama (local)Any OpenAI-compatible

Nhập tệp âm thanh & video

Kéo và thả, dán, hoặc chọn bất kỳ tệp âm thanh hay video nào. MP4, MOV, MP3, WAV, FLAC, OGG, WebM, và hơn 25 định dạng khác. DuckType trích xuất âm thanh và chuyển đổi thành văn bản. Các kỹ năng chạy trên kết quả giống như khi đọc chính tả trực tiếp.

Trí tuệ ngôn ngữ

Vượt ra ngoài độ chính xác chuyển giọng nói thành văn bản

DuckType hiểu các biến thể chính tả theo vùng, phiên âm chữ CJK và học từ vựng của bạn. Không có ứng dụng đọc chính tả nào khác làm được điều này.

Phiên âm CJK

Đọc chính tả bằng tiếng Nhật, Trung hoặc Hàn và nhận đầu ra Latin phiên âm cùng với văn bản gốc. Hữu ích cho người học ngôn ngữ, người làm phụ đề và bất kỳ ai làm việc với nhiều hệ thống chữ viết.

東京

tōkyō

Tiếng NhậtRomaji

Bộ phân tích Lindera để đọc kanji chính xác

你好世界

nǐ hǎo shì jiè

Tiếng TrungPinyin

Pinyin cấp ký tự với dấu thanh

한국

han gug

Tiếng HànRevised Romanization

Phân tích Hangul sử dụng hệ thống chuẩn

Sửa chính tả theo vùng

Hầu hết các công cụ chuyển giọng nói thành văn bản mặc định xuất ra tiếng Anh Mỹ hoặc tiếng Bồ Đào Nha Brazil. DuckType tự động sửa chính tả để khớp với biến thể vùng miền của bạn.

Tiếng Anh (Anh)

colorcolour
analyzeanalyse
centercentre

Tiếng Bồ Đào Nha (châu Âu)

bebêbebé
abdômenabdómen

Tiếng Đức (Thụy Sĩ)

straßestrasse

Từ điển & phím tắt

Từ điển

Tạo nhiều danh sách từ điển cho các ngữ cảnh khác nhau. Thuật ngữ kỹ thuật, tên sản phẩm, từ vựng y tế. Bật và tắt danh sách tùy nhu cầu.

Thay thế văn bản

Xác định phím tắt mở rộng thành văn bản dài hơn. Nhập từ viết tắt, chữ ký email, đoạn mã, hoặc các cụm từ thường dùng.

Hơn 1.900 emoji và phím tắt

Thư viện emoji Unicode tích hợp và phím tắt văn bản. Nói một từ kích hoạt và DuckType sẽ chèn emoji hoặc văn bản mở rộng cho bạn.

Năng suất

Được xây dựng cho người dùng đọc chính tả cả ngày

Phím tắt toàn cục, tùy chỉnh sâu, và hệ thống tiến trình giúp bạn luôn có động lực.

Dán tại con trỏ

Văn bản được phiên âm sẽ được dán trực tiếp tại vị trí con trỏ của bạn. Hoạt động trong mọi ứng dụng: trình soạn thảo văn bản, trình duyệt, cửa sổ trò chuyện, terminal. Chạy song song với các ứng dụng ghi âm khác mà không xung đột.

Thống kê & cấp độ

Theo dõi số từ mỗi phút, số từ hàng ngày, và chuỗi ngày đọc chính tả. Đạt các mốc và nâng cấp con vịt của bạn từ Vịt Con lên Đô Đốc.

Bộ cài sẵn kỹ năng

Nhóm nhiều kỹ năng thành các bộ cài đặt có thể tái sử dụng. Chuyển đổi giữa các quy trình làm việc bằng một phím tắt duy nhất. Một bộ cho email, một bộ cho chú thích mã, một bộ cho ghi chú cuộc họp.

CLI

Chuyển ngữ tệp âm thanh và video từ terminal. Chuyển đầu ra vào các công cụ khác, chạy các tác vụ hàng loạt hoặc tích hợp DuckType vào các tập lệnh shell và quy trình tự động hóa.

Kỹ năng Claude Code

Chuyển ngữ âm thanh và video trực tiếp trong Claude Code. Đặt câu hỏi về các bản ghi âm, lấy tóm tắt hoặc tìm kiếm trong các bản chuyển ngữ mà không cần chuyển ngữ cảnh.

Tùy chỉnh sâu

Lời nhắc AI tùy chỉnh, ngưỡng im lặng có thể cấu hình, hồ sơ ghi âm theo từng ứng dụng và kiểm soát chi tiết từng cài đặt. Tinh chỉnh DuckType phù hợp với cách bạn làm việc.

Quyền riêng tư

Dữ liệu của bạn là của bạn

DuckType được thiết kế để dữ liệu của bạn không đi bất cứ đâu mà bạn không chọn. Không giám sát, không đo từ xa theo mặc định, không thu thập dữ liệu.

Không đọc màn hình

DuckType không bao giờ đọc cây trợ năng, thu thập nội dung cửa sổ hoặc kiểm tra những gì trên màn hình của bạn. Quyền truy cập trợ năng là tùy chọn và chỉ được dùng để định vị con trỏ.

Không ghi lại URL

DuckType không theo dõi ứng dụng bạn sử dụng, trang web bạn truy cập, hay những gì bạn đang làm khi đọc chính tả. Không thu thập bất kỳ dữ liệu hành vi nào.

Tự động dự phòng ngoại tuyến

DuckType tự động dự phòng sang mô hình cục bộ khi mất kết nối internet hoặc nhà cung cấp đám mây gặp sự cố. Bạn cũng có thể chọn chạy hoàn toàn ngoại tuyến. Không có dữ liệu nào rời khỏi thiết bị của bạn.

Độc lập, không có VC hậu thuẫn

DuckType được xây dựng độc lập. Không có nhà đầu tư thúc đẩy chỉ số tăng trưởng hay thu thập dữ liệu. Đăng ký của bạn chi trả cho việc phát triển. Chỉ vậy thôi.

Kỹ thuật

Được xây dựng bằng Rust, không phải Electron

DuckType sử dụng Tauri và Rust để đạt hiệu suất gốc với một phần nhỏ tài nguyên so với các giải pháp thay thế dựa trên Electron.

Tauri + Rust

Backend Rust gốc với giao diện webview nhẹ. Không có Chromium đi kèm. Sử dụng ít bộ nhớ và CPU.

Kích thước tải xuống vừa phải

Khoảng 55 MB trên macOS. Khoảng 80 MB trên Windows vì bao gồm thành phần phụ trợ ffmpeg. Các đối thủ dựa trên Electron có dung lượng khoảng 238 MB.

Không bao giờ mất công việc của bạn

Mọi bản chuyển ngữ đều được lưu cục bộ trong SQLite. Tìm kiếm, chỉnh sửa và chạy lại các kỹ năng trên toàn bộ lịch sử của bạn. Nếu chuyển ngữ thất bại hoặc ứng dụng gặp sự cố giữa chừng khi đang ghi âm, âm thanh của bạn vẫn được bảo toàn và tự động khôi phục khi khởi động lại.

macOS và Windows

Hỗ trợ macOS 11 Big Sur trở lên và Windows 10 trở lên. Linux và thiết bị di động đang được lên kế hoạch hỗ trợ.

Dùng thử DuckType

Tải về cho macOS 11 Big Sur trở lên hoặc Windows 10 trở lên. Không giới hạn từ với mô hình cục bộ hoặc API key của bạn. Không cần tài khoản hay thẻ tín dụng.

Tải DuckType