DuckTypeでできること全て
100以上の言語、CJKローマ字変換、地域別スペル修正、AIスキルの連結など、多数の機能を搭載。
文字起こし
会議、講義、インタビューなどを文字起こし
ローカルモデルでオフライン動作、またはクラウドに接続してさらに高精度な文字起こしが可能です。AIスキルで文法の修正、翻訳、要約など、プロンプトで指定した処理を自動で行います。
100言語以上
英語やスペイン語から日本語、アラビア語、ヒンディー語まで。言語サポートはプロバイダーによって異なり、エンジンによっては最大100言語に対応しています。
API keyの持ち込み
OpenAI、Groq、Deepgram、またはElevenLabsのアカウントを連携して、Deepgram Nova 3 MedicalやElevenLabs Scribe v2などの専門モデルをご利用ください。API費用への上乗せはありません。API keyはローカルに保存され、当社のサーバーに送信されることはありません。
または、お任せください
DuckType ホスト型の文字起こしとスキルは月 200,000 語から始まり、より多く使う方向けに月 600,000 語の Pro プランとプロバイダー自動切り替えを提供します。クラウドプロバイダーに接続できない場合、DuckType は自動的にローカルモデルに切り替えます。API key の管理は不要です。
クラウドプロバイダー
DuckType Cloud
マネージド
OpenAI
Whisper
Groq
Whisper
Deepgram
Nova 3, Nova 3 Medical
Mistral
Voxtral Mini, Voxtral Small
Cloudflare
Workers AI
Baseten
独自のモデルを使用する
ElevenLabs
Scribe v2
ローカルモデル(オフライン)
Whisper
100言語、複数サイズ対応
Parakeet TDT
英語、高精度
SenseVoice
中国語・日本語・韓国語・英語・広東語
プッシュトゥトーク
キーを押している間録音し、離すと文字起こしします。細かい制御に適したクラシックモードです。
クリックして録音
クリックまたはキーボードショートカットで録音を切り替えます。長い口述筆記セッションに適しています。
ダブルタップ
修飾キーをダブルタップすると録音を開始できます。ショートカットに手を伸ばさず素早く起動できます。
Fnキー長押し
Fnキーを押し続けると録音できます。カスタムショートカット不要で、自然な操作感です。
自動モード
音声検出による常時リッスンが有効です。文章は無音区間で区切られます。マイクは使用可能になると自動的に優先デバイスに切り替わります。
即時録音
録音間でマイクストリームを再利用するため、起動遅延がほぼゼロです。Bluetoothの接続待ちもありません。話し始めた瞬間に録音が始まります。
システム音声のキャプチャ
Zoom、Google Meet、Teamsなど、音声を再生する任意のアプリから録音できます。マイク、システム音声、またはその両方を同時にキャプチャできます。追加ソフトウェアは不要です。
リアルタイム文字起こし
会議の進行に合わせてリアルタイムで文字起こしされます。音声アクティビティ検出が発話を自動的にセグメント化するため、その場でリアルタイムに追うことができます。
AI要約
会議終了後に、重要な決定事項・アクションアイテム・未解決の質問をまとめた要約を生成します。設定済みのLLMプロバイダーを使用します。自動実行またはオンデマンドで実行できます。
会議メモ
文字起こしと並行してMarkdownメモを作成・編集できます。メモはプレーンファイルとしてローカルに保存されるため、任意のエディターで開けます。
録音ファイルのインポート
音声または動画ファイルをドロップして、既存の録音を文字起こし・要約できます。複数セッションにわたる録音を一時停止・再開しても、コンテキストは失われません。
検索と整理
すべての会議と文字起こしを全文検索できます。フォルダーで整理し、会議の全履歴を閲覧できます。
カスタム AI スキル
カスタムプロンプトでスキルを作成できます。文法の修正、他言語への翻訳、会議メモの要約、文体の書き直しなど、プロンプトで表現できることなら何でも対応します。スキルはすべての文字起こしに自動実行するか、手動で起動するか選択できます。
スキルの連結
複数のスキルを順番に連結できます。一つの出力が次の入力になります。文字起こし、翻訳、箇条書き形式への整形を、すべて一度の処理で実行できます。
7社以上のLLMプロバイダー
スキルはお好みの言語モデルで動作します。クラウドAPIを使用するか、Ollamaでローカル実行して完全オフラインのAI処理も可能です。
音声・動画ファイルのインポート
ドラッグ&ドロップ、貼り付け、またはファイル選択で音声・動画ファイルを使えます。MP4、MOV、MP3、WAV、FLAC、OGG、WebMなど25以上の形式に対応。DuckTypeが音声を抽出してテキストに変換します。スキルはライブ音声入力と同様に結果に対して実行されます。
言語インテリジェンス
文字起こし精度を超えて
DuckType は地域別のスペルバリアントを理解し、CJK文字をローマ字変換し、あなたの語彙を学習します。これを実現している音声入力アプリは他にありません。
CJKローマ字変換
日本語・中国語・韓国語でディクテーションして、元のテキストと並べてローマ字のラテン文字出力を得られます。語学学習者、字幕制作者、複数の文字体系を扱う方に便利です。
東京
tōkyō
正確な漢字読みのためのLinderaトークナイザー
你好世界
nǐ hǎo shì jiè
声調記号付きの文字単位ピンイン
한국
han gug
標準システムによるハングル分解
地域別スペル修正
多くの文字起こしエンジンはデフォルトでアメリカ英語またはブラジルポルトガル語を出力します。DuckTypeはお使いの地域の表記に合わせてスペルを自動補正します。
英語(イギリス)
ポルトガル語(ヨーロッパ)
スイスドイツ語
辞書とショートカット
辞書
用途別に複数の辞書リストを作成できます。技術用語、製品名、医療用語などを登録し、必要に応じてリストのオン・オフを切り替えられます。
テキスト置換
長いテキストに展開するショートカットを定義できます。略語、メール署名、コードスニペット、よく使うフレーズなどを登録できます。
1,900以上の絵文字とショートカット
内蔵のUnicode絵文字ライブラリとテキストショートカット。トリガーワードを言うと、DuckTypeが絵文字や展開テキストを自動で挿入します。
カーソル位置に貼り付け
文字起こしされたテキストは、カーソルのある位置に直接貼り付けられます。テキストエディター、ブラウザー、チャット画面、ターミナルなど、あらゆるアプリで動作します。他の録音アプリと競合することなく併用できます。
統計とレベル
1分あたりの語数、日別語数、音声入力の連続記録を追跡できます。マイルストーンを達成してダックをDucklingからAdmiralへとレベルアップさせましょう。
スキルプリセット
複数のスキルを再利用可能なプリセットにまとめられます。ショートカット一つでワークフローを切り替え可能。メール用、コードコメント用、会議メモ用など。
CLI
ターミナルから音声・動画ファイルを文字起こしできます。出力を他のツールにパイプしたり、バッチジョブを実行したり、DuckTypeをシェルスクリプトや自動化ワークフローに組み込んだりできます。
Claude Codeスキル
Claude Code内で音声・動画ファイルを直接文字起こしできます。コンテキストを切り替えずに、録音内容への質問、要約の取得、文字起こしの検索が可能です。
高度なカスタマイズ
カスタムAIプロンプト、無音閾値の設定、アプリごとの録音プロファイル、あらゆる設定の細かな制御が可能です。自分の作業スタイルに合わせてDuckTypeを調整できます。
画面の読み取りなし
DuckTypeはアクセシビリティツリーの読み取り、ウィンドウ内容のキャプチャ、画面上の情報の検査を一切行いません。アクセシビリティアクセスは任意であり、カーソル位置の特定にのみ使用されます。
URLの記録なし
DuckType は使用しているアプリ、訪問したウェブサイト、音声入力中の操作を一切追跡しません。行動データの収集はゼロです。
オフライン時の自動切り替え
インターネットが切断された場合やクラウドプロバイダーに障害が発生した場合、DuckTypeは自動的にローカルモデルに切り替わります。完全オフラインでの利用も選択できます。データはデバイスの外に出ません。
独立系、VCの支援なし
DuckType は独立して開発されています。成長指標やデータ収集を求める投資家はいません。サブスクリプション料金は開発費に充てられます。それだけです。
技術情報
Electronではなく、Rustで構築
DuckType は Tauri と Rust を使用してネイティブパフォーマンスを実現し、Electron ベースの代替アプリに比べてリソース使用量を大幅に削減しています。
Tauri + Rust
Rust ネイティブバックエンドと軽量 WebView フロントエンドを採用。Chromium は不要で、メモリとCPUの使用量を最小限に抑えます。
軽量なダウンロードサイズ
macOS では約 55 MB、Windows では ffmpeg メディアサイドカーを含むため約 80 MB です。Electron ベースの競合製品は約 238 MB です。
作業内容を失わない
すべての文字起こしはSQLiteにローカル保存されます。全履歴の検索・編集・スキルの再実行が可能です。文字起こしに失敗したり、録音中にアプリがクラッシュしても、音声は保持され、次回起動時に自動的に復元されます。
macOSとWindows
macOS 11 Big Sur以降およびWindows 10以降に対応しています。LinuxおよびモバイルへのサポートはThank you for your interest。
DuckType を試す
macOS 11 Big Sur以降またはWindows 10以降向けにダウンロードできます。ローカルモデルまたはご自身のAPI keyで単語数無制限。アカウントやクレジットカードは不要です。
DuckTypeをダウンロード