DuckTypeDuckType

DuckTypeでできること全て

100以上の言語、CJKローマ字変換、地域別スペル修正、AIスキルの連結など、多数の機能を搭載。

文字起こし

会議、講義、インタビューなどを文字起こし

ローカルモデルでオフライン動作、またはクラウドに接続してさらに高精度な文字起こしが可能です。AIスキルで文法の修正、翻訳、要約など、プロンプトで指定した処理を自動で行います。

100言語以上

英語やスペイン語から日本語、アラビア語、ヒンディー語まで。言語サポートはプロバイダーによって異なり、エンジンによっては最大100言語に対応しています。

API keyの持ち込み

OpenAI、Groq、Deepgram、またはElevenLabsのアカウントを連携して、Deepgram Nova 3 MedicalElevenLabs Scribe v2などの専門モデルをご利用ください。API費用への上乗せはありません。API keyはローカルに保存され、当社のサーバーに送信されることはありません。

または、お任せください

DuckType ホスト型の文字起こしとスキルは月 200,000 語から始まり、より多く使う方向けに月 600,000 語の Pro プランとプロバイダー自動切り替えを提供します。クラウドプロバイダーに接続できない場合、DuckType は自動的にローカルモデルに切り替えます。API key の管理は不要です。

クラウドプロバイダー

DuckType Cloud

マネージド

OpenAI

Whisper

Groq

Whisper

Deepgram

Nova 3, Nova 3 Medical

Mistral

Voxtral Mini, Voxtral Small

Cloudflare

Workers AI

Baseten

独自のモデルを使用する

ElevenLabs

Scribe v2

ローカルモデル(オフライン)

Whisper

100言語、複数サイズ対応

Parakeet TDT

英語、高精度

SenseVoice

中国語・日本語・韓国語・英語・広東語

録音モード

好みの方法で録音を開始

素早い編集向けのプッシュトゥトークから、連続ディクテーション向けの常時オン自動モードまで。DuckTypeを最小化していても、すべてのモードがグローバルに動作します。

プッシュトゥトーク

キーを押している間録音し、離すと文字起こしします。細かい制御に適したクラシックモードです。

クリックして録音

クリックまたはキーボードショートカットで録音を切り替えます。長い口述筆記セッションに適しています。

ダブルタップ

修飾キーをダブルタップすると録音を開始できます。ショートカットに手を伸ばさず素早く起動できます。

Fnキー長押し

Fnキーを押し続けると録音できます。カスタムショートカット不要で、自然な操作感です。

自動モード

音声検出による常時リッスンが有効です。文章は無音区間で区切られます。マイクは使用可能になると自動的に優先デバイスに切り替わります。

即時録音

録音間でマイクストリームを再利用するため、起動遅延がほぼゼロです。Bluetoothの接続待ちもありません。話し始めた瞬間に録音が始まります。

会議

会議を録音・文字起こし・要約する

リアルタイム文字起こしとAI生成要約で、あらゆる会話を記録できます。ビデオ通話、対面会議、またはお使いのマシン上の音声に対応しています。

システム音声のキャプチャ

Zoom、Google Meet、Teamsなど、音声を再生する任意のアプリから録音できます。マイク、システム音声、またはその両方を同時にキャプチャできます。追加ソフトウェアは不要です。

リアルタイム文字起こし

会議の進行に合わせてリアルタイムで文字起こしされます。音声アクティビティ検出が発話を自動的にセグメント化するため、その場でリアルタイムに追うことができます。

AI要約

会議終了後に、重要な決定事項・アクションアイテム・未解決の質問をまとめた要約を生成します。設定済みのLLMプロバイダーを使用します。自動実行またはオンデマンドで実行できます。

会議メモ

文字起こしと並行してMarkdownメモを作成・編集できます。メモはプレーンファイルとしてローカルに保存されるため、任意のエディターで開けます。

録音ファイルのインポート

音声または動画ファイルをドロップして、既存の録音を文字起こし・要約できます。複数セッションにわたる録音を一時停止・再開しても、コンテキストは失われません。

検索と整理

すべての会議と文字起こしを全文検索できます。フォルダーで整理し、会議の全履歴を閲覧できます。

AI処理

文字起こし後にテキストを変換

AIスキルが文字起こし結果に対して、文法修正・翻訳・要約など、プロンプトで指定した処理を実行します。

カスタム AI スキル

カスタムプロンプトでスキルを作成できます。文法の修正、他言語への翻訳、会議メモの要約、文体の書き直しなど、プロンプトで表現できることなら何でも対応します。スキルはすべての文字起こしに自動実行するか、手動で起動するか選択できます。

スキルの連結

複数のスキルを順番に連結できます。一つの出力が次の入力になります。文字起こし、翻訳、箇条書き形式への整形を、すべて一度の処理で実行できます。

7社以上のLLMプロバイダー

スキルはお好みの言語モデルで動作します。クラウドAPIを使用するか、Ollamaでローカル実行して完全オフラインのAI処理も可能です。

OpenAI (GPT)Anthropic (Claude)Google (Gemini)GroqOpenRouterOllama (local)Any OpenAI-compatible

音声・動画ファイルのインポート

ドラッグ&ドロップ、貼り付け、またはファイル選択で音声・動画ファイルを使えます。MP4、MOV、MP3、WAV、FLAC、OGG、WebMなど25以上の形式に対応。DuckTypeが音声を抽出してテキストに変換します。スキルはライブ音声入力と同様に結果に対して実行されます。

言語インテリジェンス

文字起こし精度を超えて

DuckType は地域別のスペルバリアントを理解し、CJK文字をローマ字変換し、あなたの語彙を学習します。これを実現している音声入力アプリは他にありません。

CJKローマ字変換

日本語・中国語・韓国語でディクテーションして、元のテキストと並べてローマ字のラテン文字出力を得られます。語学学習者、字幕制作者、複数の文字体系を扱う方に便利です。

東京

tōkyō

日本語Romaji

正確な漢字読みのためのLinderaトークナイザー

你好世界

nǐ hǎo shì jiè

中国語Pinyin

声調記号付きの文字単位ピンイン

한국

han gug

韓国語Revised Romanization

標準システムによるハングル分解

地域別スペル修正

多くの文字起こしエンジンはデフォルトでアメリカ英語またはブラジルポルトガル語を出力します。DuckTypeはお使いの地域の表記に合わせてスペルを自動補正します。

英語(イギリス)

colorcolour
analyzeanalyse
centercentre

ポルトガル語(ヨーロッパ)

bebêbebé
abdômenabdómen

スイスドイツ語

straßestrasse

辞書とショートカット

辞書

用途別に複数の辞書リストを作成できます。技術用語、製品名、医療用語などを登録し、必要に応じてリストのオン・オフを切り替えられます。

テキスト置換

長いテキストに展開するショートカットを定義できます。略語、メール署名、コードスニペット、よく使うフレーズなどを登録できます。

1,900以上の絵文字とショートカット

内蔵のUnicode絵文字ライブラリとテキストショートカット。トリガーワードを言うと、DuckTypeが絵文字や展開テキストを自動で挿入します。

生産性

一日中ディクテーションする人のために

グローバルショートカット、豊富なカスタマイズ、やる気を維持する進行システム。

カーソル位置に貼り付け

文字起こしされたテキストは、カーソルのある位置に直接貼り付けられます。テキストエディター、ブラウザー、チャット画面、ターミナルなど、あらゆるアプリで動作します。他の録音アプリと競合することなく併用できます。

統計とレベル

1分あたりの語数、日別語数、音声入力の連続記録を追跡できます。マイルストーンを達成してダックをDucklingからAdmiralへとレベルアップさせましょう。

スキルプリセット

複数のスキルを再利用可能なプリセットにまとめられます。ショートカット一つでワークフローを切り替え可能。メール用、コードコメント用、会議メモ用など。

CLI

ターミナルから音声・動画ファイルを文字起こしできます。出力を他のツールにパイプしたり、バッチジョブを実行したり、DuckTypeをシェルスクリプトや自動化ワークフローに組み込んだりできます。

Claude Codeスキル

Claude Code内で音声・動画ファイルを直接文字起こしできます。コンテキストを切り替えずに、録音内容への質問、要約の取得、文字起こしの検索が可能です。

高度なカスタマイズ

カスタムAIプロンプト、無音閾値の設定、アプリごとの録音プロファイル、あらゆる設定の細かな制御が可能です。自分の作業スタイルに合わせてDuckTypeを調整できます。

プライバシー

データはあなたのもの

DuckTypeはあなたが選んだ場所以外にデータを送らないよう設計されています。監視なし、デフォルトでテレメトリーなし、データの収集なし。

画面の読み取りなし

DuckTypeはアクセシビリティツリーの読み取り、ウィンドウ内容のキャプチャ、画面上の情報の検査を一切行いません。アクセシビリティアクセスは任意であり、カーソル位置の特定にのみ使用されます。

URLの記録なし

DuckType は使用しているアプリ、訪問したウェブサイト、音声入力中の操作を一切追跡しません。行動データの収集はゼロです。

オフライン時の自動切り替え

インターネットが切断された場合やクラウドプロバイダーに障害が発生した場合、DuckTypeは自動的にローカルモデルに切り替わります。完全オフラインでの利用も選択できます。データはデバイスの外に出ません。

独立系、VCの支援なし

DuckType は独立して開発されています。成長指標やデータ収集を求める投資家はいません。サブスクリプション料金は開発費に充てられます。それだけです。

技術情報

Electronではなく、Rustで構築

DuckType は Tauri と Rust を使用してネイティブパフォーマンスを実現し、Electron ベースの代替アプリに比べてリソース使用量を大幅に削減しています。

Tauri + Rust

Rust ネイティブバックエンドと軽量 WebView フロントエンドを採用。Chromium は不要で、メモリとCPUの使用量を最小限に抑えます。

軽量なダウンロードサイズ

macOS では約 55 MB、Windows では ffmpeg メディアサイドカーを含むため約 80 MB です。Electron ベースの競合製品は約 238 MB です。

作業内容を失わない

すべての文字起こしはSQLiteにローカル保存されます。全履歴の検索・編集・スキルの再実行が可能です。文字起こしに失敗したり、録音中にアプリがクラッシュしても、音声は保持され、次回起動時に自動的に復元されます。

macOSとWindows

macOS 11 Big Sur以降およびWindows 10以降に対応しています。LinuxおよびモバイルへのサポートはThank you for your interest。

DuckType を試す

macOS 11 Big Sur以降またはWindows 10以降向けにダウンロードできます。ローカルモデルまたはご自身のAPI keyで単語数無制限。アカウントやクレジットカードは不要です。

DuckTypeをダウンロード