DuckTypeDuckType

Wszystko, co potrafi DuckType

Ponad 100 języków, romanizacja CJK, regionalne korekty pisowni, łączenie umiejętności AI i wiele więcej.

Transkrypcja

Transkrybuj spotkania, wykłady, wywiady i nie tylko

Działa offline z lokalnymi modelami lub połącz się z chmurą, aby uzyskać jeszcze większą dokładność. Umiejętności AI poprawiają gramatykę, tłumaczą, podsumowują lub wykonują dowolne zadanie opisane w podpowiedzi.

100+ języków

Od angielskiego i hiszpańskiego po japoński, arabski i hindi. Obsługa języków zależy od dostawcy — niektóre silniki obsługują do 100 języków.

Użyj własnego klucza

Połącz własne konto OpenAI, Groq, Deepgram lub ElevenLabs, aby odblokować specjalistyczne modele, takie jak Deepgram Nova 3 Medical i ElevenLabs Scribe v2. Bez narzutów na koszty API. Twoje klucze są przechowywane lokalnie i nigdy nie są wysyłane na nasze serwery.

Albo zostaw to nam

Transkrypcja i umiejętności hostowane przez DuckType zaczynają się od 200 000 słów/miesiąc, z planem Pro na 600 000 słów do intensywniejszego użytku i automatycznym przełączaniem między dostawcami. Jeśli dostawcy chmurowi są niedostępni, DuckType automatycznie przełącza się na modele lokalne. Żadnych kluczy API do zarządzania.

Dostawcy chmurowi

DuckType Cloud

Zarządzany

OpenAI

Whisper

Groq

Whisper

Deepgram

Nova 3, Nova 3 Medical

Mistral

Voxtral Mini, Voxtral Small

Cloudflare

Workers AI

Baseten

Użyj własnego modelu

ElevenLabs

Scribe v2

Modele lokalne (offline)

Whisper

100 języków, wiele rozmiarów

Parakeet TDT

Angielski, wysoka dokładność

SenseVoice

Chiński, japoński, koreański, angielski, kantoński

Tryby nagrywania

Zacznij nagrywać po swojemu

Od trybu push-to-talk do szybkich edycji, aż po zawsze włączony tryb automatyczny do ciągłego dyktowania. Każdy tryb działa globalnie, nawet gdy DuckType jest zminimalizowany.

Push-to-talk

Przytrzymaj klawisz, aby nagrywać, zwolnij, aby dokonać transkrypcji. Klasyczny tryb zapewniający precyzyjną kontrolę.

Kliknij, aby nagrywać

Włącz lub wyłącz nagrywanie kliknięciem lub skrótem klawiszowym. Dobre do dłuższych sesji dyktowania.

Podwójne naciśnięcie

Naciśnij dwukrotnie klawisz modyfikatora, aby rozpocząć nagrywanie. Szybka aktywacja bez sięgania po skrót klawiszowy.

Przytrzymanie klawisza Fn

Przytrzymaj klawisz Fn, aby nagrywać. Natywne odczucie, bez potrzeby ustawiania skrótu.

Tryb automatyczny

Ciągłe nasłuchiwanie z wykrywaniem aktywności głosowej. Zdania są segmentowane według przerw w ciszy. Mikrofon automatycznie przełącza się na preferowane urządzenie, gdy tylko stanie się dostępne.

Natychmiastowe nagrywanie

Ponownie wykorzystuje strumień mikrofonu między nagraniami, dzięki czemu czas aktywacji jest bliski zeru. Brak opóźnienia rozgrzewania Bluetooth. Nagrywanie rozpoczyna się w momencie, gdy zaczniesz mówić.

Spotkania

Nagrywaj, transkrybuj i podsumowuj spotkania

Rejestruj dowolną rozmowę z transkrypcją na żywo i podsumowaniami generowanymi przez AI. Działa z połączeniami wideo, spotkaniami stacjonarnymi lub dowolnym dźwiękiem na Twoim komputerze.

Przechwytywanie dźwięku systemowego

Nagrywaj dźwięk z Zoom, Google Meet, Teams lub dowolnej aplikacji odtwarzającej dźwięk. Przechwytuj mikrofon, dźwięk systemowy lub oba jednocześnie. Żadnego dodatkowego oprogramowania.

Transkrypcja na żywo

Mowa jest transkrybowana w czasie rzeczywistym w trakcie trwania spotkania. Wykrywanie aktywności głosowej automatycznie segmentuje mowę, dzięki czemu możesz śledzić przebieg na bieżąco.

Podsumowania AI

Po zakończeniu spotkania generuj podsumowanie z kluczowymi decyzjami, zadaniami i otwartymi pytaniami. Korzysta ze skonfigurowanego dostawcy LLM. Może działać automatycznie lub na żądanie.

Notatki ze spotkania

Pisz i edytuj notatki w formacie Markdown obok transkrypcji. Notatki są zapisywane lokalnie jako zwykłe pliki, które możesz otworzyć w dowolnym edytorze.

Importuj nagrania

Upuść plik audio lub wideo, aby transkrybować i podsumować istniejące nagranie. Wstrzymuj i wznawiaj wielosesyjne nagrania bez utraty kontekstu.

Wyszukiwanie i organizacja

Pełnotekstowe wyszukiwanie po wszystkich spotkaniach i transkrypcjach. Organizuj za pomocą folderów i przeglądaj pełną historię spotkań.

Przetwarzanie AI

Przekształcaj tekst po transkrypcji

Umiejętności AI działają na Twojej transkrypcji, aby poprawiać gramatykę, tłumaczyć, streszczać lub robić cokolwiek, co opiszesz w prompcie.

Niestandardowe umiejętności AI

Twórz umiejętności z własnymi promptami. Poprawiaj gramatykę, tłumacz na inny język, streszczaj notatki ze spotkań, przepisuj ton lub rób cokolwiek innego. Umiejętności mogą działać automatycznie przy każdej transkrypcji lub być wyzwalane ręcznie.

Łączenie umiejętności

Łącz wiele umiejętności w sekwencje. Wynik jednej staje się wejściem kolejnej. Transkrybuj, tłumacz i formatuj jako punkty — wszystko w jednym przebiegu.

7+ dostawców LLM

Umiejętności działają z wybranym przez Ciebie modelem językowym. Używaj cloud API lub uruchamiaj lokalnie z Ollama dla w pełni offline przetwarzania AI.

OpenAI (GPT)Anthropic (Claude)Google (Gemini)GroqOpenRouterOllama (local)Any OpenAI-compatible

Importuj pliki audio i wideo

Przeciągnij i upuść, wklej lub wybierz dowolny plik audio lub wideo. MP4, MOV, MP3, WAV, FLAC, OGG, WebM i ponad 25 innych formatów. DuckType wyodrębnia dźwięk i konwertuje go na tekst. Umiejętności działają na wyniku tak samo jak przy dyktowaniu na żywo.

Inteligencja językowa

Poza dokładnością transkrypcji

DuckType rozumie regionalne warianty pisowni, romanizuje skrypty CJK i uczy się Twojego słownictwa. Żadna inna aplikacja do dyktowania tego nie robi.

Romanizacja CJK

Dyktuj po japońsku, chińsku lub koreańsku i otrzymuj zromanizowany wynik w piśmie łacińskim obok oryginalnego tekstu. Przydatne dla uczących się języków, specjalistów od napisów i osób pracujących w różnych systemach pisma.

東京

tōkyō

JapońskiRomaji

Tokenizator Lindera do dokładnego odczytu znaków kanji

你好世界

nǐ hǎo shì jiè

ChińskiPinyin

Pinyin na poziomie znaków ze znacznikami tonów

한국

han gug

KoreańskiRevised Romanization

Dekompozycja Hangul z wykorzystaniem standardowego systemu

Regionalne korekty pisowni

Większość silników transkrypcji domyślnie generuje tekst w amerykańskim angielskim lub brazylijskim portugalskim. DuckType automatycznie koryguje pisownię, aby odpowiadała Twojemu regionalnemu wariantowi językowego.

Angielski brytyjski

colorcolour
analyzeanalyse
centercentre

Europejski portugalski

bebêbebé
abdômenabdómen

Szwajcarski niemiecki

straßestrasse

Słownik i skróty

Słownik

Twórz wiele list słownika dla różnych kontekstów. Terminy techniczne, nazwy produktów, słownictwo medyczne. Włączaj i wyłączaj listy według potrzeb.

Zamiany tekstu

Definiuj skróty rozwijające się w dłuższy tekst. Wpisuj skróty, stopki e-mail, fragmenty kodu lub często używane frazy.

Ponad 1900 emoji i skrótów

Wbudowana biblioteka emoji Unicode i skróty tekstowe. Powiedz słowo wyzwalające, a DuckType wstawi za Ciebie odpowiednie emoji lub rozwinięty tekst.

Produktywność

Stworzone dla osób dyktujących cały dzień

Globalne skróty, szerokie możliwości dostosowania i system postępów, który utrzymuje motywację.

Wklej w miejscu kursora

Transkrybowany tekst jest wklejany bezpośrednio w miejscu kursora. Działa w każdej aplikacji: edytorach tekstu, przeglądarkach, oknach czatu, terminalach. Działa równolegle z innymi aplikacjami do nagrywania bez konfliktów.

Statystyki i poziomy

Śledź słowa na minutę, dzienne liczby słów i serie dyktowań. Osiągaj kamienie milowe i awansuj swojego kaczora od Kaczątka do Admirała.

Presety umiejętności

Grupuj wiele umiejętności w gotowe zestawy. Przełączaj się między przepływami pracy jednym skrótem. Jeden do e-maili, jeden do komentarzy w kodzie, jeden do notatek ze spotkań.

CLI

Transkrybuj pliki audio i wideo z poziomu terminala. Przekazuj wyniki do innych narzędzi, uruchamiaj zadania wsadowe lub integruj DuckType ze skryptami powłoki i przepływami automatyzacji.

Skill Claude Code

Transkrybuj pliki audio i wideo bezpośrednio w Claude Code. Zadawaj pytania dotyczące nagrań, uzyskuj podsumowania lub przeszukuj transkrypcje bez zmiany kontekstu.

Głęboka personalizacja

Niestandardowe prompty AI, konfigurowalne progi ciszy, profile nagrywania per aplikacja i szczegółowa kontrola nad każdym ustawieniem. Dostosuj DuckType do swojego stylu pracy.

Prywatność

Twoje dane pozostają Twoje

DuckType jest zaprojektowany tak, aby Twoje dane nigdy nie trafiały tam, gdzie ich nie wysłałeś. Żadnej inwigilacji, żadnej telemetrii domyślnie, żadnego zbierania danych.

Brak odczytu ekranu

DuckType nigdy nie odczytuje drzewa dostępności, nie przechwytuje zawartości okien ani nie sprawdza, co masz na ekranie. Dostęp ułatwień dostępu jest opcjonalny i służy wyłącznie do pozycjonowania kursora.

Bez zapisywania adresów URL

DuckType nie śledzi używanych aplikacji, odwiedzanych stron internetowych ani tego, co robisz podczas dyktowania. Nie są zbierane żadne dane behawioralne.

Automatyczne przełączanie w tryb offline

DuckType automatycznie przełącza się na modele lokalne, gdy połączenie z internetem jest niedostępne lub dostawca chmurowy zawiedzie. Możesz też działać całkowicie offline z własnego wyboru. Żadne dane nie opuszczają Twojego urządzenia.

Niezależny, bez finansowania VC

DuckType jest budowany niezależnie. Żadnych inwestorów naciskających na wskaźniki wzrostu ani zbieranie danych. Twoja subskrypcja finansuje rozwój. To wszystko.

Techniczne

Zbudowany w Rust, nie w Electron

DuckType używa Tauri i Rust dla natywnej wydajności przy ułamku zużycia zasobów w porównaniu z alternatywami opartymi na Electron.

Tauri + Rust

Natywny backend w Rust z lekkim frontendem webview. Bez dołączonego Chromium. Niskie zużycie pamięci i procesora.

Pobieranie dopasowane do platformy

Około 55 MB na macOS. Około 80 MB na Windows, ponieważ zawiera pakiet ffmpeg. Konkurenci oparci na Electronie zajmują około 238 MB.

Nigdy nie trać swojej pracy

Każda transkrypcja jest zapisywana lokalnie w SQLite. Przeszukuj, edytuj i uruchamiaj ponownie umiejętności na całej historii. Jeśli transkrypcja się nie powiedzie lub aplikacja ulegnie awarii podczas nagrywania, Twoje audio zostanie zachowane i automatycznie odzyskane przy następnym uruchomieniu.

macOS i Windows

Obsługuje macOS 11 Big Sur i nowsze oraz Windows 10 lub nowsze. Obsługa Linuxa i urządzeń mobilnych jest planowana.

Wypróbuj DuckType

Pobierz dla macOS 11 Big Sur i nowszych lub Windows 10 i nowszych. Nieograniczona liczba słów z modelami lokalnymi lub własnym API key. Konto ani karta kredytowa nie są wymagane.

Pobierz DuckType