Bonjour à tous,
Je vous présente dictee : un outil de dictée vocale avec son plasmoïde (mais pas que). Votre dictée est transcrite et traduite en direct sous le curseur, bien sûr — mais il y a aussi un backend de diarisation complète pour vos réunions et visios. 100 % local par défaut, natif Wayland, avec plusieurs retours visuels au choix.

Ce que ça fait
- Dictée push-to-talk avec raccourci personnalisable, pour transcription et traduction en direct au curseur.
- 4 moteurs ASR commutables à chaud : Parakeet-TDT 0.6B v3 (25 langues, ponctuation native, par défaut), Canary-1B v2 (traduction intégrée, 48 paires), faster-whisper (99 langues), Vosk (léger, strict offline).
- Post-traitements optionnels : règles regex/dictionnaire, capitalisation par langue, et nettoyage LLM via Ollama local (modèle léger type
gemma3:4b, 100 % offline). - Fenêtre de transcription de fichiers avec lecteur timeline, multi-onglets, diarisation jusqu’à 4 locuteurs (NVIDIA Sortformer), traduction par onglet, analyse LLM des transcriptions diarisées avec le service LLM de votre choix — local (Ollama, LM Studio, vLLM, Jan, ou endpoint personnalisé) ou cloud (OpenRouter, Mistral, DeepSeek, Perplexity, Groq, Claude, Gemini, OpenAI…). Export PDF / SRT / JSON / Markdown.
Plasmoïde Plasma 6
Un accès rapide à Dictée et un retour visuel directement dans le panel grâce au plasmoïde.

Transcription de fichiers avec diarisation
Une fenêtre dédiée pour la transcription offline de fichiers audio/vidéo. Le pipeline de diarisation par chunks permet de travailler sur des fichiers longs.

Installation
curl -fsSL https://raw.githubusercontent.com/rcspam/dictee/master/install.sh | bash
Ou récupérez le paquet pour votre distro directement depuis la release v1.3.2 — Debian/Ubuntu, Fedora/RHEL, PKGBUILD Arch (prêt pour l’AUR), et tarball générique pour autre distib. Vous y trouverez un .plasmoid autonome si seul le widget vous intéresse.
Les bibliothèques CUDA sont embarquées via un venv pip au postinst sur .deb / .rpm — aucun dépôt NVIDIA à ajouter. Des paquets CPU-only existent pour les machines sans GPU dédié. Depuis la v1.3.2, le paquet CUDA n’installe plus inutilement les 1,5 Go de libs
pip si aucun GPU NVIDIA n’est détecté — bascule automatique en CPU au runtime.
Dépôt & licence
- Sources : github.com/rcspam/dictee
- Licence : GPL-3.0-or-later
- Wiki (24 pages, FR + EN) : github.com/rcspam/dictee/wiki
- Backend : Rust (ONNX Runtime, FastConformer + TDT)
- UI : PyQt6 + QML (plasmoïde)
Retours bienvenus
Je suis surtout preneur de retours d’utilisateurs Plasma 6 sur :
- Cas particuliers Wayland — différents compositeurs, focus multi-écrans, Activités.
- UX du plasmoïde — l’aide-mémoire au survol, utile ou envahissant ?
- Tout ce qui casse à l’installation — surtout sur les distributions que je teste moins (openSUSE, NixOS).
Je réponds volontiers aux questions techniques sur le pipeline ASR, le décodeur ONNX/TDT, ou l’intégration Plasma. À bientôt !