Zurück zur Wissensdatenbank
Spracheingabe/5 Min. Lesezeit

Stream Deck Diktat mit lokalem Whisper AI

Local AI Transcribe bringt OpenAI Whisper auf eine einzelne Stream-Deck-Taste. Einmal drücken zum Aufnehmen, einmal drücken zum Stoppen — Transkription vollständig auf dem eigenen Rechner, ohne Cloud-Verbindung, ohne Abo.

Was Whisper ist

Whisper ist ein Open-Source-Spracherkennungsmodell von OpenAI, das 2022 veröffentlicht wurde. Es gibt vier Größen — Tiny, Base, Small und Medium — mit einem Spektrum von sehr schnell und kompakt bis hochgenau.

Der entscheidende Punkt: Es läuft vollständig auf dem lokalen Rechner. Es gibt keinen Whisper-Cloud-Dienst, kein Abo und keine übertragenen Daten. Die Mikrofoneingabe wird auf CPU oder GPU verarbeitet, das Ergebnis bleibt auf dem Computer.

Die vier Modellgrößen

Der Kompromiss über alle vier Größen ist Geschwindigkeit gegen Genauigkeit.

  • Tiny — am schnellsten und leichtesten. Gut für kurze, klare Phrasen in ruhigen Umgebungen. Sehr geringe RAM-Nutzung.
  • Base — ein kleiner Schritt in der Genauigkeit über Tiny bei ähnlicher Geschwindigkeit. Ein guter Einstiegspunkt.
  • Small — deutlich genauer für alltägliche Sprache. Für die meisten Nutzer empfohlen.
  • Medium — höchste Genauigkeit, höchste Anforderungen. Langsam auf CPU-Rechnern ohne GPU; deutlich schneller mit Nvidia-CUDA-Grafikkarte.

Drei Ausgabemodi

Nach der Aufnahme kann der transkribierte Text auf drei Arten zugestellt werden. Ausgabemodus einmal in den Tasteneinstellungen festlegen.

  • Zwischenablage — Text wird kopiert. Manuell einfügen, wo er gebraucht wird.
  • Auto-Paste — Text wird direkt in das Fenster eingefügt, das beim Drücken der Taste aktiv war.
  • Auto-Send — Text wird eingefügt und Enter automatisch gedrückt. Praktisch für Chat, KI-Eingaben und Suchfelder.

Warum nicht Windows-Spracheingabe

Windows Voice Typing (Win + H) sendet Audio zur Transkription an Microsoft-Server. Eine Internetverbindung ist erforderlich und Mikrofondaten verlassen den Rechner.

Whisper über Stream Deck tut nichts davon. Audio wird lokal erfasst und verarbeitet. Netzwerkzugriff wird nur für den einmaligen ersten Modell-Download benötigt — danach alles offline.

Praktische Anwendungen

  • Längere Texte schreiben — Absätze diktieren statt tippen. Whisper verarbeitet vollständige Aufnahmen, keine Live-Streams, was natürlichere Ergebnisse liefert.
  • KI-Chat-Eingaben — direkt in ChatGPT, Claude, Copilot oder Gemini diktieren. Mit Auto-Send wird die Nachricht ohne Tastaturberührung abgeschickt.
  • Meeting-Notizen — nach einem Call diktieren, solange der Kontext frisch ist. Text landet ohne Cloud-Verarbeitung im Notiz-Tool.
  • Schnelle E-Mails und Nachrichten — Antwort sprechen, Auto-Paste liefert sie ab.

Ersteinrichtung

Für den ersten Modell-Download wird einmalig eine Internetverbindung benötigt. Danach vollständig offline.

  • Local AI Transcribe aus dem Elgato Marketplace installieren.
  • Aktion auf eine Stream-Deck-Taste ziehen und Tasteneinstellungen öffnen.
  • Modellgröße auswählen. Small wird für die meisten Nutzer empfohlen.
  • Taste einmal drücken. Das Plugin lädt das Whisper-Modell automatisch herunter — je nach Verbindung ein bis zwei Minuten.
  • Nach dem Download ist das Plugin einsatzbereit. Keine Internetverbindung mehr nötig.
Local AI Transcribe holen

Reale Produktbeispiele

Diese Illustrationen nutzen Assets und Workflow-Muster, die bereits auf den Produktseiten gezeigt werden.

Diktat-Plugin

Plugin ansehen
Local AI Transcribe auf einer Stream-Deck-Taste mit Aufnahme- und Verarbeitungszustand.

Local AI Transcribe legt privates Whisper-Diktat auf eine Stream-Deck-Taste.

Eine Taste startet die Aufnahme, eine Taste stoppt. Das Ergebnis landet in der Zwischenablage, wird eingefügt oder automatisch gesendet — Audio verlässt das Gerät nie.

100% lokal mit Whisper AIDrei Ausgabemodi57+ Sprachen

Grundlegender Ablauf

Drücken

Einmal drücken, um die Aufnahme zu starten. Die Taste zeigt einen Live-Aufnahmestatus.

Sprechen

Natürlich in einer von 57+ Sprachen diktieren. Whisper erkennt die Sprache automatisch.

Empfangen

Nochmal drücken zum Stoppen. Text landet in der Zwischenablage, wird eingefügt oder gesendet.

Produkte ansehen

Wie du OpenAI Whisper für lokales Diktat per Stream-Deck-Taste nutzt — ohne Cloud, ohne Abo, ohne Audiodaten, die deinen Rechner verlassen.

    Stream Deck Diktat mit Whisper AI | Arise Create