Zurück zur Wissensdatenbank
Spracheingabe/5 Min. Lesezeit

Local AI Transcribe

Local AI Transcribe läuft vollständig lokal auf deiner Maschine — ohne Cloud. Drücken zum Aufnehmen, nochmals drücken zum Stopp, und dein Text landet in der Zwischenablage, im aktiven Fenster oder im KI-Chat. Dein Audio verlässt deinen Computer nie.

Local AI Transcribe auf einer Stream-Deck-Taste.

Was es tut

Local AI Transcribe fügt deinem Stream Deck eine Push-to-Dictate-Taste hinzu. Einmal drücken zum Aufnehmen, nochmals drücken zum Stopp. Das Plugin führt OpenAI Whisper lokal auf deiner Maschine aus und liefert den transkribierten Text dorthin, wo du ihn brauchst.

Dein Audio wird vollständig auf deinem Computer verarbeitet. Es wird nichts an einen Server gesendet, und nach dem einmaligen Modell-Download ist keine Internetverbindung mehr erforderlich.

Das Plugin unterstützt über 57 Sprachen, darunter Deutsch, Französisch, Spanisch und Japanisch. Whisper erkennt die gesprochene Sprache automatisch — es ist keine manuelle Sprachauswahl erforderlich.

Modellgrößen

Vier Whisper-Modellgrößen stehen zur Auswahl. Kleinere Modelle sind schneller, aber weniger präzise. Größere Modelle sind präziser, brauchen aber mehr Zeit und Speicher.

  • Tiny — am schnellsten, geringste Genauigkeit. Gut für kurze Notizen in ruhiger Umgebung.
  • Base — etwas präziser als Tiny bei ähnlicher Geschwindigkeit. Guter Einstiegspunkt.
  • Small — deutlich präziser bei moderater Geschwindigkeit. Für die meisten Anwendungsfälle empfohlen.
  • Medium — höchste Genauigkeit, langsamste Verarbeitung, höchster Speicherbedarf. Am besten für Fachvokabular oder mehrsprachigen Inhalt. Falls dein Rechner eine CUDA-fähige Nvidia-GPU hat, wird die Verarbeitungszeit für Medium erheblich reduziert — oft schneller als Small auf reiner CPU-Hardware.

Ausgabemodi

Wähle in den Tasteneinstellungen, wie der transkribierte Text nach jeder Aufnahme geliefert wird.

  • Nur Zwischenablage — Text wird in die Zwischenablage kopiert. Manuell einfügen wo nötig.
  • Auto-Paste — Text wird direkt in das Fenster eingefügt, das beim Drücken der Taste aktiv war. Das Zielfenster muss vorher fokussiert sein.
  • Auto-Send — Text wird eingefügt und Enter wird automatisch gedrückt. Nützlich für KI-Chateingaben und Messaging-Apps.
Local AI Transcribe Aufnahme-Status-Icon auf einer Stream-Deck-Taste.

Tastenstatus

  • Bereit — bereit zum Aufnehmen. Drücken zum Starten.
  • Aufnahme — Mikrofon ist aktiv. Nochmals drücken zum Stoppen und Transkribieren.
  • Verarbeitung — Whisper konvertiert dein Audio. Warten bis abgeschlossen.
  • Fertig — Text wurde übermittelt. Taste kehrt zu Bereit zurück.

Ersteinrichtung

Beim ersten Start muss ein Modell heruntergeladen werden. Dies geschieht automatisch und erfordert eine Internetverbindung.

  • Installiere Local AI Transcribe über den Elgato Marketplace.
  • Ziehe die Aktion auf eine Taste und öffne die Tasteneinstellungen.
  • Wähle eine Modellgröße. Tiny oder Base sind am schnellsten heruntergeladen.
  • Drücke die Taste einmal. Das Plugin lädt das Modell automatisch herunter.
  • Nach dem Download ist die Taste einsatzbereit und benötigt keine Internetverbindung mehr.

Voraussetzungen

  • Windows oder macOS (13.0 oder neuer)
  • Elgato-Stream-Deck-Hardware
  • Stream-Deck-Software
  • Mikrofon erlaubt in Windows (Einstellungen → Datenschutz → Mikrofon)
  • Internetverbindung nur für den einmaligen Modell-Download

Fehlerbehebung

  • Modell-Download schlägt fehl — Eine stabile Internetverbindung ist erforderlich. Prüfe, ob Firewall oder Sicherheitssoftware Stream Deck blockiert. Probiere ein kleineres Modell.
  • Text erscheint nicht nach der Aufnahme — Prüfe den Ausgabemodus. Bei Auto-Paste muss das Zielfenster vor dem Drücken fokussiert gewesen sein.
  • Transkription ist ungenau — Wechsle zu einem größeren Modell (Small oder Medium).
  • Verarbeitung sehr langsam — Wechsle zu einem kleineren Modell. Größere Modelle benötigen deutlich mehr Zeit.
  • Mikrofon nicht erkannt — Öffne Windows-Einstellungen → Datenschutz & Sicherheit → Mikrofon und erlaube Stream Deck den Zugriff.
  • Aufnahme startet, Transkription ist leer — Sprich näher ans Mikrofon und sorge für ruhigere Umgebung.
Im Elgato Marketplace ansehen

Produkte ansehen

Setup-Anleitung, Ausgabemodus-Referenz und Fehlerbehebung für Local AI Transcribe — datenschutzorientierte Sprache-zu-Text per lokalem Whisper AI auf deinem Stream Deck.

    Local AI Transcribe | Arise Create