Smart Home: Open-Source-Plattform openHAB 3.4 hört aufs Kommando

Die Plattform openHAB integriert Software zum Erkennen von Stichwörtern, die einen Befehl starten, und Dienste zur Spracherkennung, um Befehle zu verarbeiten.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Rainald Menge-Sonnentag
Inhaltsverzeichnis

Alle Jahre wieder veröffentlicht die openHAB-Community kurz vor Weihnachten ein frisches Release. Für Version 3.4 steht vor allem die Sprachsteuerung im Fokus der Neuerungen. Als Vorsatz für das neue Jahr hat das Team derweil den Sprung auf die nächste Hauptversion auf dem Zettel. Seit dem letzten Release im Juni gibt es 17 neue Add-ons.

openHAB 3.4 bringt einige Ergänzungen für die Sprachsteuerung, deren Umsetzung bereits im Sommer mit Version 3.3 begonnen hat. Die Plattform bietet zwei Systeme für das Keyword Spotting, also zum Erkennen von Stichwörtern, die einen Sprachbefehl starten, und drei unterschiedliche Dienste für die Spracherkennung.

(Bild: Rustpotter)

Rustpotter ist ein in Rust geschriebenes Open-Source-Projekt zum Keyword Spotting. Nutzerinnen und Nutzer erstellen ihr eigenes Modell anhand von Audio-Samples. Die Daten verlassen den openHAB-Server nicht. Die Betreiber des Projekts bieten eine Demo-Seite zum Ausprobieren anhand trainierter Standardwörter an.

Der Porcupine Keyword Spotter ist ein proprietäres Produkt von Picovoice. Das Erkennen von Stichworten erfolgt ebenfalls offline, aber das System benötigt eine Internetverbindung, um die Service Access Keys zu überprüfen. openHAB bringt für das System das englische Keyword Spotting mit. Die deutsche Datei lässt sich manuell aus einem GitHub-Repository nachinstallieren.

Vosk Speech-to-Text ist ein Open-Source-System für die Spracherkennung, das ohne Cloud-Anbindung läuft und gut zwanzig Sprachen verarbeitet. openHAB kann zudem die Speech-to-Text-API von Google verwenden, deren Verarbeitung in der Cloud erfolgt und die einen Account erfordert. Der Dienst ist kommerziell und erlaubt 60 Freiminuten pro Monat.

Die Speech-to-Text-API von IBM Watson ist ebenfalls kommerziell und an die Cloud gebunden. Auch sie erfordert die vorherige Einrichtung eines Kontos. IBMs Dienst verarbeitet monatlich 500 Minuten kostenlos.

Wenn openHAB 3.4 ein Stichwort erkennt und daraufhin den Sprachbefehl verarbeitet, spielt es auf Wunsch eine Melodie als akustisches Signal, die sich mit einer simplen Textschreibweise frei konfigurieren lässt.

Buchstaben und Zahlen stehen für Noten und Tonlängen der Erkennungsmelodie.

(Bild: openHAB)

Mit dem neuen Add-on HAB Speaker wird der Browser zum Smart Speaker von openHAB: Es nimmt Sprachbefehle entgegen und bietet eine simple UI für die Dialogführung anhand der konfigurierten Dienste zur Spracherkennung (Speech to Speech, STT) und Sprachsynthese (Text to Speech, TTS).

Mit der Veröffentlichung von openHAB 3.4 haben die Arbeiten an der nächsten Hauptversion begonnen. Version 4.0 wird auf Java 17 statt Java 11 setzen. Damit steht auch zum Verarbeiten von JavaScript-Code ein Umstieg von der Nashorn-Engine auf GraalVM auf dem Plan.

Die Änderungen sollen aber weitgehend unter der Haube bleiben. Größere Inkompatibilitäten wie das Abschalten der openHAB-1-Kompatibilitätsschicht in Version 3 will das Team vermeiden. Wer die geplanten Änderungen verfolgen möchte, kann einen Blick auf das Issue-Tracking für openHAB 4 werfen.

Weitere Neuerungen in openHAB 3.4 lassen sich dem openHAB-Blog entnehmen. Auf der Download-Seite findet sich neben dem aktuellen, stabilen Release auch ein erster Snapshot von openHAB 4.

(rme)