Raspberry Pi-Projekt: KI-Sprachassistent mit eigenem sprechenden Avatar bauen
Ein 10-Zoll-Display, ein Raspberry Pi und ein Mikrofon werden durch etwas Python-Code und viele Webdienste zu einem personalisierten Sprachassistenten.
- Dirk Wahl
Sprachassistenten wie Alexa, Siri, Cortana, etc. gibt es schon in vielen Varianten. Der hier vorgestellte selbstgebaute Sprachassistent kommt in Gegensatz dazu mit einer persönlichen Note daher, denn ein individueller Avatar einer beliebigen Person (in meinem Fall von mir selbst) auf dem Bildschirm gibt Antworten auf die gestellten Fragen.
Dank seiner Verbindung mit Google Speech-to-Text und Text-to-Speech und die API-Schnittstelle zu ChatGPT kann dieser Sprachassistent zudem auch noch andere Dinge als viele seiner eingangs erwähnten digitalen Kollegen, etwa kreativ Rollen spielen oder als Übersetzer agieren, eben alles, was ChatGPT zu bieten hat. Aktuelle Nachrichten wie das Wetter oder die Verkehrslage kann ChatGPT allerdings nicht liefern – ist das gewünscht, kann man sich den offenen Python-Code des Assistenten selbst nach Belieben erweitern und Informationen über andere APIs einholen.
- Individuellen sprechenden Avatar erstellen
- Wake Word generieren und Anfrage ĂĽber das Mikrofon aufnehmen
- API-Verbindungen zu Google und ChatGPT herstellen
- Ausgabe der ChatGPT-Antwort als Animation mit Sprache auf dem Mini-Monitor
Checkliste
Zeitaufwand:
etwa zwei Stunden
Kosten:
ca. 150 Euro fĂĽr die Hardware, fĂĽr die Nutzung der Webdienste fallen ggf. laufende Kosten an
- KI-Projekt: ChatGPT auf einer Schreibmaschine mit ESP32 umsetzen
- Raspi-Projekt: Stau- und Wettervorhersage als KI-Bild anzeigen lassen
- Video: Der Sprachassistent in Aktion
Material
- Raspberry Pi 4 mit Gehäuse
- MicroSD-Karte 32 GB
- 10,1-Zoll-Mini-Monitor mit HDMI-Eingang und Lautsprecher; meiner ist von Aishichen
- HDMI-Kabel mit Microstecker fĂĽr den Raspberry Pi 4
- 12-V-Netzteil und/oder 11,1-V-LiPo Akku samt Anschlusskabel mit XT60-Buchse
- 12-V-DC-DC Step-down-Converter mit USB-C Ausgang fĂĽr den Raspberry Pi
- DC-Y-Kabel zum parallelen Verbinden des Monitors und des Step-Down Converters
- USB-Mikrofon mit Schwanenhals; meines ist von Supvox
Ich betreibe meinen Sprachassistenten auf einem Mini-HDMI-Monitor mit Lautsprecher; der Raspberry sitzt hinten auf dem Bildschirm und ein USB-Mikro mit Schwanenhals ragt nach oben heraus. Betrieben wird alles zusammen durch ein 12-Volt-Netzteil. Alternativ ist auch ein Akkubetrieb möglich, unterwegs muss dann das mitgeführte Smartphone per Hotspot für die nötige Internetverbindung sorgen.
Das war die Leseprobe unseres heise-Plus-Artikels "Raspberry Pi-Projekt: KI-Sprachassistent mit eigenem sprechenden Avatar bauen". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.