Lokaler Sprachassistent mit Home Assistant: Fragen und Ergänzungen

Twanger · 22. Dezember 2024 um 15:35

Hi zusammen,

dies ist mein erster Beitrag. Schön, dass es diese Community gibt!
Ich hoffe zukünftig auch etwas beitragen zu können.

Für alle die sich einen lokalen Sprachassistenten bauen wollen kann ich diese Anleitung sehr empfehlen. Bei mir läuft das bisher recht gut.

Allerdings habe ich ein paar Fragen bzw. Erweiterungen die ich gerne ergänzen möchte - vielleicht habt ihr hierzu eine Idee:

Ich beginne mal mit Folgendem:
Weiß jemand, wie ich einen Aktivierungston ergänzen kann? Es soll also ein kurzer Ton abgespeilt werden nachdem man das Aktivierungswort gesagt hat.

Danke für eure Antworten!

Tuxtom007 · 23. Dezember 2024 um 09:55

Ich würde lieber direkt auf die gerade vorgestellten HA-Sprachassistenten setzen.

Die bieten dann die Möglichkeit, die Auswertungen lokale auf den HA-Server zu machen ( langsam ) oder über Nabucasa-Cloud ( schnelle Variante ).
Locale Nutzung setzt dann einen entsprechend schnellen HA-Server voraus, RapberryPi reicht da wohl kann, das für die Verzögerungen von rund 3 - 5 sec vom Sprachbefehlt bis zur Ausführung ( lt. der ersten Videos ).

Ich bin mal gespannt auf die Teile, hab mir zwei bestellt, wobei die aber erst frühestens mitte Januar kommen sollen - waren direkt nach vorstellung ausverkauft .

Twanger · 23. Dezember 2024 um 17:40

Ich werde mir auch den Sprachassistenten von Nabu Casa und auch den Satellite von FutureProofHomes kaufen.
Aber das ist ja fast schon langweilig und ich möchte gerne etwas basteln und auch weiter dazu lernen.

Wolfi · 23. Dezember 2024 um 17:53

Die HA Matter HUB/BRIDGE mit Echo oder G Home funktioniert auch schon gut obwohl die Bridge Alpha Status hat.

Gruss

Stevie · 18. April 2025 um 10:20

Hallo Zusammen,

gibt es hier etwas Neues? Hat jemand „HelloX“ aus dem o.a. Link in Betrieb und kann berichten?
Wie schlägt sich die Lösung von Nabu Casa auf einer lokalen HW (also ohne Cloud Anbindung)?

3-5 Sekunden Verzögerung sind nicht gerade toll. Welche HW braucht es wirklich, damit die Sprachsteuerung „Ratzfatz“ abläuft?

NO OFFENS: Leider hat sich @Tuxtom007 in der Passage mit dem Raspberry Pi grammatikalisch etwas verhackt, sodass die Aussage nicht ganz klar ist.

Danke im Voraus für sachdienliche Hinweise und

Greetz
Stevie

Twanger · 18. April 2025 um 11:42

@Stevie: meinst du den „Home X“ aus meinem ersten Post?

Was ist aus dem Beitrag von Tuxom007 nicht ganz klar?

Ansonsten bin ich jetzt auf den Nabu Casa Assistenten umgestiegen und bin einigermaßen zufrieden (nur die Reaktionszeit ist mir noch zu lamgsam).
Zu weiterer Hardware kann ich leider nichts berichten.

Stevie · 18. April 2025 um 11:56

@Twanger:
Zunächst Danke für die zeitnahe Antwort.
Ja, ich meine tatsächlich „Home X“ aus deinem ersten Post.

Zitat Anfang @Tuxtom007:
Locale Nutzung setzt dann einen entsprechend schnellen HA-Server voraus, RapberryPi reicht da wohl kann, das für die Verzögerungen von rund 3 - 5 sec vom Sprachbefehlt bis zur Ausführung ( lt. der ersten Videos ).
Zitat Ende:
Ich zerlege das jetzt Mal: Man braucht also einen entsprechend schnellen Rechner. Wie schnell? Braucht es zwingend einen Nvidia-Chip oder reicht da auch eine flotte Main-CPU?
Den nächsten Satz „RaspberryPi reicht da wohl kann…“ verstehe ich überhaupt nicht…und der scheint jedoch wichtig zu sein. Also reicht der Raspberry oder nicht? Wie steht das im Verhältnis zu den Verzögerungen von 3-5 Sekunden?
Schafft der Raspberry das mit Verzögerung vn 3-5 Sekunden oder gilt diese Verzögerung für einen leistungsstarken Server?

Es ist sicherlich nur ein kleines Missverständnis…aber so wie’s da steht, raff’ ich’s net!

Betreibst du den Nabu Casa Assistenten lokal oder über deren Cloud? Wie hoch sind denn die Reaktionszeiten bei deiner Lösung?

Greetz
Stevie

Tuxtom007 · 18. April 2025 um 15:13

Kannst du dir aussuchen, die Cloud ist schneller, bei lokalen Installation brauchst du eben CPU-Performance auf dem HA-Rechner, der entsprechend schnell reagieren kann.

Die Ersten Tests haben wohl ergeben, das lokale Installation ca 3-5 Sekunden Verzögerung bis zu einer Antwort / Reaktion vorhanden sind.
Der RasPi reicht dafür überhaupt nicht, weil viel zu schwach.

Stevie · 18. April 2025 um 15:51

@Tuxtom007
Aaah! Der Herr sprach: „Es werde Licht!“ …und es ward Licht!

Cloud scheidet für mich konsequent aus. …und nachdem die neue Regierung in spe die Vorratsdatenspeicherung inkl. Erschnüffeln aller Daten in öffentlichen Medien legitimiert hat, bekommt der Begriff „Datensparsamkeit“ eine völlig neue Bedeutung. Brauchen wir hier nicht zu diskutieren, ist nur meine persönliche Meinung.

Mit einem Raspberry hätte ich mich eh nicht so gut anfreunden können. Auf dem HA-Server nun alle Cores der CPU „anzutakten“, bloß damit man 5- 20 Sprachbefehle am Tag mit erträglichen Response Times verarbeiten kann, könnte bissi Overkill sein.

Mal sehen, ob man nicht irgendeine Spezial-HW, die im Leerlauf etwas um die 5-7W zieht, an den Start bringen kann.

Jedenfalls erstmal Danke für die Klarstellung.

Stevie · 18. April 2025 um 17:40

Ich antworte mir mal selber.
Ich habe gerade, relativ günstig, einen NVIDIA Jetson Orin Nano Super Dev Kit – 67 TOPS, 8 GB DDR5 geschossen. Jedenfalls war das deutlich, deutlich unter den €570,-- die sonst so aufgerufen wurden.
Ich gebe der Sache jetzt mal eine Chance.
Ja…das kostet jetzt alles Zeit und auch bissi Geld. Über Beides verfüge ich eigentlich nur begrenztl…aber ständig auf einem Dashboard 'rumfingern, finde ich irgendwie nicht optimal. Wenn ich es nicht hinbekomme, kann ich immer noch die Dashboards quälen. …aber ich werde ja auch keinesfalls dümmer davon.

Dreckfresse · 18. April 2025 um 17:55

Von welcher Version redet ihr hier eigentlich
Oder wirklich der alte richtige RapberryPi

Tuxtom007 · 19. April 2025 um 04:44

Die Rede war beim Erscheinen vom dem Sprachassistenten bis zum aktuelle Pi5.

Keine Ahnung ob die überhaupt unterstützt wird.

Nvidia bringt ja nur dann was, wenn die auch von der Software unterstützt wird und dazu werden Tools und Bibliotheken benötitg - spreche aus Erfahrung, wir machen die Spielchen in der Firme gerade auch, das wir eigene KI-Systeme bauen.

Da müsste man sich mal mehr mit dem Sprachassistenten von HA beschäftigen, ich meine Bestellung damals aber wieder storniert, mir fehlt da derzeit zum einem die Zeit für und zum anderen auch die Lust.

Stevie · 19. April 2025 um 05:55

@Tuxtom007
Hast du Thread und Kontext noch auf dem Schirm? Dieser wurde ja im Dez. letzten Jahres gestartet; da kann man schon Mal den Überblick verlieren.

Dass der Jetson grds. mit HA funktioniert wurde ja bereits vom @Twanger in seinem Eröffnungspost festgestellt. Da weiß ich also nicht, wie ich deine Aussage werten soll.

Auf welche Erfahrungswerte beziehst du dich hier? Das Geschäftsgebahren von Nvidia ist im Markt bekannt. Natürlich braucht es Bibliotheken und Tools. Das wurde ebenfalls im verlinkten Video gezeigt. Hast du dir das Video Mal angesehen?

Naja…wir sprechen ja von einer lokalen Instanz des Voice Assistant. Da wird man sich wohl ein bisschen mit diesem beschäftigen müssen. Das Thema Zeit hatte ich ja in meinem letzten Post angesprochen.

Tuxtom007 · 19. April 2025 um 08:23

Nö, wie schon geschrieben, für mich ist das Thema Sprachassistenten erledigt, ich habe auch sämtliche Alexas rausgeworfen

Stevie · 19. April 2025 um 09:22

Ok…nun weiß ich, wie ich das Alles einzuschätzen habe. Mein erster Eindruck wurde absolut bestätigt…

Tuxtom007 · 19. April 2025 um 09:34

Hier kleine Info, gerade in einem Onlineshop gesehen:

Weiterer Hinweis: Weniger leistungsstarke Home Assistant-Hardware kann zu einer langsameren Spracherkennung führen. Falls du eine weniger leistungsstarke Home Assistant-Hardware verwendest, wie Raspberry Pi 4/5, NAS-Systeme, Yellow, Green, etc., solltest du die Sprachverarbeitung in die Home Assistant Cloud auslagern.

Stevie · 19. April 2025 um 10:27

Ich habe keine „weniger leistungsstarke HA-Hardware“.

Tuxtom007 · 26. April 2025 um 07:12

Ich hab gerade einen der HA Voice-Assistenten hier, werde jetzt am WE mal damit rumspielen, warte nur noch auf Netzteile, die ich bestellt habe, da ich keine 5V/2A Netzteil mit USB-C frei habe.

Erster Installationsversuche waren, sagen wir mal wenig erfolgreich - der hat immer wieder die Verbindung zum Netz verloren und dann brach die ESPHome-Installation ab.

Stevie · 26. April 2025 um 08:57

Bin gespannt! Keep us informed, please!

Tuxtom007 · 26. April 2025 um 10:43

Naja was soll ich sagen.

Abfrage der Uhrzeit ( was banales ) - 2 bis 3 sec Verzögerung, egal ob per Cloud oder Local, bei Wetter steigt der schon aus, Licht einschalten ging garnicht.

Und die Verständlichkeit von dem Teil ist gruselig, alleine schon wenn Radio/TV im Raum läuft, versteht der schon nichts mehr, auch wenn 4m vom TV entfernt und mal sollte auch ziemlich in der Nähe sein.

Ok, das Teil ist noch PreView, aber da ist verdammt viel Luft nach oben was Performance, Verständlichkeit usw. betrifft. Ich weiss nicht, wieviel da überhaupt noch geht, weil das werkelt ja nur ein ESP32-S3 drin.
Auch die Sprachqualität ist bescheiden, für Text-Ausgaben geht es, Musik ist noch, das muss ich noch testen. Zumindest kann man externe Lautsprecher anschliessen ( aktive ), werde ich auch noch testen.
Auch scheint die deutsche Sprache noch bei weitem nicht so unterstützt zu werden, bei englich geht es besser.

Aktuell würde ich sagen: ein Amazon Echo dot ist dem Teil um Welten überlegen, ich hab noch ganz alte hier, aber die selber deutlich besser.