Kategorien
Allgemeines Blabla

Piper TTS – Thorsten 🔥high🔥 Modell (bald) verfügbar

Das Training ist abgeschlossen und das „Paket“ gepackt ✅.

Jetzt geht es nur noch um die Veröffentlichung und dann kann meine Stimme nicht nur in der Qualität „low“ (mega schnell), „medium“ (ziemlich schnell), sondern auch in „high„, also hoher Qualität erzeugt werden 🎉.

Wie bisher auch kann die Stimme dann auch in der Smarthome / Home Automation Software „Home Assistant“ verwendet werden.

Auf einem Raspberry Pi 3 (nicht optimal dafür geeignet, der 4er ist wohl deutlich schneller), liegt der RTF Wert bei ca. 6,5. Auf meinem 5 Jahre alten Desktop PC mit Ubuntu liegt er (CPU basiert) bei ca. 0,4.

🔊 Und so klingt das ganze dann.

Wenn alles gut klappt, dann wird das Modell die nächsten Tage öffentlich sein. Viel Spaß dann damit 😊.

Feedback dazu gerne per Twitter (ja, ja ich weiß) unter @ThorstenVoice oder als Kommentar auf meinem Youtube Kanal.

Kategorien
Allgemeines Blabla

Speaker auf der FrOSCon

Ich durfte auf der großen deutschen Open Source Konferenz (FrOSCon) am 06.08.2023 als Speaker auftreten 🤩.

Dort präsentierte ich meinen Vortrag „Qualitative und freie Sprachsynthese – darf’s ein bisschen weniger Cloud sein.

Natürlich konnte ich dort auch meine Thorsten-Voice Stimme mit den „großen Stimmen“ der US Technologiekonzerne wie Google vergleichen 😉.

Es war mir eine große Freude und Ehre dort auf ganz viele tolle Menschen treffen zu dürfen, welche den Mehrwert von freier Open-Source Software und Zusammenarbeit erkannt haben.

Kategorien
Allgemeines Blabla

t3n Magazin & Podcast zu „Thorsten-Voice“

Eine ganz besondere Ehre fand ich die Kontaktaufnahme vom t3n Magazin (gehört zur Heise Gruppe). Nach einem sehr angenehmen Interview wurde das „Thorsten-Voice“ Projekt an zwei Stellen im Verlag verwendet 🥰.

  1. Im gedruckten Magazin vom 28.05.2023 unter der Überschrift „Hör mal, wer da spricht.
  2. Im t3n Catchup Podcast „Lebensverlängernde Maßnahmen im All„. Hier wurde meine künstliche TTS-Stimme im Podcast verwendet.
Kategorien
Allgemeines Blabla

Video Tutorials wie Du Thorsten-Voice einrichten kannst

Auf meinem „Thorsten-Voice“ Youtube Kanal gibt es jetzt Schritt-für-Schritt Anleitungen, wie Du meine freie, künstliche, Text-to-Speech Stimme in verschiedenen Betriebssystemen und Anwendungen verwenden kannst 🥳.

Microsoft Windows

Linux

Apple Mac OS X

Raspberry Pi

Nutzung in Home Assistant

Kategorien
Allgemeines Blabla

Thorsten-Voice @ Webmontag Frankfurt

Ich durfte als Sprecher oder neudeutsch „Speaker“ beim 109ten Webmontag in Frankfurt am 08.05.2023 auftreten. Den Auftritt gibt’s zum Nachschauen auf Youtube.

Dort sprach ich über die Vorteile von freien, Open-Source künstlichen TTS-Stimmen und stelle Motivation und Ziele meines „Thorsten-Voice“ Projektes vor.

❤️ Dank an die Organisatoren vom Webmontag Frankfurt 😊.

Kategorien
Allgemeines Blabla

Emotionen mit Thorsten-Voice?!

Ja, es stimmt! Thorsten-Voice kann auch emotional betonen. Möglich ist das Dank Mimic 3. Die folgenden Beispiele zeigen wie es klingt und das verlinkte Video zeigt Dir, wie du es bei Dir auf deinem Computer einrichten kannst.

Viel Vergnügen.

😀: Ich kann auch gut gelaunt und fröhlich klingen.
😡: Ist eine wütende Stimme gewollt, so kann ich auch laut sein.
🤢: Manche Kinder widert Brokkoli ziemlich an.
🥴: Die Thorsten Stimme kann auch angetrunken sprechen.
🥱: Kurz vor dem zu Bett gehen, klingt die Stimme müde.
😴: Gerade Nachts ist eine flüsternde Stimme empfehlenswert.
Kategorien
Allgemeines Blabla

🗣️ Thorsten-Voice @ Huggingface

Auch wenn ich einige Audiobeispiele meiner künstlichen Stimme hier veröffentlicht habe, möchte man „meine“ Stimme vielleicht mit eigenen Texten ausprobieren.

Daher habe ich einen Huggingspace Bereich dafür eingerichtet. Also mit eigenen Texten im Browser direkt jetzt ausprobieren.

https://huggingface.co/spaces/Thorsten-Voice/demo

Kategorien
Allgemeines Blabla

ThorstenVoice-Dataset-2022.10 veröffentlicht 🎉

Das neue ThorstenVoice Dataset ist jetzt für den freien Download verfügbar 🥳. Genau, wie die vorherigen Datensätze ist auch dieses unter der CC0 Lizenz verfügbar, damit es von jedem frei verwendet werden kann.

Wenn Du das Dataset verwendest, dann bitte nutze die folgende DOI um es zu zitieren – Vielen Dank 😊.
DOI: 10.5281/zenodo.7265581

@dataset{muller_thorsten_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {ThorstenVoice Dataset 2022.10},
  month        = oct,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}
Kategorien
Allgemeines Blabla

Neuer Thorsten-Voice Sprachdatensatz (bald)

Die bereits verfügbaren „Thorsten“ Tacotron2 DDC und VITS TTS-Modelle basieren auf meinem offenen und kostenfreien Sprachdatensatz, welcher in wenigen Tagen veröffentlicht wird. Der Datensatz trägt den kreativen Namen „Thorsten-22.10„.

Hier einige Beispiele von Originalaufnahmen aus dem Sprachdatensatz:

Beispiel Originalaufnahme aus Sprachdatensatz 01
Beispiel Originalaufnahme aus Sprachdatensatz 02
Beispiel Originalaufnahme aus Sprachdatensatz 03
Beispiel Originalaufnahme aus Sprachdatensatz 04
Beispiel Originalaufnahme aus Sprachdatensatz 05

Einige Angaben zum Sprachdatensatz „Thorsten-22.10“:

Anzahl Aufnahmen12.432
Audiodauer11+ Stunden
Samplerate22.050Hz
KanäleMono
Normalisierung-24dB
Sprechgeschwindigkeit
(Durchschnitt)
17,5 Zeichen / Sekunde

Hier einige Beispiele einer darauf trainierten künstlichen Stimme:

Thorsten – künstliche TTS Version Beispiel 1
Thorsten – künstliche TTS Version Beispiel 1
Thorsten – künstliche TTS Version Beispiel 3

Ja, ja – schön und gut, aber wo kann ich es runterladen?

Noch einen Augenblick Gedult. Der Datensatz wird die nächsten Tage veröffentlicht und der Link hier, auf meinem Twitter Account (@ThorstenVoice) und auf meinem Youtube Kanal bekanntgegeben.

Kategorien
Allgemeines Blabla

Neues „Thorsten“ TTS Modell verfügbar 🥳

Ihr habt abgestimmt und euch für „Variante 2“ entschieden. Das neue Modell ist seit heute per Coqui 🐸 TTS Version 0.8.0 direkt einsetzbar. Danke für eure Rückmeldungen und eure Unterstützung auf dem Weg zu diesem neuen Modell 😊.

Großer Dank gilt natürlich auch meinem mehrjährigen TTS-Weggefährten Dominik und allen weiteren TTS Enthusiasten 👏.

pip install TTS==0.8.0
tts-server --model_name tts_models/de/thorsten/tacotron2-DDC
http://localhost:5002
This is default text for notification bar