Die erste Version meiner kostenlosen (Süd-)Hessisch babbelnden künstlichen Sprachausgabe (Text to Speech / TTS) ist verfügbar 😊.
Beispiel der künstlichen Sprachausgabe
Weitere Audio-Beispiele, Anwendungs- und Nutzungsmöglichkeiten, eine Video Anleitung zur Einrichtung und Nutzung findest Du auf der „Guude!“ Seite.
Egal ob Content-Creator mit Voice Over Sprachausgabe (Instagram, Insta Reel, Insta Story, Youtube, Shorts, …), Schulprojekt mit TTS ohne Cloud und kostenfrei, und, und, und – die hessische TTS Stimme ist für euch alle da.
Als Südhesse und Open-Source Sprachtechnologie-Enthusiast ist es mir eine besondere Freude ein neues Thorsten-Voice TTS Modell anzukündigen. Und zwar (bitte imaginären Trommelwirbel vorstellen 🥁):
(Süd) Hessisch als freie künstliche Stimme!
Un nadürlich gilt für des Modell des gleiche, was ach für mei annern Modelle gilt, also:
Kost nix
Geht uff deim lokale Kompjuter (nix mit Klaud)
Derf von jedem frei verwend wern (offene Lizenz)
Un damit de ma a Vorstellung hast, wie des ungefähr klingt, dadefür hab ich hier e Beispiel:
Guude, dieses kleine künstliche Sprachbeispiel wurde mit meiner künstlichen Thorsten-Voice Stimme erstellt. Als Südhesse ist mir natürlich eine Ehre und eine wahre Freude eine kostenlose und ohne Internet verwendbare künstliche Stimme mit südhessischem Akzent für alle Bereitzustellen. Ich hoffe, dass ich die fertige Stimme in wenigen Tagen mit einer Anleitung, wie sie benutzt werden kann, hier bereitstellen kann. Übrigens, wer mich unterstützen möchte, der sollte meinen Jutjub (Youtube) Kanal Thorsten-Voice abonnieren, damit ich meinem Ziel, die silberne Auszeichnung für 100000 Abonnenten zu bekommen, ein Stück näher komme. Dankeschön.
Texteingabe, die mit meiner künstlichen Stimme gesprochen wurde.
Quelle: Wikipedia
Ei subba, kann ich dich unnerstütze?
Die kostenlose Spende meiner Stimme ist mir eine Freude und dies mache ich aus absoluter Überzeugung. Aber ich habe einen Wunsch, bei dem ich Hilfe brauchen könnte. Ich hätte gerne den silbernen Youtube Playbutton, den man für 100.000 Abonnenten bekommt. Da fehlen mir aktuell noch ca. 97.000 Abos für 😆. Daher freue ich mich über jedes Abo meines „Thorsten-Voice“ Kanals.
Quelle Originalbild: Wikipedia
Aber davon unabhängig freue ich mich über Feedback zu meinen künstlichen Stimmen 😊.
Das Training ist abgeschlossen und das „Paket“ gepackt ✅.
Jetzt geht es nur noch um die Veröffentlichung und dann kann meine Stimme nicht nur in der Qualität „low“ (mega schnell), „medium“ (ziemlich schnell), sondern auch in „high„, also hoher Qualität erzeugt werden 🎉.
Wie bisher auch kann die Stimme dann auch in der Smarthome / Home Automation Software „Home Assistant“ verwendet werden.
Auf einem Raspberry Pi 3 (nicht optimal dafür geeignet, der 4er ist wohl deutlich schneller), liegt der RTF Wert bei ca. 6,5. Auf meinem 5 Jahre alten Desktop PC mit Ubuntu liegt er (CPU basiert) bei ca. 0,4.
🔊 Und so klingt das ganze dann.
Wenn alles gut klappt, dann wird das Modell die nächsten Tage öffentlich sein. Viel Spaß dann damit 😊.
Feedback dazu gerne per Twitter (ja, ja ich weiß) unter @ThorstenVoice oder als Kommentar auf meinem Youtube Kanal.
Auf meinem „Thorsten-Voice“ Youtube Kanal gibt es jetzt Schritt-für-Schritt Anleitungen, wie Du meine freie, künstliche, Text-to-Speech Stimme in verschiedenen Betriebssystemen und Anwendungen verwenden kannst 🥳.
Ja, es stimmt! Thorsten-Voice kann auch emotional betonen. Möglich ist das Dank Mimic 3. Die folgenden Beispiele zeigen wie es klingt und das verlinkte Video zeigt Dir, wie du es bei Dir auf deinem Computer einrichten kannst.
Viel Vergnügen.
😀: Ich kann auch gut gelaunt und fröhlich klingen.😡: Ist eine wütende Stimme gewollt, so kann ich auch laut sein.🤢: Manche Kinder widert Brokkoli ziemlich an.🥴: Die Thorsten Stimme kann auch angetrunken sprechen.🥱: Kurz vor dem zu Bett gehen, klingt die Stimme müde.😴: Gerade Nachts ist eine flüsternde Stimme empfehlenswert.
Auch wenn ich einige Audiobeispiele meiner künstlichen Stimme hier veröffentlicht habe, möchte man „meine“ Stimme vielleicht mit eigenen Texten ausprobieren.
Daher habe ich einen Huggingspace Bereich dafür eingerichtet. Also mit eigenen Texten im Browser direkt jetzt ausprobieren.
Das neue ThorstenVoice Dataset ist jetzt für den freien Download verfügbar 🥳. Genau, wie die vorherigen Datensätze ist auch dieses unter der CC0 Lizenz verfügbar, damit es von jedem frei verwendet werden kann.
Wenn Du das Dataset verwendest, dann bitte nutze die folgende DOI um es zu zitieren – Vielen Dank 😊. DOI: 10.5281/zenodo.7265581
@dataset{muller_thorsten_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {ThorstenVoice Dataset 2022.10},
month = oct,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
Die bereits verfügbaren „Thorsten“ Tacotron2 DDC und VITS TTS-Modelle basieren auf meinem offenen und kostenfreien Sprachdatensatz, welcher in wenigen Tagen veröffentlicht wird. Der Datensatz trägt den kreativen Namen „Thorsten-22.10„.
Hier einige Beispiele von Originalaufnahmen aus dem Sprachdatensatz:
Beispiel Originalaufnahme aus Sprachdatensatz 01Beispiel Originalaufnahme aus Sprachdatensatz 02Beispiel Originalaufnahme aus Sprachdatensatz 03Beispiel Originalaufnahme aus Sprachdatensatz 04Beispiel Originalaufnahme aus Sprachdatensatz 05
Einige Angaben zum Sprachdatensatz „Thorsten-22.10“:
Anzahl Aufnahmen
12.432
Audiodauer
11+ Stunden
Samplerate
22.050Hz
Kanäle
Mono
Normalisierung
-24dB
Sprechgeschwindigkeit (Durchschnitt)
17,5 Zeichen / Sekunde
Hier einige Beispiele einer darauf trainierten künstlichen Stimme:
Thorsten – künstliche TTS Version Beispiel 1Thorsten – künstliche TTS Version Beispiel 1Thorsten – künstliche TTS Version Beispiel 3
Ja, ja – schön und gut, aber wo kann ich es runterladen?
Noch einen Augenblick Gedult. Der Datensatz wird die nächsten Tage veröffentlicht und der Link hier, auf meinem Twitter Account (@ThorstenVoice) und auf meinem Youtube Kanal bekanntgegeben.
Ihr habt abgestimmt und euch für „Variante 2“ entschieden. Das neue Modell ist seit heute per Coqui 🐸 TTS Version 0.8.0 direkt einsetzbar. Danke für eure Rückmeldungen und eure Unterstützung auf dem Weg zu diesem neuen Modell 😊.
Großer Dank gilt natürlich auch meinem mehrjährigen TTS-Weggefährten Dominik und allen weiteren TTS Enthusiasten 👏.
Ich bin langsam „betriebstaub“, daher brauche ich etwas hilfe von Dir. Aktuell habe ich zwei neue TTS Modelle trainiert, aber nur einer davon wird es in die Veröffentlichung schaffen.
Daher die Frage – welche Variante gefällt besser?
Variante 1
In den alten Zeiten, wo das Wünschen noch geholfen hat, lebte ein König, dessen Töchter waren alle schön; aber die jüngste war so schön, daß die Sonne selber, die doch so vieles gesehen hat, sich verwunderte, sooft sie ihr ins Gesicht schien. (Quelle: Der Froschkönig)Heute ist Sonntag, der vierzehnte August. Die aktuelle Außentemperatur ist einfach nur sehr hoch. Am besten hilft heute ein kühles und leckeres Eis.Russland will nach britischer Einschätzung seine Truppen in der Südukraine verstärken. Frankreichs Präsident Macron hat das Ratifizierungsprotokoll für den NATO-Beitritt Finnlands und Schwedens unterzeichnet. Die Entwicklungen im Liveblog. (Quelle: Tagesschau)Das weiß ich nicht, aber ich lerne jeden Tag neue Dinge.
Variante 2
In den alten Zeiten, wo das Wünschen noch geholfen hat, lebte ein König, dessen Töchter waren alle schön; aber die jüngste war so schön, daß die Sonne selber, die doch so vieles gesehen hat, sich verwunderte, sooft sie ihr ins Gesicht schien. (Quelle: Der Froschkönig)Heute ist Sonntag, der vierzehnte August. Die aktuelle Außentemperatur ist einfach nur sehr hoch. Am besten hilft heute ein kühles und leckeres Eis.Russland will nach britischer Einschätzung seine Truppen in der Südukraine verstärken. Frankreichs Präsident Macron hat das Ratifizierungsprotokoll für den NATO-Beitritt Finnlands und Schwedens unterzeichnet. Die Entwicklungen im Liveblog. (Quelle: Tagesschau)Das weiß ich nicht, aber ich lerne jeden Tag neue Dinge.