Die bereits verfügbaren „Thorsten“ Tacotron2 DDC und VITS TTS-Modelle basieren auf meinem offenen und kostenfreien Sprachdatensatz, welcher in wenigen Tagen veröffentlicht wird. Der Datensatz trägt den kreativen Namen „Thorsten-22.10„.
Hier einige Beispiele von Originalaufnahmen aus dem Sprachdatensatz:
Einige Angaben zum Sprachdatensatz „Thorsten-22.10“:
| Anzahl Aufnahmen | 12.432 |
| Audiodauer | 11+ Stunden |
| Samplerate | 22.050Hz |
| Kanäle | Mono |
| Normalisierung | -24dB |
| Sprechgeschwindigkeit (Durchschnitt) | 17,5 Zeichen / Sekunde |
Hier einige Beispiele einer darauf trainierten künstlichen Stimme:
Ja, ja – schön und gut, aber wo kann ich es runterladen?
Noch einen Augenblick Gedult. Der Datensatz wird die nächsten Tage veröffentlicht und der Link hier, auf meinem Twitter Account (@ThorstenVoice) und auf meinem Youtube Kanal bekanntgegeben.
