Kategorie: Allgemeines Blabla

Hier findest du (unregelmäßig) Neuigkeiten rund um offene Sprachtechnologien im Allgemeinen und/oder Thorsten-Voice im Speziellen 💛.

Allgemeines Blabla

Thorsten-Voice ❤️ CosyVoice3

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 29. Juni 2026

Ich habe die vergangenen Monate an einem neuen freien
Thorsten-Voice TTS Modell gearbeitet. Wie immer kostenlos, offen lizenziert und vollständig lokal nutzbar, ohne Cloud und ohne Datenweitergabe.

Nach Coqui und Piper setze ich diesmal auf CosyVoice3 als Grundlage. Es nutzt ein modernes LLM-basiertes TTS-System von FunAudioLLM, das besonders natürliche Prosodie und Sprechrhythmus erzeugt.

Hier sind einige Audiobeispiele meiner KI-Stimme:

Das Modell steht auf drei Wegen zur Verfügung:

Modell auf HuggingFace für eigene Projekte und Finetuning
HuggingFace Space direkt im Browser ausprobieren, keine Installation nötig
Docker Image auf Docker Hub ein Befehl, läuft lokal

Weitere Details zu meinem CosyVoice3 Modell und Einrichtung/Nutzung des Docker Container Image findest du auf den oben verlinkten Seiten.

Direkt im Browser ausprobieren

Viel Spaß damit! Feedback wie immer willkommen.

Allgemeines Blabla

Blog Post on Mozilla Data Collective

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 28. März 2026

Guude 👋🏼,

I’m very grateful to have had the opportunity to write a blog post for the Mozilla Data Collective.

In this post, I share my journey of contributing my personal voice („Thorsten-Voice“) as a CC0 open-source datasets including my initial motivation, doubts, and what happened afterwards.

The blog post is available in both languages:
👉 English version
👉 Deutsche Version

Allgemeines Blabla

Thorsten-Voice on Mozilla Data Collective

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 27. Februar 2026

All my Thorsten-Voice speech datasets are now also available via the Mozilla Data Collective (MDC).

This includes:

TV-2021.02-Neutral
TV-2022.10-Neutral
TV-2021.06-Emotional
TV-2023.09-Hessisch
TV-44kHz-Full (approx. 40 hours, 38,000+ recordings)

The datasets remain released under the CC0 public domain dedication and are free to use for both research and commercial applications.

Mozilla Data Collective now serves as an additional open distribution channel alongside Zenodo and Hugging Face, further increasing accessibility and long-term availability.

The goal of Thorsten-Voice remains unchanged: to provide high-quality German speech datasets as open resources for text-to-speech research, development, and innovation.

Thanks Mozilla Foundation for your nice LinkedIn post 😊.

Allgemeines Blabla

Orpheus TTS | Modellvergleich

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 15. Dezember 2025

Guude 👋. Ich habe mit Orpheus TTS eine neue Version der Thorsten-Voice trainiert. Ursprünglich dachte ich, es klingt deutlich natürlicher als die bisherigen Modelle.

Je öfter ich gehört habe, desto unsicherer bin ich mir. Ist das neue Modell „Orpheus“ wirklich ein Fortschritt zu bestehenden Modellen? Da ich natürlich hier nicht objektiv sein kann, bitte ich um eure Schwarmintelligenz, bzw. Schwarm-Ohren 👂.

„Dieser Satz wurde von der künstlichen Thorsten Voice gesprochen.“

Bitte hört euch die kurzen Beispiele an und stimmt auf LinkedIn (Link) darüber ab.

Coqui TTS Modell (existiert schon länger)

Piper TTS Modell (existiert schon länger)

Das NEUE MODELL – trainiert mit Orpheus TTS. Besser oder schlechter als bisherige Modelle?

Wie findet ihr das neue Orpheus Modell im Vergleich zu den bisherigen Modellen? Natürlichkeit? Verständlichkeit? Stimmnähe zum Original? Soll ich das Orpheus TTS Modell veröffentlichen? Umfrage und Diskussion gerne im LinkedIn Beitrag (Link zur Umfrage).

Als Orientierung ist hier einmal meine Originalstimme – sozusagen als Referenz.

Original von Thorsten Müller gesprochene Aufnahme.

Allgemeines Blabla

10,000 Subscribers on the Thorsten-Voice YouTube Channel 🎉

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 26. September 2025

Guude 👋!
It’s hard to believe: I started Thorsten-Voice and its YouTube channel as a small niche project for open-source voice tech enthusiasts.

Back then, the idea was simple. Donate my own voice and make it freely available as an open dataset for TTS (text-to-speech).
I never could have imagined that today, only a few years later, the Thorsten-Voice YouTube channel would reach 10,000 subscribers – a community of people passionate about voice technology, open source TTS models, speech synthesis and voice cloning.

Thorsten-Voice Youtube channel

On the channel, you’ll find tutorials, dataset creation guides, training experiments, and reviews of the latest AI voice models.
This milestone is only possible because of you:
your comments, your feedback, and your curiosity for free and open speech technology.

🙏 A huge THANK YOU to all 10,000 of you voice tech enthusiasts!

And the journey doesn’t stop here. New stuff is already on the way. Together, we’ll keep making voice technology open, accessible, and free for everyone. 🌍💡

Allgemeines Blabla

Thorsten-Voice im SPIEGEL

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 19. August 2025

Am 17. August 2025 erschien auf SPIEGEL Online (Netzwelt) ein Artikel über Thorsten Müller und sein Thorsten-Voice Projekt mit dem Titel:„Der Mann, der seine Stimme verschenkte“.

Der Beitrag von Annika Schultz beleuchtet die Entstehungsgeschichte des Projekts, die Motivation hinter der Stimmspende und die Bedeutung von offenen Sprachmodellen für digitale Souveränität, Barrierefreiheit und Forschung.

Der Artikel ist hier: https://www.spiegel.de/netzwelt/web/kuenstliche-intelligenz-das-steckt-hinter-der-thorsten-voice-a-1d8dd455-7548-47d8-b6bd-e6f37c7488fa?sara_ref=re-xx-cp-sh

Allgemeines Blabla

FrOSCon 2025 – Speaker Edition

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 12. Juli 2025

Ich freue mich sehr, auf der diesjährigen Jubiläumsausgabe (20 Jahre) der „Free and Open Source Software Conference“ (FrOSCon) sprechen zu dürfen.

Mein Vortrag:

Alexa ade – cloudfreie Sprachsteuerung von Home Assistant

findet am Sonntag Morgen (17.08.2025) um 10 Uhr im Hörsaal 5 der Hochschule Bonn-Rhein-Sieg statt.

https://programm.froscon.org/froscon2025/talk/f0790b15-791e-45fa-b15a-478c291d5cf4

Allgemeines Blabla

Artikel im entwickler.de Magazin #MLCon

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 13. Juni 2025

Ich freue mich riesig, mein Herzensthema in der aktuellen Ausgabe des entwickler.de / #MLCon Magazins teilen zu dürfen: freie, lokal nutzbare TTS-Sprachmodelle in Deutsch – ganz ohne Cloud-Zwang! 🚀

Als Gründer von Thorsten-Voice ist es super zu sehen, wie das Interesse an verständlicher, nachvollziehbarer und unabhängiger KI-Sprachausgabe wächst. Im Artikel zeige ich, wie ihr mit Open-Source-Tools (bspw. Piper) hochwertige TTS-Lösungen lokal betreiben könnt – ideal für Assistenzsysteme, barrierefreie Anwendungen oder das eigene Smart Home.

Ein riesiges Dankeschön an das gesamte Team von entwickler.de und besonders an Niklas Horlebein für die tolle Möglichkeit und die Unterstützung, diesen Artikel zu schreiben! 🙏

📄 Zum Artikel auf entwickler.de: https://entwickler.de/machine-learning/freie-und-lokale-ki-sprachausgabe-mit-thorsten-voice

Allgemeines Blabla

Freie KI-Stimmen für eine souveräne digitale Zukunft

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 13. April 2025

Ob Sprachassistenten, Vorlesefunktionen im Zuge der Barrierefreiheit oder Content für Social Media – immer häufiger kommen synthetische KI-Stimmen (Text-to-Speech) zum Einsatz. Doch die meisten dieser Technologien stammen von großen Konzernen aus den USA oder China. Sie sind meist proprietär, intransparent – und machen uns abhängig von Diensten, die sich jederzeit ändern, abgeschaltet oder kostenpflichtig werden können.

Das Thorsten-Voice-Projekt setzt bewusst einen anderen Akzent.

Digitale Souveränität beginnt bei der Stimme

Wer Sprachsynthese nutzt, sollte frei entscheiden können, wie und wo sie eingesetzt wird – und wem man dabei vertraut.
Thorsten-Voice bietet genau das: eine hochwertige, deutschsprachige KI-Stimme, die vollständig Open Source, uneingeschränkt nutzbar und kostenfrei verfügbar ist.
Ohne Registrierung, ohne Lizenzbindung, ohne Cloud-Zwang.

Die Stimme „Thorsten“ kann lokal genutzt, weiterentwickelt oder in eigene Projekte integriert werden – ob als Vorlesestimme, für Lernplattformen, im Bildungsbereich, in der Forschung, in der Verwaltung (gerade auch im Zuge der Verwaltungsdigitalisierung ein Thema) oder für inklusive Anwendungen.

Technologie muss nicht exklusiv, teuer oder intransparent sein.
Thorsten-Voice zeigt, dass hochwertige Sprachsynthese auch frei und offen sein kann – für alle.

Gerne hier direkt ausprobieren 😊.

Allgemeines Blabla

Thorsten-Voice in den Medien

Beitragsautor Von Thorsten Müller
Veröffentlichungsdatum 13. April 2025

Ich freue mich sehr – und bin ehrlich dankbar –, dass das
Thorsten-Voice-Projekt in den vergangenen Monaten in verschiedenen Medien aufgegriffen wurde.
Von Fachzeitschriften über Blogs bis hin zur Tagespresse: Die Resonanz zeigt, dass das Interesse an freier Sprachsynthese und digitaler Souveränität wächst – und das motiviert mich enorm, den Weg weiterzugehen.

👉 Auf der überarbeiteten Medienseite findest du jetzt eine übersichtliche Liste aller bisherigen Beiträge – inklusive Links zu Artikeln, Podcasts und Printberichten.

Ich habe die Aktualisierung auch auf LinkedIn geteilt – vielleicht magst du reinschauen oder den Beitrag weiterleiten.

Bei Interesse an Interviews, Berichten oder allgemeinen Fragen zu Thorsten-Voice freue ich mich jederzeit über eine Nachricht per Kontaktformular. Insbesondere, wenn es um digitale Souveränität im Bereich hochwertiger Sprachausgabe geht, bin ich offen für Austausch!