Mozilla Common Voice

Mozilla Robot Greetings from the Common Voice Project

Moin, moin,

heute möchte ich Euch auf das Common Voice Projekt der Mozilla Stiftung hinweisen.

Die Common Voice Initiative liefert die Grundlage für das Deep Speech Projekt der Stiftung, bei dem es um Spracherkennung geht. Eine Technologie, die immer wichtiger wird und bereits in viele Bereiche des täglichen Lebens Einzug gehalten hat. Modelle zur Spracherkennung zu programmieren ist sehr teuer und mit hohem Aufwand verbunden. Daher mag es sein, dass ernstzunehmende Lösungen bisher nur durch grosse Konzerne bereitgestellt und genutzt werden. Dem möchte Mozilla eine öffentliche Initiative entgegensetzen, einerseits Spracherkennungsmodelle der Öffentlichkeit zugänglich macht, etwa Entwicklern auf diesem Gebiet. Dies geschieht im Deep Speech Projekt. Das Projekt wird begleitet durch das Common Voice Projekt, das die Grundlage für das vorgenannte Projekt schafft. Mit Common Voice werden Sprachdateien in verschiedenen Sprachen generiert und ebenfalls der Öffentlichkeit unter der gemeinfreien CCO Lizenz zugänglich gemacht.

Mozilla erstellt diese Sprachdatenbank aber nicht selbständig, sondern lädt Freiwillige ein, daran mitzuwirken. Nutzer können vorgeschlagene Beispielsätze nachsprechen oder bereits aufgenommene Sprachdateien auf ihre Aussprache hin überprüfen. Das geht alles ganz einfach und macht Spass. Das Projekt kann entweder über die Website oder eine IOS-App angesteuert werden. Für die deutsche Sprache gibt es bislang 997 Sprecher, die 65 Stunden an Sprachaufnahmen beigesteuert haben.

Also nicht lange warten. Beginnt heute mit Eurem Beitrag zur Erstellung einer frei verfügbaren Sprachdatenbank. Ach ja. Bereits heute könnt Ihr schon den Sprachdatensatz herunterladen. Aber Vorsicht. Derzeit kommt er mit einer Größe von 12 GB durch die Leitung. Also vorher noch einmal die Downloadraten prüfen.

Viel Spass mit dem Projekt.

Euer omongkosong