RSS-Feed abonnieren

Passwort vergessen?

v Anmelden

25. Mai 2022

Spracherkennung in Opencast

Verfasst von

Seit dem 25. Mai 2022 wird bei über Stud.IP und Opencast Studio hochgeladenen Videos und Podcasts eine automatische Umwandlung der gesprochenen Sprache in deutschen Text versucht (Spracherkennung). Erkannte Worte werden als standardmäßig geschlossene Untertitel im Videoplayer bereit gestellt und können durch Studierende aktiviert und durch Lehrende in Stud.IP herunter geladen werden.

Die Spracherkennung wird nach allen anderen Verarbeitungsschritten durchgeführt. Die Untertitel stehen daher erst einige Minuten nach dem Erscheinen des Videos zur Verfügung und aktuell noch nicht für Hörsaalaufzeichnungen oder vorhandene Aufzeichnungen.

Wie gut funktioniert die automatische Erkennung?

Wir haben Fehlerraten von 10 bis 40% erhalten, je nachdem wie deutlich gesprochen wurde und wie viele Fremdworte verwendet wurden. Wir halten die Untertitel dennoch für eine Hilfe und einen wichtigen ersten Schritt in Richtung Barrierefreiheit. Nicht zuletzt hat YouTube Standards für Erwartungen gesetzt. Beachten Sie bitte, dass die automatische Erzeugung teils fehlerhaft sein wird. Verlassen Sie sich nicht ausschließlich auf die automatisch erzeugten Untertitel. Fragen Sie bei Verstehensproblemen bei Ihren Lehrenden nach, insbesondere bei Belehrungen, z.B. zu Laborpraktika! Für die automatisch erstellten Untertitel übernehmen wir – wie YouTube auch – keine Haftung! Bei unangemessener Sprache wenden Sie sich gern an opencast@elearning.uni-halle.de.

Warum werden die Untertitel nicht manuell erstellt?

Das wäre mit den aktuell vorhandenen Werkzeugen zu aufwändig und unglaublich teuer. Ein Mensch braucht etwa 1,5 bis 10-mal die Videospiellänge, um Untertitel manuell zu erstellen. Es wird jedoch bald die Möglichkeit geben, die automatisch erstellten Untertitel mit Hilfe eines Web-Werkzeuges zu korrigieren.

Wie kann ich die Untertitel nutzen?

Im Paella-Player können Untertitel über den Knopf Untertitel Icon im Paella-Player aktiviert werden. Nach Auswahl einer Sprache können Untertitel durchsucht werden und durch Anklicken des entsprechenden Segments direkt zu dieser Stelle im Video gesprungen werden. Ein erneuter Klick auf den Knopf für die Untertitel Untertitel Icon im Paella-Player schließt das Suchmenü und das Video kann mit den gewählten Untertiteln angesehen werden. Zum Deaktivieren der Untertitel, wählen Sie bitte „None“ in der Sprachauswahl.

Warum gibt es mehrere Untertitel in einer Sprache?

Falls ein Video aus Präsentations (Slides)- und Präsentator (Kamera)-Video besteht, werden für die Tonspuren beider Videos Untertitel erzeugt. Wurden beim Hochladen Untertitel angefügt, kommen diese hinzu.

Funktioniert auch die Erkennung anderer Sprachen als Deutsch?

Auch die Erkennung englischer Sprache steht auf der Agenda. Zunächst wollen wir herausfinden, ob uns eine automatische Erkennung der Sprache (Englisch/Deutsch/Französisch/…) gelingt und dann je nach Bedarf weitere Sprachen anbieten.

Warum sind die Untertitel in Kleinschreibung?

Bisher haben wir ein Modell im Einsatz, das den Text erkennt und daraus Worte formt. Groß- und Kleinschreibung, sowie Interpunktion sind aber auch schon auf unserer Agenda.

Was ist mit der Rechtsgrundlage und dem Datenschutz?

Datenschutz ist uns wichtig. Die Spracherkennung findet vollständig auf Servern des ITZ der MLU Halle-Wittenberg statt. Dazu werden Modelle von alphacephei/VOSK (offline open source speech recognition toolkit) eingesetzt. Die Spracherkennung erfolgt aus berechtigtem Interesse zur Verbesserung der Barrierefreiheit (§ 16a BGG LSA) und ist daher auch nicht optional.

Nutzen von Untertiteln

  • Untertitel ermöglichen es Studierenden, sich die Videos an Orten mit lauten Umgebungsgeräuschen (z.B. im Zug) anzuschauen.
  • Bei der Arbeit in Bibliotheken ohne Kopfhörer können sich die Inhalte der Videos mit Untertiteln dennoch angeeignet werden.
  • Wenn Deutsch nicht die eigene Muttersprache ist, kann es für Studierende hilfreich sein, die Inhalte nicht nur akustisch, sondern zusätzlich visuell zu erfassen.
  • Bei einer Beeinträchtigung des Hörvermögens sind Untertitel ein essentieller Bestandteil, um die Inhalte des Videos erfassen zu können.
  • Die Untertitel sind durchsuchbar und die Stellen im Video können direkt angesprungen werden. So können bestimmte Sachverhalte in längeren Videos gezielt gesucht und noch einmal verinnerlicht werden.

Über Felix Pahlow

  • Felix ist seit dem 1. April 2020 am ITZ im Bereich E-Learning (Teilzeit 50vH) tätig.

Kommentieren


Seiten

Letzte Kommentare