23. Juni 2025
Verbesserte Spracherkennung und Untertitelung bei Videos
Im Jahr 2022 wurde an der MLU damit begonnen, automatisch erzeugte Untertitel in deutscher Sprache zu Opencast-Videos und -Podcasts hinzuzufügen, die über Stud.IP und Opencast Studio hochgeladen wurden. 2023 wurde kurzzeitig ein Versuch mit einem deutlich aufwändigeren und präziserem Modell unternommen. Nach Abschluss einiger Nachbesserungen, erfolgt in Kürze ein weiterer Anlauf.
Das Erzeugen der Untertitel läuft asynchron nach regulärer Verarbeitung der Videos ab. Die fertigen, besseren Untertitel erscheinen im Regelfall zwischen zwei und drei Tagen nach Veröffentlichung des Videos.
Erkannte Worte werden als standardmäßig geschlossene Untertitel im Videoplayer bereitgestellt und können durch Studierende aktiviert und durch Lehrende in Stud.IP heruntergeladen werden.
Wie nutze ich die Untertitel?
Im Opencast Paella-Player können die Untertitel über das Sprechblasen-Symbol aktiviert und nach Auswahl einer Sprache auch durchsucht werden. Durch Anklicken des entsprechenden Textsegments kann direkt zur Stelle im Video gesprungen werden. Ein erneuter Klick auf das Sprechblasen-Symbol schließt das Suchmenü. Das Video kann dann mit den gewählten Untertiteln angesehen werden. Zum Deaktivieren der Untertitel wählen Sie bitte „None“ in der Sprachauswahl.
Was hat sich verändert und verbessert?
Die überarbeitete Spracherkennung bietet eine verbesserte Lesbarkeit, da nun Groß- und Kleinschreibung sowie Satzzeichen berücksichtigt werden. Insgesamt hat sich die Fehlerrate bei der Erstellung der Untertitel verringert. Die folgenden Bilder zeigen die Untertitel mit alter und neuer Spracherkennung für die gleiche Vorlesungssequenz im Vergleich.
Hinweise zur Richtigkeit von Untertiteln
Trotz verbesserter Spracherkennung kann es weiterhin zur fehlerhaften Erzeugung von Untertiteln kommen. Verlassen Sie sich nicht ausschließlich auf die automatisch erzeugten Untertitel. Studierende sollten bei Fragen und Verständnisproblemen bei Lehrenden nachfragen, insbesondere bei Belehrungen, z.B. zu Laborpraktika. Für die automatisch erstellten Untertitel übernehmen wir – wie YouTube auch – keine Haftung. Bei unangemessener Sprache wenden Sie sich gern an opencast@elearning.uni-halle.de.
Mögliche auftretende Probleme:
- Insbesondere bei Stille kann es zu Halluzinationen, also Transkripten, die nicht auf gesprochenem Text basieren, kommen.
- Nach längeren Stillepausen dauert es eine Weile, bis Sprache wieder korrekt erkannt wird. Ggf. wird für längere Zeit ins Englische übersetzt.
- Die ermittelte Sprache der Untertitel könnte falsch angegeben sein. Dies geschieht insbesondere dann, wenn in den ersten 30 Sekunden keine erkennbare Sprache im Video ist.
- Ggf. erscheinen zunächst die altbekannten, schlechteren Untertitel ohne Groß- und Kleinschreibung, wenn es sich um ein über Stud.IP und Opencast Studio hochgeladenen Video handelt.
Hinweise für Lehrende
Uns ist bewusst, dass das Schneiden von Aufzeichnungen mit Zusatzaufwand verbunden ist und dass Sie sich möglicherweise unwohl oder unrichtig wiedergegeben fühlen. Dafür halten wir im Folgenden Lösungen bereit.
Wie kann ich bessere Untertitel erhalten?
Ein ideales Video hat keine Sprechpausen, die länger als 30 Sekunden andauern. Ansonsten kommt es zu Halluzinationen und unerwünschten Sprachwechseln. Hörsaalvorlesungen können nach deren automatischer Bereitstellung im Stud.IP über den Opencast Editor geschnitten werden. Dieses Schneiden kann durch Lehrende selbst oder Tutor*Innen in den Stud.IP Lehrveranstaltungen vorgenommen werden. So können insbesondere Abschnitte zu Beginn und am Ende der Vorlesung sehr einfach entfernt werden. Wir helfen Ihnen gern. Sprechen Sie uns an: opencast@elearning.uni-halle.de
Wie kann ich Untertitel löschen?
Der Knopf „Untertitel löschen“ wird unabhängig davon angezeigt, ob tatsächlich Untertitel für ein Video vorhanden sind und beauftragt die Löschung automatisch erstellter Untertitel im Opencast.

Rechtsgrundlage und Datenschutz
Datenschutz ist uns wichtig. Die Spracherkennung findet vollständig auf Servern des ITZ der MLU Halle-Wittenberg statt. Dazu werden Modelle von alphacephei/VOSK (offline open source speech recognition toolkit) und OpenAI Whisper eingesetzt. Es werden keine Inhalte an die Hersteller der Modelle zurück gegeben. Die Untertitelung erfolgt aus berechtigtem Interesse (Art. 6 Abs. 1 Bst. f DSGVO) zur Verbesserung der Barrierefreiheit (§ 16a BGG LSA) und ist daher auch nicht optional.
Untertitel unabhängig von Opencast erhalten
Falls Sie als Angestelle*r der MLU für Ihre Audio- oder Videodateien unabhängig von der Opencast-Nutzung Untertitel oder ein Transkript erzeugen lassen möchten, sprechen Sie uns bitte einfach an: opencast@elearning.uni-halle.de