RSS-Feed abonnieren

Passwort vergessen?

v Anmelden

6. Dez 2023

Neues von der Spracherkennung

Verfasst von

Seit dem 20. Mai 2025 werden alle Videos automatisch mit Untertiteln in deutscher Sprache versehen. Nachdem bereits seit dem 25. Mai 2022 über Stud.IP und Opencast Studio hochgeladene Videos sowie Podcasts eine automatische Umwandlung der gesprochenen Sprache in deutschen Text erhalten, bekommen nun alle neuen Videos Untertitel.

Die maschinelle Erstellung der Untertitlung läuft asynchron nach regulärer Verarbeitung der Videos ab. Wann die fertigen Untertitel erscheinen, hängt von der Systemlast ab. Es sind Zeiträume von einigen Stunden bis hin zu wenigen Tagen möglich.

Erkannte Worte werden als standardmäßig geschlossene Untertitel im Videoplayer bereit gestellt und können durch Studierende aktiviert und durch Lehrende in Stud.IP herunter geladen werden.

Wie gut funktioniert die neue automatische Erkennung?

Untertitel sind ein wichtiger Schritt in Richtung Barrierefreiheit. Nicht zuletzt hat YouTube Standards gesetzt.

Beachten Sie bitte, dass die automatische Erzeugung von Untertiteln teils fehlerhaft sein wird. Wir haben Fehlerraten von 4 bis 15% erhalten. Verlassen Sie sich nicht ausschließlich auf die automatisch erzeugten Untertitel. Fragen Sie bei Verstehensproblemen bei Ihren Lehrenden nach, insbesondere bei Belehrungen, z.B. zu Laborpraktika! Für die automatisch erstellten Untertitel übernehmen wir – wie YouTube auch – keine Haftung! Bei unangemessener Sprache wenden Sie sich gern an opencast@elearning.uni-halle.de.

Wann erfolgt das Erstellen der Untertitel?

Etwa zwei Tage nach Veröffentlichung des Videos wird der Versuch unternommen, automatisch Untertitel in hoher Qualität zu erstellen. So haben Lehrende noch Zeit das Video zu schneiden, bevor es mit Untertiteln versehen wird. Für Videos, die per Opencast Studio oder Stud.IP hochgeladen wurden, werden aktuell sofort Untertitel in schlechterer Qualität erzeugt.

Warum werden die Untertitel nicht manuell erstellt?

Das wäre mit den aktuell vorhandenen Werkzeugen zu aufwändig und unglaublich teuer. Ein Mensch braucht etwa 1,5 bis 10-mal die Videospiellänge, um Untertitel manuell zu erstellen. Es wird jedoch bald die Möglichkeit geben, die automatisch erstellten Untertitel mit Hilfe eines Web-Werkzeuges zu korrigieren.

Wie kann ich die Untertitel nutzen?

Im Paella-Player können Untertitel über den Knopf Untertitel Icon im Paella-Player aktiviert und nach Auswahl einer Sprache durchsucht werden. Durch Anklicken des entsprechenden Segments kann direkt zu dieser Stelle im Video gesprungen werden. Ein erneuter Klick auf den Knopf für die Untertitel Untertitel Icon im Paella-Player schließt das Suchmenü. Das Video kann mit den gewählten Untertiteln angesehen werden. Zum Deaktivieren der Untertitel, wählen Sie bitte „None“ in der Sprachauswahl.

Funktioniert die Erkennung anderer Sprachen als Deutsch?

Ja, besonders gut funktioniert die Erkennung mit Spanisch, Italienisch Englisch und Portugiesisch. Aktuell besteht leider die Einschränkung, dass häufig eine unzutreffende Sprache erkannt wird, wenn in den ersten 30 Sekunden nicht gesprochen wird.

Wird Groß- und Kleinschreibung berücksichtigt?

Ja, die neuen Untertitel erkennen Sie daran, dass Groß- und Kleinschreibung und Interpunktionen berücksichtigt werden.

Was ist mit der Rechtsgrundlage und dem Datenschutz?

Datenschutz ist uns wichtig. Die Spracherkennung findet vollständig auf Servern des ITZ der MLU Halle-Wittenberg statt. Dazu werden Modelle von alphacephei/VOSK (offline open source speech recognition toolkit) und OpenAI Whisper eingesetzt. Es werden keine Inhalte an die Hersteller der Modelle zurück gegeben. Die Untertitelung erfolgt aus berechtigtem Interesse (Art. 6 Abs. 1 Bst. f DSGVO) zur Verbesserung der Barrierefreiheit (§ 16a BGG LSA) und ist daher auch nicht optional.

Nutzen von Untertiteln

  • Bei einer Beeinträchtigung des Hörvermögens sind Untertitel ein essentieller Bestandteil, um die Inhalte des Videos erfassen zu können.
  • Wenn Deutsch nicht die eigene Muttersprache ist, kann es für Studierende hilfreich sein, die Inhalte nicht nur akustisch, sondern zusätzlich visuell zu erfassen.
  • Untertitel ermöglichen es Studierenden, sich die Videos an Orten mit lauten Umgebungsgeräuschen (z.B. im Zug) anzuschauen.
  • Die Untertitel sind durchsuchbar und die Stellen im Video können direkt angesprungen werden. So können bestimmte Sachverhalte in längeren Videos gezielt gesucht und noch einmal verinnerlicht werden.
  • Bei der Arbeit in Bibliotheken ohne Kopfhörer können die Inhalte der Videos mit Untertiteln dennoch erfasst werden.

Welche Einschränkungen gibt es?

  • Insbesondere bei Stille kann es zu Halluzinationen, also Transkripten, die nicht auf gesprochenem Text basieren, kommen.
  • Nach längeren Stillepausen dauert es eine Weile, bis Sprache wieder korrekt erkannt wird. Ggf. wird für längere Zeit ins Englische übersetzt.
  • Die ermittelte Sprache der Untertitel könnte falsch angegeben sein. Dies geschieht insbesondere, wenn in den ersten 30 Sekunden keine erkennbare Sprache im Video ist.
  • Zunächst erscheinen ggf. schlechtere Untertitel, wenn es sich um ein über Stud.IP und Opencast Studio hochgeladenes Video handelt.
  • Bis die Untertitel zur Verfügung stehen, dauert es etwa zwei Tage.
  • Wird das Video nach dem automatischen Untertiteln erneut geschnitten, werden die Untertitel ggf. gelöscht. Wir bemühen uns, als zukünftige Entwicklung, die Untertitel nach dem Schneiden erneut bereit stellen zu können.

Was können Lehrende tun, um bessere Untertitel zu erhalten?

Ein für unser Sprache-zu-Text-System ideales Video hat keine Sprechpausen, die länger als 30 Sekunden andauern. Ansonsten kommt es zu Halluzinationen und unerwünschten Sprachwechseln.

Hörsaalvorlesungen können nach deren automatischer Bereitstellung im Stud.IP über den Opencast Editor geschnitten werden. Dieses Schneiden kann durch Lehrende selbst oder Tutor*Innen in den Stud.IP Lehrveranstaltungen vorgenommen werden. So können insbesondere Abschnitte zu Beginn und am Ende der Vorlesung sehr einfach entfernt werden.

Wir helfen Ihnen gern. Sprechen Sie uns an:
opencast@elearning.uni-halle.de

Können Lehrende Untertitel löschen?

Ja, das ist möglich.

Bildschirmfoto: Ein Video im Reiter Opencast aus Sicht eines Lehrenden im Stud.IP. Hervorgehoben der Knopf "Untertitel löschen"
Der Knopf „Untertitel löschen“ wird unabhängig davon angezeigt, ob tatsächlich Untertitel für ein Video vorhanden sind und beauftragt die Löschung automatisch erstellter Untertitel im Opencast

Über Jan Mertens

Kommentieren


Letzte Kommentare