6. Dez 2023
Neues von der Spracherkennung
Nachdem bereits seit dem 25. Mai 2022 über Stud.IP und Opencast Studio hochgeladene Videos sowie Podcasts eine automatische Umwandlung der gesprochenen Sprache in deutschen Text erhalten, bekommen bald alle neuen Videos Untertitel.
Die maschinelle Erstellung der Untertitlung läuft asynchron nach regulärer Verarbeitung der Videos ab. Wann die fertigen Untertitel erscheinen, hängt von der Systemlast ab. Es sind Zeiträume von einigen Stunden bis hin zu wenigen Tagen möglich.
Erkannte Worte werden als standardmäßig geschlossene Untertitel im Videoplayer bereit gestellt und können durch Studierende aktiviert und durch Lehrende in Stud.IP herunter geladen werden.
Wie gut funktioniert die neue automatische Erkennung?
Untertitel sind ein wichtiger Schritt in Richtung Barrierefreiheit. Nicht zuletzt hat YouTube Standards gesetzt.
Beachten Sie bitte, dass die automatische Erzeugung von Untertiteln teils fehlerhaft sein wird. Wir haben Fehlerraten von 4 bis 15% erhalten. Verlassen Sie sich nicht ausschließlich auf die automatisch erzeugten Untertitel. Fragen Sie bei Verstehensproblemen bei Ihren Lehrenden nach, insbesondere bei Belehrungen, z.B. zu Laborpraktika! Für die automatisch erstellten Untertitel übernehmen wir – wie YouTube auch – keine Haftung! Bei unangemessener Sprache wenden Sie sich gern an opencast@elearning.uni-halle.de.
Warum werden die Untertitel nicht manuell erstellt?
Das wäre mit den aktuell vorhandenen Werkzeugen zu aufwändig und unglaublich teuer. Ein Mensch braucht etwa 1,5 bis 10-mal die Videospiellänge, um Untertitel manuell zu erstellen. Es wird jedoch bald die Möglichkeit geben, die automatisch erstellten Untertitel mit Hilfe eines Web-Werkzeuges zu korrigieren.
Wie kann ich die Untertitel nutzen?
Im Paella-Player können Untertitel über den Knopf aktiviert und nach Auswahl einer Sprache Untertitel durchsucht werden. Durch Anklicken des entsprechenden Segments kann direkt zu dieser Stelle im Video gesprungen werden. Ein erneuter Klick auf den Knopf für die Untertitel schließt das Suchmenü. Das Video kann mit den gewählten Untertiteln angesehen werden. Zum Deaktivieren der Untertitel, wählen Sie bitte „None“ in der Sprachauswahl.
Funktioniert die Erkennung anderer Sprachen als Deutsch?
Ja, besonders gut funktioniert die Erkennung mit Spanisch, Italienisch Englisch und Portugiesisch. Allerdings werden die Untertitel im Player immer als „Deutsch“ angeboten.
Wird Groß- und Kleinschreibung berücksichtigt?
Ja, die neuen Untertitel erkennen Sie daran, dass Groß- und Kleinschreibung und Interpunktionen berücksichtigt werden.
Was ist mit der Rechtsgrundlage und dem Datenschutz?
Datenschutz ist uns wichtig. Die Spracherkennung findet vollständig auf Servern des ITZ der MLU Halle-Wittenberg statt. Dazu werden Modelle von alphacephei/VOSK (offline open source speech recognition toolkit) und OpenAI Whisper eingesetzt. Es werden keine Inhalte an die Hersteller der Modelle zurück gegeben. Die Untertitelung erfolgt aus berechtigtem Interesse (Art. 6 Abs. 1 Bst. f DSGVO) zur Verbesserung der Barrierefreiheit (§ 16a BGG LSA) und ist daher auch nicht optional.
Nutzen von Untertiteln
- Bei einer Beeinträchtigung des Hörvermögens sind Untertitel ein essentieller Bestandteil, um die Inhalte des Videos erfassen zu können.
- Wenn Deutsch nicht die eigene Muttersprache ist, kann es für Studierende hilfreich sein, die Inhalte nicht nur akustisch, sondern zusätzlich visuell zu erfassen.
- Untertitel ermöglichen es Studierenden, sich die Videos an Orten mit lauten Umgebungsgeräuschen (z.B. im Zug) anzuschauen.
- Die Untertitel sind durchsuchbar und die Stellen im Video können direkt angesprungen werden. So können bestimmte Sachverhalte in längeren Videos gezielt gesucht und noch einmal verinnerlicht werden.
- Bei der Arbeit in Bibliotheken ohne Kopfhörer können die Inhalte der Videos mit Untertiteln dennoch erfasst werden.
Welche Einschränkungen gibt es?
- Insbesondere bei Stille kann es zu Halluzinationen, also Transkripten, die nicht auf gesprochenem Text basieren, kommen.
- Als Sprache der Untertitel wird stets „Deutsch“ angegeben, auch wenn in einer anderen Sprache gesprochen wurde.
- Zunächst erscheinen ggf. schlechtere Untertitel, wenn es sich um ein über Stud.IP und Opencast Studio hochgeladenes Video handelt.
- Bis die Untertitel zur Verfügung stehen, dauert es Stunden bis hin zu Tagen.
- Die Untertitel werden aktuell noch auf das gesamte Video erzeugt und Schnittmarken werden dabei nicht berücksichtigt. Das Beheben dieser technischen Einschränkung hat für uns höchste Priorität.
Können Lehrende Untertitel löschen?
Ja, das ist möglich.