MOOC breiter verfügbar machen
Offene Massen-Online-Kurse (Massive Οpen Online Courses, MOOC) erfreuen sich immer größerer Beliebtheit. Tatsächlich bieten heute schätzungsweise 200 Universitäten auf der ganzen Welt insgesamt mehr als 1 200 MOOC an. Diese Kurse werden von mehr als 1 300 Lehrern unterrichtet und von rund zehn Millionen Nutzern besucht. Trotz dieser Popularität wird die Verbreitung von MOOC durch Sprachbarrieren stark eingeschränkt, da die überwiegende Mehrheit der Kurse auf Englisch stattfindet. Obwohl die Notwendigkeit, MOOC-Inhalte zu übersetzen, von den meisten Kursanbietern erkannt wurde, waren die bisher zur Verfügung gestellten Lösungen allesamt fragmentarisch, abhängig von menschlichen Übersetzern und mussten zudem offline umgesetzt werden. Um dieses Hindernis zu überwinden, entwickelte das EU-finanzierte TRAMOOC-Projekt eine qualitativ hochwertige Plattform für die maschinelle Übersetzung (MÜ) von verschiedenen MOOC-Inhalten, darunter Aufgaben, Tests, Präsentationen, Vorlesungsuntertitel und Forumsdiskussionen. Das Ergebnis ist der erste freie und offene Übersetzungsdienst, der neuronale maschinelle Übersetzungsmodelle (Neural Machine Translation, NMT) für Bildungsinhalte verwendet. Das TRAMOOC-System bietet genaue und kohärente Übersetzungen dieser Inhalte aus dem Englischen in elf europäische und BRIC-Sprachen (BG, CS, DE, EL, HR, IT, NL, PL, PT, RU, ZH), die früheren MÜ-Lösungen enorme Schwierigkeiten bereiteten. „Obwohl die vorhandenen maschinellen Übersetzungsdienste tendenziell universell sind, können sie, wenn sie an eine bestimmte Domäne wie MOOC angepasst werden, eine signifikante Verbesserung der MÜ-Leistung für diese Domäne erzielen“, so Projektkoordinatorin Dr. Valia Kordoni. „Genau an diesem Punkt setzt das EU-finanzierte TRAMOOC-Projekt an, indem es einen qualitativ hochwertigen maschinellen Übersetzungsdienst bereitstellt, der speziell auf die Domäne MOOC zugeschnitten ist.“ Ein multifunktionales Open-Source-System Die Open-Source-TRAMOOC-Plattform bedient sich einer modernen neuronalen Übersetzungsarchitektur sowie innovativer Verfahren zur Domänenanpassung. Diese Kombination von Technologien erhöht deutlich die Kohärenz und Genauigkeit der Übersetzungsergebnisse. Auf diese Weise können wesentliche Verbesserungen gegenüber herkömmlichen phrasenbasierten statistischen Maschinenübersetzungssystemen (Phrase-based Statistical Machine Translation, PBSMT) erreicht werden. Die Verwendung von sowohl synchronen als auch asynchronen Übersetzungsmodi ermöglicht es TRAMOOC eine breite Palette von Dateiformaten zu übersetzen, einschließlich HTML-Dateien, Untertiteln und Microsoft Office-Dokumenten. Darüber hinaus wird das übersetzte Material in demselben Dateiformat ausgegeben, in dem es ursprünglich empfangen wurde. „Da es sich hierbei um ein Open-Source-System handelt, kann jede beliebige MÜ-Lösung für jede Sprache problemlos in die Plattform integriert werden“, fügt Dr. Kordoni hinzu. Zusätzlich zur TRAMOOC-Plattform stellten die Projektforscher ein innovatives Bewertungsschema für Übersetzungen vor, das bereits vorhandene linguistische Tools und Ressourcen verbessern soll. „Dank dieser Funktion können die Forscher die fortschrittlichen Tools und Lösungen, die im Laufe des Projekts entwickelt wurden, mit geeigneten Lizenzmodellen sowie Softwarepaketen für die Entwicklung modernster Systeme zur Übersetzung von Bildungstexten testen“, erklärt Dr. Kordoni. „Zusammen bilden die Lernprozesse des Übersetzungsmodells, die Bootstrap-Verfahren und die Text-Mining-Methoden eine Bibliothek von Algorithmen, die für die Wissenschaftsgemeinde von unschätzbarem Wert sein werden.“ Türen öffnen Das wichtigste Ergebnis des Projekts ist, dass es sogar noch mehr Nutzern den Zugang zu MOOC ermöglicht. „Für viele europäische Bürger und Menschen auf der ganzen Welt hat TRAMOOC die Tür zu multimedialen Bildungsinhalten geöffnet, die aufgrund von Sprachbeschränkungen bisher nicht verfügbar waren“, so Dr. Kordoni abschließend. „Jeder kann jetzt MOOC nutzen, um seine Bildung zu verbessern, seine Kompetenzen zu erweitern und seine Beschäftigungsfähigkeit zu erhöhen.“
Schlüsselbegriffe
TRAMOOC, MOOC, maschinelle Übersetzungen, Europäische Union, EU