Skip to main content
European Commission logo
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

A Sequence Classification Framework for Human Language Technology

Article Category

Article available in the following languages:

Wie Maschinen die Sprache der Menschen interpretieren

Das Projekt SEQCLAS hat mit seiner Arbeit an der Verbesserung unseres Verständnisses, wie automatische Systeme die menschliche Sprache verarbeiten, die Grundlage dafür geschaffen, durch künstliche Intelligenz unterstützte Text- und Sprachtechnologien auf die nächste Stufe zu bringen.

Haben Sie schon einmal versucht, eine Fremdsprache fließend zu beherrschen, indem Sie Vokabellisten und Grammatikregeln auswendig lernen? Wenn ja, dann sind Sie damit höchstwahrscheinlich nicht sehr weit gekommen, denn durch Hören, Lesen und Sprechen gesammelte Erfahrungen spielen im menschlichen Lernprozess eine zentrale Rolle. Auch bei der Entwicklung von Sprachtechnologien wie zum Beispiel Spracherkennung, maschineller Übersetzung und Text-/Bilderkennung ist das nicht anders. Die Fortschritte auf diesen Gebieten wurden durch enorme Innovationen im Bereich der künstlichen Intelligenz vorangetrieben, da neuronale Netze anhand von Daten aus der realen Welt trainiert werden, um Sprache genauer zu erkennen und zu übersetzen. Damit das volle Potenzial dieser drei Technologien ausgeschöpft werden kann, hat das Projekt SEQCLAS ihre Gemeinsamkeiten erkundet. Das vom Europäischen Forschungsrat (ERC) finanzierte Projekt betrachtete sie aus der Perspektive eines ganzheitlichen Rahmens auf der Grundlage der statistischen Entscheidungstheorie. Mit ihm könnten die im Sprachtechnologiebereich arbeitenden Teams die Algorithmen kritisch bewerten und verbessern.

Wie treffsicheres Unterscheiden gelingt

„In allen drei Anwendungsbereichen ist es immer der Kontext, mit dessen Hilfe das System die Eingaben besser interpretieren und genauere Ergebnisse produzieren kann“, erklärt Hermann Ney, Leiter des Lehrstuhls Human Language Technology and Pattern Recognition an der RWTH Aachen in Deutschland und SEQCLAS-Hauptforscher. Bei Sprache ist dieser Kontext jedoch komplex und vielschichtig. Wie kann die Maschine den gesprochenen Unterschied zwischen „Lärche“ (dem Baum) und „Lerche“ (dem Vogel) erkennen, um wortgetreu zu übertragen, oder „Bank“ (die Sitzgelegenheit) vom identischen Substantiv (dem Geldinstitut) unterscheiden, um die passende Übersetzung auszuwählen? „Nehmen wir das Beispiel der Spracherkennung: Jeder Laut muss als Teil einer Sequenz betrachtet werden, in Bezug auf ein Wort, einen Satz, sogar einen Dialog, um seine Bedeutung richtig zu interpretieren“, betont Ney. Um derartige Sequenzen zu verarbeiten und zu klassifizieren, müssen die neuronalen Netze die sie strukturierenden Muster erkennen können. Das Team von SEQCLAS betrachtete diese Herausforderung aus dem Blickwinkel der Entscheidungstheorie. Innerhalb dieses Rahmens wird die Bedeutung des Leistungskriteriums (z. B. die Anzahl der Fehler) für diese sequenzweise abzuarbeitenden Aufgaben hervorgehoben. „Folglich kann das Leistungskriterium zum Einsatz kommen, um die Struktur und das Training der auf neuronalen Netzen basierenden Systeme zu verbessern“, sagt Ney. Bei der maschinellen Übersetzung sei diese Leistung aufgrund der verschiedenen möglichen Interpretationen und Übersetzungen jedoch schwieriger zu quantifizieren, räumt er ein.

Blick in Richtung Fortschritt

Zur Ergänzung ihrer konzeptionellen Arbeit arbeiteten die Forschenden an einigen Modellen und Tests, um diese in praktische Verbesserungen umzusetzen. Sie wendeten unüberwachtes und halbüberwachtes Lernen an, um maschinelles Übersetzen anhand monolingualer Daten in Ausgangs- und Zielsprachen zu realisieren. Diese Arbeit könnte beispielsweise dazu beitragen, bessere maschinelle Übersetzungen für seltenere Sprachenpaare bereitzustellen. Ney und sein Team stellten außerdem mehrere Prototypsysteme bereit, die als Basis der weiterführenden Forschung auf diesem vielversprechenden Gebiet dienen werden. Seiner Meinung nach sei mit dem ganzheitlichen Ansatz des Projekts gleichermaßen eine einzigartige historische Perspektive auf die den Sprachtechnologien zugrunde liegenden Konzepte verbunden. „Wir neigen dazu, zu vergessen, dass neuronale Netze schon seit über 30 Jahren der Spracherkennung dienen. Ihre Entwicklung wurde lange Zeit durch mangelnde Rechenleistung ausgebremst“, fügt Ney hinzu. „Eine Neubewertung und Aktualisierung der bisherigen Forschung im Lichte der heutigen Möglichkeiten und Erkenntnisse könnte uns eine Hilfe dabei sein, weitere Fortschritte auf diesem Gebiet zu erzielen.“

Schlüsselbegriffe

SEQCLAS, Sprachtechnologie, Spracherkennung, Text-/Bilderkennung, maschinelle Übersetzung, neuronales Netz, Algorithmus, unüberwachtes Lernen, halbüberwachtes Lernen

Entdecken Sie Artikel in demselben Anwendungsbereich