Morphologically-informed representations for natural language processing

Cel

The morphological structure of a word plays an important role in determining its function and meaning, yet it is often disregarded by current machine learning models aimed at natural language processing (NLP). State-of-the-art NLP models typically rely on word-level or character-level representations. This arguably works well for English, the dominant language in NLP research, since it is morphologically simple, but poses a challenge for morphologically-rich languages like Basque, Estonian, or Kurdish. As a consequence, the current state of the art is biased against these languages, preventing us from building better NLP technology for them.

The MorphIRe project aims to learn morphologically-informed representations for NLP. It proposes to explore the fine-grained morphological analysis of word forms in order to learn representations that are grounded in morphemes, the smallest grammatical unit of language. Using these representations as input to NLP models is expected to improve their performance particularly for morphologically-rich languages. To this end, MorphIRe will make use of deep learning with neural network architectures both to learn the representations and to apply them to state-of-the-art models for a variety of NLP tasks, such as language modelling and dependency parsing.

The impact of MorphIRe is twofold: 1) Learning input representations that can be used in a variety of models encourages reusability of the results and promises that improvements will carry over to future NLP research. 2) Through improving the state of the art on morphologically-rich languages, speakers of these languages will ultimately benefit from better NLP technology. This way, MorphIRe has the potential for making both a scientific and a societal impact.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.

Program(-y)

Temat(-y)

MSCA-IF-2018 - Individual Fellowships

Zaproszenie do składania wniosków

H2020-MSCA-IF-2018

Zobacz inne projekty w ramach tego zaproszenia

System finansowania

MSCA-IF-EF-ST - Standard EF

Koordynator

KOBENHAVNS UNIVERSITET

Wkład UE netto

€ 207 312,00

Adres

NORREGADE 10
1165 Kobenhavn
Dania

Region

Danmark Hovedstaden Byen København

Rodzaj działalności

Higher or Secondary Education Establishments

Linki

Kontakt z organizacją Strona internetowa

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 207 312,00

Cel

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.

Program(-y)

Temat(-y)

Zaproszenie do składania wniosków

System finansowania

Koordynator

Udostępnij tę stronę

Pobierz

Morphologically-informed representations for natural language processing

Cel

Dziedzina nauki (EuroSciVoc) Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.

Program(-y)

Temat(-y)

Zaproszenie do składania wniosków

System finansowania

Koordynator

Udostępnij tę stronę

Pobierz

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.