Descrizione del progetto
Il futuro della tecnologia di interazione vocale è adesso
Negli ultimi anni, le tecnologie vocali hanno fatto passi da gigante. La voce, infatti, sta rapidamente sostituendo il tatto e il testo come principale mezzo di interazione con i dispositivi moderni. In questo contesto, il progetto COMPRISE, finanziato dall’UE, svilupperà la tecnologia di interazione vocale di prossima generazione. L’obiettivo è quello di ridurre i costi relativi alla raccolta e all’etichettatura dei dati vocali per una varietà di lingue, in modo da renderla più inclusiva. Attualmente, le tecnologie di interazione vocale sono fortemente orientate a favore dell’inglese e di altre lingue con una base di utenti più ampia. La sostenibilità di questo nuovo ecosistema, che servirà i parlanti di lingue con scarse risorse o con accento, sarà dimostrata per tre settori ad alto impatto commerciale: le app intelligenti per i consumatori, il commercio elettronico e la sanità elettronica.
Obiettivo
Besides visual and tactile, the Next Generation Internet will rely more and more on voice interaction. This technology requires huge amounts of speech and language data in every language to reach state-of-the-art performance. The standard today is to store the voices of end users in the cloud and label them manually. This approach raises critical privacy concerns, it limits the number of deployed languages, and it has led to market and data concentration in the hands of big non-European companies such as Google, Facebook, etc.
COMPRISE defines a fully private-by-design methodology and tools that will reduce the cost and increase the inclusiveness of voice interaction technology through research advances on privacy-driven data transformations, personalised learning, automatic labelling, and integrated translation. This leads to a holistic easy-to-use software development kit interoperating with a cloud-based resource platform. The sustainability of this new ecosystem will be demonstrated for three sectors with high commercial impact: smart consumer apps, e-commerce, and e-health.
COMPRISE will address the mission-oriented challenges of privacy-by-design, inclusiveness, and cost-effectiveness in a sector-agnostic way; allow virtually unlimited collection of real-life non-private quality speech and language data; enable businesses in the Digital Single Market to quickly develop multilingual voice-enabled services in many languages; allow all citizens to transparently access contents and services available in other languages by voice interaction in their own language; result in cost savings for both technology providers and users.
COMPRISE will find application in many sectors beyond those demonstrated, e.g. e-government, e-justice, e-learning, tourism, culture, media, etc. It will have a huge societal impact in terms of unprecedented verifiable privacy guarantees, service to speakers of under-resourced languages or accented speakers, and overall user experience.
Campo scientifico
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP.
- medical and health scienceshealth scienceshealth care serviceseHealth
- natural sciencescomputer and information sciencesinternet
- natural sciencescomputer and information sciencessoftwaresoftware development
- social scienceseconomics and businessbusiness and managementcommercee-commerce
- social sciencespolitical sciencesgovernment systemse-governance
Parole chiave
Programma(i)
Meccanismo di finanziamento
RIA - Research and Innovation actionCoordinatore
78153 Le Chesnay Cedex
Francia