Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Contenido archivado el 2024-05-24

Ontology driven Temporal Text Mining on Organisational Data for Extracting Temporal Valid Knowledge

Article Category

Article available in the following languages:

Despliegue de la Web semántica

Es posible extraer información semántica de datos Web y almacenarlos de un modo que haga posible recuperarlos con eficacia a través de un marco innovador y orientado a la empresa desarrollado por el proyecto PARMENIDES.

La toma de decisiones estratégicas, especialmente en los ámbitos empresarial y competitivo, que cada vez revisten más importancia, requiere la adquisición de información relevante como las tendencias del mercado, las fusiones y los valores empresariales. Una característica es que el proceso de extracción de esta información a partir de múltiples fuentes requiere el uso de muchos recursos y, lo que es importante, tiene que realizarse de manera regular y con bastante frecuencia. En el proyecto PARMENIDES, financiado por el Quinto Programa Marco, se adoptó un enfoque sistemático basado en ontologías con vistas a la integración de todo el proceso de recopilación y análisis de información. A fin de descomponer el proceso empresarial en consultas convencionales, se desarrollaron métodos específicos que establecen de manera semiautomática ontologías sobre dominios de aplicación concretos, anotan documentos con componentes ontológicos e identifican identidades dentro de ellos. Se explotaron dos metodologías complementarias para el establecimiento de ontologías sobre textos estructurados, notas de prensa e informes que no forman parte de una base de datos. La metodología basada en plantillas, con sus orígenes en el procesamiento de lenguajes naturales, expresa la estructura y la semántica de los documentos mediante plantillas de normas y las enriquece con anotaciones formales. Por otro lado, la metodología KDD (Descubrimiento de Conocimientos en Bases de Datos) se utiliza como soporte para el descubrimiento de conceptos y relaciones que caracterizan a los documentos. Asimismo, es relevante para el dominio del discurso. Los activos de la información extraída se conservan en un almacén documental a fin de servir de soporte para tareas de descubrimiento de conocimientos a lo largo del tiempo y para permitir la detección de nuevas tendencias que, de otro modo, quedarían ocultas. Aunque la gran variedad de ontologías disponibles ofrece material conceptual estandarizado, a menudo combinado con sugerencias valiosas sobre las relaciones conceptuales asociadas, este conocimiento tiene que ser reestructurado con frecuencia. El sistema de extracción de conocimientos Parmenides puede cubrir la escasez de material ontológico para dominios que actualmente son el centro de numerosas actividades de investigación.

Descubra otros artículos del mismo campo de aplicación