Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Contenido archivado el 2024-05-24

consortium on discovering knowledge with Inductive Queries

Article Category

Article available in the following languages:

De los datos al conocimiento

Dado que muchos investigadores se encuentran ante a una cantidad abrumadora de datos pero no cuentan con los medios para extraer de ellos la información que les interesa, se ha estudiado un nuevo enfoque para el descubrimiento de conocimiento en bases de datos.

En los albores del tercer milenio, la «explosión de datos» podría considerarse la principal característica de la ciencia. Prácticamente todas las ciencias experimentales, desde la física de partículas hasta la biología molecular, pasando por la neurología y la astronomía, están presenciando un aumento sin precedentes en la cantidad y la complejidad de los datos de los que disponen. Estas bases de datos contienen gran cantidad de conocimientos científicos recogidos por medio de herramientas sofisticadas y de tecnologías de la información cada vez más potentes. El proyecto CINQ adoptó un enfoque innovador para analizar estas cantidades ingentes de datos que no constituyen información en sí mismos y que resultan difíciles de gestionar. Se desarrollaron algoritmos inteligentes de minería de datos con el fin de extraer artefactos de conocimiento para facilitar el proceso de descubrimiento de conocimiento y proporcionar una representación consistente y con complejidad semántica de los datos de entrada heterogéneos. Los socios del proyecto CINQ utilizaron bases de datos inductivas para lograr una mejor integración entre los datos y los artefactos de conocimiento que los contienen. Con las bases de datos inductivas fue posible realizar consultas ordinarias para acceder a los datos y manipularlos, mientras que las consultas inductivas permitieron extraer patrones como secuencias de elementos que suelen aparecer juntos y reglas asociativas. Por tanto, el descubrimiento de conocimiento en bases de datos inductivas se convierte en un proceso de consulta ampliado por medio del cual los analistas pueden especificar los datos o patrones que les interesan. Uno de los objetivos del proyecto CINQ era buscar un lenguaje de consulta adecuado, cosa que también persigue el proyecto IQ que está en curso, financiado por el Sexto Programa Marco. Aunque el proyecto CINQ dedicó gran parte de sus esfuerzos a la búsqueda de patrones de consulta para la extracción de información de páginas web, se centró principalmente en los retos científicos de la genómica funcional. La mayoría de las técnicas actuales de análisis de datos de expresión génica se basa en algoritmos de agrupamiento con los que se pretende identificar grupos de genes cuya expresión aparece relacionada en distintas situaciones biológicas. Dado que su validez a nivel biológico es cuestionable, se propusieron algoritmos de minería de datos para la búsqueda de reglas descriptivas de los datos recogidos por medio del análisis en serie de la expresión génica (SAGE) o de chips de ADN.

Descubra otros artículos del mismo campo de aplicación