Reportaje - Minería de datos 3.0: de la información a una «inteligencia colectiva»
El volumen de información y conocimientos generados se expande a gran velocidad. Desde 1986, nuestra capacidad para almacenar, transmitir y computar información se ha incrementado a un ritmo anual del 23 %. En 2007, el usuario medio de Internet transmitía a diario un volumen de información equivalente a 6 periódicos y recibía una cantidad de datos equivalente a 174 periódicos, según un estudio publicado el pasado mes de febrero en Science. Dicho volumen de información crece en parte alimentado por los sitios web de intercambio social, que albergan miles de millones de imágenes y vídeos, la mayoría de los cuales han sido anotados e intercambiados entre amigos o bien publicados en grupos dedicados a temas de interés concretos. La magnitud de los datos aumenta a tal velocidad que supera nuestra capacidad para organizarlos. «Para los usuarios y las organizaciones resulta sencillo generar e intercambiar contenidos, sea entre individuos o en el seno de comunidades, gracias a dispositivos avanzados de comunicación como los ordenadores portátiles, las tabletas y los teléfonos inteligentes», explicó Yiannis Kompatsiaris, coordinador del proyecto financiado con fondos europeos WeKnowIt . Con tal cantidad de contenidos, la extracción de información útil resulta extremadamente compleja y costosa, mientras que las aplicaciones disponibles en la actualidad no permiten plenamente la realización de un procesado y una gestión inteligentes de los datos, en opinión del Dr. Kompatsiaris. «Los usuarios no consiguen procesar la información con eficiencia y sacar partido a los conocimientos que contiene», añadió. El proyecto integrado WeKnowIt se puso en marcha con la finalidad de cambiar el panorama. Su planteamiento pretende conceptualizar las distintas formas de datos que el usuario se encuentra a diario y transformarlas en información dotada de cohesión y utilidad práctica que su equipo llama «inteligencia colectiva». En su mayor parte, el proyecto se centró en extraer el tipo de datos generados en medios sociales en forma de marcadores, etiquetas e interacciones en redes sociales, donde las opiniones y aportaciones del colectivo dan lugar a un conjunto de datos extremadamente detallado. «Cada día recibimos y procesamos distintos tipos de "inteligencia" o conocimientos», explicó Kompatsiaris. «Están los contenidos digitales y la información contextual que denominamos "inteligencia mediática". Las aportaciones de usuarios a gran escala constituyen una "inteligencia de la masa", mientras que las interacciones personales suponen "inteligencia social", todo lo cual conforma la inteligencia personal y corporativa de individuos y empresas.» El propósito de WeKnowIt nace del convencimiento de que, si se combinan, las distintas fuentes de información pueden dar lugar a una «inteligencia colectiva» que podría incrementar exponencialmente la capacidad de los individuos y las instituciones para hallar y sacar partido a información pertinente en el momento oportuno. Cuando WeKnowIt se puso en marcha en 2008, sus objetivos se antojaban inusitadamente ambiciosos, pero a día de hoy resultan mucho más factibles. Los responsables del proyecto consiguieron el concurso de algunas de las entidades más prestigiosas del mundo en cuanto a gestión e integración de datos, como la Universidad de Tecnología de Brno (República Checa), la Universidad de Coblenza-Landau (Alemania), Yahoo! España y Vodafone y el Centro de Investigación y Tecnología Hellas (CERTH, Grecia). Además, la empresa Software Mind (Polonia) se ocupó del desarrollo y la integración de software, mientras que la Universidad de Sheffield y el ayuntamiento de la misma ciudad (Reino Unido) desarrollaron herramientas fundamentales para la definición de casos de uso. En suma, las diez organizaciones asociadas, procedentes de República Checa, Alemania, España, Grecia, Polonia y Reino Unido, invirtieron 3 años y 7,5 millones de euros (5,37 de ellos otorgados por la Unión Europea) para desarrollar una plataforma y una serie de herramientas asociadas con las que ayudar a los usuarios a manejar muy distintos tipos y fuentes de información de manera cohesiva. Plataforma central «Valiéndose de una amplia variedad de herramientas, la plataforma WeKnowIt transforma información carente de estructura y de gran magnitud en temas, entidades, puntos de interés, contactos sociales y acontecimientos dotados de significado», indicó Kompatsiaris. Con este fin, el equipo del proyecto desarrolló una plataforma central, en forma de aplicación de conectividad, que puede instalarse en servidores para procesar los datos entrantes y canalizarlos con eficacia. Seguidamente, varios socios del proyecto desarrollaron un gran número de herramientas, veinte en total, que pueden emplearse y combinarse de distintas formas, sea directamente o a través de la plataforma central WeKnowIt. «Desarrollamos siete herramientas para el estudio de casos prácticos - uno de respuesta a emergencias y otro relacionado con un grupo social de consumidores - y nuestros socios crearon otras trece para tareas específicas», explicó Kompatsiaris. ClustTour («Exploración urbana mediante colecciones híbridas») es un ejemplo de herramienta autónoma desarrollada por CERTH-ITI para una tarea concreta. Se trata de una aplicación de exploración en línea que permite al usuario encontrar sitios atractivos usando colecciones de fotografías relacionadas con lugares de interés y acontecimientos. ClustTour se vale tanto de información visual como de etiquetas en un sistema de «clasificación de colecciones» y «módulo de fusión» para identificar fotos afines entre sí y, a continuación, sitúa los objetos de interés en un plano. El usuario no tiene más que pulsar en las fotos para ver lo que hay en cada lugar. En opinión de Kompatsiaris, esta función puede mejorar radicalmente la información que tienen a su disposición quienes visitan una ciudad. Una guía de viaje convencional simplemente destacaría el Museo Arqueológico Nacional de Atenas como punto de interés. En cambio, ClustTour generó muchos más detalles al hallar fotografías interesantes de objetos expuestos en el museo, como por ejemplo la Inscripción de Arkhagetas, la colección de arte cicládico primitivo, una serie de conocidas esculturas e incluso una colección de artículos de oro descubiertos por el arqueólogo alemán Schliemann. «Queda claro que la herramienta ClustTour, desarrollada en WeKnowIt, puede ofrecer una experiencia de preparación de un viaje y de exploración muy detalladas y ricas en medios audiovisuales», señaló Kompatsiaris. Y ésta no es más que una de las muchas herramientas, que además pueden combinarse entre sí. El caso práctico dedicado al grupo social de consumidores tenía la finalidad de ayudar a planificar una excursión desde un ordenador personal y después de ofrecer indicaciones a través del teléfono móvil durante la propia excursión. Estas funciones se basaban en varias herramientas de WeKnowIt, como ClustTour, Fannr (un anotador para Flickr) y VIRaL, una herramienta visual de extracción y localización, entre otras. En el estudio sobre la respuesta a emergencias también se emplearon varias herramientas de WeKnowIt con el propósito de facilitar información pertinente y oportuna a servicios de emergencias. Se utilizó un proceso inteligente de carga de archivos capaz de, por ejemplo, identificar un lugar a partir de una fotografía remitida por un usuario. El sistema puede incluso evaluar el grado de urgencia determinando la gravedad del incidente a partir de las fotos. El estudio de ambos casos prácticos se completó de manera satisfactoria y el proyecto llegó al término de su fase formal hace pocos meses. Pero desde entonces, por así decir, el proyecto ha cobrado vida propia. «Muchas de las entidades asociadas siguen desarrollando programas informáticos y herramientas que guardan relación con el modelo y la arquitectura que se definieron en WeKnowIt. Muchas también mantienen el contacto e intercambian información con regularidad», aclaró Kompatsiaris. Así, por ejemplo CERTH-ITI, Yahoo! y la Universidad de Coblenza continúan su colaboración y sus actividades de investigación sobre aspectos de la extracción en tiempo real de información de medios sociales. También buscan nuevas aplicaciones, como en el sector de las noticias y los grandes acontecimientos tales como festivales de música y cine. Por su parte, la Universidad de Sheffield y el ayuntamiento de esta ciudad trabajan en actualizar la función de respuesta a emergencias creada en el proyecto. Por otra parte, CERTH-ITI participa en una nueva empresa tecnológica derivada llamada Veribin, dedicada a la compilación de contenidos en varios sectores y áreas comerciales. Los dos mercados de interés son las noticias y la educación virtual, y CERTH-ITI aplicará y seguirá desarrollando las técnicas de formación de colecciones a partir de medios sociales desarrolladas en WeKnowIt. Veribin ha surgido de ATC S.A. Information Technology Company y, según informó Kompatsiaris, recientemente la Secretaría de Investigación y Desarrollo de Grecia le concedió financiación para facilitar su establecimiento inicial. Entretanto, Software Mind se dedica a desarrollar nuevas herramientas para la Web Semántica orientadas a los sectores financiero y de las telecomunicaciones, mientras que Vodafone aprovechará los conocimientos adquiridos en el proyecto para explotar la infraestructura de la red y ofrecer nuevos servicios. La Universidad de Coblenza también ha constituido una empresa teológica llamada Kreuzverweis que aprovecha los resultados de WeKnowIt relativos a la capa de la inteligencia corporativa. El equipo del proyecto también ha solicitado la concesión de nueve patentes. Esta es sólo una selección de los productos y los resultados que el público pronto tendrá a su alcance. Con el tiempo surgirán más, sobre todo una vez se establezca el grupo de usuarios de WeKnowIt, cuyo cometido es el de ayudar a los interesados a mantenerse al tanto de las últimas novedades relacionadas con el proyecto. Para las investigaciones del proyecto WeKnowIt se obtuvo financiación del Séptimo Programa Marco de la UE, concretamente por medio del subprograma «Contenido inteligente y semántica». Enlaces útiles: - proyecto WeKnowIt - registro de datos del proyecto WeKnowIt en CORDIS Artículos relacionados: - Un proyecto europeo facilitará la cooperación y las decisiones mediante entornos intensivos en datos - Una ayuda para la policía sobresaturada de información - Resolver la «crisis de elección» en Internet - La búsqueda: los ordenadores buscan significados más a fondo