Los ojos del mundo
La visión artificial está adentrándose rápidamente en campos distintos de la investigación académica y utiliza procesos de automatización en fábrica, como la inspección de calidad. Con las herramientas y plataformas apropiadas, ahora las nuevas posibilidades parecen infinitas en cuanto a aplicaciones vestibles, realidad aumentada, supervisión y «vida cotidiana asistida por el entorno» (AAL), entre otras. La visión, nuestro sensor más potente, implica obtener datos masivos de la realidad. La cantidad de datos generados en el mundo por sensores de imagen hace que la cantidad de datos recopilados por todos los sensores restantes en su conjunto parezca minúscula. «Por primera vez, el desafío que plantea ya solo la potencia de procesamiento que requiere la visión artificial ha sido abordado de frente por nuestro proyecto EoT», explica el coordinador del proyecto EoT, el profesor Óscar Déniz Suárez. «El objetivo era desarrollar una plataforma de visión de núcleo optimizada en cuanto a potencia, tamaño, coste y capacidad de programación que pueda trabajar de forma independiente y, además, capaz de integrarse en todo tipo de artefactos», añade. Como característica derivada, la capacidad de llevar a cabo inferencias de aprendizaje profundas no estaba entre los objetivos iniciales del proyecto, sino que surgió posteriormente como un resultado muy deseable, según el consorcio. Visión artificial integrada eficiente con aprendizaje profundo El resultado es una plataforma para una visión artificial integrada increíblemente eficiente, posibilitada por un elemento clave de hardware: un procesador Myriad 2 de consumo ultrabajo de Movidius. «Algunas características destacables incluyen una interfaz de aprendizaje profundo y una wifi de consumo ultrabajo tanto con mensajería como con retransmisión de vídeo capaz de enviar alarmas a dispositivos, cargador de batería interno y conector de sonido», desarrolla el profesor Suárez. La placa ofrece actualmente interfaz para tres cámaras diferentes y presenta unas dimensiones reducidas: 48x56 mm. La placa de hardware se desarrolló durante la primera mitad del proyecto y se basa en el principio de eliminar componentes para reducir el tamaño del producto final. Después, el desarrollo de software pudo continuar en paralelo con las unidades existentes sin un gran impacto. Tres demostradores, una multitud de aplicaciones Los socios del proyecto desarrollaron tres demostradores para ilustrar las posibles funciones de la tecnología: una muñeca con la placa integrada en el cuerpo y la cabeza, unos auriculares y un sistema de detección del vertido ilegal de basura. «Cabe destacar que todos los sistemas presentan un diseño que da prioridad a la privacidad y no se graban ni, en consecuencia, envían imágenes», destaca el profesor Suárez. La muñeca representa la función de aprendizaje profundo puesto que puede distinguir entre seis expresiones faciales posibles. Además, EoT calcula que podría hacerlo de forma continua durante trece horas con una única carga de una batería de 4 000 mAh agotada. Los auriculares, desarrollados para museos, reconocen automáticamente cuadros y proporcionan al visitante información sonora relevante. La placa de EoT de los auriculares también se conecta con una aplicación de teléfono inteligente para experiencias multimedia o interactivas. El sistema formó parte de un proyecto piloto llevado a cabo en el museo vienés de fama mundial Albertina y será la base para una propuesta de un nuevo proyecto, la última fase hacia el desarrollo de productos. Otro demostrador es el «Litterbug», un dispositivo EoT contra el vertido ilegal de basura que lo evita en primer lugar detectando el acto con una cámara y a continuación emitiendo señales sonoras cuando se comete el delito. Comercialización: el futuro de la visión artificial Antiguos empleados de los socios crearon una empresa de nueva creación, Ubotica Technologies, que no solo dispone de una licencia para desarrollar una amplia variedad de productos basados en EoT, sino también la experiencia necesaria. «El chip Myriad 2 que se encuentra en el núcleo de EoT es un dispositivo complejo de controlar, integrar en otros componentes electrónicos y desplegar», destaca el profesor Suárez. Esto incluye un complejo software asociado con el procesador, sensores, comunicaciones y visión optimizada, además de la interfaz de aprendizaje profundo. «Ubotica ya tiene la experiencia para desarrollar variantes de EoT en el menor tiempo posible», concluye el profesor Suárez.
Palabras clave
EoT, aprendizaje profundo, visión artificial, sensor, Myriad 2