El enigmático mundo de los protones, desvelado por la IA
En el proyecto NNNPDF, financiado con fondos europeos, se pretendía explorar la vida interior de una partícula conocida, el protón, y analizar su estructura de una forma novedosa: recurriendo a técnicas propias del aprendizaje automático. «La estructura del protón viene descrita de forma teórica por la llamada teoría de la interacción fuerte, una de las cuatro fuerzas fundamentales de la naturaleza. Sin embargo, determinar esta estructura a partir de los primeros principios resulta una labor extremadamente compleja», señala el coordinador del proyecto, Stefano Forte. El coordinador explica que la estructura del protón debe inferirse a partir de datos comparando las predicciones con los resultados experimentales, como los obtenidos en el Gran Colisionador de Hadrones de la Organización Europea de Investigación Nuclear, preservando la estructura del protón como una variable desconocida. «El reto consiste entonces en desvelar una ley de la física que, aunque sabemos que existe, no se puede deducir a partir de los primeros principios. Es como intentar aprender un nuevo idioma sin conocer su gramática, un problema típico del aprendizaje automático», explica Forte.
Superar los retos del uso del aprendizaje automático
El estudio de partículas subatómicas como los protones supone un gran desafío debido a su naturaleza cuántica. «A diferencia de lo que sucede con el engranaje de un mecanismo, los quark que forman un protón se asemejan a una bocanada dentro de una nube. Las leyes de la física que buscamos predicen probabilidades de sucesos, más que sucesos como tales», señala Forte. «Por consiguiente, necesitábamos adoptar un enfoque del aprendizaje automático poco convencional que trascendiera el reconocimiento de patrones, como las imágenes, y decodificara en su lugar las probabilidades asociadas a sucesos». Para lograrlo, el equipo de NNNPDF debió hacer frente a dos obstáculos técnicos principales. El primero tenía que ver con la generación eficaz de un gran número de predicciones que pudieran interpretarse estadísticamente. El segundo consistía en explorar el espacio de todos los modelos posibles para encontrar aquel que mejor describiera la naturaleza de forma objetiva e imparcial. El equipo hizo uso de redes neuronales y de redes neuronales profundas como modelos de inferencia, junto con métodos de Montecarlo para reproducir la naturaleza estadística de sus resultados. Además, se recurrió a la optimización de hiperparámetros y a la validación cruzada K-fold con el fin de explorar varias clases de modelos y probar su capacidad generalizadora. Asimismo, la agrupación en mallas y la aceleración por «hardware» permitieron procesar rápidamente grandes volúmenes de datos y mejorar la eficacia de los análisis.
El motor de la aplicación del aprendizaje automático en la física de altas energías
La creciente necesidad de recurrir al aprendizaje automático en la física de altas energías se debe a la necesidad de extraer señales ocultas a partir de grandes cantidades de datos. Sin embargo, esta aplicación sigue conllevando retos, tales como lograr evitar el sesgo de los experimentadores y evaluar con precisión los niveles de incertidumbre. En el proyecto NNNPDF se han abordado estos retos desde el primer momento, poniendo así de relieve el inmenso potencial que ofrece el aprendizaje automático para este campo. «Dado que la investigación en física de altas energías se centra en la frontera de la precisión, la detección de señales sutiles exige un control excepcional de la exactitud experimental y teórica. Nuestra principal contribución ha consistido en desarrollar herramientas fiables de aprendizaje automático cuya precisión pudiera evaluarse de forma segura», destaca Forte. «Las técnicas de aprendizaje automático son cada vez más frecuentes en la física de altas energías. Aunque todavía no se ha atribuido ningún descubrimiento directamente al aprendizaje automático, nuestro equipo ha ofrecido la primera prueba de que los quarks pesados (o quarks encantados) forman parte de la función de onda del protón. Nuestro hallazgo, publicado en la revista Nature, es posiblemente el primer ejemplo de un avance en este campo impulsado por el aprendizaje automático», añade Forte. Los logros de NNNPDF tienen repercusiones directas e indirectas en diversos campos. Directamente, la descripción precisa de la estructura del protón permite realizar pruebas sutiles de la teoría actual de las interacciones fundamentales, lo que podría conducir al descubrimiento de la naturaleza de la materia oscura. Indirectamente, las metodologías avanzadas propuestas en el aprendizaje automático, la ciencia de datos y la informática de alto rendimiento podrían ayudar a encontrar aplicaciones que vayan mucho más allá de la física de partículas.
Palabras clave
NNNPDF, aprendizaje automático, estructura del protón, física de altas energías, probabilidades de sucesos, Gran Colisionador de Hadrones, quarks pesados, quarks encantados, materia oscura