Publié le 25-06-2018 dans cafés
Dernier café avant la fin du semestre, ce 3 juillet au PROTO204. David Rousseau nous parlera de l'infrastructure logicielle du "Data challenge TrackML", un défi lancé à la communauté "Machine Learning" pour reconstruire les données du CERN.
Les collisions de protons au LHC du CERN deviennent de plus en plus complexes a analyser. D’ici 2025, un événement (c.a.d l’image de la collision de deux paquets de protons) comprendra 100.000 points 3D a grouper en 10.000 traces. Les algorithmes traditionnels souffrent d’une explosion combinatoire et deviennent très lent dans ces conditions. Tout bien considéré il manque encore un facteur 10.
Pour attaquer ce problème, le data challenge TrackML vient de démarrer, pour susciter de nouvelles idées dans la communauté Machine Learning / Computer Science. Le challenge aura lieu en deux phases :
- la premiere sur Kaggle (du 1 mai au 13 août), les algorithmes étant classés sur leur précision (grosso modo, la fraction de hits bien associés), sans notion de vitesse (c’est une competition officielle IEEE WCCI),
- la deuxième sur Codalab de juillet a octobre, les algorithmes étant classés sur leur vitesse, pour une precision minimale (c’est une competition officielle NIPS).
Couverture médiatique :