Plusieurs équipes d’étudiants venus de différentes écoles françaises et encadrées par des experts, étudient pendant deux jours un problème lié à des données et présentent devant un jury leurs solutions.
Les différentes problématiques datas proposées sont issus d'entreprises ou d'institutions. L’équipe gagnante reçoit le premier prix de 10 000 € offert par l'association IA Pau. Le cadre de ce data challenge peut être l’occasion pour vous, entreprise, d’étudier l’une de vos problématiques datas. Découvrez ci-dessous les projets étudiés lors des précédentes sessions. |
Vous souhaitez détecter de nouvelles idées, développer/comparer de nouvelles approches, valoriser vos données non organisées ?
Confiez l’une de vos problématiques datas à une équipe d’étudiants coachée par des experts durant 2 jours lors d’une compétition de data scientists dans le cadre du Data Challenge de l’évènement sur l’intelligence artificielle IA Pau ! |
Historique des vainqueurs
2020 - ENSAE, ParisDe nombreuses équipes ont travaillé intensément durant 2 jours et une nuit et ont apporté des solutions de très grande qualité aux 4 projets proposés.
Toutes nos félicitations aux vainqueurs, une équipe d'étudiants de l'ENSAE-PARIS qui a remporté le premier prix de 10 000€ sur le projet de TOTAL de recherche d'images similaires. Une équipe d'étudiants de l'université de Nantes a remporté le second prix (3 000€) sur le projet Lo Congres (analyse morpho-syntaxique en occitan), une équipe complémentaire d'étudiants de Lyon a remporté le troisième prix (2 000€) sur le projet Elan Bearnais (proposition de solutions de coaching). Le prix "Numérique responsable" (transition énergétique) de 5 000€ a été attribué à l'équipe d'étudiants de l'université de Nantes qui a également remporté le second prix. |
2019 - EISTI, PauParmi les différents sujets proposés, ils ont choisi le projet d'assistant vocal intelligent dédié aux questions techniques agricoles transmis par la société Euralis (Pau).
Ils ont ensuite travaillé pendant 2 jours (et une nuit!) durant une compétition acharnée avec les nombreuses autres équipes. Ils ont gagné ! Toutes nos félicitations à l'équipe d'élèves ingénieurs de l'EISTI-PAU qui a remporté ce data challenge. |
Historique des projets
2020 - Elan Bearnais Pau Lacq Orthez, PauProjet : team performance prediction with machine learning
Problématique et objectifs : construire un algorithme capable de suggérer à l’utilisateur à tout moment durant un match, une ou plusieurs solutions de coaching en fonction de l’évolution du score, du temps restant à jouer, et des joueurs présents sur le terrain. Descriptif du jeu de données fourni : un historique de plus de 28 000 évènements observés durant plusieurs matchs. |
2020 - Lo Congres, PauProjet : analyse morpho-syntaxique en occitan
Problématique et objectifs : réaliser un PoS-tagger pour des textes de corpus, à partir de lexiques très complets et de corpus non annotés : à partir d'une phrase, l'algorithme doit être capable de la découper en unités et d'attribuer une étiquette morpho-syntaxique (verbe, nom propre masculin singulier,...) pour chaque unité. Descriptif du jeu de données fourni : plusieurs structures de données dont une bibliothèques des catégories grammaticales, un lexique de 1 400 000 formes fléchies en occitan gascon (verbes conjugués, noms et adjectifs déclinés, etc.), des corpus annotés et non annotés . |
2020 - Téréga, PauProjet : prévision des demandes clients
Problématique et objectifs : construire un algorithme capable de prévoir les demandes de capacités de transport de gaz des clients dans les points de stockage et les points d’interfaces entre deux réseaux. Descriptif du jeu de données fourni : un historique des demandes réelles des clients depuis 2016 et un historique des variables pouvant influencer ces demandes depuis 2016. |
2020 - Total, PauProjet : image duplicator detector
Problématique et objectifs : élaborer des algorithmes pour déterminer rapidement si le contenu visuel d'une image est identique ou similaire à d’autres images (near duplicates) et pour trouver si une image appartient à une autre image (template matching). Descriptif du jeu de données fourni : une bibliothèque d'images dont certaines sont identiques ou très proches (near duplicates), une bibliothèque d'images contenant d'une part les images originales et d'autre part les sous-images (templates). |
2019 - Cap Gemini, PauProjet : pronostics sportifs (coupe du monde de rugby)
Problématique et objectifs : à l’aide d’outils d’apprentissage supervisé, vous devrez prédire les résultats de toutes les rencontres de la Coupe du Monde 2019. L’objectif final sera de déterminer le Champion du Monde et le score de la finale. Descriptif du jeu de données fourni : résultats rencontres ayant opposées chaque équipe depuis le 1er janvier 2015 jusqu’au 10 septembre 2019. |
2019 - Data-Pink, LyonSegmentation sémantique d’images satellites
Problématique et objectifs : à partir du framework opensource RoboSat.pink (édité par DataPink), améliorer la qualité de reconnaissance des patterns (par exemple en respectant la topologie), ou les performances logicielles sur la phase de training et lors de l’inférence. Descriptif du jeu de données fourni : 40 000 images (définition 512x512), avec labels d'occupation du sol calés sur chaque image. |
2019 - Euralis, PauAssistant vocal intelligent dédié aux questions techniques agricoles
Problématique et objectifs : à partir d’une base de données d’images, de conversations, ainsi que des pointeurs vers des sites de conseils agronomiques, construire une base de connaissance constitué de couples (images, texte) contenant les images collectées et le texte associé contenant la réponse au problème, puis mettre en place un algorithme capable de suggérer à l'utilisateur une (ou plusieurs) réponses associées à une nouvelle image. Descriptif du jeu de données fourni : un dossier WhatsApp de 2 ans d'historiques de discussions, un fichier métier contenant plus de 500 questions des techniciens, les réponses techniques, des annotations, des pointeurs vers des sites de conseils agronomiques. |
2019 - Kappsports, BidartEvaluer les performances des coureurs de sports d'endurance
Problématique et objectifs : attribuer un score à chaque sportif de la base fournie, traduisant son niveau sur chacune des disciplines (course sur route, trail, cyclisme, triathlon...), à partir du niveau de performance de l'ensemble des participants à l'épreuve; objectifs finaux : donner une idée générale du niveau d'une course, attribuer des évaluations aux coureurs (comme pour le tennis), leur permettre de suivre leur évolution, se comparer. Descriptif du jeu de données fourni : base détaillée de tous les résultats, avec les informations de distance et type d'épreuve. |
2019 - La Fibre 64, PauDétermination d'emplacements appropriés pour couvrir une zone en 4G
Problématique et objectifs : entre 2 points, trouver un itinéraire routier sans rupture de la couverture 4G; entre 2 points, déterminez les endroits les plus adaptés pour implanter un ou plusieurs pylônes de téléphonie mobile afin que le chemin soit le plus court possible. Descriptif du jeu de données fourni : un modèle numérique de terrain (BD_ALTI), tracé des routes départementales, implantation et couverture des 4 principaux opérateurs. |
2018 - Capgemini et Safran Helicopter Engines, PauDétection d’anomalies moteurs
Problématique et objectifs : à partir des paramètres fournis dans les données, détection d’anomalie non supervisée, en créant des features pertinents et adaptés aux modèles de machine learning utilisés. Descriptif du jeu de données fourni : un historique des vols de 24 hélicoptères sur l’année 2017. |
2018 - Elan Béarnais Pau-Orthez (Pau), PauAssistant pour recruter les meilleurs joueurs
Problématique et objectifs : identifier le profil des joueurs performants pour savoir lesquels sont disposés à avoir un bon impact dans le championnat ; rechercher des similitudes entre les joueurs afin de pouvoir « prédire » le futur d’un joueur à partir de ses saisons passées. Descriptif du jeu de données fourni : l’historique en carrière de l’ensemble des joueurs ayant évolué en première division entre 2005 et 2018. |
2018 - IPREM ( Université), PauDétection de contrefaçon d’un vin
Problématique et objectifs : pouvoir différencier des vins provenant de pays différents; pouvoir identifier l’origine (continent, pays, région) d’un vin inconnu (contrefaçon); identifier des critères discriminants pour (signature de) certains Pays / Régions / Continents. Descriptif du jeu de données fourni : les concentrations élémentaires en ppb (ug /L) et les rapports isotopiques de vins provenant de continent, pays et régions différentes. |
2018 - Comm.Agglo. Pau, PauOutil de recherche intelligente pour les archives communautaires
Problématique et objectifs : découpage et regroupement lexical de toutes les données archivées; étude d’un outil de navigation et recherche intelligent des délibérations. Descriptif du jeu de données fourni : une liste codifié de délibérations. |
2018 - Faster Horses, PauPossibilités et risques liés à l’exploitation des donnée pour les élèves
Problématique et objectifs : concevoir une activité qui pourra servir l’exploitation des données des élèves, tout en leur montrant la richesse des informations qui peuvent être obtenues par l’analyse de données qui peuvent paraître très limitées et fragmentées. Par exemple, créer un algorithme qui permette de reconnaître des communautés de personnes, à partir de données de localisation d’un groupe de collégiens. Descriptif du jeu de données fourni : positions GPS de 36 collégiens sur une période. |
2018 - Universal Software, Douala (Cameroun)IA pour aide au diagnostic médical
Problématique et objectifs : concevoir un outil informatique d’assistance au diagnostic médical, qui va permettre de réduire les erreurs de diagnostic et prendre en compte tous les traitements antérieurs et actes médicaux du patient. Descriptif du jeu de données fourni : plusieurs liste des datas : maladies, antécédents, motifs de consultation (les symptômes), liste des examens, dossiers patients. |