Projets

Modèle de prédiction

Fiche de Projet
Réalisé par : Sebastian Engelke
Contact : Sebastian.Engelke@unige.ch
Cours : Machine Learning
Cursus : Master
Nombre d'étudiant-es : 50 - 100
Innovations utilisées :
Exposer des cas pratiques
Problématique :
Responsabiliser
Faculté : GSEM
Description du Projet
Situation de départ

La volonté de l’enseignant est de permettre aux étudiant-es d’aborder le concept de « Machine Learning » de manière appliquée. Le but est donc que le travail réalisé en cours soit pratique et représentatif du monde actif. Pour ce faire, l’enseignant a créé pour ses étudiant-es un projet de concours en exploration de données (« Data mining competition ») interne au cours. L’exercice s’effectue sur des données réelles issues de compagnies les ayant mises en ligne.


Mise en place et déroulement du projet

Le cours débute par 2 à 3 séances durant lesquelles le concept étudié ainsi que les bases théoriques et pratiques sont définies. L’enseignant propose ensuite de prendre part au concours en utilisant la plateforme Kaggle. Cette plateforme permet à de nombreuses entreprises de mettre à disposition de larges bases de données afin de répondre à une demande précise. Les étudiant-es sont ainsi placé-es dans une situation intermédiaire entre cours et réalité.

Durant les 8 semaines suivantes, les étudiant-es participent par groupe de 2 à cette compétition. En utilisant un échantillon de la base de données mise à disposition, leur objectif est de développer le meilleur modèle de prédiction (« machine learning model ») de comportement du reste des données. Pour ce faire, les groupes peuvent, s’ils le souhaitent, soumettre jusqu’à une proposition de modèle par jour. À chaque proposition soumise, un feedback leur est envoyé leur permettant d’améliorer leur modèle tout en travaillant de manière autonome. La fréquence à laquelle les groupes participent à cette compétition n’est pas imposée ce qui permet de les responsabiliser.

Parallèlement, les étudiant-es participent à des travaux pratiques (TP) organisés par les assistant-es. Durant ces TP, ils/elles réalisent des exercices pratiques et peuvent également poser des questions en lien avec les modèles développés dans le cadre de la compétition.

Une partie de l’évaluation (40%) porte sur le rapport écrit de fin de semestre dans lequel les étudiant-es font part de leur réflexion autour du modèle qu’ils/elles ont proposé. Les modèles sont appliqués à toute la base de données et les 3 modèles prédisant le mieux les données sont récompensés par un bonus pour l’examen final. Celui-ci se présente sous forme écrite classique et compte pour 60% de la note finale.


Retour et conseils sur la mise en place d'un tel projet

Une des difficultés lors de la mise en place de ce projet concerne le choix de la base de données exploitée. Celle-ci ne devant être ni trop simple ni trop complexe. Le risque étant de démotiver ou décourager les étudiant-es.

La mise en place d’un tel projet a apporté beaucoup à son créateur et lui a permis de repenser sa façon d’enseigner en s’impliquant de manière plus directe dans son enseignement en interagissant plus avec les étudiant-es.

D’une part, l’aspect très appliqué et la notion de compétition sont des caractéristiques qui motivent les étudiant-es à prendre part au cours et à se dépasser. D’autre part, ils/elles ont parfois tendance à sous-estimer le temps à investir en dehors des heures de cours et pourraient se sentir submergé-es. 


Avis des étudiant-es

« The course is complete, with a theoretical side, a practical side with the report, and a competition side with the challenge on Kaggle. »

« The course is very much application-oriented. The structure is also clear. The data competition is a very nice way to make the learning process more dynamic. »

« The data competition is interesting and challenging. »

« The data competition may redirect focus from the actual objectives of the course. »

« Very good course! Demanding content, but teacher stimulates reflection and the Kaggle competition is a good incentive for us to do some real ML! »

Fichiers multimédias annexes