École Européenne d'Été en E.D.A.
Thèmes abordés et objectifs
L'Analyse Exploratoire des Données
(Exploratory Data Analysis)
Par sa méthodologie, la profusion de techniques qu'elle offre,
l'analyse exploratoire des données constitue une source abondante
d'alternatives souples, robustes, de mise en oeuvre aisée,
et parfaitement pertinentes, aux paradigmes traditionnels de la
statistique classique que les données prennent trop souvent
plaisir à malmener. Plongeant ses racines dans les traditions et
pratiques statistiques, l'exploration revitalise la statistique; en
témoignent sa forte progression sur le terrain des applications,
tout particulièement dans le domaine de ce que l'on appelle
maintenant le Data Mining
et ses développements théoriques récents, ainsi que
le nombre conséquent de logiciels qui lui sont consacrés
ou qui en font un large usage.
L'emploi des concepts et des
méthodes exploratoires facilite l'enseignement de l'analyse des
données et de la statistique, et son usage s'y répand,
favorisé par l'aisance à circonscrire les questions
essentielles, à révéler les accords ou les
désaccords entre les données et leur représentation
formelle, à évaluer rapidement la nouvelle
hypothèse que fait naître telle représentation
graphique, tel diagramme de diagnostic, ou tel tableau codé.
Les domaines d'utilisation et les disciplines scientifiques
des participants aux sessions de l'école sont très
variés: agronomie, biologie et physiologie, chimie,
économie, géographie, gestion, hydrogéologie,
informatique, linguistique, micro-électronique, sciences
médicales, sciences sociales.
Pourtant l'EDA apparaît
encore peu dans les cursus universitaires, y compris dans des
filières spécialisées de statistique ou d'analyse
des données. Bien que des initiatives importantes aient eu lieu
récemment, à l'INRA, à l'ENSAE-INSEE et EUROSTAT
(projet TES), le besoin de formation, initiale et continue, subsiste;
l'association MIRAGE se propose de répondre à ce besoin,
par le canal de cette École d'Été. Les intervenants
y sont tous enseignants ou chercheurs, pratiquant l'EDA dans des
contextes divers et avec des approches différentes, tant en
recherche qu'en production.
L'Ecole d'été en E.D.A.
Cours de base
L'ossature de l'école est le
cours de base; y sont présentes de façon simple les
apports de l'EDA, en ménageant les ouvertures vers des
applications immédiates. Il est dispensé par
un seul intervenant (E. Horber, Genève) pour en assurer
l'homogénéité.
Ateliers
Une large part
de l'enseignement repose sur les ateliers (mise en pratique du
cours de base), autour de jeux concrets de données,
à l'aide de logiciels interactifs sur des
micro-ordinateurs courants. L'atelier est un groupe de travail
autour de pôles d'intérêts définis par les
participants. Des échanges de vue fructueux ont ainsi lieu,
consacrés à des thèmes familiers aux participants,
où l'on aborde en commun (avec monitorat technique) des
données relevant de leur propre domaine d'activité.
Conférences et tables rondes
Des conférences et tables rondes, d'approfondissement ou de
sensibilisation, sur des thèmes non-abordés dans le cours de base,
viennent coiffer cette structure:
- L'analyse exploratoire comme base conceptuelle et méthodologique du
Data Mining.
- "Bootstrap" (méthodes "à la Cyrano") et enveloppes de simulation
- Analyse graphique interactive
- Graphique comme interface Homme-Données
- Analyse additive généralisée
- "Projection Pursuit" (directions révélatrices),
outil multidimensionnel exploratoire
- Approche exploratoire des séries temporelles
- Approche exploratoire des données spatiales
- ...
Journée du logiciel exploratoire (vendredi)
Une Journée du logiciel exploratoire et ses applications
présente l'univers des logiciels exploratoires (EDA, DataDesk, S,
LispStat, SAS-Insight, Vista, JMP, Tétralogie, ...) et discute les apports, les difficultés et les
limites de ces outils dans la pratique, en invitant tout particulièrement les participants des écoles d'été précédantes à (re)venir partager leurs expériences et découvertes.
Cette Journée est
ouverte à un public plus large.
Objectifs et audience
L'École d'Été se veut un lieu de
rencontre, confrontation de
différentes pratiques et diffusion des acquis
conceptuels, sur le traitement des données selon le
point de vue exploratoire à l'aide d'outils
graphiques, interactifs et
robustes.
L'association MIRAGE poursuit en cette
manifestation ses objectifs premiers:
- Assurer prioritairement la diffusion des concepts essentiels et du
corpus des techniques élémentaires en EDA. C'est le
rôle assigné, en particulier, au cours de base.
- Associer ce complément
de formation,
essentiellement pratique, intégrant le "point de vue
utilisateur", à une véritable mise
en commun de l'expérience des participants, afin de pouvoir
caractériser, et étudier de façon concrète,
les problématiques qui entrent en oeuvre tout au long du
processus de
traitement des
données, depuis la prise
de contact initiale
jusqu'à la composition du rapport
d'analyse.
- Offrir à chacun
l'opportunité de se constituer un point
de vue sur
l'état de
l'art en analyse exploratoire, de développer
son autonomie à traiter ses propres données,
de se constituer une méthodologie
pertinente, en pleine adéquation avec
ses préoccupations. Chacun peut ainsi
accroître ses
potentialités de
communication aussi bien avec ses collègues
qu'avec les chercheurs d'autres disciplines.
- Fournir un lieu de rencontre annuelle aux
praticiens d'une analyse concrète, créative des
données, et aux chercheurs et
enseignants de cette "Statistique Moderne" qui
prend aujourd'hui corps, et dont l'EDA constitue le robuste tronc
commun.