• Le 13 décembre 2018
    De 14:00 à 17:00
    Campus Lombarderie
    Amphi Pasteur (bâtiment 2)

Ce séminaire a été lancé par des enseignants-chercheurs en sciences des données issus de plusieurs établissements nantais ayant pour ambition d’amorcer, et à terme, de faire vivre les échanges entre équipes sur le thème du traitement des données. Le séminaire vous donne rendez-vous sur le campus sciences de l'Université de Nantes le jeudi 13 décembre pour un après-midi consacré à la thématique des forêts aléatoires.

Programme :

  • 14h00 : Jean-Michel Poggi (Univ. Paris Descartes et Univ. Paris-Sud, LM Orsay) : "Forêts aléatoires : importance et sélection de variables"
    La méthode des forêts aléatoires, introduite par Leo Breiman en 2001, est désormais largement utilisée tant en classification qu'en régression avec un succès spectaculaire. Après avoir rappelé la source et les principes des méthodes d'arbres, on présente les forêts aléatoires, l'erreur Out-of-Bag et le score d'importance des variables par permutation. On esquisse ensuite une stratégie de sélection de variables en deux étapes : le classement des variables basé sur les scores d'importance suivie d'une procédure d'introduction ascendante séquentielle des variables.
    Références : R. Genuer, J-M. Poggi. Arbres CART et Forêts aléatoires, Importance et sélection de variables, In Apprentissage Statistique et Données Massives, Maumy-Bertrand M., Saporta G. et Thomas Agnan C. (eds), Technip, p. 295-342, 2018

     
  • 15h15 -16h00 : Discussions
     
  • 16h00 - 16h30 : Pot de clôture

Organisateurs :

  • L. BELLANGER (SPAN, LMJL UMR CNRS 6629)
  • V. CARIOU (StatSC, ONIRIS)
  • Y. FOUCHER (SPHERE INSERM UMR 1246 - LabCom RISCA)
  • P.-A. GOURRAUD (ITUN - CRTI - UMR INSERM 1064 - CHU)
  • P. KUNTZ (DUKe, LS2N)