S'inscrire

Apprentissage statistique : théorie et application

Environnement scientifique et technique de la formation

Laboratoire de biométrie et biologie évolutive - UMR 5558

RESPONSABLES

Laurent JACOB

Chargé de recherche

UMR 5558

Franck PICARD

Directeur de recherche

UMR 5558

LIEU

LYON (69)

ORGANISATION

3 jours
De 4 à 10 stagiaires
TD encadrés par 1 intervenant pour 5 stagiaires maximum

COÛT PÉDAGOGIQUE

1300 Euros

A L'ISSUE DE LA FORMATION

Evaluation de la formation par les stagiaires
Envoi d'une attestation de formation

DATE DU STAGE

18310 : du lundi 04/06/2018 au mercredi 06/06/2018

Janvier Février Mars Avril
Mai Juin
18310
Juillet Août
Sept. Oct. Nov. Déc.

OBJECTIFS

- Comprendre les fondements théoriques de l'apprentissage statistique
- Choisir les outils adaptés à ses objectifs à la lumière de cette théorie
- Savoir mettre en oeuvre ces outils sur des grandes masses de données

PUBLIC

Chercheurs ou ingénieurs en science des données / statistiques

PRÉREQUIS

Bac + 4 minimum, connaissances de base en algèbre linéaire, probabilités, statistique et programmation (R et Matlab)

PROGRAMME

L'augmentation de la quantité de données disponibles motive le développement de méthodes permettant leur analyse et leur exploitation. Un obstacle majeur rencontré lors de cette exploitation est la grande dimension des données : malgré l'augmentation du nombre d'observations (échantillons biologiques, images, textes), ce dernier reste petit devant la complexité de leur description (millions de mutations dans un génome ou de pixels dans une image). Un second obstacle technique est le passage à l'échelle de méthodes initialement conçues pour des petits jeux de données.
Cette formation propose aux professionnels confrontés à ce type de données d'acquérir des connaissances empruntant aux statistiques, à l'apprentissage et à l'optimisation et permettant de comprendre et de surmonter ces obstacles.
La première partie de la formation s'attachera à donner un cadre théorique justifiant les méthodes présentées, permettant de les comparer systématiquement et de comprendre pourquoi et quand elles fonctionnent. Sera ensuite constituée une boîte à outils permettant de faire face aux différents problèmes rencontrés en data science : supervisé / non-supervisé, non-linéaire, données massives.


- Fondamentaux : théorie de l'apprentissage statistique, sur-apprentissage, apprentissage supervisé, régression ridge, Support Vector Machine (SVM), validation
- Optimisation pour l'apprentissage statistique : optimisation convexe, non lisse, algorithmes proximaux, optimisation stochastique
- Propriétés statistiques du Lasso : propriétés de sélection de variables, consistances, calibration de pénalité.
- Apprentissage non supervisé : clustering, analyse en composantes principales
- Méthodes non-linéaires : méthodes à noyaux, réseaux de neurones
Alternance de cours (13,5 h) et de travaux dirigés (7,5 h)

EQUIPEMENT

Un ordinateur sera mis à disposition de chaque stagiaire.

INTERVENANTS

L. Jacob, N. Pustelnik, F. Picard (chercheurs) et V. Viallon (maître de conférences)

Choisir une formation

Choisir un autre domaine

Contactez-nous
par téléphone
01 69 82 44 55
ou par
+ d'infos