Machine Learning 2 (DATA931)

Volume horaire

CM : 12h / TD : 12h / TP : 16h

Présentation

Ce module s'inscrit dans la continuité des modules DATA832 et INFO831 dans lesquels le B.A.-ba de la science des données a été présenté à travers les différents paradigmes de l'apprentissage automatique et de la statistique exploratoire et expérimenté avec la machinerie algorithmique de base, mettant en évidence les limites des outils basiques de modélisation. Un ensemble de méthodes avancées, étendant les fondamentaux de l'apprentissage, est présenté dans ce module. Chacune des approches permet d'améliorer le processus d'apprentissage en se focalisant sur un aspect particulier, par exemple la réduction de la variance des décisions, le traitement de problèmes non linéaires, ou encore l'apprentissage à partir d'un très grand nombre d'exemples et l'extraction automatique de caractéristiques. A une présentation conceptuelle des différentes méthodes, sera associée une réflexion sur leur implémentation et une expérimentation basée sur des cas concrets de recherche et développement.

This module is a continuation of the DATA832 and INFO831 modules in which the BA-ba of data science has been presented through the different paradigms of machine learning and exploratory data analysis. Experimental studies with basic algorithmic machinery have highlighted limitations of basic modeling tools and the need of using advanced methods.

A set of advanced methods, extending the fundamentals of machine learning, is presented in this module. Each approach improves the learning process by focusing on a particular aspect, such as reducing variance of decisions, dealing with non-linear problems, or learning from a very large number of examples with automatic feature extraction.

A conceptual presentation of different methods will be associated with some thoughts on their implementation and with experimentations based on case studies used in applied research.

Objectifs

1. identifier les avancées conceptuelles et technologiques associées au développement des méthodes d'apprentissage modernes

2. mettre en oeuvre des méthodes d'apprentissage modernes en utilisant des outils de développement appropriés

Compétences acquises

A l'issue de ce cours, l'étudiant sera capable :

  • de présenter des applications qui ont contribué au succès des approches modernes en apprentissage automatique et analyser leurs caractéristiques
  • de formuler les principes et concepts de base des principales approches modernes
  • d'installer, configurer et utiliser des bibliothèques d'apprentissage avancé en Python
  • d'expérimenter des techniques avancées d'apprentissage pour la classification d'objets en utilisant des bases de données massives de référence
  • de concevoir et de développer sa propre application d'apprentissage avancé dans le cadre du big data

Pré-requis

  • DATA832
  • INFO831

Plan du cours

Panorama de méthodes avancées pour le big data

  1. Méthodes ensemblistes (bagging, forêts aléatoires, boosting)
  2. Machines à vecteurs supports et méthodes à noyaux
  3. Apprentissage profond (deep learning)
  4. Méthodes par renforcement
  5. Séries temporelles et motifs séquentiel
  1. ensemble methods (bagging, random forests, boosting)
  2. vector support machines, kernel methods
  3. deep learning
  4. renforcement methods
  5. time series, sequential patterns

Bibliographie

  • T. Hastie, R. Tibshirani, J. Friedman, The Elements of Statistical Learning - Data Mining, Inference, and Prediction, Second Edition, Springer, 2013
  • I. Goodfellow, Y. Bengio, A. Courville, Deep learning, MIT Press book, 2016

Diplômes intégrant ce cours

En bref

Langue d'enseignement
Français

Contact(s)

UFR, Écoles, Instituts

Lieu(x)

  • Annecy-le-Vieux (74)