v1.11.0 (686)

Mastère spécialisé - Big Data : gestion et analyse des données massives

Contexte

En 2020, le big data devrait représenter un marché mondial de 72 milliards de dollars1, principalement porté par les entreprises américaines du GAFA (Google, Apple, Facebook, Amazon). Mais la France a développé un écosystème qui la met en bonne position sur le podium mondial, grâce notamment à ses compétences en mathématiques et en informatique, ses formations scientifiques de haut niveau et aux incubateurs qui permettent à des milliers de start-up de se lancer.

LE BIG DATA : UN FUTUR INCONTOURNABLE
Aujourd’hui, l’intégration de ces technologies semble incontournable pour les entreprises engagées dans la transformation digitale. L’État français positionne le big data parmi ses 34 Plans pour la nouvelle France industrielle et table sur la création de 10 000 emplois directs d’ici 2020.

VERS DE NOUVEAUX MÉTIERS
Le big data appelle de nouveaux profils sur le marché de l’emploi, dotés de compétences techniques permettant d’imaginer des algorithmes et systèmes de gestion des données, afin d’en maîtriser les volumes, la vitesse et la
variabilité. Ces profils doivent aussi anticiper les nouveaux services et usages, et prendre en compte les aspects juridiques relatifs aux données personnelles.

Objectif

Savoir anticiper les nouveaux services et usages tout en prenant en compte les aspects juriques relatifs à la collecte, au stockage et à l'explotation des données personnelles.

contenu

Le programme s'appuie sur de nombreuses études de cas et des retours d’expérience, avec 4 périodes de formation sur 9 mois suivies d'un stage de 4 à 6 mois. Un projet professionnel Fil Rouge et des séminaires thématiques complètent le cursus.

Période 1
Systèmes répartis pour le Big Data, Statistique, Bases de données, Algorithmes distribués pour les grandes bases de données, Hadoop, Kit Data Science

Période 2
Machine Learning, NoSQL-NewSQL, Économie de l’Internet et Droit des données personnelles, Projet « Fil rouge »

Période 3
Sécurité informatique pour le Big Data, Économétrie pour le Big Data, Machine Learning avancé, Projet « Fil rouge »

Période 4
Données du web, Visualisation d’informations, l’Écosystème Big Data, Projet « Fil rouge »

Projet « Fil rouge »
Ce projet place un groupe d’étudiants en situation professionnelle pour mettre en pratique les connaissances acquises. Les projets sont proposés par de grandes entreprises comme EDF, GRDF, Capgemini, PSA Peugeot Citroën, UGC, Morpho ou des start-up comme Ownpage, ToucanToco, DCbrain, Yuzu, Kernix et portent des thématiques variées : e-réputation, recommandations de films, cartographie musicale, repérage des clients fragiles, attractivité d’un article de presse, prédiction de l’attrition (churn)… Ils portent toujours sur des données et des problématiques réelles des entreprises.

niveau requis

Titulaires d’un diplôme d’ingénieur en informatique ou en télécommunications, ou
Titulaires d’un Master 2 universitaire scientifique ou technique, en informatique ou en mathématiques appliquées, ou
Titulaires de diplômes étrangers de niveau équivalent à Bac+5, MSc ou MBA, en informatique ou mathématiques appliquées.

Un niveau d’anglais minimum est exigé : TOEIC de 700 au moins, TOEFL (Paper) de 550 au moins ou un niveau similaire d’un test équivalent.

Pré-requis
Il est fortement recommandé à tous les candidats de suivre le MOOC « Fondamentaux pour le Big Data »  et de joindre leurs résultats à leur dossier de candidature (notez que les résultats peuvent être transmis dans un second temps, après le dépôt du dossier complet).

Il est demandé aux candidats de maîtriser suffisamment les concepts ci-dessous pour être à l’aise dans leur utilisation.

- Mathématiques
Analyse : suites/séries numériques, éléments de calcul différentiel, éléments d’analyse de Fourier, d’analyse Hilbertienne
Algèbre : espaces vectoriels, applications linéaires, calcul matriciel, produits scalaires, formes quadratiques
Optimisation : multiplicateurs de Lagrange, descente de gradient
Statistique : expérience aléatoire, estimateur, risque, maximum de vraisemblance, moindres carrés, intervalles de confiance, tests statistiques
Probabilité : lois de probabilités, vecteurs aléatoires, loi/espérance conditionnelle, loi des grands nombres, théorème de la limite centrale, chaînes de Markov

- Informatique
Programmation en Java
Concepts de base : comment définir une variable, structures de contrôle : boucles for, for each, while
Classes et objets : comment définir une classe, les attributs, les méthodes ; concepts de public, private, protected ; différence entre une variable ou méthode static ou normale (non-static) ; l’héritage : comment étendre une classe (extends) ; les interfaces : comment définir une interface et l’implémenter dans une classe ; le polymorphisme : comment surcharger une méthode, comprendre comment marchent les méthodes surchargées
Bases de la bibliothèque standard de Java : collections (ArrayList, HashMap, HashSet, etc.) ; comment insérer un item dans une liste, supprimer un item au début, à la fin, ou au milieu ; quand utiliser les collections (par exemple, ArrayList versus LinkedList).
Comment prendre une description mathématique ou textuelle d’un algorithme et l’implémenter.
Programmation en Python
Maîtriser les concepts équivalents à ceux de Java ci-dessus (sauf public, private, protected et les interfaces)
Unix/Linux
Maîtriser les commandes de base

admission

Le dépôt des candidatures se fait uniquement en ligne.
Votre dossier doit faire apparaître une vraie maîtrise de la programmation et des mathématiques présentées dans le MOOC. S’il est retenu, vous serez sollicité pour un entretien téléphonique. Si ce dernier est concluant, votre dossier sera étudié en jury.
Quatre jurys sont organisés tout au long de l’année, les dates limites de candidature sont indiquées en encadré. Il est conseillé de postuler aussi tôt que possible, notamment pour les étudiants étrangers et pour ceux ayant fait une demande de Fongécif. Les candidats sont informés de la réponse du jury de manière individualisée par mail. En cas d’admission, vous disposez pendant 10 jours d’une priorité d’inscription qui vous garantit une place.

Mode d'emploi de l'admission(770 Ko)
Demande d'admission en ligne

vie étudiante

 

informations pratiques

Responsables du mastère
Stéphan Clémençon
James Eagan
Ons Jelassi Ben Atallah

Modalités d'inscription et dates
Frais de dossier 115 €
Admission, dates limites, tarifs

commentaires complémentaires

Informations complémentaires

compétences acquises

Un professionnel du big data dispose de compétences techniques pointues : collecte, représentation, modélisation, analyse et traitement des données, intégration des contraintes de stockage distribué. Des connaissances  transversales sont également indispensables pour contribuer à la création de valeur et développer une vision d’ensemble stratégique. La sécurité et de la protection des données personnelles requièrent enfin une attention sur les aspects juridiques et les risques informatiques.

métiers

Data scientist
Architecte de système d’information big data
Chief data officer
Expert en data visualisation

atouts

- Rejoignez le secteur le plus stratégique de l’économie numérique
- Appréhendez les challenges économiques et juridiques du Big Data
- Mesurez l’impact de l’utilisation des algorithmes de Machine Learning
- Accompagnez votre entreprise dans les changements liés à l’exploitation de ses données

La notoriété du Mastère Spécialisé® Big Data de Télécom ParisTech est forte aussi bien auprès des grands groupes internationaux que des start-ups. Les étudiants reçoivent généralement plusieurs propositions de stage ou d’embauche au cours de leur formation.

Une dizaine d’entreprises (Thales, Safran, Airbus, Orange…) sont membres du comité de perfectionnement du Mastère Spécialisé® Big Data, ce qui permet que ses contenus restent toujours en adéquation avec les besoins des entreprises.

débouchés

Les professionnels de la donnée accèdent à des postes de data scientist, architecte de système d’information big data, chief data officer ou encore d’expert en data visualisation. Presque tous les secteurs d’activité sont désormais à la recherche de leurs compétences : finance, industrie, grande distribution, transports, assurance, santé, énergie, agriculture... et nombreux sont les métiers encore à inventer.

Parcours

Unités d'enseignement

UE Type d'enseignement Domaines Catégorie d'UE Volume horaire Responsables Site pédagogique
AMPHI Amphi Ateliers Présentations BGD Enseignement scientifique & technique Ons JELASSI
IGR204 Visualisation Enseignement scientifique & technique Image-Données-Signal 24 James EAGAN
INF332 Programmation Java Enseignement scientifique & technique 8 Ons JELASSI
INF344 Données du Web Enseignement scientifique & technique Informatique 60 Fabian SUCHANEK
INF720 Langage C et programmation Système Unix Enseignement scientifique & technique Informatique 20 Sylvie VIGNES,
Eric LECOLINET
INF725 INF725 , Bases de données (spécifiques pour les MS) Enseignement scientifique & technique Informatique 20 Talel ABDESSALEM
INF726 Sécurité pour le Big Data Enseignement scientifique & technique Informatique 20 Ons JELASSI
INF727 Systèmes Répartis pour le Big Data Enseignement scientifique & technique Informatique 16 Remi SHARROCK
INF728 Bases de données non relationnelles Enseignement scientifique & technique Informatique 20 Ons JELASSI
INF729 Introduction au framework HADOOP Enseignement scientifique & technique 20 Ons JELASSI
INF730 Internet des objets BGD Enseignement scientifique & technique 16 Ons JELASSI
INF731 Mise en pratique Données du Web Enseignement scientifique & technique 8 Fabian SUCHANEK
INFMDI721 Kit Big Data Enseignement scientifique & technique Informatique 20 Stephan CLEMENÇON,
Ons JELASSI
INFMDI722 Séminaires Enseignement scientifique & technique Informatique 40 Stephan CLEMENÇON
INFMDI732 Mise en pratique Machine Learning Avancé Enseignement scientifique & technique 8 Stephan CLEMENÇON
INFMDI780 Projet Big Data Enseignement scientifique & technique Mathématiques 20 Stephan CLEMENÇON
MDI341 Machine learning avancé Enseignement scientifique & technique Mathématiques 40 Stephan CLEMENÇON,
Joseph SALMON,
Florence D'ALCHE
MDI343 Apprentissage statistique et fouille de donnees Enseignement scientifique & technique Mathématiques 40 Stephan CLEMENÇON,
Joseph SALMON,
Florence D'ALCHE
MDI721 Mise en pratiques Statistiques Enseignement scientifique & technique Joseph SALMON
MDI724 Mise en pratique Apprentissage statistique Enseignement scientifique & technique 20 Stephan CLEMENÇON
SD701 Exploration de grands volumes de données Enseignement scientifique & technique 16 Stephan CLEMENÇON
SES720 Economie de l'Internet et des données personnelles Enseignement scientifique & technique Sciences économiques et sociales 20 Patrick WAELBROECK
SES721 L'écosystème du Big Data Enseignement scientifique & technique Sciences économiques et sociales 20 Patrick WAELBROECK
SES722 Econométrie pour le Big Data Enseignement scientifique & technique Sciences économiques et sociales Patrick WAELBROECK
THESEPRO Thèse professionnelle Stages et mission entreprise
Veuillez patienter