Table des matières: Big data et machine learning

Big data et machine learning : les concepts et les outils de la data science

4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entrepr...

Description complète

Enregistré dans:

Détails bibliographiques
Auteurs principaux :	Lemberger Pirmin (Auteur), Batty Marc (Auteur), Morel Médéric (Auteur), Raffaëlli Jean-Luc (Auteur)
Autres auteurs :	Géron Aurélien (Préfacier)
Format :	Livre
Langue :	français
Titre complet :	Big data et machine learning : les concepts et les outils de la data science / Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]; préface d'Aurélien Géron
Édition :	2e édition
Publié :	Malakoff : Dunod , DL 2016
Description matérielle :	1 vol. (XVI-255 p.)
Collection :	InfoPro. Management des systèmes d'information
Sujets :	Données massives Apprentissage automatique Exploration de données

P. III
Préface
P. XV
Avant-propos
Première partie - Les fondements du Big Data
P. 3
Chapitre 1 - Les origines du Big Data
P. 3
1.1 La perception de la donnée dans le grand public
P. 5
1.2 Des causes économiques et technologiques
P. 8
1.3 La donnée et l'information
P. 9
1.4 La valeur
P. 10
1.5 Les ressources nécessaires
P. 11
1.6 De grandes opportunités
P. 13
Chapitre 2 - Le Big Data dans les organisations
P. 13
2.1 La recherche de l'Eldorado
P. 14
2.2 L'avancée par le cloud
P. 15
2.3 La création de la valeur
P. 15
2.4 Les 3V du Big Data
P. 17
2.5 Un champ immense d'applications
P. 19
2.6 Exemples de compétences à acquérir
P. 22
2.7 Des impacts à tous les niveaux
P. 26
2.8 B comme Big Data ou Big Brother ?
P. 29
Chapitre 3 - Le mouvement NoSQL
P. 29
3.1 Bases relationnelles, les raisons d'une domination
P. 34
3.2 Le dogme remis en question
P. 40
3.3 Les différentes catégories de solutions
P. 50
3.4 Le NoSQL est-il l'avenir des bases de données ?
P. 53
Chapitre 4 - L'algorithme MapReduce et le framework Hadoop
P. 53
4.1 Automatiser le calcul parallèle
P. 54
4.2 Le pattern MapReduce
P. 58
4.3 Des exemples d'usage de MapReduce
P. 63
4.4 Le framework Hadoop
P. 68
4.5 Au-delà de MapReduce
Deuxième partie - Le métier de data scientist
P. 73
Chapitre 5 - Le quotidien du data scientist
P. 73
5.1 Data scientist : licorne ou réalité ?
P. 80
5.2 Le data scientist dans l'organisation
P. 82
5.3 Le workflow du data scientist
P. 91
Chapitre 6 - Exploitation et préparation de données
P. 91
6.1 Le déluge des données
P. 96
6.2 L'exploitation de données
P. 101
6.3 La préparation de données
P. 106
6.4 Les outils de préparation de données
P. 109
Chapitre 7 - Le Machine Learning
P. 109
7.1 Qu'est-ce que Le Machine Learning ?
P. 119
7.2 Les différents types de Machine Learning
P. 122
7.3 Les principaux algorithmes
P. 136
7.4 Réseaux de neurones et Deep Learning
P. 152
7.5 Illustrations numériques
P. 163
7.6 Systèmes de recommandation
P. 173
Chapitre 8 - La visualisation des données
P. 173
8.1 Pourquoi visualiser l'information ?
P. 177
8.2 Quels graphes pour quels usages ?
P. 184
8.3 Représentation de donnée complexes
Troisième partie - Les outils du Big Data
P. 193
Chapitre 9 - L'écosystème Hadoop
P. 194
9.1 La jungle de l'éléphant
P. 196
9.2 Les composants d'Apache Hadoop
P. 203
9.3 Les principales distributions Hadoop
P. 206
9.4 Spark ou la promesse du traitement Big Data in-memory
P. 212
9.5 Les briques analytiques à venir
P. 214
9.6 Les librairies de calcul
P. 219
Chapitre 10 - Analyse de logs avec Pig et Hive
P. 219
10.1 Pourquoi analyser des logs ?
P. 220
10.2 Pourquoi choisir Pig ou Hive ?
P. 221
10.3 La préparation des données
P. 226
10.4 L'analyse des parcours clients
P. 229
Chapitre 11 - Les architectures gamma
P. 229
11.1 Les enjeux du temps réel
P. 231
11.2 Rappels sur MapReduce et Hadoop
P. 231
11.3 Les architectures gamma
P. 239
Chapitre 12 - Apache Storm
P. 239
12.1 Qu'est-ce que Storm ?
P. 240
12.2 Positionnement et intérêt dans les architectures gamma
P. 241
12.3 Principes de fonctionnement
P. 244
12.4 Un exemple très simple
P. 247
Conclusion
P. 251
Index

Big data et machine learning : les concepts et les outils de la data science

Documents similaires