Big data et machine learning : les concepts et les outils de la data science
4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entrepr...
Enregistré dans:
Auteurs principaux : | , , , |
---|---|
Autres auteurs : | |
Format : | Livre |
Langue : | français |
Titre complet : | Big data et machine learning : les concepts et les outils de la data science / Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]; préface d'Aurélien Géron |
Édition : | 2e édition |
Publié : |
Malakoff :
Dunod
, DL 2016 |
Description matérielle : | 1 vol. (XVI-255 p.) |
Collection : | InfoPro. Management des systèmes d'information |
Sujets : |
- P. III
- Préface
- P. XV
- Avant-propos
- Première partie - Les fondements du Big Data
- P. 3
- Chapitre 1 - Les origines du Big Data
- P. 3
- 1.1 La perception de la donnée dans le grand public
- P. 5
- 1.2 Des causes économiques et technologiques
- P. 8
- 1.3 La donnée et l'information
- P. 9
- 1.4 La valeur
- P. 10
- 1.5 Les ressources nécessaires
- P. 11
- 1.6 De grandes opportunités
- P. 13
- Chapitre 2 - Le Big Data dans les organisations
- P. 13
- 2.1 La recherche de l'Eldorado
- P. 14
- 2.2 L'avancée par le cloud
- P. 15
- 2.3 La création de la valeur
- P. 15
- 2.4 Les 3V du Big Data
- P. 17
- 2.5 Un champ immense d'applications
- P. 19
- 2.6 Exemples de compétences à acquérir
- P. 22
- 2.7 Des impacts à tous les niveaux
- P. 26
- 2.8 B comme Big Data ou Big Brother ?
- P. 29
- Chapitre 3 - Le mouvement NoSQL
- P. 29
- 3.1 Bases relationnelles, les raisons d'une domination
- P. 34
- 3.2 Le dogme remis en question
- P. 40
- 3.3 Les différentes catégories de solutions
- P. 50
- 3.4 Le NoSQL est-il l'avenir des bases de données ?
- P. 53
- Chapitre 4 - L'algorithme MapReduce et le framework Hadoop
- P. 53
- 4.1 Automatiser le calcul parallèle
- P. 54
- 4.2 Le pattern MapReduce
- P. 58
- 4.3 Des exemples d'usage de MapReduce
- P. 63
- 4.4 Le framework Hadoop
- P. 68
- 4.5 Au-delà de MapReduce
- Deuxième partie - Le métier de data scientist
- P. 73
- Chapitre 5 - Le quotidien du data scientist
- P. 73
- 5.1 Data scientist : licorne ou réalité ?
- P. 80
- 5.2 Le data scientist dans l'organisation
- P. 82
- 5.3 Le workflow du data scientist
- P. 91
- Chapitre 6 - Exploitation et préparation de données
- P. 91
- 6.1 Le déluge des données
- P. 96
- 6.2 L'exploitation de données
- P. 101
- 6.3 La préparation de données
- P. 106
- 6.4 Les outils de préparation de données
- P. 109
- Chapitre 7 - Le Machine Learning
- P. 109
- 7.1 Qu'est-ce que Le Machine Learning ?
- P. 119
- 7.2 Les différents types de Machine Learning
- P. 122
- 7.3 Les principaux algorithmes
- P. 136
- 7.4 Réseaux de neurones et Deep Learning
- P. 152
- 7.5 Illustrations numériques
- P. 163
- 7.6 Systèmes de recommandation
- P. 173
- Chapitre 8 - La visualisation des données
- P. 173
- 8.1 Pourquoi visualiser l'information ?
- P. 177
- 8.2 Quels graphes pour quels usages ?
- P. 184
- 8.3 Représentation de donnée complexes
- Troisième partie - Les outils du Big Data
- P. 193
- Chapitre 9 - L'écosystème Hadoop
- P. 194
- 9.1 La jungle de l'éléphant
- P. 196
- 9.2 Les composants d'Apache Hadoop
- P. 203
- 9.3 Les principales distributions Hadoop
- P. 206
- 9.4 Spark ou la promesse du traitement Big Data in-memory
- P. 212
- 9.5 Les briques analytiques à venir
- P. 214
- 9.6 Les librairies de calcul
- P. 219
- Chapitre 10 - Analyse de logs avec Pig et Hive
- P. 219
- 10.1 Pourquoi analyser des logs ?
- P. 220
- 10.2 Pourquoi choisir Pig ou Hive ?
- P. 221
- 10.3 La préparation des données
- P. 226
- 10.4 L'analyse des parcours clients
- P. 229
- Chapitre 11 - Les architectures gamma
- P. 229
- 11.1 Les enjeux du temps réel
- P. 231
- 11.2 Rappels sur MapReduce et Hadoop
- P. 231
- 11.3 Les architectures gamma
- P. 239
- Chapitre 12 - Apache Storm
- P. 239
- 12.1 Qu'est-ce que Storm ?
- P. 240
- 12.2 Positionnement et intérêt dans les architectures gamma
- P. 241
- 12.3 Principes de fonctionnement
- P. 244
- 12.4 Un exemple très simple
- P. 247
- Conclusion
- P. 251
- Index