Big data et machine learning : les concepts et les outils de la data science

4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entrepr...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Lemberger Pirmin (Auteur), Batty Marc (Auteur), Morel Médéric (Auteur), Raffaëlli Jean-Luc (Auteur)
Autres auteurs : Géron Aurélien (Préfacier)
Format : Livre
Langue : français
Titre complet : Big data et machine learning : les concepts et les outils de la data science / Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]; préface d'Aurélien Géron
Édition : 2e édition
Publié : Malakoff : Dunod , DL 2016
Description matérielle : 1 vol. (XVI-255 p.)
Collection : InfoPro. Management des systèmes d'information
Sujets :
  • P. III
  • Préface
  • P. XV
  • Avant-propos
  • Première partie - Les fondements du Big Data
  • P. 3
  • Chapitre 1 - Les origines du Big Data
  • P. 3
  • 1.1 La perception de la donnée dans le grand public
  • P. 5
  • 1.2 Des causes économiques et technologiques
  • P. 8
  • 1.3 La donnée et l'information
  • P. 9
  • 1.4 La valeur
  • P. 10
  • 1.5 Les ressources nécessaires
  • P. 11
  • 1.6 De grandes opportunités
  • P. 13
  • Chapitre 2 - Le Big Data dans les organisations
  • P. 13
  • 2.1 La recherche de l'Eldorado
  • P. 14
  • 2.2 L'avancée par le cloud
  • P. 15
  • 2.3 La création de la valeur
  • P. 15
  • 2.4 Les 3V du Big Data
  • P. 17
  • 2.5 Un champ immense d'applications
  • P. 19
  • 2.6 Exemples de compétences à acquérir
  • P. 22
  • 2.7 Des impacts à tous les niveaux
  • P. 26
  • 2.8 B comme Big Data ou Big Brother ?
  • P. 29
  • Chapitre 3 - Le mouvement NoSQL
  • P. 29
  • 3.1 Bases relationnelles, les raisons d'une domination
  • P. 34
  • 3.2 Le dogme remis en question
  • P. 40
  • 3.3 Les différentes catégories de solutions
  • P. 50
  • 3.4 Le NoSQL est-il l'avenir des bases de données ?
  • P. 53
  • Chapitre 4 - L'algorithme MapReduce et le framework Hadoop
  • P. 53
  • 4.1 Automatiser le calcul parallèle
  • P. 54
  • 4.2 Le pattern MapReduce
  • P. 58
  • 4.3 Des exemples d'usage de MapReduce
  • P. 63
  • 4.4 Le framework Hadoop
  • P. 68
  • 4.5 Au-delà de MapReduce
  • Deuxième partie - Le métier de data scientist
  • P. 73
  • Chapitre 5 - Le quotidien du data scientist
  • P. 73
  • 5.1 Data scientist : licorne ou réalité ?
  • P. 80
  • 5.2 Le data scientist dans l'organisation
  • P. 82
  • 5.3 Le workflow du data scientist
  • P. 91
  • Chapitre 6 - Exploitation et préparation de données
  • P. 91
  • 6.1 Le déluge des données
  • P. 96
  • 6.2 L'exploitation de données
  • P. 101
  • 6.3 La préparation de données
  • P. 106
  • 6.4 Les outils de préparation de données
  • P. 109
  • Chapitre 7 - Le Machine Learning
  • P. 109
  • 7.1 Qu'est-ce que Le Machine Learning ?
  • P. 119
  • 7.2 Les différents types de Machine Learning
  • P. 122
  • 7.3 Les principaux algorithmes
  • P. 136
  • 7.4 Réseaux de neurones et Deep Learning
  • P. 152
  • 7.5 Illustrations numériques
  • P. 163
  • 7.6 Systèmes de recommandation
  • P. 173
  • Chapitre 8 - La visualisation des données
  • P. 173
  • 8.1 Pourquoi visualiser l'information ?
  • P. 177
  • 8.2 Quels graphes pour quels usages ?
  • P. 184
  • 8.3 Représentation de donnée complexes
  • Troisième partie - Les outils du Big Data
  • P. 193
  • Chapitre 9 - L'écosystème Hadoop
  • P. 194
  • 9.1 La jungle de l'éléphant
  • P. 196
  • 9.2 Les composants d'Apache Hadoop
  • P. 203
  • 9.3 Les principales distributions Hadoop
  • P. 206
  • 9.4 Spark ou la promesse du traitement Big Data in-memory
  • P. 212
  • 9.5 Les briques analytiques à venir
  • P. 214
  • 9.6 Les librairies de calcul
  • P. 219
  • Chapitre 10 - Analyse de logs avec Pig et Hive
  • P. 219
  • 10.1 Pourquoi analyser des logs ?
  • P. 220
  • 10.2 Pourquoi choisir Pig ou Hive ?
  • P. 221
  • 10.3 La préparation des données
  • P. 226
  • 10.4 L'analyse des parcours clients
  • P. 229
  • Chapitre 11 - Les architectures gamma
  • P. 229
  • 11.1 Les enjeux du temps réel
  • P. 231
  • 11.2 Rappels sur MapReduce et Hadoop
  • P. 231
  • 11.3 Les architectures gamma
  • P. 239
  • Chapitre 12 - Apache Storm
  • P. 239
  • 12.1 Qu'est-ce que Storm ?
  • P. 240
  • 12.2 Positionnement et intérêt dans les architectures gamma
  • P. 241
  • 12.3 Principes de fonctionnement
  • P. 244
  • 12.4 Un exemple très simple
  • P. 247
  • Conclusion
  • P. 251
  • Index