Big data et machine learning : les concepts et les outils de la data science

4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entrepr...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Lemberger Pirmin (Auteur), Batty Marc (Auteur), Morel Médéric (Auteur), Raffaëlli Jean-Luc (Auteur)
Autres auteurs : Géron Aurélien (Préfacier)
Format : Livre
Langue : français
Titre complet : Big data et machine learning : les concepts et les outils de la data science / Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]; préface d'Aurélien Géron
Édition : 2e édition
Publié : Malakoff : Dunod , DL 2016
Description matérielle : 1 vol. (XVI-255 p.)
Collection : InfoPro. Management des systèmes d'information
Sujets :
LEADER 06184cam a2200553 4500
001 PPN195624653
003 http://www.sudoc.fr/195624653
005 20240531112500.0
010 |a 978-2-10-075463-2  |b br.  |d 29,90 EUR 
035 |a (OCoLC)960196724 
073 1 |a 9782100754632 
100 |a 20161010h20162016k y0frey0103 ba 
101 0 |a fre 
102 |a FR 
105 |a a z 001yy 
106 |a r 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c n  |2 rdamedia 
182 1 |6 z01  |a n 
183 1 |6 z01  |a nga  |2 rdacarrier 
200 1 |a Big data et machine learning  |e les concepts et les outils de la data science  |f Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]  |g préface d'Aurélien Géron 
205 |a 2e édition 
210 |a Malakoff  |c Dunod  |d DL 2016 
215 |a 1 vol. (XVI-255 p.)  |c ill., couv. ill. en coul.  |d 25 cm 
225 2 |a InfoPro  |i Management des systèmes d'information 
314 |a Autre contribution : Jean-Luc Raffaëlli (auteur) 
320 |a Notes bibliogr. et webogr. Index 
330 |a 4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d un data lab... Cette deuxième édition est complétée et enrichie par des mises à jour sur les réseaux de neurones et sur le Deep Learning ainsi que sur Spark." 
359 2 |p P. III  |b Préface  |p P. XV  |b Avant-propos  |b Première partie - Les fondements du Big Data  |p P. 3  |b Chapitre 1 - Les origines du Big Data  |p P. 3  |c 1.1 La perception de la donnée dans le grand public  |p P. 5  |c 1.2 Des causes économiques et technologiques  |p P. 8  |c 1.3 La donnée et l'information  |p P. 9  |c 1.4 La valeur  |p P. 10  |c 1.5 Les ressources nécessaires  |p P. 11  |c 1.6 De grandes opportunités  |p P. 13  |b Chapitre 2 - Le Big Data dans les organisations  |p P. 13  |c 2.1 La recherche de l'Eldorado  |p P. 14  |c 2.2 L'avancée par le cloud  |p P. 15  |c 2.3 La création de la valeur  |p P. 15  |c 2.4 Les 3V du Big Data  |p P. 17  |c 2.5 Un champ immense d'applications  |p P. 19  |c 2.6 Exemples de compétences à acquérir  |p P. 22  |c 2.7 Des impacts à tous les niveaux  |p P. 26  |c 2.8 B comme Big Data ou Big Brother ?  |p P. 29  |b Chapitre 3 - Le mouvement NoSQL  |p P. 29  |c 3.1 Bases relationnelles, les raisons d'une domination  |p P. 34  |c 3.2 Le dogme remis en question  |p P. 40  |c 3.3 Les différentes catégories de solutions  |p P. 50  |c 3.4 Le NoSQL est-il l'avenir des bases de données ?  |p P. 53  |b Chapitre 4 - L'algorithme MapReduce et le framework Hadoop  |p P. 53  |c 4.1 Automatiser le calcul parallèle  |p P. 54  |c 4.2 Le pattern MapReduce  |p P. 58  |c 4.3 Des exemples d'usage de MapReduce  |p P. 63  |c 4.4 Le framework Hadoop  |p P. 68  |c 4.5 Au-delà de MapReduce  |b Deuxième partie - Le métier de data scientist  |p P. 73  |b Chapitre 5 - Le quotidien du data scientist  |p P. 73  |c 5.1 Data scientist : licorne ou réalité ?  |p P. 80  |c 5.2 Le data scientist dans l'organisation  |p P. 82  |c 5.3 Le workflow du data scientist  |p P. 91  |b Chapitre 6 - Exploitation et préparation de données  |p P. 91  |c 6.1 Le déluge des données  |p P. 96  |c 6.2 L'exploitation de données  |p P. 101  |c 6.3 La préparation de données  |p P. 106  |c 6.4 Les outils de préparation de données  |p P. 109  |b Chapitre 7 - Le Machine Learning  |p P. 109  |c 7.1 Qu'est-ce que Le Machine Learning ?  |p P. 119  |c 7.2 Les différents types de Machine Learning  |p P. 122  |c 7.3 Les principaux algorithmes  |p P. 136  |c 7.4 Réseaux de neurones et Deep Learning  |p P. 152  |c 7.5 Illustrations numériques  |p P. 163  |c 7.6 Systèmes de recommandation  |p P. 173  |b Chapitre 8 - La visualisation des données  |p P. 173  |c 8.1 Pourquoi visualiser l'information ?  |p P. 177  |c 8.2 Quels graphes pour quels usages ?  |p P. 184  |c 8.3 Représentation de donnée complexes  |b Troisième partie - Les outils du Big Data  |p P. 193  |b Chapitre 9 - L'écosystème Hadoop  |p P. 194  |c 9.1 La jungle de l'éléphant  |p P. 196  |c 9.2 Les composants d'Apache Hadoop  |p P. 203  |c 9.3 Les principales distributions Hadoop  |p P. 206  |c 9.4 Spark ou la promesse du traitement Big Data in-memory  |p P. 212  |c 9.5 Les briques analytiques à venir  |p P. 214  |c 9.6 Les librairies de calcul  |p P. 219  |b Chapitre 10 - Analyse de logs avec Pig et Hive  |p P. 219  |c 10.1 Pourquoi analyser des logs ?  |p P. 220  |c 10.2 Pourquoi choisir Pig ou Hive ?  |p P. 221  |c 10.3 La préparation des données  |p P. 226  |c 10.4 L'analyse des parcours clients  |p P. 229  |b Chapitre 11 - Les architectures gamma  |p P. 229  |c 11.1 Les enjeux du temps réel  |p P. 231  |c 11.2 Rappels sur MapReduce et Hadoop  |p P. 231  |c 11.3 Les architectures gamma  |p P. 239  |b Chapitre 12 - Apache Storm  |p P. 239  |c 12.1 Qu'est-ce que Storm ?  |p P. 240  |c 12.2 Positionnement et intérêt dans les architectures gamma  |p P. 241  |c 12.3 Principes de fonctionnement  |p P. 244  |c 12.4 Un exemple très simple  |p P. 247  |b Conclusion  |p P. 251  |b Index 
410 | |0 087550156  |t InfoPro. Management des systèmes d'information  |x 1773-5483 
606 |3 PPN167193686  |a Données massives  |2 rameau 
606 |3 PPN027940373  |a Apprentissage automatique  |2 rameau 
606 |3 PPN035198222  |a Exploration de données  |2 rameau 
676 |a 006.31  |v 22  |z fre 
676 |a 658.05 
676 |a 658.403 8  |v 23 
680 |a Q325.5 
680 |a QA76.9.D3 
700 1 |3 PPN169069400  |a Lemberger  |b Pirmin  |4 070 
701 1 |3 PPN184212413  |a Batty  |b Marc  |4 070 
701 1 |3 PPN117949280  |a Morel  |b Médéric  |4 070 
701 1 |3 PPN184212510  |a Raffaëlli  |b Jean-Luc  |4 070 
702 1 |3 PPN050363468  |a Géron  |b Aurélien  |4 080 
801 3 |a FR  |b Abes  |c 20170710  |g AFNOR 
979 |a ROC 
930 |5 441092306:569366690  |b 441092306  |a 681.3 BIG D02  |j u 
930 |5 851912101:586519920  |b 851912101  |j u 
998 |a 764540