Big data et machine learning : les concepts et les outils de la data science
4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entrepr...
Enregistré dans:
Auteurs principaux : | , , , |
---|---|
Autres auteurs : | |
Format : | Livre |
Langue : | français |
Titre complet : | Big data et machine learning : les concepts et les outils de la data science / Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]; préface d'Aurélien Géron |
Édition : | 2e édition |
Publié : |
Malakoff :
Dunod
, DL 2016 |
Description matérielle : | 1 vol. (XVI-255 p.) |
Collection : | InfoPro. Management des systèmes d'information |
Sujets : |
LEADER | 06184cam a2200553 4500 | ||
---|---|---|---|
001 | PPN195624653 | ||
003 | http://www.sudoc.fr/195624653 | ||
005 | 20240531112500.0 | ||
010 | |a 978-2-10-075463-2 |b br. |d 29,90 EUR | ||
035 | |a (OCoLC)960196724 | ||
073 | 1 | |a 9782100754632 | |
100 | |a 20161010h20162016k y0frey0103 ba | ||
101 | 0 | |a fre | |
102 | |a FR | ||
105 | |a a z 001yy | ||
106 | |a r | ||
181 | |6 z01 |c txt |2 rdacontent | ||
181 | 1 | |6 z01 |a i# |b xxxe## | |
182 | |6 z01 |c n |2 rdamedia | ||
182 | 1 | |6 z01 |a n | |
183 | 1 | |6 z01 |a nga |2 rdacarrier | |
200 | 1 | |a Big data et machine learning |e les concepts et les outils de la data science |f Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.] |g préface d'Aurélien Géron | |
205 | |a 2e édition | ||
210 | |a Malakoff |c Dunod |d DL 2016 | ||
215 | |a 1 vol. (XVI-255 p.) |c ill., couv. ill. en coul. |d 25 cm | ||
225 | 2 | |a InfoPro |i Management des systèmes d'information | |
314 | |a Autre contribution : Jean-Luc Raffaëlli (auteur) | ||
320 | |a Notes bibliogr. et webogr. Index | ||
330 | |a 4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d un data lab... Cette deuxième édition est complétée et enrichie par des mises à jour sur les réseaux de neurones et sur le Deep Learning ainsi que sur Spark." | ||
359 | 2 | |p P. III |b Préface |p P. XV |b Avant-propos |b Première partie - Les fondements du Big Data |p P. 3 |b Chapitre 1 - Les origines du Big Data |p P. 3 |c 1.1 La perception de la donnée dans le grand public |p P. 5 |c 1.2 Des causes économiques et technologiques |p P. 8 |c 1.3 La donnée et l'information |p P. 9 |c 1.4 La valeur |p P. 10 |c 1.5 Les ressources nécessaires |p P. 11 |c 1.6 De grandes opportunités |p P. 13 |b Chapitre 2 - Le Big Data dans les organisations |p P. 13 |c 2.1 La recherche de l'Eldorado |p P. 14 |c 2.2 L'avancée par le cloud |p P. 15 |c 2.3 La création de la valeur |p P. 15 |c 2.4 Les 3V du Big Data |p P. 17 |c 2.5 Un champ immense d'applications |p P. 19 |c 2.6 Exemples de compétences à acquérir |p P. 22 |c 2.7 Des impacts à tous les niveaux |p P. 26 |c 2.8 B comme Big Data ou Big Brother ? |p P. 29 |b Chapitre 3 - Le mouvement NoSQL |p P. 29 |c 3.1 Bases relationnelles, les raisons d'une domination |p P. 34 |c 3.2 Le dogme remis en question |p P. 40 |c 3.3 Les différentes catégories de solutions |p P. 50 |c 3.4 Le NoSQL est-il l'avenir des bases de données ? |p P. 53 |b Chapitre 4 - L'algorithme MapReduce et le framework Hadoop |p P. 53 |c 4.1 Automatiser le calcul parallèle |p P. 54 |c 4.2 Le pattern MapReduce |p P. 58 |c 4.3 Des exemples d'usage de MapReduce |p P. 63 |c 4.4 Le framework Hadoop |p P. 68 |c 4.5 Au-delà de MapReduce |b Deuxième partie - Le métier de data scientist |p P. 73 |b Chapitre 5 - Le quotidien du data scientist |p P. 73 |c 5.1 Data scientist : licorne ou réalité ? |p P. 80 |c 5.2 Le data scientist dans l'organisation |p P. 82 |c 5.3 Le workflow du data scientist |p P. 91 |b Chapitre 6 - Exploitation et préparation de données |p P. 91 |c 6.1 Le déluge des données |p P. 96 |c 6.2 L'exploitation de données |p P. 101 |c 6.3 La préparation de données |p P. 106 |c 6.4 Les outils de préparation de données |p P. 109 |b Chapitre 7 - Le Machine Learning |p P. 109 |c 7.1 Qu'est-ce que Le Machine Learning ? |p P. 119 |c 7.2 Les différents types de Machine Learning |p P. 122 |c 7.3 Les principaux algorithmes |p P. 136 |c 7.4 Réseaux de neurones et Deep Learning |p P. 152 |c 7.5 Illustrations numériques |p P. 163 |c 7.6 Systèmes de recommandation |p P. 173 |b Chapitre 8 - La visualisation des données |p P. 173 |c 8.1 Pourquoi visualiser l'information ? |p P. 177 |c 8.2 Quels graphes pour quels usages ? |p P. 184 |c 8.3 Représentation de donnée complexes |b Troisième partie - Les outils du Big Data |p P. 193 |b Chapitre 9 - L'écosystème Hadoop |p P. 194 |c 9.1 La jungle de l'éléphant |p P. 196 |c 9.2 Les composants d'Apache Hadoop |p P. 203 |c 9.3 Les principales distributions Hadoop |p P. 206 |c 9.4 Spark ou la promesse du traitement Big Data in-memory |p P. 212 |c 9.5 Les briques analytiques à venir |p P. 214 |c 9.6 Les librairies de calcul |p P. 219 |b Chapitre 10 - Analyse de logs avec Pig et Hive |p P. 219 |c 10.1 Pourquoi analyser des logs ? |p P. 220 |c 10.2 Pourquoi choisir Pig ou Hive ? |p P. 221 |c 10.3 La préparation des données |p P. 226 |c 10.4 L'analyse des parcours clients |p P. 229 |b Chapitre 11 - Les architectures gamma |p P. 229 |c 11.1 Les enjeux du temps réel |p P. 231 |c 11.2 Rappels sur MapReduce et Hadoop |p P. 231 |c 11.3 Les architectures gamma |p P. 239 |b Chapitre 12 - Apache Storm |p P. 239 |c 12.1 Qu'est-ce que Storm ? |p P. 240 |c 12.2 Positionnement et intérêt dans les architectures gamma |p P. 241 |c 12.3 Principes de fonctionnement |p P. 244 |c 12.4 Un exemple très simple |p P. 247 |b Conclusion |p P. 251 |b Index | |
410 | | | |0 087550156 |t InfoPro. Management des systèmes d'information |x 1773-5483 | |
606 | |3 PPN167193686 |a Données massives |2 rameau | ||
606 | |3 PPN027940373 |a Apprentissage automatique |2 rameau | ||
606 | |3 PPN035198222 |a Exploration de données |2 rameau | ||
676 | |a 006.31 |v 22 |z fre | ||
676 | |a 658.05 | ||
676 | |a 658.403 8 |v 23 | ||
680 | |a Q325.5 | ||
680 | |a QA76.9.D3 | ||
700 | 1 | |3 PPN169069400 |a Lemberger |b Pirmin |4 070 | |
701 | 1 | |3 PPN184212413 |a Batty |b Marc |4 070 | |
701 | 1 | |3 PPN117949280 |a Morel |b Médéric |4 070 | |
701 | 1 | |3 PPN184212510 |a Raffaëlli |b Jean-Luc |4 070 | |
702 | 1 | |3 PPN050363468 |a Géron |b Aurélien |4 080 | |
801 | 3 | |a FR |b Abes |c 20170710 |g AFNOR | |
979 | |a ROC | ||
930 | |5 441092306:569366690 |b 441092306 |a 681.3 BIG D02 |j u | ||
930 | |5 851912101:586519920 |b 851912101 |j u | ||
998 | |a 764540 |