Table des matières: Data Scientist et langage R

Data Scientist et langage R : Guide d'autoformation à l'exploitation des Big Data

Tous les experts s'accordent à dire que 90% des usages du Big Data proviennent de l'utilisation des data sciences. L'objectif de ce livre est de proposer une formation complète et opérationnelle sur les data sciences qui permet de délivrer des solutions via l'usage du langage R....

Description complète

Enregistré dans:

Détails bibliographiques
Auteur principal :	Laude Henri (Auteur)
Format :	Livre
Langue :	français
Titre complet :	Data Scientist et langage R : Guide d'autoformation à l'exploitation des Big Data / Henri Laude
Publié :	Saint-Herblain : Éditions ENI , 2016
Collection :	Epsilon (Saint-Herblain. En ligne)
Titre de l'ensemble :	Epsilon
Accès en ligne :	Accès Nantes Université
Sujets :	Données massives Apprentissage automatique Exploration de données Ordinateurs > Programmation R (logiciel) big data > machine learning
Documents associés :	Autre format: Data scientist et langage R

Chapitre 1 Introduction
P. 15
1. Data scientist, un métier à la mode
P. 16
2. Les data-sciences
P. 17
3. Le Big Data
P. 18
4. La dynamique de cet ouvrage
P. 24
5. Petit bestiaire des data-services
P. 70
6. Informatique professionnelle et data-sciences
P. 76
7. Notations
P. 81
8. À vous de jouer !
Chapitre 2 Premiers pas avec R
P. 83
1. Installation des composants
P. 90
2. Prise en main de R
P. 179
3. Manipulation des données
Chapitre 3 Maîtriser les bases
P. 215
1. Se mettre en harmonie avec les données
P. 249
2. Matrices et vecteurs
P. 279
3. Estimations
P. 302
4. Mise en pratique : apprentissage supervisé
Chapitre 4 Techniques et algorithmes incontournables
P. 325
1. Constituer sa boîte à outils
P. 326
2. Représentation graphique des données
P. 346
3. Machine learning : pratiques courantes
P. 393
4. Où en sommes-nous dans notre apprentissage ?
Chapitre 5 Cadre méthodologique du data scientist
P. 395
1. Le problème méthodologique au niveau du projet
P. 399
2. Le cycle interne des data-sciences
P. 411
3. Compléments méthodologiques
Chapitre 6 Traitement du langage naturel
P. 415
1. Positionnement du problème
P. 416
2. Analyse sémantique latente et SVD
Chapitre 7 Graphes et réseaux
P. 431
1. Introduction
P. 431
2. Premiers pas
P. 449
3. Graphes et réseaux (sociaux)
Chapitre 8 Autres problèmes, autres solutions
P. 465
1. Séries temporelles
P. 499
2. Systèmes flous
P. 509
3. Essaim (swarm)
Chapitre 9 Feature Engineering
P. 517
1. Feature Engineering, les bases
P. 541
2. PCA classique, éléments mathématiques
P. 544
3. Réduction des données (data reduction)
P. 545
4. Réduction de la dimensionnalité et entropie
Chapitre 10 Compléments utiles
P. 557
1. GAM : généralisation de LMGLM
P. 559
2. Manipulation d'images
P. 575
3. Comment créer un échantillon : LHS (hypercube latin)
P. 577
4. Travailler sur des données spatiales
P. 590
5. Savoir-faire utiles
P. 598
6. Gradients Boosting et Generalized Boosted Regression
Annexes
P. 605
1. De l'utilité de ces annexes
P. 605
2. Formulas
P. 607
3. Stratégies suivant la nature des données
P. 611
4. Filtres (sur images)
P. 614
5. Distances
P. 618
6. Astuces et petits conseils
P. 620
7. Packages et thèmes à étudier
P. 622
8. Vocabulaire et tricks of the trade
P. 626
9. Algorithmes à étudier
P. 627
10. Quelques formulations d'algèbre linéaire
P. 629
Conclusion
P. 631
Index

Data Scientist et langage R : Guide d'autoformation à l'exploitation des Big Data

Documents similaires