Data Scientist et langage R : Guide d'autoformation à l'exploitation des Big Data

Tous les experts s'accordent à dire que 90% des usages du Big Data proviennent de l'utilisation des data sciences. L'objectif de ce livre est de proposer une formation complète et opérationnelle sur les data sciences qui permet de délivrer des solutions via l'usage du langage R....

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Laude Henri (Auteur)
Format : Livre
Langue : français
Titre complet : Data Scientist et langage R : Guide d'autoformation à l'exploitation des Big Data / Henri Laude
Publié : Saint-Herblain : Éditions ENI , 2016
Collection : Epsilon (Saint-Herblain. En ligne)
Titre de l'ensemble : Epsilon
Accès en ligne : Accès Nantes Université
Sujets :
Documents associés : Autre format: Data scientist et langage R
  • Chapitre 1 Introduction
  • P. 15
  • 1. Data scientist, un métier à la mode
  • P. 16
  • 2. Les data-sciences
  • P. 17
  • 3. Le Big Data
  • P. 18
  • 4. La dynamique de cet ouvrage
  • P. 24
  • 5. Petit bestiaire des data-services
  • P. 70
  • 6. Informatique professionnelle et data-sciences
  • P. 76
  • 7. Notations
  • P. 81
  • 8. À vous de jouer !
  • Chapitre 2 Premiers pas avec R
  • P. 83
  • 1. Installation des composants
  • P. 90
  • 2. Prise en main de R
  • P. 179
  • 3. Manipulation des données
  • Chapitre 3 Maîtriser les bases
  • P. 215
  • 1. Se mettre en harmonie avec les données
  • P. 249
  • 2. Matrices et vecteurs
  • P. 279
  • 3. Estimations
  • P. 302
  • 4. Mise en pratique : apprentissage supervisé
  • Chapitre 4 Techniques et algorithmes incontournables
  • P. 325
  • 1. Constituer sa boîte à outils
  • P. 326
  • 2. Représentation graphique des données
  • P. 346
  • 3. Machine learning : pratiques courantes
  • P. 393
  • 4. Où en sommes-nous dans notre apprentissage ?
  • Chapitre 5 Cadre méthodologique du data scientist
  • P. 395
  • 1. Le problème méthodologique au niveau du projet
  • P. 399
  • 2. Le cycle interne des data-sciences
  • P. 411
  • 3. Compléments méthodologiques
  • Chapitre 6 Traitement du langage naturel
  • P. 415
  • 1. Positionnement du problème
  • P. 416
  • 2. Analyse sémantique latente et SVD
  • Chapitre 7 Graphes et réseaux
  • P. 431
  • 1. Introduction
  • P. 431
  • 2. Premiers pas
  • P. 449
  • 3. Graphes et réseaux (sociaux)
  • Chapitre 8 Autres problèmes, autres solutions
  • P. 465
  • 1. Séries temporelles
  • P. 499
  • 2. Systèmes flous
  • P. 509
  • 3. Essaim (swarm)
  • Chapitre 9 Feature Engineering
  • P. 517
  • 1. Feature Engineering, les bases
  • P. 541
  • 2. PCA classique, éléments mathématiques
  • P. 544
  • 3. Réduction des données (data reduction)
  • P. 545
  • 4. Réduction de la dimensionnalité et entropie
  • Chapitre 10 Compléments utiles
  • P. 557
  • 1. GAM : généralisation de LMGLM
  • P. 559
  • 2. Manipulation d'images
  • P. 575
  • 3. Comment créer un échantillon : LHS (hypercube latin)
  • P. 577
  • 4. Travailler sur des données spatiales
  • P. 590
  • 5. Savoir-faire utiles
  • P. 598
  • 6. Gradients Boosting et Generalized Boosted Regression
  • Annexes
  • P. 605
  • 1. De l'utilité de ces annexes
  • P. 605
  • 2. Formulas
  • P. 607
  • 3. Stratégies suivant la nature des données
  • P. 611
  • 4. Filtres (sur images)
  • P. 614
  • 5. Distances
  • P. 618
  • 6. Astuces et petits conseils
  • P. 620
  • 7. Packages et thèmes à étudier
  • P. 622
  • 8. Vocabulaire et tricks of the trade
  • P. 626
  • 9. Algorithmes à étudier
  • P. 627
  • 10. Quelques formulations d'algèbre linéaire
  • P. 629
  • Conclusion
  • P. 631
  • Index