Kernel-based testing and their application to single-cell data

Les technologies de sequençage en cellule unique mesurent des informations à l échelle de chaque cellule d une population. Les données issues de ces technologies présentent de nombreux défis : beaucoup d observations en grande dimension et souvent parcimonieuses. De nombreuses expériences de biologi...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Ozier-Lafontaine Anthony (Auteur), Michel Bertrand (Directeur de thèse), Picard Franck (Directeur de thèse), Minvielle Stéphane (Président du jury de soutenance), Villa-Vialaneix Nathalie (Rapporteur de la thèse), Szabó Zoltán (Rapporteur de la thèse), Vert Jean-Philippe (Membre du jury), Vallot Céline (Membre du jury)
Collectivités auteurs : Centrale Nantes 1991-.... (Organisme de soutenance), École doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication Nantes 2022-.... (Ecole doctorale associée à la thèse), Laboratoire de Mathématiques Jean Leray Nantes (Laboratoire associé à la thèse)
Format : Thèse ou mémoire
Langue : anglais
Titre complet : Kernel-based testing and their application to single-cell data / Anthony Ozier-Lafontaine; sous la direction de Bertrand Michel et de Franck Picard
Publié : 2023
Accès en ligne : Accès Nantes Université
Note sur l'URL : Accès au texte intégral
Note de thèse : Thèse de doctorat : Mathématiques et leurs interactions : Ecole centrale de Nantes : 2023
Sujets :
Description
Résumé : Les technologies de sequençage en cellule unique mesurent des informations à l échelle de chaque cellule d une population. Les données issues de ces technologies présentent de nombreux défis : beaucoup d observations en grande dimension et souvent parcimonieuses. De nombreuses expériences de biologie consistent à comparer des conditions.L objet de la thèse est de développer un ensemble d outils qui compare des échantillons de données issues des technologies de séquençage en cellule unique afin de détecter et décrire les différences qui existent. Pour cela, nous proposons d appliquer les tests de comparaison de deux échantillons basés sur les méthodes à noyaux existants. Nous proposons de généraliser ces tests à noyaux pour les designs expérimentaux quelconques, ce test s inspire du test de la trace de Hotelling- Lawley. Nous implémentons pour la première fois ces tests à noyaux dans un packageR et Python nommé ktest, et nos applications sur données simulées et issues d expériences démontrent leurs performances. L application de ces méthodes à des données expérimentales permet d identifier les observations qui expliquent les différences détectées. Enfin, nous proposons une implémentation efficace de ces tests basée sur des factorisations matricielles de type Nyström, ainsi qu un ensemble d outils de diagnostic et d interprétation des résultats pour rendre ces méthodes accessibles et compréhensibles par des nonspécialistes
Single-cell technologies generate data at the single-cell level. They are coumposed of hundreds to thousands of observations (i.e. cells) and tens of thousands of variables (i.e. genes). New methodological challenges arose to fully exploit the potentialities of these complex data. A major statistical challenge is to distinguish biological informationfrom technical noise in order to compare conditions or tissues. This thesis explores the application of kernel testing on single-cell datasets in order to detect and describe the potential differences between compared conditions.To overcome the limitations of existing kernel two-sample tests, we propose a kernel test inspired from the Hotelling-Lawley test that can apply to any experimental design. We implemented these tests in a R and Python package called ktest that is their first useroriented implementation. We demonstrate the performances of kernel testing on simulateddatasets and on various experimental singlecell datasets. The geometrical interpretations of these methods allows to identify the observations leading a detected difference. Finally, we propose a Nyström-based efficient implementationof these kernel tests as well as a range of diagnostic and interpretation tools
Variantes de titre : Tests à noyaux, et leurs applications aux données de séquençage en cellule unique
Notes : Titre provenant de l'écran-titre
Ecole(s) Doctorale(s) : École Doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication (Nantes)
Partenaire(s) de recherche : Laboratoire de Mathématiques Jean Leray (Nantes) (Laboratoire)
Autre(s) contribution(s) : Stéphane Minvielle (Président du jury) ; Jean-Philippe Vert, Céline Vallot (Membre(s) du jury) ; Nathalie Villa-Vialaneix, Zoltán Szabó (Rapporteur(s))
Configuration requise : Configuration requise : un logiciel capable de lire un fichier au format : PDF