Kernel-based testing and their application to single-cell data

Les technologies de sequençage en cellule unique mesurent des informations à l échelle de chaque cellule d une population. Les données issues de ces technologies présentent de nombreux défis : beaucoup d observations en grande dimension et souvent parcimonieuses. De nombreuses expériences de biologi...

Full description

Saved in:
Bibliographic Details
Main Authors : Ozier-Lafontaine Anthony (Auteur), Michel Bertrand (Directeur de thèse), Picard Franck (Directeur de thèse), Minvielle Stéphane (Président du jury de soutenance), Villa-Vialaneix Nathalie (Rapporteur de la thèse), Szabó Zoltán (Rapporteur de la thèse), Vert Jean-Philippe (Membre du jury), Vallot Céline (Membre du jury)
Corporate Authors : Centrale Nantes 1991-.... (Organisme de soutenance), École Doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication Nantes (Ecole doctorale associée à la thèse), Laboratoire de Mathématiques Jean Leray Nantes (Laboratoire associé à la thèse)
Format : Thesis
Language : anglais
Title statement : Kernel-based testing and their application to single-cell data / Anthony Ozier-Lafontaine; sous la direction de Bertrand Michel et de Franck Picard
Published : 2023
Online Access : Via Nantes Université network
Online Access note : Accès au texte intégral
Note de thèse : Thèse de doctorat : Mathématiques et leurs interactions : Ecole centrale de Nantes : 2023
Subjects :
LEADER 06167nlm a2200709 4500
001 PPN276614992
003 http://www.sudoc.fr/276614992
005 20240326055900.0
029 |a FR  |b 2023ECDN0025 
033 |a http://www.theses.fr/2023ECDN0025 
035 |a (OCoLC)1427723343 
035 |a STAR210948 
100 |a 20240325d2023 k y0frey0103 ba 
101 0 |a eng  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a ||||ma 00|yy 
135 |a dr||||||||||| 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c c  |2 rdamedia 
182 1 |6 z01  |a b 
183 |6 z01  |a ceb  |2 RDAfrCarrier 
200 1 |a Kernel-based testing and their application to single-cell data  |f Anthony Ozier-Lafontaine  |g sous la direction de Bertrand Michel et de Franck Picard 
214 1 |d 2023 
230 |a Données textuelles 
304 |a Titre provenant de l'écran-titre 
314 |a Ecole(s) Doctorale(s) : École Doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication (Nantes) 
314 |a Partenaire(s) de recherche : Laboratoire de Mathématiques Jean Leray (Nantes) (Laboratoire) 
314 |a Autre(s) contribution(s) : Stéphane Minvielle (Président du jury) ; Jean-Philippe Vert, Céline Vallot (Membre(s) du jury) ; Nathalie Villa-Vialaneix, Zoltán Szabó (Rapporteur(s)) 
328 0 |b Thèse de doctorat  |c Mathématiques et leurs interactions  |e Ecole centrale de Nantes  |d 2023 
330 |a Les technologies de sequençage en cellule unique mesurent des informations à l échelle de chaque cellule d une population. Les données issues de ces technologies présentent de nombreux défis : beaucoup d observations en grande dimension et souvent parcimonieuses. De nombreuses expériences de biologie consistent à comparer des conditions.L objet de la thèse est de développer un ensemble d outils qui compare des échantillons de données issues des technologies de séquençage en cellule unique afin de détecter et décrire les différences qui existent. Pour cela, nous proposons d appliquer les tests de comparaison de deux échantillons basés sur les méthodes à noyaux existants. Nous proposons de généraliser ces tests à noyaux pour les designs expérimentaux quelconques, ce test s inspire du test de la trace de Hotelling- Lawley. Nous implémentons pour la première fois ces tests à noyaux dans un packageR et Python nommé ktest, et nos applications sur données simulées et issues d expériences démontrent leurs performances. L application de ces méthodes à des données expérimentales permet d identifier les observations qui expliquent les différences détectées. Enfin, nous proposons une implémentation efficace de ces tests basée sur des factorisations matricielles de type Nyström, ainsi qu un ensemble d outils de diagnostic et d interprétation des résultats pour rendre ces méthodes accessibles et compréhensibles par des nonspécialistes 
330 |a Single-cell technologies generate data at the single-cell level. They are coumposed of hundreds to thousands of observations (i.e. cells) and tens of thousands of variables (i.e. genes). New methodological challenges arose to fully exploit the potentialities of these complex data. A major statistical challenge is to distinguish biological informationfrom technical noise in order to compare conditions or tissues. This thesis explores the application of kernel testing on single-cell datasets in order to detect and describe the potential differences between compared conditions.To overcome the limitations of existing kernel two-sample tests, we propose a kernel test inspired from the Hotelling-Lawley test that can apply to any experimental design. We implemented these tests in a R and Python package called ktest that is their first useroriented implementation. We demonstrate the performances of kernel testing on simulateddatasets and on various experimental singlecell datasets. The geometrical interpretations of these methods allows to identify the observations leading a detected difference. Finally, we propose a Nyström-based efficient implementationof these kernel tests as well as a range of diagnostic and interpretation tools 
337 |a Configuration requise : un logiciel capable de lire un fichier au format : PDF 
541 | |a Tests à noyaux, et leurs applications aux données de séquençage en cellule unique  |z fre 
606 |3 PPN268123543  |a Analyse en cellule unique  |2 rameau 
606 |3 PPN028118952  |a Noyau cellulaire  |2 rameau 
606 |3 PPN028904141  |a Systèmes linéaires  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
610 0 |a Tests à noyaux 
610 0 |a Séquençage en cellule unique 
610 0 |a Modèle linéaire à noyaux 
610 0 |a Nyström 
610 0 |a Fonctions d influence 
686 |a 620  |2 TEF 
700 1 |3 PPN275972887  |a Ozier-Lafontaine  |b Anthony  |f 1994-....  |4 070 
701 1 |3 PPN229667155  |a Michel  |b Bertrand  |f 19..-....  |4 727 
701 1 |3 PPN094626685  |a Picard  |b Franck  |f 1978-....  |c directeur de recherche en biologie  |4 727 
701 1 |3 PPN032987552  |a Minvielle  |b Stéphane  |f 1960-....  |4 956 
701 1 |3 PPN101680503  |a Villa-Vialaneix  |b Nathalie  |f 1976-....  |4 958 
701 1 |3 PPN191610003  |a Szabó  |b Zoltán  |f 1965-....  |4 958 
701 1 |3 PPN122407385  |a Vert  |b Jean-Philippe  |f 1973-....  |c mathématicien  |4 555 
701 1 |3 PPN137424531  |a Vallot  |b Céline  |f 1982-....  |4 555 
711 0 2 |3 PPN03063525X  |a Centrale Nantes  |c 1991-....  |4 295 
711 0 2 |3 PPN268274525  |a École Doctorale Mathématiques et Sciences et Technologies du numérique, de l Information et de la Communication  |c Nantes  |4 996 
711 0 2 |3 PPN087220865  |a Laboratoire de Mathématiques Jean Leray  |c Nantes  |4 981 
801 3 |a FR  |b Abes  |c 20240325  |g AFNOR 
856 4 |q PDF  |s 16678306  |u http://www.theses.fr/2023ECDN0025/document  |z Accès au texte intégral 
856 4 |u http://www.theses.fr/2023ECDN0025/abes 
856 4 |u https://theses.hal.science/tel-04520324 
930 |5 441092306:816280975  |b 441092306  |j g 
991 |5 441092306:816280975  |a exemplaire créé automatiquement par STAR 
998 |a 964967