Extraction de motifs communs dans un ensemble de séquences : application à l'identification de sites de liaison aux protéines dans les séquences primaires d'ADN

L extraction de motifs ayant une signification biologique, et notamment l identification de sites de régulation de la synthèse protéique dans les séquences primaires d ADN, est un des enjeux de la recherche en bioinformatique. Une anomalie dans cette régulation peut avoir de graves conséquences sur...

Description complète

Détails bibliographiques
Auteurs principaux : Mancheron Alban (Auteur), Rusu Irena (Directeur de thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), Centrale Nantes 1991-.... (Autre partenaire associé à la thèse), École nationale supérieure des mines Nantes 1990-2016 (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Extraction de motifs communs dans un ensemble de séquences : application à l'identification de sites de liaison aux protéines dans les séquences primaires d'ADN / Alban Mancheron; sous la direction d'Irena Rusu
Publié : [S.l.] : [s.n.] , 2006
Description matérielle : 1 vol. (274 f.)
Condition d'utilisation et de reproduction : Publication autorisée par le jury
Note de thèse : Thèse de doctorat : Informatique : Nantes : 2006
Sujets :
Documents associés : Reproduit comme: Extraction de motifs communs dans un ensemble de séquences
Reproduit comme: Extraction de motifs communs dans un ensemble de séquences
Particularités de l'exemplaire : BU Sciences, Ex. 1 :
Titre temporairement indisponible à la communication

LEADER 04766cam a2200541 4500
001 PPN111589363
003 http://www.sudoc.fr/111589363
005 20240829055200.0
029 |a FR  |b 2006NANT2060 
035 |a (OCoLC)493861020 
100 |a 20061222d2006 k y0frey0103 ba 
101 0 |a fre  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a a ma 001yy 
106 |a r 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c n  |2 rdamedia 
182 1 |6 z01  |a n 
200 1 |a Extraction de motifs communs dans un ensemble de séquences  |e application à l'identification de sites de liaison aux protéines dans les séquences primaires d'ADN  |f Alban Mancheron  |g sous la direction d'Irena Rusu 
210 |a [S.l.]  |c [s.n.]  |d 2006 
215 |a 1 vol. (274 f.)  |c ill.  |d 30 cm 
316 |5 441092104:296659223  |a Titre temporairement indisponible à la communication 
320 |a Bibliographie f. 233-247. Index 
328 |b Thèse de doctorat  |c Informatique  |e Nantes  |d 2006 
330 |a L extraction de motifs ayant une signification biologique, et notamment l identification de sites de régulation de la synthèse protéique dans les séquences primaires d ADN, est un des enjeux de la recherche en bioinformatique. Une anomalie dans cette régulation peut avoir de graves conséquences sur la santé d un organisme. Aussi, l extraction de ces sites permet de mieux comprendre le fonctionnement cellulaire et de soigner certaines pathologies. Les difficultés posées par ce problème sont le manque d informations sur les motifs à extraire, ainsi que le volume important des données à traiter. Deux algorithmes polynomiaux l un déterministe et l autre probabiliste permettant de le traiter ont été conçus. Dans ce contexte, nous avons introduit une nouvelle famille de fonctions de score et étudié leurs propriétés statistiques. Nous avons également caractérisé le langage reconnu par la structure d index appelée Oracle, et proposé une amélioration la rendant plus efficace. 
330 |a The extraction of significant biological patterns, and in particular the identification of regulation sites of proteinic synthesis in DNA primary sequences, is one of the major issues today in bioinformatics. Indeed any anomaly in proteinic synthesis regulation has detrimental damages on the well-being of certain organisms. Extracting these sites enables to better understand cellular operation or even to remove or cure pathology. What is promblematic is the lack of information on patterns to be extracted, as well as the large volume of data to mine. In ths dissertation, we introduce two polynomial algorithms the first one is deterministic and the other one is probabilist to address the issue of pattern extraction. We introduce a new family of score functions and we study theirs statistical properties. We characterize the language which is recognized by the index structure named Oracle , and we modifiy this structure in order to make it more efficient. 
371 1 |a Publication autorisée par le jury 
456 | |0 111598400  |t Extraction de motifs communs dans un ensemble de séquences  |b Ressource électronique  |o application à l'identification de sites de liaison aux protéines dans les séquences primaires d'ADN  |f Alban Mancheron  |c [S.l.]  |n [s.n.]  |d 2006 
456 | |0 24692943X  |t Extraction de motifs communs dans un ensemble de séquences  |o application à l'identification de sites de liaison aux protéines dans les séquences primaires d'ADN  |f Alban Mancheron  |d 2006  |c Grenoble  |n Atelier national de reproduction des thèses  |p Microfiches  |s [ Grenoble thèses] 
541 | |a Pattern extraction from a set of sequences. An application to proteins binding sites identification in DNA primary sequences  |z eng 
606 |3 PPN069395721  |a Bioinformatique  |2 rameau 
606 |3 PPN027282171  |a Algorithmes  |2 rameau 
606 |3 PPN027652963  |a ADN  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
700 1 |3 PPN111581362  |a Mancheron  |b Alban  |f 1976-...  |4 070 
701 1 |3 PPN095050671  |a Rusu  |b Irena  |4 727 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 985 
711 0 2 |3 PPN03063525X  |a Centrale Nantes  |c 1991-....  |4 985 
711 0 2 |3 PPN033236720  |a École nationale supérieure des mines  |c Nantes  |c 1990-2016  |4 985 
711 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 996 
801 3 |a FR  |b Abes  |c 20231213  |g AFNOR 
979 |a SCI 
930 |5 441092104:296659223  |b 441092104  |j g 
991 |5 441092104:296659223  |a Exemplaire modifié automatiquement le 18-07-2024 18:40 
998 |a 487961