Recherche par le contenu efficiente dans les bases de données parallèles d'images

Cette thèse porte sur le traitement des requêtes par similarité sur les données de haute dimensionnalité, notamment multimédias, et, parmi elles, les images plus particulièrement. Ces requêtes, notamment celles des k plus proches voisins (kNN), posent des problèmes de calcul de par la nature des don...

Description complète

Enregistré dans:
Détails bibliographiques
Auteur principal : Manjarrez Sanchez Jorge Roberto (Auteur)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Organisme de soutenance), Centrale Nantes 1991-.... (Organisme de soutenance), École nationale supérieure des mines Nantes 1990-2016 (Organisme de soutenance), École doctorale sciences et technologies de l'information et des matériaux Nantes (Organisme de soutenance)
Autres auteurs : Valduriez Patrick (Directeur de thèse), Martinez José (Directeur de thèse)
Format : Thèse ou mémoire
Langue : anglais
français
Titre complet : Recherche par le contenu efficiente dans les bases de données parallèles d'images / Jorge Roberto Manjarrez Sanchez; sous la direction de Patrick Valduriez; co-directeur José Martinez
Publié : [S.l.] : [s.n.] , 2009
Description matérielle : 1 vol. (96 f.)
Note de thèse : Thèse doctorat : Informatique, bases de données : Nantes : 2009
Disponibilité : Publication autorisée par le jury
Sujets :
LEADER 04961cam a2200445 4500
001 PPN149692692
005 20240425055200.0
029 |a FR  |b 2009NANT2089 
100 |a 20110131d2009 k y0frey0103 ba 
101 0 |a eng  |a fre  |d fre  |d eng 
102 |a FR 
105 |a a m 000yy 
106 |a r 
200 1 |a Recherche par le contenu efficiente dans les bases de données parallèles d'images  |b Texte imprimé  |f Jorge Roberto Manjarrez Sanchez  |g sous la direction de Patrick Valduriez  |g co-directeur José Martinez 
210 |a [S.l.]  |c [s.n.]  |d 2009 
215 |a 1 vol. (96 f.)  |c ill.  |d 30 cm 
300 |a Thèse rédigée en anglais avec un résumé étendu en français 
310 |a Publication autorisée par le jury 
312 |a Le titre de la page de couverture est rédigé en anglais 
320 |a Bibliogr. f. 89-96 
328 |b Thèse doctorat  |c Informatique, bases de données  |e Nantes  |d 2009 
330 |a Cette thèse porte sur le traitement des requêtes par similarité sur les données de haute dimensionnalité, notamment multimédias, et, parmi elles, les images plus particulièrement. Ces requêtes, notamment celles des k plus proches voisins (kNN), posent des problèmes de calcul de par la nature des données elles-mêmes et de la taille de la base des données. Nous avons étudié leurs performances quand une méthode de partitionnement est appliquée sur la base de données pour obtenir et exploiter des classes. Nous avons proposé une taille et un nombre optimaux de ces classes pour que la requête puisse être traitée en temps optimal et avec une haute précision. Nous avons utilisé la recherche séquentielle comme base de référence. Ensuite nous avons proposé des méthodes de traitement de requêtes parallèles sur une grappe de machines. Pour cela, nous avons proposé des méthodes d'allocation des données pour la recherche efficace des kNN en parallèle. Nous proposons de même, un nombre réduit de noeuds sur la grappe de machines permettant néanmoins des temps de recherche sous-linéaires et optimaux vis-à-vis des classes déterminées précédemment. Nous avons utilisé des donnés synthétiques et réelles pour les validations pratiques. Dans les deux cas, nous avons pu constater des temps de réponse et une qualité des résultats supérieurs aux méthodes existantes, lesquelles, au-delà d'un faible nombre des dimensions, deviennent inefficaces. 
330 |a In this thesis, we address the performance problem when searching in large databases of images. The processing of similarity queries is a computational challenge because of the dimensionality of the abstract representation for the images and size of the databases. We present two data organization methods that account for performance improvement. The first one is based on the clustering of the database in centralized settings. We derive an optimal range of values for the number of clusters to obtain from a database, which in conjunction with a searching algorithm allows to efficiently process nearest neighbor queries. However as the dimensionality and size of the database increase, a single computer is overwhelmed. The second method is based on data partitioning over a shared nothing machine. Based on the results of the first method, this method maximizes parallelism. We also derive the optimal number of processing nodes to maximize resource utilization. We performed extensive experiments with synthetic and real databases. They validate the proposals and show that the performance level is superior to existing approaches which beyond a certain dimensionality or database size become inefficient. 
541 | |a Efficient content-based retrieval in parrallel databases of images  |z eng 
606 |3 PPN033475598  |a Multimédias  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN027390896  |a Analyse multivariée  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN02722337X  |a Classification  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
606 |3 PPN074260103  |a Grilles informatiques  |3 PPN027253139  |x Thèses et écrits académiques  |2 rameau 
700 1 |3 PPN149662203  |a Manjarrez Sanchez  |b Jorge Roberto  |f 1970-....  |4 070 
702 1 |3 PPN028314417  |a Valduriez  |b Patrick  |4 727 
702 1 |3 PPN103190082  |a Martinez  |b José  |f 1964-....  |c professeur à l'École Polytechnique de Nantes  |4 727 
712 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
712 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 295 
712 0 2 |3 PPN03063525X  |a Centrale Nantes  |c 1991-....  |4 295 
712 0 2 |3 PPN033236720  |a École nationale supérieure des mines  |c Nantes  |c 1990-2016  |4 295 
712 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 295 
801 3 |a FR  |b Abes  |c 20110216  |g AFNOR 
930 |5 441092104:414521609  |b 441092104  |a 2009 NANT 2089  |j u 
979 |a SCI 
998 |a 584015