From 2D to stereoscopic-3D visual saliency : revisiting psychophysical methods and computational modeling

L attention visuelle est l un des mécanismes les plus importants mis en oeuvre par le système visuel humain (SVH) afin de réduire la quantité d information que le cerveau a besoin de traiter pour appréhender le contenu d une scène. Un nombre croissant de travaux est consacré à l étude de l attention...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Wang Junle (Auteur), Le Callet Patrick (Directeur de thèse), Ricordel Vincent (Directeur de thèse), Dufaux Frédéric (Président du jury de soutenance), Guérin-Dugué Anne (Rapporteur de la thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), École polytechnique de l'Université de Nantes (Organisme de soutenance), École doctorale Sciences et technologies de l'information et mathématiques Nantes (Organisme de soutenance), Institut de recherche en communications et cybernétique Nantes 1958-2017 (Ecole doctorale associée à la thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : From 2D to stereoscopic-3D visual saliency : revisiting psychophysical methods and computational modeling / Junle Wang; sous la direction Patrick Le Callet ; co-encadrant de these Vincent Ricordel
Publié : [Lieu de publication inconnu] : [éditeur inconnu] , 2012
Accès en ligne : Accès Nantes Université
Note de thèse : Thèse de doctorat : Automatique et informatique appliquée, Traitement du signal et des images : Nantes : 2012
Contenu : Le volume 2 est le résumé français de la thèse
Sujets :
Documents associés : Reproduction de: From 2D to stereoscopic-3D visual saliency
Description
Résumé : L attention visuelle est l un des mécanismes les plus importants mis en oeuvre par le système visuel humain (SVH) afin de réduire la quantité d information que le cerveau a besoin de traiter pour appréhender le contenu d une scène. Un nombre croissant de travaux est consacré à l étude de l attention visuelle, et en particulier à sa modélisation computationnelle. Dans cette thèse, nous présentons des études portant sur plusieurs aspects de cette recherche. Nos travaux peuvent être classés globalement en deux parties. La première concerne les questions liées à la vérité de terrain utilisée, la seconde est relative à la modélisation de l attention visuelle dans des conditions de visualisation 3D. Dans la première partie, nous analysons la fiabilité de cartes de densité de fixation issues de différentes bases de données occulométriques. Ensuite, nous identifions quantitativement les similitudes et les différences entre carte de densité de fixation et carte d importance visuelle, ces deux types de carte étant les vérités de terrain communément utilisées par les applications relatives à l attention. Puis, pour faire face au manque de vérité de terrain exploitable pour la modélisation de l attention visuelle 3D, nous procédons à une expérimentation oculométrique binoculaire qui aboutit à la création d une nouvelle base de données avec des images stéréoscopiques 3D. Dans la seconde partie, nous commençons par examiner l impact de la profondeur sur l attention visuelle dans des conditions de visualisation 3D. Nous quantifions d abord le " biais de profondeur " lié à la visualisation de contenus synthétiques 3D sur écran plat stéréoscopique. Ensuite, nous étendons notre étude avec l usage d images 3D au contenu naturel. Nous proposons un modèle de l attention visuelle 3D basé saillance de profondeur, modèle qui repose sur le contraste de profondeur de la scène. Deux façons différentes d exploiter l information de profondeur par notre modèle sont comparées. Ensuite, nous étudions le biais central et les différences qui existent selon que les conditions de visualisation soient 2D ou 3D. Nous intégrons aussi le biais central à notre modèle de l attention visuelle 3D. Enfin, considérant que l attention visuelle combinée à une technique de floutage peut améliorer la qualité d expérience de la TV-3D, nous étudions l influence de flou sur la perception de la profondeur, et la relation du flou avec la disparité binoculaire
Visual attention is one of the most important mechanisms deployed in the human visual system to reduce the amount of information that our brain needs to process. An increasing amount of efforts are being dedicated in the studies of visual attention, particularly in computational modeling of visual attention. In this thesis, we present studies focusing on several aspects of the research of visual attention. Our works can be mainly classified into two parts. The first part concerns ground truths used in the studies related to visual attention ; the second part contains studies related to the modeling of visual attention for Stereoscopic 3D (S-3D) viewing condition. In the first part, our work starts with identifying the reliability of FDM from different eye-tracking databases. Then we quantitatively identify the similarities and difference between fixation density maps and visual importance map, which have been two widely used ground truth for attention-related applications. Next, to solve the problem of lacking ground truth in the community of 3D visual attention modeling, we conduct a binocular eye-tracking experiment to create a new eye-tracking database for S-3D images. In the second part, we start with examining the impact of depth on visual attention in S-3D viewing condition. We firstly introduce a so-called depth-bias in the viewing of synthetic S-3D content on planar stereoscopic display. Then, we extend our study from synthetic stimuli to natural content S-3D images. We propose a depth-saliency-based model of 3D visual attention, which relies on depth contrast of the scene. Two different ways of applying depth information in S-3D visual attention model are also compared in our study. Next, we study the difference of center-bias between 2D and S-3D viewing conditions, and further integrate the center-bias with S-3D visual attention modeling. At the end, based on the assumption that visual attention can be used for improving Quality of Experience of 3D-TV when collaborating with blur, we study the influence of blur on depth perception and blur s relationship with binocular disparity.
Variantes de titre : Saillance visuelle, de la 2D à la 3D stéréoscopique : examen des méthodes psychophysiques et modélisation computationnelle
Notes : Ecole(s) Doctorale(s) : École doctorale sciences et technologies de l'information et de mathématiques (Nantes)
Partenaire de recherche : Institut de recherche en communications et cybernétique (IRCCyN) (Nantes) (Laboratoire)
Autre(s) contribution(s) : Frédéric Dufaux (Président du jury) ; Luce Morin (Membre du jury) ; Anne Guérin Dugué, Ingrid Heynderickx (Rapporteur(s))
Bibliographie : Références bibliographiques