Soutenance de thèse
Mercredi 13 décembre, 10h
En salle Jules Ferry, au 29 rue d'Ulm (et
pas au 45!), dans le cinquième arrondissement (RER B: Luxembourg).
Comment venir:
L'exposé sera en français et les transparents en anglais.
La thèse est disponible ici et les
transparents là.
Statistiques de formes pour la segmentation d'images avec a
priori.
Le but de la vision par ordinateur est d'automatiser un certain nombre de
tâches visuelles que les êtres humains accomplissent quotidiennement sans
même y penser, mais qui se sont révélées bien ardues. Parmis celles-ci, la
segmentation consiste à trouver le contour d'un objet dans une image donnée.
L'une des approches courantes pour résoudre ce problème est de définir un
critère qui à tout contour potentiel associe une valeur, et de trouver le
contour qui maximise ce critère. Deux difficultés surgissent alors: le
choix du critère et la maximisation de celui-ci. Les critères habituels
sont fondés sur l'homogénéité de certains descripteurs des deux régions
délimitées par le contour (l'intérieur et l'extérieur de l'objet), à savoir
la couleur ou la texture; d'autres reposent sur l'hétérogénéité de ces
descripteurs au niveau du contour. Ces critères ne portent aucune information
sur la forme de l'objet lui-même.
Le but de cette thèse est de construire, à partir d'un ensemble donné
d'exemples de contours, un nouveau critère qui exprime quantitativement la
ressemblance entre une forme quelconque et ces exemples. Ce critère
permettra ainsi d'avoir un a priori sur la forme de l'objet à trouver dans
une nouvelle image.
Plus précisément, on définit tout d'abord mathématiquement l'ensemble de
"toutes les formes". L'étude de plusieurs métriques sur cet ensemble
conduit à leur équivalence topologique. Par la suite, on considèrera
essentiellement la distance de Hausdorff.
La construction d'une approximation dérivable de cette distance permet
alors de construire un chemin entre deux formes quelconques par descente de
gradient de cette approximation. Le gradient d'une application dépendant
d'une forme est un champ de déformation défini sur cette forme,
c'est-à-dire appartenant à son espace tangent; il dépend
très fortement du produit scalaire que l'on y a choisi. Ce produit scalaire
peut donc être vu comme un a priori sur les champs de
déformation et change qualitativement les évolutions. Une extension de la
notion de gradient à des a priori non linéaires est également proposée.
Les champs instantanés de déformation d'une forme vers une autre obtenus
par gradient d'une distance permettent de définir
la "moyenne" d'un ensemble donné de contours, ainsi que
les modes caractéristiques de déformation qui lui sont associés.
Ces derniers expriment la variabilité de la forme dans l'échantillon étudié. De ces
statistiques sur les formes on déduit plusieurs critères de segmentation,
qui sont testés et illustrés sur quelques exemples. Des statistiques assez similaires
sont également menées sur des images (au lieu de formes) dans une approche
difféomorphique, testées sur des photographies de visages, puis utilisées
dans une tâche de reconnaissance d'expression.
Shape statistics for image segmentation
The variational approach on an image segmentation task consists in
defining a criterion depending on a contour, in computing its derivative
with respect to the contour, and in minimizing it with a gradient descent
method. We propose a way to compute shape statistics of a sample set of
contours and to incorporate them as a shape prior in the variational
framework.
We first define the set of "all shapes" as the set of "regular enough"
shapes. We study several metrics on it and show they are topologically
equivalent. Consequently only one of them, namely the Hausdorff distance,
is
considered in the sequel. With the only knowledge of the distance between
shapes we build a low-dimensional map thanks to the graph Laplacian
technique.
We then build a differentiable approximation of the Hausdorff distance.
This allows to define the "mean" shape of a sample set of shapes and to
find
it with a variational approach. It happens that the notion of "shape
gradient" depends strongly on the underlying inner product structure, and
that consequently we also have to choose a convenient inner product in
order
to set priors on the deformation fields that a shape undergoes during the
gradient descent process.
We then compute statistics based on the instantaneous deformation fields
that the "mean shape" should undergo to move towards each example of the
sample set of shapes. The application of PCA to the fields leads to
sensible
characteristic modes of deformation that convey the shape variability.
Contour statistics are turned into a shape prior and an example of image
segmentation with this criterion is shown. A similar approach is also tried
on images instead of contours: eigenmodes are shown for a human face
database, and an expression recognition task is performed using SVM on
deformation fields.
The thesis is available here and the slides there.