Soutenance de thèse

Mercredi 13 décembre, 10h

En salle Jules Ferry, au 29 rue d'Ulm (et pas au 45!), dans le cinquième arrondissement (RER B: Luxembourg).

Comment venir:

L'exposé sera en français et les transparents en anglais.

La thèse est disponible ici et les transparents là.

Statistiques de formes pour la segmentation d'images avec a priori.

Le but de la vision par ordinateur est d'automatiser un certain nombre de tâches visuelles que les êtres humains accomplissent quotidiennement sans même y penser, mais qui se sont révélées bien ardues. Parmis celles-ci, la segmentation consiste à trouver le contour d'un objet dans une image donnée. L'une des approches courantes pour résoudre ce problème est de définir un critère qui à tout contour potentiel associe une valeur, et de trouver le contour qui maximise ce critère. Deux difficultés surgissent alors: le choix du critère et la maximisation de celui-ci. Les critères habituels sont fondés sur l'homogénéité de certains descripteurs des deux régions délimitées par le contour (l'intérieur et l'extérieur de l'objet), à savoir la couleur ou la texture; d'autres reposent sur l'hétérogénéité de ces descripteurs au niveau du contour. Ces critères ne portent aucune information sur la forme de l'objet lui-même. Le but de cette thèse est de construire, à partir d'un ensemble donné d'exemples de contours, un nouveau critère qui exprime quantitativement la ressemblance entre une forme quelconque et ces exemples. Ce critère permettra ainsi d'avoir un a priori sur la forme de l'objet à trouver dans une nouvelle image.
Plus précisément, on définit tout d'abord mathématiquement l'ensemble de "toutes les formes". L'étude de plusieurs métriques sur cet ensemble conduit à leur équivalence topologique. Par la suite, on considèrera essentiellement la distance de Hausdorff.
La construction d'une approximation dérivable de cette distance permet alors de construire un chemin entre deux formes quelconques par descente de gradient de cette approximation. Le gradient d'une application dépendant d'une forme est un champ de déformation défini sur cette forme, c'est-à-dire appartenant à son espace tangent; il dépend très fortement du produit scalaire que l'on y a choisi. Ce produit scalaire peut donc être vu comme un a priori sur les champs de déformation et change qualitativement les évolutions. Une extension de la notion de gradient à des a priori non linéaires est également proposée.
Les champs instantanés de déformation d'une forme vers une autre obtenus par gradient d'une distance permettent de définir la "moyenne" d'un ensemble donné de contours, ainsi que les modes caractéristiques de déformation qui lui sont associés. Ces derniers expriment la variabilité de la forme dans l'échantillon étudié. De ces statistiques sur les formes on déduit plusieurs critères de segmentation, qui sont testés et illustrés sur quelques exemples. Des statistiques assez similaires sont également menées sur des images (au lieu de formes) dans une approche difféomorphique, testées sur des photographies de visages, puis utilisées dans une tâche de reconnaissance d'expression.

Shape statistics for image segmentation

The variational approach on an image segmentation task consists in defining a criterion depending on a contour, in computing its derivative with respect to the contour, and in minimizing it with a gradient descent method. We propose a way to compute shape statistics of a sample set of contours and to incorporate them as a shape prior in the variational framework.
We first define the set of "all shapes" as the set of "regular enough" shapes. We study several metrics on it and show they are topologically equivalent. Consequently only one of them, namely the Hausdorff distance, is considered in the sequel. With the only knowledge of the distance between shapes we build a low-dimensional map thanks to the graph Laplacian technique.
We then build a differentiable approximation of the Hausdorff distance. This allows to define the "mean" shape of a sample set of shapes and to find it with a variational approach. It happens that the notion of "shape gradient" depends strongly on the underlying inner product structure, and that consequently we also have to choose a convenient inner product in order to set priors on the deformation fields that a shape undergoes during the gradient descent process.
We then compute statistics based on the instantaneous deformation fields that the "mean shape" should undergo to move towards each example of the sample set of shapes. The application of PCA to the fields leads to sensible characteristic modes of deformation that convey the shape variability. Contour statistics are turned into a shape prior and an example of image segmentation with this criterion is shown. A similar approach is also tried on images instead of contours: eigenmodes are shown for a human face database, and an expression recognition task is performed using SVM on deformation fields.

The thesis is available here and the slides there.

Retour à la page principale