Automatiser les démonstrations

Dans ce chapitre nous introduisons plusieurs techniques pour automatiser les démonstrations en logique du premier ordre.

4.1 Peut-on automatiser les démonstrations ?

Automatiser les démonstrations consiste à trouver un algorithme qui étant donnée une formule quelconque va pouvoir répondre à la question est-ce que cette formule est valide ?

On a vu que ce problème était équivalent à savoir s’il existe un algorithme qui, pour une formule quelconque, répond à la question est-ce que cette formule est satisfiable ? En effet la validité de la formule A est équivalente à l’insatisfiabilité de la formule ¬ A.

4.1.1 Décidabilité de la logique propositionnelle

Proposition 1 La validité d’une formule propositionnelle est une propriété décidable.

Preuve: Etant donnée une formule de la logique propositionnelle, elle a un nombre fini de variables, n. On peut calculer sa valeur de vérité pour chacune des 2ⁿ interprétations et en fonction du résultat, répondre à la question de la validité. □

Evidemment la méthode donnée ci-dessus n’est pas efficace et d’autres techniques existent pour rendre plus effective la procédure. On pourrait se dire que la question de la satisfiabilité d’une formule (problème SAT) est plus simple puisqu’il suffit de trouver une interprétation qui rend vraie la formule. Or ce n’est pas le cas, le problème reste intrinsèquement dur. On rappelle les définitions liées à la NP-complétude dans le cas du problème SAT :

Proposition 2 (théorème de Cook, 71) Le problème de satisfiabilité d’une formule est un problème NP-complet en le nombre de variables propositionnelles.

Preuve: La preuve va constituer à ramener la résolution du problème NP à une question de satisfiabilité en logique propositionnelle, en faisant un codage logique de la machine de Turing qui résoud le problème initial. □

On peut chercher des solutions plus efficaces pour des classes particulières de formules.

Si la formule est déjà en forme normale disjonctive, alors la satisfiablilité est immédiate car la formule est soit la formule ⊥ donc insatisfiable soit de la forme C∨ D avec C une conjonction élémentaire et cette conjonction élémentaire a un modèle qui est un modèle de la formule complète. La formule est donc satisfiable. Ce résultat associé au théorème de Cook implique que la complexité de la satisfiabilité se retrouve dans la complexité de mettre une formule quelconque en FND.

On a vu que l’on avait des méthodes linéaires pour ramener la satisfiabilité d’une formule à la satisfiablilité d’une formule en forme normale conjonctive. Cependant, même en se limitant à une formule en FNC dont les clauses propositionnelles ont au plus trois littéraux (problème dit 3-SAT), le problème SAT reste NP-complet.

4.1.2 Semi-décidabilité de la logique du premier ordre

Contrairement au cas propositionnel, dans le cas de la logique du premier ordre il y a une infinité d’interprétations possibles pour les symboles. On ne peut donc pas les énumérer toutes en général ou construire des tables de vérité.

Dans le cas des formules universelles (avec uniquement des quantificateurs universels en forme prénexe), le théorème de Herbrand nous permet de nous restreindre à une recherche parmi les modèles de Herbrand. Associé au théorème de compacité, il nous donne une méthode algorithmique pour savoir si une formule P (ou un ensemble de formules) est insatisfiable.

Proposition 3 (Semi-décidabilité de la logique du premier-ordre)

Le problème d’insatisfiabilité d’une formule du calcul des prédicats est semi-décidable.
Le problème de validité d’une formule du calcul des prédicats est semi-décidable.

Preuve: Le premier résultat est une conséquence de l’algorithme présenté ci-dessus et le second en découle en utilisant le fait que tester la validité de A est équivalent à tester l’insatisfiabilité de la formule ¬ A. □

On peut s’interroger sur la possibilité de faire mieux, c’est-à-dire de décider de la validité d’une formule. La réponse est négative.

Proposition 4 (Indécidabilité de la logique du premier-ordre) Les problèmes de satisfiabilité ainsi que de validité d’une formule du calcul des prédicats sont indécidables.

Preuve: La preuve se fait en ramenant un problème indécidable comme l’arrêt d’une machine de Turing ou la correspondance de Post à un problème de validité en logique du premier ordre. □

La preuve de semi-décidabilité nous a donné un algorithme naïf pour chercher une preuve d’une formule. En effet la méthode énumère au hasard l’ensemble des instances d’une formule et repose à chaque fois la question de la satisfiabilité. Pour améliorer cela, on peut chercher à engendrer des instances qui vont pouvoir interagir avec d’autres parties de la formule pour conduire à une contradiction.

4.2 Unification

On a vu que la question de la satisfiabilité nécessitait de produire des instances de formules, c’est-à-dire de remplacer des variables par des termes ayant de bonnes propriétés. Dans cette section, nous allons introduire un outil, l’unification, qui nous sera utile dans la méthode de résolution pour produire des instances particulières de formules. L’unification traite une classe de problèmes très simples à savoir des équations entre termes avec variables. C’est un problème qui a des applications multiples comme la question de l’inférence de types dans les langages fonctionnels.

4.2.1 Définitions

On se donne une signature F pour les termes et un ensemble X de variables. On rappelle qu’une substitution est une application σ ∈ X→ T(F,X). On s’intéresse à des substitutions dites à support fini c’est-à-dire telles que σ(x)=x sauf pour un nombre fini de variables. De telles substitutions se représentent facilement comme des ensembles finis {x← σ(x) | x∈ X ∧ σ(x)≠x}. Ainsi, la substitution identité telle que σ(x)=x pour tout x∈ X se représentera simplement par un ensemble vide {}.

Étant donnée une substitution, on a défini dans la section 1.5.3 une application de T(F,X)→ T(F,X) qui à un terme t associe le terme noté t[σ] dans lequel on a remplacé chaque variable x par σ(x).

Définition 1 (Composition de substitutions) On peut composer deux substitutions σ₁ et σ₂ en une nouvelle substitution notée σ₁σ₂ définie par (σ₁σ₂))(x)=σ₁(x)[σ₂].
Pour tout terme t : on a t[σ₁σ₂]=(t[σ₁])[σ₂].

D’un point de vue fonctionnel, la notation σ₁σ₂ correspond à appliquer la substitution σ₁ suivie de σ₂, ce qui d’un point de vue mathématiques correspond à la composition de fonctions σ₂∘σ₁

Remarque.

Il ne faut pas confondre la composition de deux substitutions qui correspond à deux substitutions successives avec la substitution simultanée. Ainsi si on pose σ₁={x← y} et σ₂={y← z}. On a σ₁σ₂={x← z;y← z} et (x+y)[σ₁σ₂]=z+z alors que la substitution simultanée est définie par {x← y;y← z} et donne le résultat (x+y)[x← y;y← z]=y+z.

Définition 2 (Problème d’unification) Un problème d’unification est donné par deux termes avec variables t et u. Ce problème admet une solution s’il existe une substitution σ telle que t[σ]=u[σ]. On dira que σ est solution du problème t=^? u, on dira aussi que σ est un unificateur des termes t et u ou encore qu’il unifie les termes t et u.

De manière plus générale, on peut se donner un ensemble de couples de termes {(t_i,u_i)|i∈ I}. Résoudre ce problème d’unification revient à chercher une substitution σ telle que t_i[σ]=u_i[σ] pour tout i∈ I.

Il s’agit de la résolution d’une équation (ou d’un système d’équations), on trouve des valeurs pour les variables qui apparaissent dans t et u, telles que si on remplace les variables par ces valeurs, alors les deux termes obtenus sont syntaxiquement égaux.

On s’intéresse ici à l’égalité syntaxique, c’est-à-dire que les termes f(t₁,…,t_n) et g(u₁,…,u_p) sont égaux uniquement lorsque les symboles f et g sont égaux, on a alors la même arité donc p=n et on doit avoir récursivement t_i=u_i pour i=1… n.

Exemple 1 Si on se donne deux expressions sur la signature pour les nombres plus(x,0) et plus(y,z) une solution est {x← 0;y← 0; z← 0}. Une autre solution est {x← y; z← 0}. Certaines équations n’ont pas de solution, par exemple plus(x,0) et 0 car on s’intéresse à une égalité syntaxique entre les termes et les symboles plus et 0 sont distincts.

Exercice 1 La signature sur les arbres est donnée avec la constante є et la fonction binaire N. Les problèmes d’unification suivants ont-ils des solutions :

N(x,є)=^? N(є,y)
N(N(x,y),є) =^? N(є,y)
N(x,є) =^? x

4.2.2 Ensemble des solutions

Si σ₁ est une solution du problème d’unification t=^? u alors il en est de même de σ₁σ₂ pour toute substitution σ₂. En effet on a t[σ₁]=u[σ₁] car σ₁ est solution du problème et donc t[σ₁σ₂]=t[σ₁][σ₂]=u[σ₁][σ₂]=u[σ₁σ₂].

Si on a deux solutions σ et τ a notre problème d’unification, on dira que σ est plus générale que τ s’il existe une substitution σ′ telle que σσ′=τ.

Exemple 2 Si on reprend l’exemple 1, on a une solution σ =^def {x← y; z← 0} et une solution τ =^def {x← 0;y← 0; z← 0}. On a τ=σ{y← 0} donc σ est plus général.

Une bonne propriété de l’unification sur les termes syntaxiques est que si un problème a une solution alors il existe une solution qui est plus générale que toutes les autres. Et donc pour calculer l’ensemble de toutes les solutions, il suffit de calculer cette substitition que l’on appelle aussi unificateur principal.

Proposition 1 (Unification) Soit E={t_i=^? u_i|i ∈ I} un problème d’unification. Si ce problème admet une solution, alors il existe un unificateur principal σ et celui-ci est calculé par la fonction suivante :

Preuve: On vérifie que chaque cas possible est couvert par une équation unique. Un problème plus délicat à justifier est la terminaison de cette définition vue comme un procédé de calcul. Dans les cas récursifs, on regarde ce qui diminue :

En résumé pour un problème E si on regarde le triplet nbvars(E),taille(E),nbeqs(E) avec nbvars(E) le nombre de variables différentes dans E, taille(E) le nombre d’occurrences de symboles dans E, et nbeqs(E) le nombre d’équations dans E, alors on remarque que chaque appel se fait sur un problème strictement plus petit si on prend l’ordre lexicographique, sauf celui où on change l’équation t=x en x=t. Mais cette règle n’est appliquée que lorsque t n’est pas une variable et sera donc immédiatement suivie de l’application d’une règle qui fait diminuer le “poids” du problème. Une autre possibilité est de définir taille(t=u) =^def 2× nbsymb(t)+nbsymb(u) au lieu de taille(t=u) =^def nbsymb(t)+nbsymb(u). On a alors taille(x=t)<taille(t=x) lorsque t n’est pas une variable.

On vérifie que les cas d’échec correspondent à des problèmes sans solution et que dans les cas où une solution est trouvée, il s’agit bien de l’unificateur principal. □

Exercice 2 Soit g une fonction binaire, f une fonction unaire et a une constante. Résoudre les problèmes d’unification suivants :

g(x,f(y))=^? g(f(y),z)
g(g(x,f(y)),z)=^? g(g(y,z),a)

Cet algorithme n’est pas efficace à cause en particulier de l’opération de substitution lorsqu’on élimine l’équation x=^? t. On peut utiliser une représentation des termes qui rend cette opération moins coûteuse. Il existe d’autres algorithmes plus complexes mais plus efficaces.

L’unification est une opération utilisée dans de nombreuses applications, par exemple dans l’algorithme de typage des programmes Caml afin de trouver le type le plus général que peut traiter une fonction. L’unification se généralise également à des théories plus complexes dans lesquelles l’égalité entre termes n’est plus syntaxique mais prend en compte des propriétés des opérations comme la commutativité ou l’associativité. Suivant les théories, on va perdre la décidabilité ou l’existence d’un unificateur principal.

L’unification sur les termes se généralise en une unification entre des littéraux. Si on a deux littéraux P et Q, ils s’unifient s’il existe une substitution σ telle que P[σ]=Q[σ]. Si P =^def R(t₁,…,t_n) (resp. P =^def ¬ R(t₁,…,t_n)) alors σ est un unificateur de P et Q si et seulement si P =^def R(u₁,…,u_n) (resp. P =^def ¬ R(u₁,…,u_n)) et σ est un unificateur de l’ensemble de problèmes {t_i=^? u_i|i=1… n}.

Exercice 3 Résoudre les problèmes d’unification suivants entre littéraux :

(plus(x,0)=x)=^? (plus(0,y)=y)
(plus(x,0)=x)=^? y ≠ z
(plus(x,0)=x)=^? (y=plus(y,0))

Exercice 4 On se donne n termes t₁,…,t_n et on cherche à unifier ces n termes, c’est-à-dire trouver une substitution σ telle que t₁[σ]=… =t_n[σ],
on dispose d’un algorithme unif qui donne l’unificateur principal de deux termes, comment peut-on procéder ?

4.2.3 Ordre sur les termes et filtrage

Définition 3 (Instance) On définit un ordre sur les termes avec variables

t≤ u

def

il existe σ tq u=t[σ]

Si u=t[σ], on dit que t est plus général que u et que u est une instance de t.

Un terme avec variables t∈T(F,X) représente un ensemble de termes clos (sans variables), les instances closes de t:

inst(t)

def

{u∈T(F)|il existe σ tq u=t[σ]}

Proposition 2 Si t≤ u alors inst(u)⊆ inst(t).

Preuve: Si t≤ u alors u=t[σ] et toute instance close de u est de la forme u[τ]=t[σ][τ]=t[στ] et est donc une instance close de t. □

Définition 4 (Filtrage, motif)

Le problème du filtrage consiste à se donner deux termes t et u et à rechercher σ tel que t[σ]=u.
Un motif est un terme dans lequel il n’y a pas deux fois la même variable.

Le langage Ocaml permet de définir une expression par cas suivant un ensemble de motifs

Exercice 5 On se donne une définition avec des motifs p₁,…,p_n, traduire les propriétés précédentes en conditions sur les ensembles inst(p₁),…,inst(p_n)

4.3 Résolution

On s’intéresse ici au problème de savoir si un ensemble de formules est satisfiable ou non, c’est-à-dire s’il existe une interprétation qui rend vraie simultanément toutes les formules. On rappelle qu’un ensemble fini de formules est satisfiable si et seulement si la conjonction de toutes les formules est elle-même une formule satisfiable. On a vu au chapitre 3 que l’on pouvait se ramener au cas où les formules manipulées sont uniquement des clauses (disjonction de littéraux), universellement quantifiées dans le cas de la logique du premier ordre.

La technique de preuve par résolution est importante car elle est à la base non seulement de systèmes de démonstration automatique mais aussi de systèmes de programmation logique. Le plus connu est le langage de programmation Prolog, dans lequel le programme est modélisé comme un ensemble de clauses et un calcul se fait par la recherche d’une preuve.

Nous commençons par traiter le cas de la résolution en logique propositionnelle puis nous verrons comment la méthode se généralise en logique du premier ordre.

4.3.1 Résolution propositionnelle

Une clause est une disjonction de littéraux et peut se écrire comme un ensemble de littéraux. Nous noterons une clause l₁∨…∨ l_n, chaque littéral apparaitra une seule fois et l’ordre est indifférent.

Le cas où cet ensemble est vide correspond à la proposition ⊥ qui est toujours fausse. Si la clause contient la formule ⊤ alors, la clause est toujours vraie (clause triviale). Nous nous intéressons à la satisfiabilité d’un ensemble de clauses, et une clause toujours vraie est satisfiable dans toutes les interprétations. Une clause triviale peut être retirée de l’ensemble considéré sans changer le problème (E est satisfiable si et seulement si E∪{⊤} est satisfiable). On peut toujours se ramener au cas où les littéraux sont des variables ou des négations de variables propositionnelles.

On suppose donné un ensemble de clauses E. On cherche à savoir si ces clauses sont satisfiables, c’est-à-dire s’il existe une interprétation I telle que I⊨ E. La notation I⊨ E représente le fait que pour toute formule P∈ E, on a I⊨ P.

Pour cela on va se donner un système de règles qui nous permet de dériver de nouvelles clauses C telle que si I⊨ E alors on a aussi I⊨ C. Le but du jeu est d’aboutir à la clause vide qui représente ⊥ et qui est insatisfiable et donc d’en conclure que l’ensemble de clause initial n’est pas satisfiable.

Définition 1 (Déduction par résolution) Soit C et C′ deux clauses propositionnelles et p une variable propositionnelle, la règle de résolution a la forme suivante :

C ∨ ¬ p C′∨ p

C∨ C′

La notation C∨ C′ construit la clause qui contient tous les littéraux de C et C′ en supprimant les doublons.

Soit E un ensemble de clauses, une déduction par résolution à partir de E est une suite de clauses C₁,…,C_n telle que pour toute clause C_i dans cette suite soit C_i∈E, soit il existe deux clauses C_j et C_k telles que j,k< i et telle que C_i soit le résultat de la règle de résolution appliquée à C_j et C_k.

Exemple 1 (déduction par résolution) On se donne l’ensemble E suivant {¬ p ∨ ¬ q ∨ r, ¬ r, p}. On peut faire les étapes de résolution suivantes (on a mis en indice de chaque règle la variable propositionnelle sur laquelle porte la résolution) :

(r)

(p)	¬ p ∨ ¬ q ∨ r p

	¬ q ∨ r

¬ r

¬ q

On obtient la déduction par résolution suivante :

¬ p ∨ ¬ q ∨ r, p, ¬ q ∨ r, ¬ r,¬ q

Définition 2 (Preuve par résolution)

une réfutation par résolution de E est une déduction par résolution à partir de E qui contient la clause vide ⊥;
une preuve par résolution (on dit aussi une preuve par réfutation) d’une formule quelconque A à partir d’un ensemble de formules E est une réfutation à partir d’une mise en forme clausale de l’ensemble de formules E ∪ {¬ A}.

Exemple 2 (réfutation) Soit l’ensemble E suivant {¬ p ∨ ¬ q ∨ r, ¬ r, p, q}. On peut construire une réfutation :

(q)

(r)

(p)	¬ p ∨ ¬ q ∨ r p

	¬ q ∨ r

¬ r

¬ q

⊥

Exemple 3 (preuve par résolution) Soit A définie comme ¬ (p ∨ (q ∧ r)) ⇒ (¬ q ∨ ¬ r). Pour faire une preuve par résolution de A, on met la formule ¬ A en forme clausale:

¬ (¬ (p ∨ (q ∧ r)) ⇒ (¬ q ∨ ¬ r)) ≡ ¬ (p ∨ (q ∧ r)) ∧ (q ∧ r) ≡ ¬ p ∧ (¬ q ∨ ¬ r) ∧ q ∧ r

On a donc quatre clauses : {¬ p, (¬ q ∨ ¬ r),q,r}. On construit une réfutation de la manière suivante :

(q)

(r)	¬ q ∨ ¬ r r

	¬ q

⊥

La formule ¬ A est instatisfiable et donc la formule A est valide.

Exercice 6 Faire une réfutation par résolution de l’ensemble des formules p∨ q,¬ p∨¬ q,p∨ ¬ q, ¬ p∨ q}.

Proposition 1 (Correction de la résolution) Soit E un ensemble de clauses

Soit E′ une déduction par résolution à partir de E, on a E⊨E′, c’est-à-dire que toute interprétation qui rend vraies les formules de E, rend vraies les formules de E′.
S’il existe une réfutation par résolution de E, alors E est insatisfiable.
Soit une formule A et E un ensemble de formules, s’il existe une preuve par résolution de A à partir de E alors A est conséquence logique de E (E⊨ A).

Complétude

On peut se poser la question de savoir si la méthode de résolution peut toujours nous donner la solution. C’est-à-dire si on se donne un ensemble E de clauses insatisfiable, est-ce qu’il existe une réfutation de E par la méthode de résolution. La réponse est oui.

Proposition 2 (Complétude de la résolution propositionnelle) Soit E un ensemble de clauses insatisfiable, alors il existe une réfutation par résolution de E.

Preuve: On va faire la preuve dans le cas où on a un nombre fini ou dénombrable de variables propositionnelles (p_i)_i∈ℕ. On construit un arbre binaire de décision. Chaque niveau est étiqueté par une variable propositionnelle, en partant de p₀, le sous-arbre gauche correspond au cas où cette variable vaut F et le sous-arbre droit, au cas où elle vaut V. Chaque branche (possiblement infinie) correspond donc à une interprétation des logique des variables propositionnelles (p_i)_i∈ℕ.

Si on a juste deux variables p et q, l’arbre de décision se présentera ainsi (on a indiqué pour chaque sommet l’interprétation correspondante)

Chaque nœud interne de l’arbre correspond à une interprétation partielle de certaines des variables. Au niveau de la racine, aucune variable n’a de valeur.

Si l’ensemble E est insatisfiable alors pour chaque interprétation I, il existe une clause C∈E telle que I⊭C. Comme C n’a qu’un nombre fini de variables, on peut positionner la formule dans l’arbre le plus haut possible telle que l’interprétation I restreinte à p₀,…,p_n rend faux la clause C. Il est possible de faire cela pour toutes les branches de l’arbre. On va appeler un tel arbre un arbre de réfutation de E.

Par exemple un arbre de réfutation pour l’ensemble de clauses {p ∨ q , p ∨ ¬ q, ¬ p} est :

Un arbre à branchement fini dont toutes les branches sont finies est lui-même fini (lemme de König). Donc on a un arbre fini, et chaque feuille contient une clause de E qui est fausse dans l’interprétation correspondant à la branche. Soit E un ensemble de clauses insatisfiable et E′ une déduction par résolution à partir de E. On construire l’arbre de réfutation pour l’ensemble des clauses E∪ E′.

Il se peut que cet arbre soit réduit à une feuille, celle-ci doit correspondre à une formule qui est fausse dans l’interprétation vide, il ne peut s’agir que de ⊥ et donc ⊥∈ E∪ E′ et on a une réfutation par résolution.

Si l’arbre n’est pas vide,on a un nœud de la forme

avec p une variable propositionnelle et C et D des clauses. Soit I l’interprétation des variables autres que p qui correspond au chemin de la racine de l’arbre jusqu’à p. Attention I ne définit pas la valeur de toutes les variables propositionnelles, c’est seulement une interprétation partielle et donc toutes les clauses ne peuvent pas être évaluées dans cette interprétation.

On a I,{p↦ F}⊭C et I,{p↦ V}⊭D par définition des arbres de réfutation. La variable propositionnelle p apparait dans C et dans D (sinon on aurait pu faire remonter l’une de ces clauses plus haut dans l’arbre). On a forcément C=C′∨ p et D=D′∨ ¬ p (sinon les clauses seraient vraies à l’endroit où elles sont positionnées). Ce qui signifie que l’on peut faire une étape de résolution entre les deux clauses, qui nous donnera une clause C′∨ D′ telle que I ⊭C′∨ D′.

On voit donc qu’au fur et à mesure que l’on construit la déduction par résolution, on a un ensemble de clauses pour lequel l’arbre de réfutation diminue. Au final on aura un arbre réduit à une feuille ⊥ ce qui correspond à une réfutation. □

Evidemment cette démonstration n’est pas une manière effective de guider la recherche d’une réfutation par la méthode de résolution puisque si on avait l’arbre de réfutation on pourrait conclure immédiatement que l’ensemble de clauses est insatisfiable sans avoir recours à la résolution. Il faut parfois une peu d’intuition pour aboutir à la clause vide. Suivant la forme des clauses on peut avoir des stratégies plus précises.

Il se peut qu’en faisant une étape de résolution on trouve la clause triviale ⊤ ou que l’on retombe sur une clause déjà connue. Cela ne signifie pas que l’on s’est trompé mais juste que les étapes de calcul faites étaient inutiles. Il faut alors chercher d’autres combinaisons ou s’interroger si l’ensemble de clauses de départ est bien insatisfiable.

4.3.2 Résolution au premier ordre

En logique propositionnelle, une clause est un ensemble de littéraux (variable propositionnelle ou négation de variable propositionnelle) et on se ramène au cas où chaque variable propositionnelle apparaît une seule fois.

Dans le cas du premier ordre, les littéraux sont de la forme R(t₁,…,t_n) ou ¬ R(t₁,…,t_n) avec R un symble de prédicat et t_i des termes. Le même symboles peut donc apparaître plusieurs fois dans le clause de manière positive ou négative associée à des termes différents.

Par ailleurs les termes qui apparaissent dans les clauses peuvent contenir des variables. De fait une clause C qui contient les variables x₁,…,x_n} est juste une représentation sans quantificateur de la formule ∀ x₁ … x_n,C que l’on a choisi de noter ∀ (C).

Une autre interprétation de la clause avec variables C est l’ensemble des instances closes (sans variable) de la formule c’est-à-dire l’ensemble des clauses C[σ₀] avec σ₀ une substitution qui remplace chaque variable de C par un terme clos. Le théorème de Herbrand nous a permis d’établir que la satisfiabilite de la formule ∀ (C) était équivalente à la satisfiabilité de l’ensemble (potentiellement infini) de toutes les instances closes de C. C’est ce qui est exploité dans la résolution au premier ordre.

On part d’un ensemble de clauses (disjonction de littéraux vue comme un ensemble de littéraux). On rappelle que l’unification sur les termes s’étend de manière naturelle à l’unification sur les littéraux. Deux littéraux L₁ et L₂ s’unifient s’ils sont de la forme R(t₁,…,t_n) et R(u₁,…,u_n) ou bien ¬ R(t₁,…,t_n) et ¬ R(u₁,…,u_n) et que le problème (t_i=^? u_i) admet une solution. Dans ce cas on note unif(L₁,L₂) l’unificateur principal.

Règles pour la résolution

Définition 3 La méthode de résolution en calcul des prédicats utilise trois règles qui manipulent des clauses :

Factorisation : si σ est l’unificateur principal de L₁ et L₂ alors :
L₁ ∨ L₂ ∨ C

L₁[σ]∨ C[σ]
Renommage : si σ est une bijection sur les variables alors :
C

C[σ]
Résolution binaire : si les clauses L₁ ∨ C et ¬ L₂ ∨ C′ n’ont pas de variables communes et si σ est l’unificateur principal de L₁ et L₂ alors :
L₁ ∨ C ¬ L₂ ∨ C′

C[σ]∨ C′[σ]

Une déduction par résolution à partir de E est une suite de clauses C₁,…,C_n telle que pour toute clause C_i dans cette suite

soit C_i∈E;
soit il existe une clause C_j telle que j< i et telle que C_i soit le résultat de la règle de factorisation ou de renommage appliquée à C_j;
soit il existe deux clauses C_j et C_k telles que j,k< i et telle que C_i soit le résultat de la règle de résolution appliquée à C_j et C_k.

Les définitions de réfutation par résolution et de preuve par résolution sont les mêmes que dans le cas propositionnel (définition 2) mais avec la notion de déduction par résolution générale.

Exemple 4 Soit l’ensemble de clauses P(x), ¬ P(y) ∨ Q(y), ¬ Q(a) avec P et Q deux symboles de prédicat unaire et a une constante.

On construit la déduction par résolution

[x← a]

[y← x]	¬ P(y) ∨ Q(y) P(x)

	Q(x)

¬ Q(a)

⊥

On remarque que les deux premières règles sont triviales dans le cas propositionnel et que la dernière règle généralise la règle de résolution propositionnelle.

La règle de renommage sert juste à préparer les clauses pour appliquer la règle de résolution dont une des conditions est que les deux clauses ne partagent pas de variable.

La règle de factorisation permet de faire disparaitre plusieurs littéraux lors d’une étape de résolution binaire comme le montre l’exemple suivant : E={P(x,y)∨ P(y,x), ¬ P(u,z) ∨ ¬ P(z,u)}

Exemple 5 (Règle de factorisation) Si on applique la règle de résolution avec les formules P(x,y)∨ P(y,x) et ¬ P(u,z) ∨ ¬ P(z,u) alors on obtient

[x← u,y← z]	P(x,y)∨ P(y,x) ¬ P(u,z) ∨ ¬ P(z,u)

	P(z,u)∨ ¬ P(z,u)

qui est la clause triviale et donc n’aboutit pas à une contradiction.

Par contre, on peut commencer par effectuer des factorisations sur les deux clauses dont on déduit facilement une contradiction

[y← u]

[x← y]	P(x,y)∨ P(y,x)

	P(y,y)

¬ P(u,z) ∨ ¬ P(z,u)	[z← u]

¬ P(u,u)

⊥

Exemple 6 (Preuve par résolution) Soit A =^def ∃ x, ∀ y, (S(y)⇒ R(x)) ⇒ (S(x)⇒ R(y)). Pour prouver A, on fait une réfutation de la formule ¬ A.

On commence par mettre ¬ A en forme clausale.

La forme normale de négation de ¬ A est ∀ x, ∃ y, (¬ S(y)∨ R(x)) ∧ S(x)∧¬ R(y)
On skolémise pour éliminer le quantificateur existentiel. Cette opération introduit un nouveau symbole de fonction que l’on notera f et qui est unaire (dépendance de la propriété par rapport à x). On obtient la formule ∀ x, (¬ S(f(x))∨ R(x)) ∧ S(x)∧¬ R(f(x))
On découpe alors en clauses, il y en a trois {(¬ S(f(x))∨ R(x)), S(y), ¬ R(f(z))}

On procède ensuite aux étapes de résolution en vue de produire la clause vide :

[x← f(z)]

[y← f(x)]	¬ S(f(x))∨ R(x) S(y)

	R(x)

¬ R(f(z))

⊥

On conclut : ¬ A est insatisfiable donc A est valide.

Exercice 7 En utilisant la résolution, montrer que

(∃ x,¬ P(x)), (∀ x,(P(x) ∨ Q(x)))⊨ ∃ x, Q(x)

Propriétés de la résolution

La correction de la méthode de résolution établit que si l’on peut déduire une clause C à partir d’un ensemble de clauses E alors la formule ∀(C) est conséquence logique de l’ensemble des formules {∀ (D)|D ∈ E}.

On établit facilement les propriété suivantes. SOit A et B deux formules, x une variable et t un terme.

Ces résultats se généralisent au cas de plusieurs formules et plusieurs variables. Si σ est une substitution alors ∀ (C) ⊨ C[σ] qui se déduit du lien entre substitution et vérité :

Par ailleurs si E ⊨ Q et que les variables libres de Q ne sont pas libres dans E, alors E ⊨ ∀ (Q).

Proposition 3 (Correction de la résolution) Soit E un ensemble de clauses, chacune des étapes possibles de déduction par résolution produit une clause C telle que {∀ (D)|D ∈ E}⊨ ∀(C).

En particulier s’il existe une réfutation de E, alors {∀ (D)|D ∈ E} est insatisfiable.

Preuve: On va montrer la correction de chacune des règles en montrant que la généralisation de la conclusion est une conséquence logique de la généralisation des hypothèses.:

La méthode de résolution est aussi complète dans le cas de la logique du premier ordre, c’est-à-dire que si E est un ensemble de clauses et que ⊥ est une conséquence logique de {∀(C)|C ∈ E} alors on peut déduire la clause vide par la méthode de résolution à partir de l’ensemble E.

Ce résultat utilise le Théorème de Herbrand et la compacité qui nous permettent d’établir qu’il existe un ensemble fini insatisfiable d’instances closes des clauses de E :

L’ensemble F est propositionnel, on peut donc par le théorème de complétude de la résolution propositionelle construire une réfutation par résolution de cet ensemble.

La clé de la preuve est ensuite le Lemme de relèvement qui permet d’établir que les étapes faites au niveau de la déduction propositionnelle peuvent se simuler au travers des règles de résolution au premier ordre.

Proposition 4 (Lemme de relèvement) Soit C et D deux clauses du premier ordre sans variable commune. Si on peut faire une étape de résolution propositionnelle entre deux instances closes

C[σ] D[σ]

alors il existe une clause E et une substitution τ telle que E peut être obtenu à partir des clauses C et D par des règles de résolution du premier ordre et P=E[τ].

Nous ne détaillerons pas la preuve ici. On pourra regarder plus précisément les points suivante.

4.3.3 Questions de stratégie

La méthode de résolution consiste à combiner des clauses dans le but d’obtenir la clause vide. Néanmoins il y a de nombreuses manières différentes de la faire et on peut s’interroger s’il existe des stratégies plus efficaces que d’autres.

Eliminer les clauses inutiles

Supposons qu’un des symboles de prédicat R n’apparaisse que de manière positive dans les clauses. Alors toutes les clauses dans lesquelles ce symbole apparaît peuvent être éliminées.

Exercice 8

Soit E un ensemble de clauses, tel que chacune des clauses contient au moins un littéral R(t₁,…,t_n) et aucun littéral négatif ¬ R(u₁,…,u_n). Montrer que E est satisfiable.
Soit E un ensemble de clauses, qui ne contient aucun littéral négatif ¬ R(u₁,…,u_n). Montrer que E est satisfiable si et seulement si l’ensemble {C∈E|C ne contient pas de littéral R(t₁,…,t_n)} est satisfiable.

Le même résultat s’applique si le symbole R n’apparait que de manière négative dans les clauses.

Il arrive que dans une dérivation, on puisse retomber sur une clause qui ressemble à une clause déjà rencontrée. Supposons qu’on ait à la fois une clause C et une clause C[σ]∨ D, alors la clause C[σ]∨ D peut être ignorée. En effet on a ∀(C)⊨ ∀ (C[σ]∨ D) donc E,∀(C),∀ (C[σ]∨ D)⊨ ⊥ si et seulement si E,∀(C)⊨ ⊥

Stratégie unitaire et clauses de Horn

Lorsque l’on combine deux clauses par la méthode de résolution, on peut obtient en générale une clause qui est aussi grosse voir plus grosse que les clauses dont on est parti. Sauf si une des deux clauses est composée d’un seul litteral (on dit que la clause est unitaire) auquel cas la clause obtenue après résolution est plus petite que la clause dont on était parti.

Malheureusement, la stratégie de choisir de faire toujours une résolution avec une clause réduite à un littéral ne fonctionne pas. En effet il y a des ensemble de clauses contradicatoires qui ne contiennent pas de clause unitaire et la stratégie de choisir toujours une clause unitaire poeut nous amener à ne jamais considérer ces clauses. C’est ce qui se passe dans l’exemple suivant :

La stratégie unitaire engendre un ensemble infini de clauses {P(f(a)),P(f(f(a))),…,P(fⁿ(a)),…} qui ne mêne pas à une contradiction alors que l’ensemble {¬ p ∨ ¬ q,¬ p ∨ q, p ∨ ¬ q,p∨ q} est lui insatisfiable.

Les clauses de Horn sont des cas particuliers de clauses qui contiennent au plus un seul littéral positif (sans négation). Les règles de la résolution appliquées à des clauses de Horn produisent des clauses de Horn.

Proposition 5 (Résolution unitaire pour les clauses de Horn) Soit S un ensemble de clauses de Horn, si S est insatisfiable, alors on peut dériver la clause vide en utilisant à chaque étape de résolution au moins une clause unitaire (résolution unitaire).

Application à la programmation logique

En 1972, l’informaticien Alain Colmerauer qui s’intéressait au traitement automatique des langues introduit, avec Philippe Roussel, le langage ProLog.

Le principe de base est de modéliser un problème à l’aide de Clauses de Horn.

Une clause avec un littéral positif p : ¬ p₁∨ … ∨ ¬ p_n∨ p est écrite sous la forme p:- p₁,…, p_n. et peut se lire comme (p₁∧ … ∧ p_n) ⇒ p qui est bien équivalent à ¬ p₁∨ … ∨ ¬ p_n∨ p

Lorsque la clause ne contient pas de littéral positif ¬ p₁∨ … ∨ ¬ p_n, elle s’écrira sous la forme :- p₁,…, p_n. et peut se lire comme (p₁∧ … ∧ p_n) ⇒ ⊥ qui est bien équivalent à ¬ p₁∨ … ∨ ¬ p_n ≡ ¬(p₁∧ … ∧ p_n).

Lorsque la clause est composée uniquement d’un littéral positif p, elle s’écrit simplement p.

Pour exécuter un programme, on va poser des questions sous la forme d’une conjonction de littéraux positifs qui peuvent contenir des variables.

Le système va rechercher les instances de ce programme qui sont conséquence logique des clauses du programme. Pour cela il va utiliser la méthode de résolution pour rechercher des contradictions à partir de la négation de ces prédicats.

Exemple 7 Une base qui modélise les relations de parenté peut se décrire avec les clauses suivantes.

1 fratrie(X,Y) :- parent(Z,X), parent(Z,Y), X \= Y. 2 parent(X,Y) :- pere(X,Y). 3 parent(X,Y) :- mere(X,Y). 4 pere(tom, sally). 5 pere(tom, erica).

Les questions que l’on peut poser sont ”est-ce que sally et erica sont dans la même fratrie” ou bien qui est dans la fratrie de sally. Cela se décrira en ProLog par les clauses suivantes :

?-fratrie(sally,erica). ?-fratrie(sally,x).

Supposons que la question soit

6 ?-fratrie(sally,erica).

Les seuls clauses unitaires sont les clauses 4 et 5. on peut combiner les clauses 2 et 4 ainsi que 2 et 5 pour obtenir les clauses unitaires suivantes :

7 parent(tom,sally). 8 parent(tom,erica).

On peut ensuite faire la résolution de la clause 1 avec ces clauses 7 puis 8 et on obtient

9 fratrie(sally,Y) :- parent(tom,Y), sally \= Y. 10 fratrie(sally,erica).

La contrainte sally≠erica est résolue indépendament.
La clause 10 se combine alors avec la question 6 pour obtenir la clause vide ce qui établit le résultat.

Si maintenant la question est de chercher toutes les personnes dans la fratrie de sally, cela se traduit par :

6 ?-fratrie(sally,x).

il s’agit de trouver pour quelles valeurs de x ce problème a une solution. Les étapes vont être analogues