Un type structuré est un type permettant d'associée
plusieurs données de façon à les traîter comme un
tout.
Un exemple de type structuré vu en L1 est le tableau :
Nous allons voir plusieurs types structurés proposés en standard par OCaml et adaptés à la programmation fonctionnelle.
Le type structuré le plus simple est celui des produits,
aussi appelés n-uplets.
En OCaml, une expression n-uplet se note (e1,
…, en) :
let div_mod a b =
(a / b, a mod b)
Le type des n-uplets se note t1 * … *
t2. Le nom de produit vient du « produit
Cartésien » A × B entre deux ensembles.
La fonction div_mod ci-dessus a le type
int -> int -> int * int
Elle prend en argument deux entiers et renvoie une paire d'entiers.
Une façon commode de travailler avec les n-uplet est d'utiliser un let multiple.
let x, y = div_mod 10 3
let () = Printf.printf "%d/%d = %d et il reste %d\n" 10 3 x y
Une autre façon de faire est d'utiliser les fonctions prédéfinies : fst (pour first) et snd (pour second) :
let res = div_mod 10 3
let () = Printf.printf "%d/%d = %d et il reste %d\n"
10 3 (fst res) (snd res)
Les n-uplets ne sont pas limités aux paires :
let hms s =
let h = s / 3600 in
let s = s / 3600 in
let m = s / 60 in
let s = s mod 60 in
(h, m, s)
(* val hms : int -> int * int * int *)
Attention, dans ce cas on ne peut plus utiliser les fonctions fst et snd qui sont réservées aux paires. La notation let est à privilégier :
let h, m, s = hms 4932
let () = Printf.printf
"%d secondes font %d heure(s), %d minute(s) et %d seconde(s)\n"
4932 h m s
(*Affiche:
4932 secondes font 1 heure(s) 22 minute(s) et 12 seconde(s)
*)
Une variante du type produit est le produit nommé aussi appelé
enregistrement (ou struct ou record).
En OCaml, un produit nommé doit être déclaré au moyen de l'instruction
type :
type point = { x : float; y : float }
let origin = { x = 0.0; y = 0.0 }
let dist p1 p2 =
let dx = p1.x -. p2.x in
let dy = p1.y -. p2.y in
sqrt (dx *. dx + dy *. dy)
(* dist : point -> point -> float *)
let p1 = { x = -1.0; y = 5.5 }
let p2 = { x = 10.0; y = 3.4 }
La syntaxe pour définir un produit nommé est :
type nom_type = {
lab1 : type1 ;
…
labn : typen ; (* le dernier ; est optionnel *)
}
Les labi sont des étiquettes ou des champs. Ils permettent d'accéder aux composantes du produit nommé. Les expressions s'écrivent :
{
lab1 = e1 ;
…
labn = en ; (* le dernier ; est optionnel *)
}
On peut ensuite accéder à un champs par : e.labi.
Les produits nommés sont un peu moins souple que les n-uplets :
type personne = { nom : string; prenom : string }
type pays = { nom : string; lat : float; long : float }
let get_nom p = p.nom
(* de type:
pays -> string
l'étiquette nom du types pays « masque » celle du type personne.
*)
Pour les TPs, on utilisera toujours des noms d'étiquettes uniques.
Il est courant en informatique d'avoir un type composé de plusieurs « cas » différents. Pour gérer cela, OCaml propose des types « sommes » (aussi appelés types algébriques ou variants). On va prendre l'exemple d'un jeu de cartes que l'on souhaite modéliser :
type couleur = Coeur | Pique | Trefle | Carreau
Le code ci-dessus permet de définir quatres constantes, du type couleur. C'est une approche plus robuste que d'utiliser des entiers ou des chaînes de caractères. On veut aussi pouvoir définir la valeur d'une carte :
type valeur = Roi | Dame | Valet | Valeur of int
Ici, on indique que la valeur d'une carte peut être soit l'une des trois constantes Roi, Dame, Valet soit une un entier « décoré » par l'étiquette Valeur. On peut enfin définir une carte, par exemple en utilisant un produit nommé :
type carte = { valeur : valeur ; couleur : couleur }
let roi_pique = { valeur = Roi; couleur = Pique }
let sept_coeur = { valeur = Valeur (7); couleur = Coeur }
On peut manipuler les types sommes comme n'importe quelle valeur OCaml :
let est_tete c =
c.valeur = Roi || c.valeur = Dame || c.valeur = Valet
(* est_tete : carte -> bool *)
Cette utilisation est cependant inélégante. De plus, on ne peut pas utiliser les « entiers étiquetés » directement :
let as_trefle = { valeur = Valeur 1; couleur = Trefle}
let () = Printf.printf "valeur : %d\n" as_trefle.valeur
(*
Error: This expression has type valeur but an expression was
expected of type int
*)
Les types produits (n-uplets ou produits nommés) possèdent une notation
simple pour accéder à leur composantes (let x, y = …, e.x,
…).
Comment manipuler des valeurs d'un type somme ?
let string_of_valeur v =
match v with
Roi -> "Roi"
| Dame -> "Dame"
| Valet -> "Valet"
| Valeur (1) -> "As"
| Valeur (n) -> string_of_int n
(* string_of_valeur : valeur -> string *)
Dans un type sommes, il faut tester tous les cas possibles (étant donné une valeur de carte, on ne sait pas a priori dans quel cas on est). Cette construction est similaire au switch de C/C++/Java mais est plus sophistiquée.
Un type somme peut être inspecté en OCaml au moyen de la construction match … with. Cette dernière a la syntaxe suivante :
match e with
p1 -> e1
| p2 -> e2
…
| pn -> en
e est l'expression à analyser. Chaque pi -> ei
est appelé une branche. Les pi sont appelés des motifs
(pattern en anglais). Les ei sont des expressions.
En première approximation, un motif est soit une constante d'un type somme, soit
une valeur étiquetée. Dans ce cas on peut capturer des sous-valeurs au moyen de
variables (comme le n dans le transparent précédent).
match e with
p1 -> e1
| p2 -> e2
…
| pn -> en
Dans l'expression ci-dessus, e est évalué pour donner une valeur v. Puis, v est comparée tour à tours aux motifs :
Le compilateur OCaml détecte si un filtrage est incomplet ou au contraire redondant. Dans les deux cas un « warning » est émis :
# let dix = Valeur (10);;
val dix : valeur = Valeur 10
# match dix with
Roi -> "Roi"
| Valeur (n) -> string_of_int n;;
Warning 8: this pattern-matching is not exhaustive.
Here is an example of a case that is not matched:
(Dame|Valet)
# match dix with
Roi -> "Roi"
| Dame -> "Dame"
| Valet -> "Valet"
| Valeur (n) -> string_of_int n
| Valeur (1) -> "As";;
Warning 11: this match case is unused.
On fera en sorte de toujours avoir du code sans warning.
On illustre l'utilisation du filtrage avec d'autres fonctions
let string_of_couleur c =
match c with
Pique -> "Pique"
| Coeur -> "Coeur"
| Trefle -> "Trefle"
| Carreau -> "Carreau"
(* string_of_couleur : couleur -> string *)
let string_of_carte c =
(string_of_valeur c.valeur) ^ " de " ^ (string_of_couleur c.couleur)
let as_pique = { valeur = Valeur (1); couleur = Pique}
let s = string_of_carte as_pique
(* s : string = "As de Pique" *)
(* renvoie -1 si c1 < c2, 0 si c1 = c2 et 1 si c1 > c2 *)
let compare_cartes c1 c2 =
match c1.valeur, c2.valeur with
| Roi, Roi | Dame, Dame | Valet, Valet -> 0
| Roi, _ -> 1
| _ , Roi -> -1
| Dame, _ -> 1
| _, Dame -> -1
| Valet, _ -> 1
| _, Valet -> -1
| Valeur v1, Valeur v2 ->
if v1 < v2 then -1
else if v1 = v2 then 0
else 1
(* compare_cartes : carte -> carte -> int *)
(* Pas de warning, on sait qu'on a traité tous les cas *)
Remarque : _ est une variable spéciale qui signifie «n'importe
quelle valeur».
On peut factoriser les motifs qui ont la même expression:
p1 | p2 | p3 -> e
On veut modéliser des formes (triangle, rectangle, carré, cercle, ellipse) de façon à pouvoir calculer leur aire.
On revient un moment sur les fonctions fst et snd
qui permettent d'extraire la première et seconde composante d'une paire.
Elles sont définies dans la bibliothèque standard d'OCaml avec un simple
filtrage :
let fst p =
match p with
(x, _) -> x
let snd p =
match p with
(_, y) -> y
let p1 = (1, 2)
let x1 = fst p1 (* x1 : int = 1 *)
let p2 = (true, "Hello")
let y2 = snd p2 (* y2 : string = "Hello" *)
Quel est le type de fst et snd ?
Essayons de simuler le compilateur OCaml et écrivons les équations que l'on peut obtenir en typant fst :
let fst p =
match p with
(x, _) -> x
Le type final de fst est donc :
Xa*Xb->Xa
C'est exactement ce qu'OCaml nous affiche :
# fst;;
val fst : 'a * 'b -> 'a = <fun>
Une fonction est dite polymorphe si le type de ses arguments ou de ses résultats n'est pas contraint. OCaml signale de tels types par : 'a, 'b, 'c, … (on lit α, β, γ, …)
# fst;;
val fst : 'a * 'b -> 'a = <fun>
# snd;;
val snd : 'a * 'b -> 'b = <fun>
# let id x = x;;
val id : 'a -> 'a = <fun>
# let dup x = (x, x);;
val dup : 'a -> 'a * 'a = <fun>
De telles fonctions peuvent être appliquées à n'importe quelles valeurs si les types sont compatibles :
# fst (1, 2);;
- : int = 1
# snd (true, "Hello");;
- : string = "Hello"
# id 42.0
- : float = 42.0
# dup false;;
- : bool * bool = (false, false)
On peut appliquer fst à n'importe quel type paire.
Note : c'est équivalent aux variables génériques du langage Java HashMap<K, V>
Une des affirmations de ce cours est que la programmation fonctionnelle est un outil permettant d'écrire du code plus compact. Considérons les trois fonctions :
let rec fact n =
if n = 0 then
1
else
n * fact (n-1)
let res = fact 10
(* 3628800 *)
let rec sum n =
if n = 0 then
0
else
n + sum (n-1)
let s = sum 10;;
(* 55 *)
let rec to_str n =
if n = 0 then
"0"
else
(string_of_int n)
^ " " ^
to_str (n-1)
let txt = to_str 10
(* "10 9 8 7 6 5 4 3 2 1 0" *)
On souhaite ne pas dupliquer le code contrôle (if, appel récursif,
…)
On veut isoler les points communs de ces trois fonctions :
On veut pouvoir écrire une fonction recur_gen qui a ce comportement. La fonction doit être paramétrée par :
Comment représenter cette opération ? Avec une fonction !
let rec recur_gen base op n =
if n = 0 then
base
else
op n (recur_gen base op (n-1))
Quel est le type de recur_gen ?
'a -> (int -> 'a -> 'a) -> int -> 'a
let add x y = x + y
(* add : int -> int -> int *)
let mul x y = x * y
(* mul : int -> int -> int *)
let add_str x y = (string_of_int x) ^ " " ^ y
(* add_str : int -> string -> string *)
let fact n = recur_gen 1 mul n (* int -> int *)
let sum n = recur_gen 0 add n (* int -> int *)
let to_str n = recur_gen "0" add_str n (* int -> string *)
recur_gen 1 mul n
↓
let rec recur_gen base op n =
if n = 0 then
base 1
else
op mul n (recur_gen base op (n-1))
↓
let rec recur_gen n =
if n = 0 then
1
else
n * (recur_gen (n-1))
En OCaml les opérateurs (+, +., ^, …) peuvent aussi être utilisées comme des fonctions. On écrit alors :( + ), ( +. ), ( ^ ), …
# ( + );;
val ( + ) : int -> int -> int = <fun>
# ( +. )
val ( +. ) : float -> float -> float = <fun>
# ( ^ )
val ( ^ ) : string -> string -> string = <fun>
# ( && )
val ( && ) : bool -> bool -> bool = <fun>
On peut définir fact et sum de façon encore plus compacte.
let fact n = recur_gen 1 ( * ) n (* int -> int *)
let sum n = recur_gen 0 ( + ) n (* int -> int *)
C'est un outil très puissant que l'on va réutiliser par la suite :