Comment interpréter les résultats des tests (COVID-19 et autres)

English version here.

En ces temps de pandémie, on parle beaucoup de l'importance des tests. Il ne fait aucun doute que pour contenir la propagation du virus, il faut identifier les personnes malades, et donc les tester. Cependant, il est tentant de considérer le résultat d'un test comme acquis : si les test est positif, je suis malade ; si le test est négatif, je ne le suis pas.

Malheureusement, les tests ne sont pas fiables à 100 % : vous pouvez être testé positif et ne pas être malade - c'est ce qu'on appelle un faux positif ; vous pouvez être testé négatif et être néanmoins malade - c'est ce qu'on appelle un faux négatif.

Afin de comprendre ce que signifie recevoir un résultat positif ou négatif à un test, nous avons besoin de deux informations:

En règle générale, la prévalence est faible et la précision élevée. Vous pouvez les régler à l'aide de ces deux curseurs :
%; %

Il est tentant de penser que puisque le test est précis dans % des cas, si vous recevez un résultat positif, vous avez % de chances d'être malade (et inversement, si vous recevez un résultat négatif, vous avez % de chances d'être en bonne santé). CE N'EST PAS LE CAS !

En fait, pour les paramètres ci-dessus, si vous obtenez un résultat positif, vous avez % de chances d'être malade, et si vous obtenez un résultat négatif, vous avez % de chances d'être en bonne santé !

Note 1 : Au lieu d'utiliser le mot "malade", nous devrions plutôt dire "infecté" en raison de la période d'incubation et du fait qu'un certain nombre de personnes infectées ne tombent pas malades du tout. Par souci de simplicité, nous nous en tiendrons néanmoins au mot "malade".

Note 2 : La précision d'un test est mesurée normalement par deux nombres : la sensibilité et la spécificité. Nous les abordons à la fin de la page.

Pourquoi ?

Visualisons ces deux paramètres :

Vous pouvez modifier la prévalence et la précision à l'aide des curseurs situés à côté des diagrammes.

Prévalence   %
% %
Malade Sain
Précision: %
% Correct
% Incorrect

Maintenant, croisons ces deux diagrammes. Nous obtenons le diagramme ci-dessous avec quatre quadrants :

Malade Sain Total
Test correct % % %
Test incorrect % % %
Total % % 100%

La partie supérieure représente la proportion de la population qui a obtenu un résultat correct, soit positif parce qu'elle est malade (à gauche, %) soit négatif parce qu'elle est en bonne santé (à droite, %).

La partie inférieure représente la proportion de la population qui a reçu des résultats incorrects : faux négatifs - le test est négatif mais ils sont en fait malades (à gauche, %); faux positifs - le test est positif mais ils sont en fait en bonne santé (à droite, %).

Vous pouvez modifier les paramètres pour voir comment les quatre quadrants changent.

Une autre façon de voir les choses

Une autre façon de regarder le diagramme est de noter que la diagonale principale (% + %) représente les personnes qui ont reçu un résultat négatif : la plupart étaient sains (vrais négatifs), mais certaines étaient malades (faux négatifs). L'autre diagonale (% + %) représente ceux qui ont reçu un résultat positif : certains étaient malades (vrais positifs), mais certains étaient sains (faux positifs).

Vous pouvez remarquer que lorsque la prévalence (proportion de personnes malades) est égale à l'inexactitude du test (proportion de tests qui donnent un résultat incorrect, c'est-à-dire 100 % - précision), les proportions de vrais et de faux positifs deviennent identiques (les deux rectangles en haut à gauche et en bas à droite ont la même surface). En effet, une petite proportion (les faux positifs) d'une grande population (les personnes en bonne santé) peut être la même qu'une grande proportion (les vrais positifs) d'une petite population (les personnes malades). Le résultat est que dans ce cas, si vous obtenez un résultat positif, vous n'avez que 50% de chance d'être malade ! Cliquez sur pour afficher un tel exemple (10 % de prévalence, 90 % de précision).

Dans le cas général, la confiance que vous pouvez avoir dans les résultats est calculée comme suit:

Probabilité d'être malade si vous recevez un test positif:   / ( + ) = %
Probabilité d'être en bonne santé si vous recevez un test négatif:   / ( + ) = %

Comme vous pouvez le voir, cela est très différent de la précision du test. Voici à nouveau les deux curseurs pour explorer comment les paramètres affectent les résultats:
%; %

Une autre visualisation

Puisque nous sommes intéressés par l'interprétation du résultat d'un test (positif ou négatif), utilisons une représentation différente. Le diagramme ci-dessous montre la proportion de personnes ayant reçu un résultat négatif sur la première ligne, répartie entre les personnes malades et les personnes en bonne santé. La deuxième ligne fait de même pour celles qui ont reçu un résultat positif. En d'autres termes, nous transformons les représentations des zones du diagramme précédent en barres et les organisons différemment.

À partir de ce diagramme, nous pouvons facilement voir la proportion de résultats corrects : pour la première ligne, il s'agit de la taille relative de la barre de droite (test négatif et malade) par rapport à l'ensemble de la première barre (tous les tests négatifs) ; pour la deuxième ligne, il s'agit de la taille relative de la barre de gauche (test positif et malade) par rapport à l'ensemble de la deuxième barre (tous les tests positifs).

Sick  Sain
Test négatif% de chances que vous soyez en bonne santé si vous recevez un test négatif.
Test positif% de chances que vous soyez malade si vous recevez un test positif.

%;

Qu'en est-il des tests pour le COVID-19

La prévalence de la maladie COVID-19 est assez faible. Les estimations actuelles se situent entre 5 et 15 % de la population.
La précision des tests disponibles, en revanche, est assez faible, environ 75 % (voir quelques références en bas de page).
Vous pouvez cliquer sur pour définir ces paramètres et voir les résultats. Comme vous pouvez le voir, la confiance dans les résultats positifs est extrêmement faible. Cela explique pourquoi il n'est pas utile de tester la population dans son ensemble

En ne testant que les personnes qui présentent des symptômes et celles qui ont été en contact étroit avec des personnes dont on sait qu'elles sont malades, nous testons une population où la prévalence de la maladie est beaucoup plus élevée, disons 70%. Cela augmente la confiance dans les résultats, comme vous pouvez le voir en cliquant sur . Comme vous pouvez le voir, la confiance dans les résultats positifs est élevée, mais la confiance dans les résultats négatifs est faible. Vous pouvez consulter le diagramme avec les quatre quadrants, plus haut dans cette page, pour voir pourquoi : nous avons maintenant une situation symétrique où une grande proportion d'une petite population (ceux qui sont en bonne santé et testés négatifs - %) est identique à une petite proportion d'une grande population (ceux qui sont malades mais testés négatifs - %).

Et maintenant, les maths

Si vous aimez les maths, voici les formules qui mènent à ces résultats contre-intuitifs. On note P(x) la probabilité de l'événement x et P(x | a) la probabilité de l'événement x sachant que a est vrai.

Voici à nouveau les deux paramètres pour plus de commodité:
%; %

Sur la base de ces deux paramètres, nous pouvons définir quatre probabilités de base:

La précision du test est la probabilité qu'une personne soit testée positivement si elle est malade, et également la probabilité qu'une personne soit testée négativement si elle est en bonne santé. Ces probabilités conditionnelles correspondent à la précision du test : Notez qu'en général, il s'agit de deux valeurs différentes, appelées sensibilité (probabilité d'obtenir un test positif en cas de maladie) et spécificité (probabilité d'obtenir un test négatif en cas de santé). Par souci de simplicité, nous utilisons une seule valeur. Vous trouverez ci-dessous une section où vous pouvez définir ces deux paramètres séparément.

Nous devons maintenant calculer la probabilité qu'un test s'avère positif (resp. négatif). Cela se produit lorsque le test est précis et que la personne est malade, et lorsque le test est incorrect et que la personne est en bonne santé (de même pour les tests négatifs) :

Les couleurs aident à comprendre comment cela correspond aux zones des deux diagonales du diagramme précédent.

Ce qui nous intéresse, ce sont les probabilités conditionnelles :

Pour les calculer, nous utilisons la formule de Bayes : P(A | B) = P(B | A) * P(A) / P(B) :

Théorie de la détection du signal

Traditionnellement, les tableaux ci-dessous sont utilisés pour présenter les quatre cas d'intérêt dans ce qu'on appelle la théorie de la détection du signal :

Test positifTest négatifTotal
Malade Bonnes détections
%
Omissions
%
%
Sain Fausses alarmes
%
Bons rejets
%
%
Total % % 100%

Si nous inversons les lignes et les colonnes du tableau et que nous utilisons des barres colorées pour représenter les pourcentages, nous obtenons le diagramme que nous avons vu plus tôt :

SickHealthyTotal
Test négatif Omissions
%
Bons rejets
%
%
Test positif Bonnes détections
%
Fausses alarmes
%
%
Total % % 100%

Sensibilité et spécificité

Dans ce qui précède, nous avons utilisé le mot "précision" pour caractériser la proportion de résultats corrects d'un test. Dans la pratique, il existe des précisions distinctes pour les tests positifs et négatifs:

Le diagramme ci-dessous, similaire à celui que nous avons vu précédemment, permet de préciser ces deux taux à l'aide des deux curseurs verticaux : celui de gauche pour la sensibilité, celui de droite pour la spécificité.

Malade Sain
Sensibilité
%
Spécificité
%
Correct %
Incorrect %
Total %
% Correct
% Incorrect
%

Voici la représentation alternative correspondante que nous avons vue plus tôt :

Malade  Sain
Test négatif% de chances que vous soyez en bonne santé si vous recevez un test négatif.
Test positif% de chances que vous soyez malade si vous recevez un test positif.

Retour à COVID-19

Dans le cas de COVID-19, la spécificité du test viral RT-PCR, qui est considéré comme le test de diagnostic le plus précis, est estimée à 75% et sa sensibilité à 90%. Vous pouvez cliquer sur pour voir les niveaux de confiance pour une prévalence de 10 % (en testant la population générale au hasard), ou sur pour voir les niveaux de confiance pour une prévalence de 70 % (en testant uniquement les cas suspects).

Lorsque la probabilité d'un faux négatif est élevée, vous pouvez augmenter la confiance dans le résultat en effectuant un nouveau test. Dans ce cas, la prévalence est actualisée en fonction de la probabilité d'un vrai positif. Cliquez sur pour voir le degré de confiance après un deuxième test pour les paramètres actuels.

En revanche, les tests d'anticorps COVID-19, qui détectent si vous avez des anticorps dans votre sang, ont une précision beaucoup plus élevée. Le test Roche Antibody, par exemple, revendique une spécificité supérieure à 99,8% et une sensibilité de 100%. Cliquez sur pour voir le degré de confiance dans les résultats pour une prévalence de 10 %.

Références


Contact: Michel Beaudouin-Lafonmbl@lri.fr