MŽthode du tri croisŽ  ou des comparaisons par paires

ExposŽ ˆ caractre pŽdagogique

 

Jean MICHEL – 31 janvier 2010

 

 

Plusieurs objets (entitŽs, solutions, projets, personnesÉ) doivent tre comparŽs et classŽs les uns par rapport aux autres, ce qui est une situation assez courante.

 

La mŽthode du tri croisŽ (ou des comparaisons par paires) que lĠon va expliquer ci-aprs, prŽsente plusieurs intŽrts :

-       il est en effet nettement plus facile de comparer les objets entre eux, par paire (comparaisons locales), plut™t que de chercher dĠemblŽe ˆ vouloir les classer dans lĠabsolu du meilleur au moins bon;

-       les comparaisons se font sur la base de jugements qualitatifs simples (cĠest meilleur ou cĠest moins bon) ;

-       ces comparaisons par paires permettent, aprs traitement mathŽmatique plus ou moins ŽlaborŽ, de dŽgager une tendance gŽnŽrale de hirŽrachisation ou classement (vers un Òquasi ordreÓ) ;

-       la mŽthode sĠadapte assez bien au contexte de jurys de plusieurs personnes (multi-Žvaluateurs) devant se prononcer entre plusiuers objets (cas des concoursÉ);

-       on peut par ailleurs Žtablir des graphes ou reprŽsentations visuelles ˆ partir des tableaux de chiffres, dĠo une meilleure comprŽhension de ce qui est important ou non, in fine ;

-       la mŽthode permet enfin (notamment dans le cas de la multi-Žvaluation) de dŽgager assez facilement des points forts de convergence et dĠamener les jurys ˆ discuter plus attentivement les cas de divergence de points de vue.

 

Il est important toutefois de mettre en relief plusieurs limites :

-       il ne sĠagit pas dĠune mŽthode ÒscientifiqueÓ mme si elle a lĠapparence de la rationalitŽ ; cĠest essentiellement une technique, un outil dĠaide ˆ la dŽcision ;

-       le choix des formules mathŽmatiques utilisŽes pour pondŽrer et agrŽger les choix ŽlŽmentaires reste arbitraire et des simulations montrent aisŽment la variabilitŽ des rŽsultats dŽgagŽs ˆ la fin de la dŽmarche ;

-       et bien Žvidemment, compilant des jugements qualitatifs, elle est forcŽment conditionnŽe par la subjectivitŽ des Žvaluateurs.

 

Dans le texte qui suit, on essaye de montrer plusieurs variantes de la mŽthode, tout en expliquant sommairement la ÒmŽcaniqueÓ utilisŽe.

Pour ne pas imposer un formalisme mathŽmatique qui pourrait rebuter nombre de lecteurs, on prŽsentera des exemples simples, tous basŽs sur lĠobjectif dĠŽvaluer et classer cinq objets :  A, B, C, D, E ( 5 projets, 5 devoirs dĠŽtudiants, 5 villesÉ.).

 


1 – Le cadre de dŽpart : les Žvaluations ŽlŽmentaires

 

On va systŽmatiquement comparer A ˆ B, A ˆ C, A ˆ D, B ˆ C etcÉ  en indiquant seulement si A est meilleur, Žgal ou moins bon que B, etc.

Dans le tableau ci-dessous, on indique si lĠobjet en ligne (en majuscules, gras et italiques) est meilleur (>), moins bon (<), ou Žgal (=) ˆ celui en colonne (majuscules standard).

 

 

A

B

C

D

E

A

-------

<

>

=

<

B

>

--------

<

>

<

C

<

>

--------

=

=

D

=

<

=

--------

<

E

>

>

=

>

--------

 

Ici, B est supŽrieur ˆ A ;  C est infŽrieur ˆ A et supŽrieur ˆ B ; D est Žgal ˆ A, infŽrieur ˆ B et Žgal ˆ C, E est supŽrieur ˆ A, supŽrieur ˆ B, Žgal ˆ C et supŽrieur ˆ D.

Du fait des comparaisons par paires (et de lĠinversion automatique des Žvaluations), on pourrait bien sžr ne considrer que la demi-matrice supŽrieure, diagonale exclue

 

 

A

B

C

D

E

A

-------

<

>

=

<

B

 

--------

<

>

<

C

 

 

--------

=

=

D

 

 

 

--------

<

E

 

 

 

 

--------

 

Cette matrice des Žvaluations comparatives donne naissance ˆ un ÒgrapheÓ faisant ressortir les objets ÒdominantsÓ et les objets ÒdominŽsÓ.

 

DessinŽ de cette faon, ce graphe est difficilement interprŽtable. Peut-on y dŽceler un quelconque ordre ou quasi ordre permettant dĠesquisser un possible classement global des objets ? Difficile a priori, sauf ˆ se faire aider par quelques techniques mathŽmatiques plus ou moins ŽlaborŽes, ce que nous allons essayer de faire maintenant.


2 – Des approches simples dans le cas dĠun Žvaluateur unique

 

Dans les deux modles ci-dessous, on retient lĠhypothse quĠune seule personne Žvalue les objets.

 

2-1. Une approche basŽe sur un principe de ÒmajoritŽ bruteÓ : modle 1

 

On va donc recourir ˆ une premire mŽtrique brutale permettant de transformer la matrice des Žvaluations comparatives en un tableau de chiffres.  Pour chaque objet en ligne, on inscrit une valeur de 1 point dans la case au regard de la colonne dĠun objet quĠil domine (majoritŽ brute). On inscrit 0 par contre en cas dĠŽgalitŽ ou dĠinfŽrioritŽ.

On procde ensuite ˆ la sommation en ligne des points pour chaque objet (poids), on convertit ces rŽsultats en pourcentages et on en dŽduit un rang pour les objets.

 

 

A

B

C

D

E

Poids

%

Rang

A

-------

0

1

0

0

A = 1

14%

3ex

B

1

--------

0

1

0

B = 2

29%

2

C

0

1

--------

0

0

C = 1

14%

3ex

D

0

0

0

--------

0

D = 0

0%

5

E

1

1

0

1

--------

E = 3

43%

1

 

 

 

 

 

 

Tot = 7

100%

 

 

En considŽrant les rangs et les pourcentages, on peut Žtablir un nouveau graphe prŽsentant un dŽbut dĠorientation ou hiŽrŽrachisation avec des flches orientŽes pour les seules relations de domination et des tirets en pointillŽs en cas dĠŽgalitŽ. On peut pour faciliter lĠŽtablissement du graphe se servir dĠune Žchelle sur une Žtendue allant de 0 ˆ 43% (en mettant toutefois lĠobjet le plus dominant ˆ gauche, lĠobjet le plus dominŽ eŽtant ˆ droite).

 

 

Ce graphe orientŽ (modle 1) fait ressortir dŽjˆ clairement que lĠobjet E domine assez nettement les 4 autres et que lĠobjet D est plut™t dominŽ. Les objets A et C semblent assez Žquivalents, B Žtant en position intermŽdiaire entre E dĠun c™tŽ et A et C de lĠautre.

 

 

 

 

 

2-2.  Une approche recoutant ˆ une pondŽration des comparaisons : modle 2

 

On peut sophistiquer le modle et attribuer des pondŽrations aux relations entre objets :

-       les deux objets comparŽs sont Žquivalents en force ou poids (=) ;

-       lĠun des objets est lŽgrement supŽrieur ˆ lĠautre (>) ;

-       lĠun des objets est plus important que lĠautre (>>) ;

-       lĠun des objets est beaucoup plus important que lĠautre (>>>).

Cela donne le tableau suivant (lĠobjet en ligne est comparŽ ˆ lĠobjet en colonne) :

 

 

A

B

C

D

E

A

-------

<<

>

=

<

B

>>

--------

<<

>

<<

C

<

>>

--------

=

=

D

=

<

=

--------

<<<

E

>

>>

=

>>>

--------

 

On recourt alors ˆ une nouvelle mŽtrique consistant ˆ attribuer ˆ lĠobjet (en ligne) dominant dans la paire une valeur de 1, 2 ou 3 points selon son degrŽ de domination sur lĠobjet en colonnes et une valeur de 0 point sĠil est dominŽ ou sĠil est Žquivalent.

 

 

A

B

C

D

E

Poids

%

Rang

A

-------

0

1

0

0

A = 1

8%

4

B

2

--------

0

1

0

B = 3

25%

2

C

0

2

--------

0

0

C = 2

17%

3

D

0

0

0

--------

0

D = 0

0%

5

E

1

2

0

3

--------

E = 6

50%

1

 

 

 

 

 

 

Tot=12

100%

 

 

On en dŽduit le graphe orientŽ et pondŽrŽ suivant, pour lequel, en outre, on accentue la force des flches proprotionnellement ˆ lĠintensitŽ de la domination.

On voit appara”tre sur ce graphe une certaine hiŽrachisation (quasi ordre), mme si des flches en sens inverse du graphe peuvent tre notŽes (triangle A, B, C). Sur cet exemple (et donc avec les valeurs choisies pour ce cas prŽcis), on observe une diffŽrenciation assez nette des poids respectifs des divers objets.

 

3 – Approches avec Žvaluateurs multiples

 

Du cas mono-Žvaluateur on peut aller vers un contexte ˆ Žvaluateurs multiples. On considrera dans les exemples qui suivent un jury de 10 Žvaluateurs.

 

3-1. Une approche multi-Žvaluateurs ˆ ÒmajoritŽ bruteÓ : modle 3

 

On relve les diverses Žvaluations, lĠobjet en ligne Žtant comparŽ ˆ celui en celui en colonne. Pour chaque paire dĠobjets, on note le nombre de jurŽs en faveur dĠune relation de type > ou de type = .

 

 

A

B

C

D

E

A

-------

3 >

1 =

2 >

3 =

9 >

1 =

1 >

2 =

B

6 >

1 =

--------

4 >

1 =

5 >

3 =

1 >

2 =

C

5 >

3 =

5 >

1 =

--------

9 >

1 =

2 >

3 =

D

0 >

1 =

2 >

3 =

0 >

1 =

--------

0 >

1 =

E

7 >

2 =

7 >

2 =

5 >

3 =

9 >

1 =

--------

 

Comme pour le modle 1, on transforme alors la matrice en un tableau de valeurs, en indiquant 1 point pour lĠobjet (en ligne) en position strictement dominante (>) et 0 point dans les autres cas.

 

 

A

B

C

D

E

Poids

%

Rang

A

-------

0

0

1

0

1

10 %

4

B

1

--------

0

1

0

2

20 %

3

C

1

1

--------

1

0

3

30 %

2

D

0

0

0

--------

0

0

0 %

5

E

1

1

1

1

--------

4

40 %

1

 

 

 

 

 

 

Tot=10

100 %

 

Le graphe associŽ fait ressortir (dans cet exemple), un ordre quasi parfait avec une rŽpartition ŽquilibrŽe des ourcentages ou poids des objets.

 

3-2. Une approche multi-Žvaluateurs ҈ la proportionnelleÓ : modle 4

 

A partir du tableau des comparaisons du modle 3, on peut aussi travailler les relations entre objets en tenant compte, plus judicieusement, du nombre dĠŽvaluateurs en faveur dĠune option ou de sa contraire (en quelque sorte, introduction dĠune certaine forme de proportionnelle). On transforme ˆ nouveau la matrice multi-Žvaluateurs des choix, en comptabilisant (pour chaque paire dĠobjets), le nombre de voix des Žvaluateurs en faveur ou en dŽfaveur dĠun des objets (les ŽgalitŽs ne sont pas prises en compte).

On procde ˆ la sommation en ligne des points obtenus, on convertit en pourcentages et on en dŽduit un rang.

 

 

A

B

C

D

E

Nombre

%

Rang

A

-------

3

2

9

1

A = 15

18 %

4

B

6

--------

4

5

1

B = 16

20 %

3

C

5

5

--------

9

2

C = 21

26 %

2

D

0

2

0

--------

0

D = 2

2 %

5

E

7

7

5

9

--------

E = 28

34 %

1

 

 

 

 

 

 

Tot=82

100

 

 

Cela donne naissance au graphe orientŽ suivant. Pour expliciter plus finement les rŽsultats, on a mis en noir les flches en noir montrent les relations de domination (avec une certaine proportionnalitŽ ˆ leur importance) et on a ajouŽ des flches en gris qui correspondent aux relations avec avis contraires (et leur force relative).

 

Ce graphe peut tre discutŽ au sein du jury, notamment autour des trois objets A, B et C, plut™t proches et certaines relations ÒcontrairesÓ (minoritŽs fortes) ˆ questionner  comme par exemple : C > B pour 5 Žvaluateurs mais  B > C pour 4 Žvaluateurs.


3-3. Une approche multi-Žvaluateurs avec comparaisons pondŽrŽes (modle 5)

 

On peut aller plus loin encore et faire Žvoluer le modle multi-Žvaluateurs en considŽrant que les Žvaluateurs se prononent sur chaque paire dĠobjets en utilisant la mŽtrique ˆ 4 valeurs du modle 2. On obtient (exemple nouveau ici) le tableau suivant dans lequel on indique, pour chaque case, le nombre dĠŽvaluateurs accordant lĠune des 4 valeurs suivantes >>>, >>, > ou =. LĠobjet en ligne est comparŽ ˆ celui en celui en colonne.

 

 

A

B

C

D

E

A

 -------

0 >>>

1 >>

2 >

1 =

0 >>>

1 >>

1 >

3 =

2 >>>

7 >>

0 >

1 =

0 >>>

0 >>

1 >

2 =

B

0 >>>

4 >>

2 >

1 =

--------

0 >>>

0 >>

4 >

1 =

0>>>

3 >>

2 >

3 =

0 >>>

0 >>

1 >

2 =

C

0 >>>

0 >>

5 >

3 =

0 >>>

1 >>

4 >

1 =

--------

6 >>>

2 >>

1 >

1 =

0 >>>

0 >>

2 >

3 =

D

0 >>>

0 >>

0 >

1 =

0 >>>

0 >>

2 >

3 =

0 >>>

0 >>

0 >

1 =

--------

0 >>>

0 >>

0 >

1 =

E

2 >>>

2 >>

3 >

2 =

1 >>>

1 >>

5 >

2 =

0 >>>

1 >>

4 >

3 =

8 >>>

1>>

0 >

1 =

--------

 

Pour le calcul des points, on multiplie par les valeurs 3 (>>>), 2 (>>) ou 1 (>) le nombre des Žvaluateurs accordant la mme valeur ˆ la relation de domination dĠun objet sur un autre.

Ainsi, dans lĠexemple donnŽ, pour la relation entre A et B :

-       4 Žvaluateurs donnent B >> A, ce qui permet dĠattribuer 4x2=8 points ˆ B ;

-       2 Žvaluateurs donnent B > A, ce qui permet dĠattribuer 2 points de plus ˆ B.

DĠo un total de 10 points ˆ B pour sa relation de domination sur A. 

 

 

A

B

C

D

E

Poids

%

Rang

A

-------

4

3

20

1

A = 28

19 %

3

B

10

--------

4

8

1

B = 23

16 %

4

C

5

6

--------

23

2

C = 36

25 %

2

D

0

2

0

--------

0

D = 2

2 %

5

E

13

10

6

26

--------

E = 55

38 %

1

 

 

 

 

 

 

Tot=144

100%

 

 

 

A partir de ce tableau, on dresse le graphe orientŽ suivant, dans lequel la force des flches est proportionnelle au diffŽrentiel de points entre les deux relations de dominant et de dominŽ.

 

 

On observe ici que le graphe est quasi bien ordonnŽ (ˆ lĠexception dĠune relation plut™t ˆ contre-courant B > A). On peut interprŽter le graphe de la faon suivante :

-       un objet E domine incontestablement les 4 autres, et cela de faon quasi unanime pour lĠensemble des Žvaluateurs  (un Žvaluateur sur 10 a optŽ pour E < A, un autre a optŽ pour E < B et deux ont choisi C < B) ;

-       un objet D est totalement dominŽ par les 4 autres et cela de faon quasi unanime (seuls 2 Žvaluateurs ont optŽ pour une relation contraire D > B) ;

-       les 3 objets A, B et C semblent former un groupe assez homogne plus difficile ˆ partager, les Žvaluateurs nĠexprimant pas de profondes divergences ; les calculs donnent toutefois un certain avantage ˆ C.

Le graphe va maintenant permettre la discussion au sein du jury.

 

 

4 – Et pour aller plus loin, des outils plus sophistiquŽs

 

Certains travaux avancŽs de recherche opŽrationnelle ont permis de pousser plus loin encore la thŽorie et les modles du tri croisŽ et de la comparaison par paires. Ils introduisent notamment plusieurs dŽveloppements nouveaux :

-       remplacer les mŽtriques en  0 (²) et 1 (>) ou en 0 (=), 1 (>), 2 (>>) et 3 (>>>) par une fonction de rŽpartition de valeurs sur une Žchelle donnŽe (fonction linŽaire ou non) ;

-       ajouter lors de chaque comparaison une probabilitŽ (certitude plus ou moins grande sur le sens ˆ donner ˆ la relation de domination), ce qui ouvre la voie ˆ lĠutilisation des Òlogiques flouesÓ dans ce type de modŽlisation et dĠaide ˆ la dŽcision.