Page principale Dossiers La nécessité du hasard - Une probabilité de réussite, conditionnelle
La nécessité du hasard - Une probabilité de réussite, conditionnelle Imprimer Envoyer
Écrit par Florent TOURNUS   
Dimanche, 06 Avril 2008 01:00
Index de l'article
La nécessité du hasard
Qu'est-ce qu'une série aléatoire ?
Nous sommes de mauvais générateurs aléatoires
Le principe d'un test
Pourquoi utiliser un tirage au sort ?
Répondre par hasard, oui, mais comment ?
Tous les tirages au sort ne se valent pas
Une probabilité de réussite, conditionnelle
Une ou plusieurs expériences ?
Martingale ? Vous avez dit martingale ?
Tirage aléatoire sans contrainte
Un tirage peut-il nuire à l'expression d'un phénomène ?
Mauvais tirage et échec de test
Une situation dissymétrique
Pour résumer : l'essentiel à retenir
Toutes les pages

Une probabilité de réussite, conditionnelle


Les tests qui ne sont constitués que d'une seule expérience, et donc d'un seul tirage au sort, peuvent également poser problème. En effet, si le tirage aléatoire de la « bonne réponse » tombe sur une réponse plus souvent choisie par un être humain que ce que laisse penser le « hasard pur » (où toutes les issues de l'expérience sont équiprobables), alors on sous-estimera la probabilité que le sujet avait de tomber juste, sans faire appel à une capacité « extraordinaire ». Ainsi, pour reprendre l'exemple du tirage d'un chiffre, si on ne fait qu'un seul test et que le 7 est tiré au sort, la probabilité que le « sujet psi » dise 7 en répondant « au pif » est d'environ 30 % : elle est largement supérieure à la probabilité attendue par « hasard pur ». Le fait d'avoir tiré un 7 modifie profondément la probabilité que le sujet tombe juste.

Ceci nous entraîne à aborder un point assez subtil lié à ce qu'on appelle une probabilité conditionnelle. La probabilité de réussir une expérience comme celle décrite ci-dessus n'est pas la même selon qu'on considère que le tirage de la « bonne réponse » a déjà été fait ou reste à venir, au moment où le « sujet psi » fait sa prédiction. Si la « bonne réponse » est tirée au sort et si le « sujet psi » n'a aucune capacité « extraordinaire », la probabilité qu'il réussisse l'expérience, considérée dans sa globalité (c'est-à-dire, que le tirage au sort de la bonne réponse fait partie de l'expérience), est de 1 chance sur 10. En revanche, si le tirage au sort a été fait au préalable et que la « bonne réponse » est fixée, alors comme expliqué ci-dessus, la probabilité que le « sujet psi » tombe juste en répondant « au pif », n'est pas la même selon le chiffre tiré et peut aller jusqu'à 30 % s'il s'agit du 7. Notez que la frontière entre les deux situations est floue... Au moment où le « sujet psi » accepte de faire le test, il a bien une chance sur 10 de réussir (s'il n'a aucune capacité « extraordinaire »). Mais, dès lors que la « bonne réponse » a été tirée, la probabilité de réussite « par hasard » change [57] : elle devient égale à la probabilité que le « sujet psi » choisisse le nombre tiré (probabilité qui n'est pas la même pour chaque chiffre, comme on l'a vu plus haut). La différence entre ces deux probabilités vient de la différence mathématique entre, d'une part, la probabilité de réussir le test et d'autre part, la probabilité de réussir le test, sachant [58] que tel chiffre est la « bonne réponse » [59].

En pratique, selon le protocole, la « bonne réponse » peut effectivement être fixée avant que le « sujet psi » donne sa réponse. Si c'est le cas, quand on analyse le résultat d'un test afin de voir s'il est conforme ou non au hasard, doit-on considérer l'expérience dans sa globalité (incluant la nature aléatoire du tirage au sort) ou examiner la probabilité que le « sujet psi » a de tomber juste, sachant que telle ou telle « bonne réponse » a été tirée ? La probabilité de réussir le test par hasard doit elle être déterminée en tenant compte du fait que la « bonne réponse » est fixée ? En d'autres termes, est-ce que la probabilité critique est une probabilité conditionnelle, conditionnée par la valeur de la « bonne réponse » ? Je vous laisse y réfléchir... Mon opinion (mais je ne sais pas si elle partagée...) concernant cette question est « oui ! » : il faut tenir compte de la valeur de la « bonne réponse » dans l'analyse des résultats et pour le calcul de la probabilité critique. Il y a des situations, par exemple quand on utilise le même tirage au sort pour toute une série d'expériences, où l'on sent bien que cette option est la plus pertinente. Mais quand il n'y a qu'une seule expérience, le choix entre les deux façons de voir les choses n'est pas évident.

Notez que si le « sujet psi » fait d'abord sa prédiction, puis qu'on tire un chiffre au sort, alors le chiffre donné par le générateur aléatoire a une chance sur 10 d'être identique à celui prédit par le « sujet psi » (dans le cas « normal » où la prédiction du « sujet psi » n'influence pas le générateur aléatoire) : la probabilité que l'expérience soit un succès est alors de 1/10 et ne dépend pas de la prédiction effectuée par le « sujet psi ». De manière relativement non-intuitive, l'ordre a donc son importance dans le calcul de la probabilité de réussite : tirer le chiffre avant ou après le choix du « sujet psi » change la situation (même sans aucune capacité « extraordinaire ») ! Cela illustre le fait que la probabilité de « A sachant B » n'est pas égale à la probabilité de « B sachant A ». En effet, par exemple ici la probabilité que le sujet choisisse le 7, sachant que le 7 a été tiré est d'environ 30 %, alors que la probabilité que le 7 soit tiré, sachant que le sujet a choisi le 7 est de 10 %.

L'effet que l'on cherche à étudier permet rarement d'intervertir l'ordre du choix du « sujet psi » et du tirage au sort de la « bonne réponse » : dans la plupart des cas le tirage au sort de la « bonne réponse » précède le choix du « sujet psi ». On peut donc se retrouver à débattre autour de la question « existentielle » posée ci-dessus : la probabilité de réussite par hasard doit-elle être vue comme une probabilité conditionnelle ? Comment faire la part des choses entre le hasard du tirage au sort de la « bonne réponse » et le « hasard » de la réponse du « sujet psi » ? Dans le cas où l'on considère la probabilité de réussite de l'expérience dans son ensemble (incluant le tirage), l'issue du tirage au sort de la « bonne réponse » peut contribuer d'une certaine manière au succès du test [60]. Tandis que dans le cas où on considère uniquement la probabilité de réussite « par hasard », sachant que la « bonne réponse » est fixée (la probabilité critique est alors vue comme une probabilité conditionnelle), il n'y a plus qu'une « source » de hasard : les chances de réussite ne dépendent que du « sujet psi ». Malheureusement, dans ce cas, il est indispensable de connaître la distribution de probabilité des réponses « par hasard » du « sujet psi » pour voir si la valeur de la « bonne réponse » a eu une incidence sur la réponse du « sujet psi ».

Pour éclaircir ce point, imaginons la situation suivante, où l'on suppose qu'on ne sait pas que l'être humain est un mauvais générateur aléatoire. Un chercheur mène une campagne d'expériences sur la capacité des gens à deviner un chiffre tiré au sort et aboutit aux résultats suivants : lorsque le chiffre à deviner est un 7, le taux de réussite est bien plus grand que lorsque c'est un 1. Le chercheur met notamment en évidence un taux de réussite de 30 %, dans le cas du 7, bien supérieur au taux de 10 % attendu par hasard. Que penseriez-vous de cette étude ? Ici, la quantité comparée au taux de 10 % attendu par hasard est bien la probabilité que le « sujet psi » choisisse le 7, sachant que la bonne réponse est 7 : c'est indéniablement une probabilité conditionnelle. Pour savoir si la valeur de 30 % est « extraordinaire », c'est-à-dire qu'elle montre que le chiffre tiré a une influence sur le choix du « sujet psi », il faut connaître la valeur de cette probabilité conditionnelle dans le cas où les deux « variables aléatoires » (valeur de la « bonne réponse » et chiffre choisi par le « sujet psi ») sont parfaitement indépendantes [61]. Or, si les deux variables sont indépendantes, alors la probabilité de choisir un 7, sachant que la bonne réponse est 7, est simplement égale à la probabilité de répondre 7 (et ce, toutes valeurs de la « bonne réponse » confondues [62]). On voit là le problème : si cette dernière probabilité n'est pas connue, on ne peut en fait rien conclure. Dans cet exemple, la valeur de 30 % semble élevée, mais lorsqu'on connait la répartition des réponses « par hasard » d'un être humain, on se rend compte que le résultat n'est que le reflet d'une préférence des gens pour le 7. Ainsi, un examen critique de cette étude fictive nous aurait permis de voir que la valeur du chiffre à deviner n'a en fait aucune incidence sur la réponse des gens. Que la « bonne réponse » ait une influence sur la probabilité de succès du « sujet psi », et donc sur son taux de réussite au test, ne signifie absolument pas que la « bonne réponse » a une influence sur le choix effectué par le « sujet psi ».

 


Notes (cliquez sur les nombres pour revenir dans le texte là où vous en étiez)

[57] Du point de vue du « sujet psi », lorsque le tirage au sort de la « bonne réponse » est effectué (avant qu'on lui demande de choisir un chiffre), ses chances de réussite restent inchangées, puisqu'il ne sait pas quel chiffre a été tiré : en réalité, sa probabilité de réussite « par hasard » a bien été modifiée par la valeur du chiffre tiré.

[58] Le « sachant » a pour sujet le statisticien et non le « sujet psi » : ce dernier ignore, bien évidemment, quelle est la « bonne réponse ».

[59] En écriture mathématique, si on note par exemple A l'événement « réussir le test » et B « la bonne réponse vaut 7 », alors la première probabilité est simplement P(A), tandis que la deuxième est P(A/B) (qui se lit probabilité de A sachant B).

[60] Le succès de l'expérience dépend en effet de deux variables aléatoires : la « bonne réponse » et le chiffre choisi par le « sujet psi ». Ainsi quand on parle de réussite « au hasard » du test, il y a finalement deux sources de hasard...

[61] Dire que le chiffre tiré a une influence sur le choix du « sujet psi » (donc, que le sujet psi possède un « pouvoir extraordinaire »...), signifie en effet que ces deux variables ne sont pas indépendantes, mais liées (lien de nature statistique, puisque le « sujet psi » n'a pas forcément 100 % de réussite). Au contraire, dans la situation « normale » (pas de pouvoir extraordinaire), les deux variables sont indépendantes l'une de l'autre : c'est cette situation qui est la situation de référence.

[62] On peut déterminer cette valeur en regardant la fréquence de la réponse « 7 », indépendamment de la « bonne réponse ». Ou mieux, on peut mesurer la fréquence de la réponse « 7 », sans qu'il y ait de « bonne réponse » : le but est simplement d'étudier la répartition des réponses « au pif » des gens.