Skip to Main Content / Passer au contenu
 

Bibliothèque de ressources

Même une experience bien planifiée peut être sujette à la dispersion et comprendre des erreurs sur lesquelles l’expérimentateur n’a pas de prise. Il peut s’agir de petites variations des conditions environnementales ou encore d’un manque de précision des relevés effectués par l’expérimentateur. Alors, comment les expérimentateurs savent-ils si les résultats observés sont affectés par une de ces erreurs ou par les effets de la variable indépendante (ce que l’expérimentateur a volontairement modifié)?

Prenons un exemple. Supposons que vous avez décidé de cultiver trois plants de tomates et que vous souhaitez observer l’effet d’un certain type d’engrais sur la hauteur des plants après un certain nombre de jours. Vous avez traité les trois plants de la même façon et vous avez contrôlé ce que vous pensiez être l’ensemble des variables. Mais à la fin, les tailles des trois plants sont très différentes. Étant donné le petit nombre de plants et le grand nombre de variations, il serait impossible de déterminer si l’engrais a affecté la hauteur des plants ou s’il a eu une incidence quelconque.

Taille de l’échantillon

Une façon dont l’expérimentateur peut procéder pour réduire au minimum les effets des erreurs et des biais, comme la variation naturelle, est d’augmenter la taille de l’échantillon. The term sample size refers to the number of repeated measurements (e.g., the number of plants grown, etc.). Par « taille de l’échantillon », on entend le nombre de mesures répétées (ex. le nombre de plants cultivés). Dans l’exemple ci-dessus, la taille de l’échantillon était de trois. En statistique, la taille de l’échantillon est représentée par la lettre n.

En général, plus la taille de l’échantillon est importante, plus l’expérimentateur peut se fier aux résultats et aux conclusions. Avec un plus grand échantillon, il y a une plus grande probabilité que les facteurs aléatoires s’annulent mutuellement et que le résultat moyen représente plus précisément le phénomène général, ou la population dans son ensemble.

Imaginons que nous prenons la moyenne de la hauteur des trois plants dans l’exemple ci-dessus.

  • Hauteur : 16 cm, 20 cm, 30 cm
  • Moyenne : 22 cm

On peut se demander si cette moyenne est représentative. Si nous cultivions d’autres plants, à quelle hauteur nous attendrions-nous?

Imaginons que nous augmentons la taille de notre échantillon à 10 sans modifier les variables. Les résultats seraient alors les suivants :

  • Hauteur : 15 cm, 17 cm, 18 cm, 17 cm, 20 cm, 25 cm, 31 cm, 15 cm, 16 cm, 16 cm
  • Moyenne : 19 cm

Maintenant, nous avons une idée beaucoup plus précise de ce que serait la hauteur des plants si on leur donnait de l’engrais et nous pourrions conclure avec une plus grande certitude. Nous pouvons également voir que la plupart des plants (6/10) mesurent entre 15 cm et 17 cm, et que le reste des plants sont plus grands. Nous pourrions même essayer de savoir pourquoi certains plants sont plus grands. Ont-ils été placés plus près de la fenêtre? Ont-ils reçu plus d’engrais? etc.

Nos plants sur rebord de la fenêtre

Alors, vous vous demandez peut-être quelle taille d’échantillon choisir. Si l’échantillon est trop petit, vous pourriez passer à côté de l’effet réel de la variable indépendante. Si l’échantillon est trop grand, vous pourriez perdre des ressources et du temps. La taille de l’échantillon dépend vraiment du type d’expérience et de différence que vous vous attendez à observer. Si vous souhaitez observer des différences très petites (ex. des tailles de feuilles différentes), vous avez besoin d’un échantillon d’une très grande taille, mais si vous vous souciez seulement de grandes différences (ex. vivant ou mort après le test), vous pouvez utiliser un échantillon plus petit.

Pour les expériences en classe, le côté pratique de la taille de l’échantillon doit également être pris en considération. En général, il est préférable d’avoir un échantillon de la plus grande taille possible sans compromettre l’expérience ou sans se retrouver dépassé par elle!

Reproductibilité et répétabilité

Les façons dont les choses se comportent dans le monde naturel sont assez constantes. La nature n’est pas capricieuse; elle ne fait pas d’erreurs, qu’elles soient systématiques ou aléatoires. Les scientifiques ne pourraient pas faire de progrès si la nature n’était pas fiable. Imaginez que vous avez touillé une cuillerée de sucre dans un verre d’eau tiède. Vous remarquez que vous ne pouvez plus voir le sucre. Intéressant! Vous vous demandez si vous allez obtenir les mêmes résultats si vous recommencez. Alors, vous faites exactement ce que vous avez fait la première fois et vous obtenez des observations très semblables à celles de votre test original. Vous essayez la même chose de nombreuses fois, et vous obtenez les mêmes résultats chaque fois.

Le fait de reproduire ou de répéter une expérience exactement de la même manière est appelé répétition. En faisant une expérience plus d’une fois, l’expérimentateur est en mesure de vérifier que la méthode fonctionne comme prévu et donne des résultats fiables. Une expérience dans laquelle l’expérimentateur original répète l’expérience en utilisant la même procédure, le même équipement, les mêmes appareils de mesure, la fait au même endroit et obtient des résultats similaires est dite répétable.

Mais imaginons que personne n’ait jamais tenté votre expérience de dilution du sucre dans l’eau. Vous avez peut-être fait une découverte! Ce dont vous avez besoin maintenant, c’est que quelqu’un d’autre tente de réaliser votre expérience en utilisant les mêmes variables et les mêmes méthodes que celles que vous avez employées. La capacité de reproduction d’une expérience par un autre expérimentateur s’appelle la reproductibilité.

La reproductibilité est l’un des principaux aspects des processus scientifiques. Si une expérience réalisée par un expérimentateur donne certains résultats et si d’autres expérimentateurs obtiennent les mêmes résultats, alors ces derniers peuvent être certains que les résultats sont fiables. C’est ainsi que se bâtissent les nouvelles connaissances. Par contre, parfois, les expériences ne peuvent pas être reproduites. Cela peut-être attribuable au biais de l’expérimentateur ou à des erreurs relatives aux méthodes ou aux observations. La non-reproduction constitue aussi une information utile et peut être l’un des moyens qui permettent aux scientifiques de découvrir des failles dans la réflexion de leurs pairs.

En savoir plus de biais et erreurs :

Biais et sources d'erreurs

Taille de l’échantillon, reproductibilité et TomatosphèreMC

Depuis 2001, chaque année, les élèves réalisent l’expérience principale TomatosphèreMC. Chaque année, des milliers de classes répètent l’expérience simple créée en partenariat avec le professeur Michael Dixon de l’Université de Guelph. En 2015 seulement, 19 000 classes de partout au Canada et aux États-Unis ont fait pousser des semences de tomates et ont consigné leur germination. Ça, c’est un échantillon de grande taille! Pour voir les résultats de l’enquête sur les semences de TomatosphèreMC présentés par toutes les classes participantes, assurez-vous de télécharger vos résultats.

Soumettre vos résultats

D’enfants avec des plants de Tomatosphère

Exercice dirigé

Exercice 1

Quelle est l’aire moyenne de la surface des feuilles des plants faisant partie des échantillons suivants?

  1. Aire : 15 cm2, 17 cm2, 18 cm2
  2. Aire : 15 cm2, 17 cm2, 18 cm2, 17 cm2, 20 cm2
  3. Aire : 15 cm2, 17 cm2, 18 cm2, 17 cm2, 20 cm2, 16 cm2, 17 cm2, 18 cm2
  4. Quelle a été l’influence de la taille de l’échantillon sur la moyenne?

Exercice 2

Quel est le nombre moyen de semences ayant germé?

  1. Nombre ayant germé : 15, 20, 25
  2. Nombre ayant germé : 21, 20, 22, 21, 20, 25, 21, 24
  3. Nombre ayant germé : 21, 20, 22, 21, 20, 25, 21, 24, 20, 21, 22, 22
  4. Quelle a été l’influence de la taille de l’échantillon sur la moyenne?

Exercice 3

Demandez aux élèves de trouver la moyenne, la médiane et le mode de la hauteur pour l’échantillon suivant composé de 10 plants.

Hauteur : 15 cm, 17 cm, 18 cm, 17 cm, 20 cm, 25 cm, 15 cm, 16 cm, 16 cm, 16 cm

Exercice 4

Fournissez le scénario suivant aux élèves et demandez-leur de répondre aux questions ci dessous.

Une élève a réalisé une expérience dans laquelle elle a comparé l’effet de différentes marques d’engrais sur la croissance des plants de tomates. Elle a découvert que les plants qui ont reçu l’engrais A ont poussé beaucoup plus haut que ceux qui ont reçu les autres marques d’engrais. Un autre étudiant qui s’intéressait aux résultats a fait pousser une quantité un peu plus importante des mêmes plants de tomates en appliquant les mêmes variables, mais n’a pas trouvé que les plants qui recevaient l’engrais A avaient poussé beaucoup plus haut que tous ceux qui avaient reçu de l’engrais d’autres marques.

  1. L’expérience a-t-elle été reproductible?
  2. Qu’est-ce qui pourrait être à l’origine des résultats observés?
  3. Quels types d’erreurs ou de biais ont pu se produire?

Exercice 5

Réfléchissez avec les élèves aux domaines de la science où la reproductibilité peut être difficile, voire impossible.

Réponses

Exercice 1

  1. 16,7
  2. 17,4
  3. 17,5
  4. Plus la taille de l’échantillon est grande, plus les données représentent précisément l’aire de la surface.

Exercice 2

  1. 20
  2. 21,75
  3. 21,58
  4. Plus la taille de l’échantillon est grande, plus les données représentent précisément le nombre de semences qui ont germé.

Exercice 3

Moyenne = 17,5, médiane = 16,5, mode = 16

Exercice 4

Réponses possibles : Paléontologie, climatologie, météorologie, océanographie, sismologie, etc.