Comment faire un test T dans Excel

Table des matières:

Comment faire un test T dans Excel
Comment faire un test T dans Excel
Anonim

Un test T est un moyen de déterminer s'il existe des différences statistiquement significatives entre les ensembles de données, en utilisant une distribution t de Student. Le test T dans Excel est un test T à deux échantillons comparant les moyennes de deux échantillons. Cet article explique ce que signifie la signification statistique et montre comment faire un test T dans Excel.

Les instructions de cet article s'appliquent à Excel 2019, 2016, 2013, 2010, 2007; Excel pour Microsoft 365 et Excel Online.

Image
Image

Qu'est-ce que la signification statistique ?

Imaginez que vous vouliez savoir lequel des deux dés donnera le meilleur score. Vous lancez le premier dé et obtenez un 2; vous lancez le deuxième dé et obtenez un 6. Cela vous indique-t-il que le deuxième dé donne généralement des scores plus élevés ? Si vous avez répondu « Bien sûr que non », alors vous avez déjà une certaine compréhension de la signification statistique. Vous comprenez que la différence était due au changement aléatoire du score, chaque fois qu'un dé est lancé. Parce que l'échantillon était très petit (un seul rouleau), il n'a rien montré de significatif.

Imaginez maintenant que vous lancez chaque dé 6 fois:

  • Le premier dé lance 3, 6, 6, 4, 3, 3; Moyenne=4,17
  • Le deuxième dé lance 5, 6, 2, 5, 2, 4; Moyenne=4.00

Cela prouve-t-il maintenant que le premier dé donne des scores plus élevés que le second ? Probablement pas. Un petit échantillon avec une différence relativement faible entre les moyennes fait qu'il est probable que la différence soit toujours due à des variations aléatoires. Au fur et à mesure que nous augmentons le nombre de lancers de dés, il devient difficile de donner une réponse sensée à la question: la différence entre les scores est-elle le résultat d'une variation aléatoire ou l'un est-il en fait plus susceptible de donner des scores plus élevés que l'autre ?

La signification est la probabilité qu'une différence observée entre les échantillons soit due à des variations aléatoires. La signification est souvent appelée le niveau alpha ou simplement « α ». Le niveau de confiance, ou simplement « c », est la probabilité que la différence entre les échantillons ne soit pas due à une variation aléatoire; en d'autres termes, qu'il y a une différence entre les populations sous-jacentes. Donc: c=1 – α

Nous pouvons définir 'α' au niveau que nous voulons, pour nous sentir sûrs que nous avons prouvé l'importance. Très souvent, α=5 % est utilisé (confiance à 95 %), mais si nous voulons être vraiment sûrs que les différences ne sont pas causées par une variation aléatoire, nous pouvons appliquer un niveau de confiance plus élevé, en utilisant α=1 % ou même α=0,1 %.

Divers tests statistiques sont utilisés pour calculer la signification dans différentes situations. Les tests T sont utilisés pour déterminer si les moyennes de deux populations sont différentes et les tests F sont utilisés pour déterminer si les variances sont différentes.

Pourquoi tester la signification statistique ?

Lorsque nous comparons différentes choses, nous devons utiliser des tests de signification pour déterminer si l'une est meilleure que l'autre. Cela s'applique à de nombreux champs, par exemple:

  • En affaires, les gens ont besoin de comparer différents produits et méthodes de marketing.
  • Dans le sport, les gens doivent comparer différents équipements, techniques et concurrents.
  • En ingénierie, les gens doivent comparer différentes conceptions et réglages de paramètres.

Si vous voulez tester si quelque chose fonctionne mieux qu'autre chose, dans n'importe quel domaine, vous devez tester la signification statistique.

Qu'est-ce que la distribution T d'un étudiant ?

La distribution t de Student est similaire à une distribution normale (ou gaussienne). Ce sont deux distributions en forme de cloche avec la plupart des résultats proches de la moyenne, mais certains événements rares sont assez éloignés de la moyenne dans les deux sens, appelés les queues de la distribution.

La forme exacte de la distribution t de Student dépend de la taille de l'échantillon. Pour des échantillons de plus de 30, il est très similaire à la distribution normale. Au fur et à mesure que la taille de l'échantillon est réduite, les queues s'agrandissent, ce qui représente l'incertitude accrue qui découle des déductions basées sur un petit échantillon.

Comment faire un test T dans Excel

Avant de pouvoir appliquer un test T pour déterminer s'il existe une différence statistiquement significative entre les moyennes de deux échantillons, vous devez d'abord effectuer un test F. En effet, différents calculs sont effectués pour le test T selon qu'il existe ou non une différence significative entre les variances.

Vous aurez besoin du Add-in Analysis Toolpak activé pour effectuer cette analyse.

Vérification et chargement du complément Analysis Toolpak

Pour vérifier et activer l'utilitaire d'analyse, suivez ces étapes:

  1. Sélectionnez l'onglet FILE >select Options.
  2. Dans la boîte de dialogue Options, sélectionnez Add-Ins dans les onglets sur le côté gauche.
  3. En bas de la fenêtre, sélectionnez le menu déroulant Gérer, puis sélectionnez Compléments Excel. Sélectionnez Allez.

    Image
    Image
  4. Assurez-vous que la case à côté de Analysis Toolpak est cochée, puis sélectionnez OK.
  5. L'utilitaire d'analyse est maintenant actif et vous êtes prêt à appliquer les tests F et les tests T.

Exécution d'un test F et d'un test T dans Excel

  1. Entrez deux ensembles de données dans une feuille de calcul. Dans ce cas, nous considérons les ventes de deux produits pendant une semaine. La valeur moyenne des ventes quotidiennes de chaque produit est également calculée, ainsi que son écart type.

    Image
    Image
  2. Sélectionnez l'onglet Data > Data Analysis

    Image
    Image
  3. Sélectionnez F-Test Two-Sample for Variances dans la liste, puis sélectionnez OK.

    Image
    Image

    Le test F est très sensible à la non-normalité. Il peut donc être plus sûr d'utiliser un test de Welch, mais c'est plus difficile dans Excel.

  4. Sélectionnez la plage de la variable 1 et la plage de la variable 2; définir l'Alpha (0,05 donne une confiance de 95 %); sélectionnez une cellule pour le coin supérieur gauche de la sortie, en considérant que cela remplira 3 colonnes et 10 lignes. Sélectionnez OK.

    Image
    Image

    Pour la plage de la variable 1, l'échantillon avec le plus grand écart type (ou variance) doit être sélectionné.

  5. Affichez les résultats du test F pour déterminer s'il existe une différence significative entre les variances. Les résultats donnent trois valeurs importantes:

    • F: le rapport entre les variances.
    • P(F<=f) unilatéral: la probabilité que la variable 1 n'ait pas réellement une variance plus grande que la variable 2. Si celle-ci est supérieure à alpha, qui est généralement de 0,05, alors il n'y a pas de différence significative entre les variances.
    • F Critique unilatéral: La valeur de F qui serait nécessaire pour donner P(F<=f)=α. Si cette valeur est supérieure à F, cela indique également qu'il n'y a pas de différence significative entre les variances.

    P(F<=f) peut également être calculé à l'aide de la fonction FDIST avec F et les degrés de liberté pour chaque échantillon comme entrées. Les degrés de liberté sont simplement le nombre d'observations dans un échantillon moins une.

  6. Maintenant que vous savez s'il existe une différence entre les variances, vous pouvez sélectionner le test T approprié. Sélectionnez l'onglet Data > Data Analysis, puis sélectionnez soit t-Test: Two-Sample Assuming Equal Variancesou Test t: deux échantillons en supposant des variances inégales

    Image
    Image
  7. Quelle que soit l'option choisie à l'étape précédente, la même boîte de dialogue s'affichera pour saisir les détails de l'analyse. Pour commencer, sélectionnez les plages contenant les échantillons pour Variable 1 Range et Variable 2 Range.

    Image
    Image
  8. En supposant que vous voulez tester l'absence de différence entre les moyennes, réglez la Différence moyenne hypothétique sur zéro.
  9. Définissez le niveau de signification Alpha (0,05 donne une confiance de 95 %) et sélectionnez une cellule pour le coin supérieur gauche de la sortie, en considérant que cela remplira 3 colonnes et 14 lignes. Sélectionnez OK.
  10. Examinez les résultats pour décider s'il y a une différence significative entre les moyennes.

    Tout comme avec le F-Test, si la valeur p, dans ce cas P(T<=t), est supérieure à alpha, alors il n'y a pas de différence significative. Cependant, dans ce cas, deux valeurs de p sont données, l'une pour un test unilatéral et l'autre pour un test bilatéral. Dans ce cas, utilisez la valeur bilatérale, car l'une ou l'autre des variables ayant une moyenne supérieure constituerait une différence significative.

Conseillé: