Comment exécuter la régression dans Excel

Table des matières:

Comment exécuter la régression dans Excel
Comment exécuter la régression dans Excel
Anonim

La régression dans Excel est un moyen d'automatiser le processus statistique de comparaison de plusieurs ensembles d'informations pour voir comment les changements dans les variables indépendantes affectent les changements dans les variables dépendantes. Si vous avez toujours voulu trouver une corrélation entre deux choses, l'utilisation de l'analyse de régression dans Excel est l'un des meilleurs moyens de le faire.

Les instructions de cet article s'appliquent à Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Quelle est la signification de la régression ?

La régression est une approche de modélisation statistique que les analystes utilisent pour déterminer les relations entre plusieurs variables.

L'analyse de régression commence avec une seule variable que vous essayez d'analyser et des variables indépendantes que vous testez pour voir si elles affectent cette seule variable. L'analyse examine les changements dans les variables indépendantes et tente de corréler ces changements avec les changements résultants dans la variable unique (dépendante).

Cela peut ressembler à des statistiques avancées, mais Excel rend cette analyse complexe accessible à tous.

Effectuer une régression linéaire dans Excel

La forme la plus simple d'analyse de régression est la régression linéaire. La régression linéaire simple examine la relation entre seulement deux variables.

Par exemple, la feuille de calcul suivante affiche des données contenant le nombre de calories qu'une personne a consommées chaque jour et son poids ce jour-là.

Image
Image

Étant donné que cette feuille de calcul contient deux colonnes de données et qu'une variable peut potentiellement avoir un effet sur l'autre, vous pouvez exécuter une analyse de régression sur ces données à l'aide d'Excel.

Activation du module complémentaire Analysis ToolPak

Avant de pouvoir utiliser la fonction d'analyse de régression d'Excel, vous devez activer le module complémentaire Analysis ToolPak dans l'écran Options d'Excel.

  1. Dans Excel, sélectionnez le menu Fichier et choisissez Options.

    Image
    Image
  2. Sélectionnez Add-ins dans le menu de navigation de gauche. Ensuite, assurez-vous que Excel Add-ins est sélectionné dans le champ Manage.

    Image
    Image
  3. Enfin, sélectionnez le bouton Go.

    Image
    Image
  4. Dans la fenêtre contextuelle des compléments. Activez Analysis ToolPack en cliquant sur la case devant pour ajouter une coche et sélectionnez OK.

    Image
    Image

Maintenant que Analysis ToolPak est activé, vous êtes prêt à commencer à effectuer une analyse de régression dans Excel.

Comment effectuer une régression linéaire simple dans Excel

En utilisant la feuille de calcul du poids et des calories comme exemple, vous pouvez effectuer une analyse de régression linéaire dans Excel comme suit.

  1. Sélectionnez le menu Données. Ensuite, dans le groupe Analysis, sélectionnez Data Analysis.

    Image
    Image
  2. Dans la fenêtre Data Analysis, sélectionnez Regression dans la liste et cliquez sur OK.

    Image
    Image
  3. La Input Y Range est la plage de cellules qui contient la variable dépendante. Dans cet exemple, c'est le poids. Le Input X Range est la plage de cellules qui contient la variable indépendante. Dans cet exemple, il s'agit de la colonne des calories.

    Image
    Image
  4. Sélectionnez Labels pour les cellules d'en-tête, puis sélectionnez New Worksheet pour envoyer les résultats vers une nouvelle feuille de calcul. Sélectionnez OK pour qu'Excel exécute l'analyse et envoie les résultats dans une nouvelle feuille.

    Image
    Image
  5. Examinez la nouvelle feuille de calcul. La sortie d'analyse a un certain nombre de valeurs que vous devez comprendre pour interpréter les résultats.

    Image
    Image

    Chacun de ces chiffres a la signification suivante:

    • Multiple R: Le coefficient de corrélation. 1 indique une forte corrélation entre les deux variables, tandis que -1 signifie qu'il existe une forte relation négative. 0 signifie qu'il n'y a pas de corrélation.
    • R Square: Le coefficient de détermination, qui montre combien de points entre les deux variables tombent sur la ligne de régression. Statistiquement, il s'agit de la somme des écarts au carré par rapport à la moyenne.
    • R carré ajusté: une valeur statistique appelée R carré qui est ajustée en fonction du nombre de variables indépendantes que vous avez choisies.
    • Erreur standard: la précision des résultats de l'analyse de régression. Si cette erreur est petite, vos résultats de régression sont plus précis.
    • Observations: Le nombre d'observations dans votre modèle de régression.

    Les valeurs restantes dans la sortie de régression vous donnent des détails sur les plus petits composants de l'analyse de régression.

    • df: Valeur statistique connue sous le nom de degrés de liberté liés aux sources de variance.
    • SS: somme des carrés. Le rapport de la somme résiduelle des carrés par rapport au SS total devrait être plus petit si la plupart de vos données correspondent à la droite de régression.
    • MS: Carré moyen des données de régression.
    • F: la statistique F (test F) pour l'hypothèse nulle. Cela fournit la signification du modèle de régression.
    • Signification F: valeur statistique appelée valeur P de F.

    À moins que vous ne compreniez les statistiques et le calcul des modèles de régression, les valeurs au bas du résumé n'auront pas beaucoup de sens. Cependant, le Multiple R et le R Square sont les deux plus importants.

Comme vous pouvez le voir, dans cet exemple, les calories ont une forte corrélation avec le poids total.

Analyse de régression linéaire multiple dans Excel

Pour effectuer la même régression linéaire mais avec plusieurs variables indépendantes, sélectionnez la plage entière (plusieurs colonnes et lignes) pour la Input X Range.

Image
Image

Lorsque vous sélectionnez plusieurs variables indépendantes, il est moins probable que vous trouviez une corrélation aussi forte car il y a tellement de variables.

Cependant, une analyse de régression dans Excel peut vous aider à trouver des corrélations avec une ou plusieurs de ces variables dont vous ne réalisez peut-être pas qu'elles existent simplement en examinant les données manuellement.

Conseillé: