R au carré (R 2 ) est une mesure statistique qui représente la proportion de la variance d'une variable dépendante expliquée par une ou plusieurs variables indépendantes dans un modèle de régression. Alors que la corrélation explique la force de la relation entre une variable indépendante et une variable dépendante, le R au carré explique dans quelle mesure la variance d'une variable explique la variance de la seconde variable. Ainsi, si le R 2 d'un modèle est de 0,50, alors environ la moitié de la variation observée peut être expliquée par les entrées du modèle.
R2=1−Variation totaleVariation inexpliquée
Le calcul proprement dit du R au carré nécessite plusieurs étapes. Cela comprend la prise des points de données (observations) des variables dépendantes et indépendantes et la recherche de la ligne de meilleur ajustement, souvent à partir d'un modèle de régression. À partir de là, vous calculez les valeurs prévues, soustrayez les valeurs réelles et mettez les résultats au carré. Cela donne une liste d'erreurs au carré, qui est ensuite additionnée et égale la variance inexpliquée.
Pour calculer la variance totale, vous devez soustraire la valeur réelle moyenne de chacune des valeurs réelles, mettre les résultats au carré et les additionner. À partir de là, divisez la première somme d'erreurs (variance expliquée) par la deuxième somme (variance totale), soustrayez le résultat de un et vous obtenez le R au carré.
En investissement, le R au carré est généralement interprété comme le pourcentage des mouvements d'un fonds ou d'un titre qui peuvent s'expliquer par les mouvements d'un indice de référence. Par exemple, un R au carré pour un titre à revenu fixe par rapport à un indice obligataire identifie la proportion de mouvement de prix du titre qui est prévisible en fonction d'un mouvement de prix de l'indice.
La même chose peut être appliquée à une action par rapport à l'indice S&P 500 ou à tout autre indice pertinent. Il peut également être appelé coefficient de détermination.
Les valeurs R au carré vont de 0 à 1 et sont généralement exprimées en pourcentages de 0 % à 100 %. Un R au carré de 100 % signifie que tous les mouvements d'un titre (ou d'une autre variable dépendante) sont entièrement expliqués par les mouvements de l'indice (ou de la ou des variables indépendantes qui vous intéressent).
En investissement, un R au carré élevé, entre 85 % et 100 %, indique que la performance de l'action ou du fonds évolue relativement en ligne avec l'indice. Un fonds dont le R au carré est faible, à 70 % ou moins, indique que le titre ne suit généralement pas les mouvements de l'indice. Une valeur R au carré plus élevée indiquera un chiffre bêta plus utile. Par exemple, si une action ou un fonds a une valeur R au carré proche de 100 %, mais a un bêta inférieur à 1, il offre très probablement des rendements ajustés au risque plus élevés.
R-Squared ne fonctionne comme prévu que dans un modèle de régression linéaire simple avec une variable explicative. Avec une régression multiple composée de plusieurs variables indépendantes, le R au carré doit être ajusté.
Le R-carré ajusté compare la puissance descriptive des modèles de régression qui incluent divers nombres de prédicteurs. Chaque prédicteur ajouté à un modèle augmente le R au carré et ne le diminue jamais. Ainsi, un modèle avec plus de termes peut sembler avoir un meilleur ajustement simplement parce qu'il a plus de termes, tandis que le R au carré ajusté compense l'ajout de variables et n'augmente que si le nouveau terme améliore le modèle au-dessus de ce qui serait obtenu par probabilité et diminue lorsqu'un prédicteur améliore le modèle moins que ce qui est prédit par hasard.
Dans une condition de surajustement, une valeur incorrectement élevée de R au carré est obtenue, même lorsque le modèle a en fait une capacité de prédiction réduite. Ce n'est pas le cas avec le R au carré ajusté.
Le bêta et le R au carré sont deux mesures de corrélation liées, mais différentes, mais le bêta est une mesure du risque relatif. Un fonds commun de placement avec un R au carré élevé est fortement corrélé à un indice de référence. Si le bêta est également élevé, il peut produire des rendements supérieurs à ceux de l'indice de référence, en particulier dans les marchés haussiers. Le R au carré mesure à quel point chaque variation du prix d'un actif est corrélée à un indice de référence.
La version bêta mesure l'ampleur de ces variations de prix par rapport à une référence. Utilisés ensemble, le R au carré et le bêta donnent aux investisseurs une image complète de la performance des gestionnaires d'actifs. Un bêta d'exactement 1,0 signifie que le risque (volatilité) de l'actif est identique à celui de son indice de référence. Essentiellement, le R au carré est une technique d'analyse statistique pour l'utilisation pratique et la fiabilité des bêtas des titres.
Le R au carré vous donnera une estimation de la relation entre les mouvements d'une variable dépendante basée sur les mouvements d'une variable indépendante. Il ne vous dit pas si le modèle que vous avez choisi est bon ou mauvais, ni si les données et les prédictions sont biaisées. Un R-carré élevé ou faible n'est pas nécessairement bon ou mauvais, car il ne reflète pas la fiabilité du modèle, ni si vous avez choisi la bonne régression. Vous pouvez obtenir un R-carré faible pour un bon modèle, ou un R-carré élevé pour un modèle mal ajusté, et vice versa.
Ce qui est considéré comme une « bonne » valeur R-Squared dépendra du contexte. Dans certains domaines, comme les sciences sociales, même un R-Square relativement faible tel que 0,5 pourrait être considéré comme relativement fort. Dans d'autres domaines, les normes pour une bonne lecture R-Squared peuvent être beaucoup plus élevées, comme 0,9 ou plus. En finance, un R-Squared supérieur à 0,7 serait généralement considéré comme montrant un niveau élevé de corrélation, alors qu'une mesure inférieure à 0,4 montrerait une faible corrélation. Ce n'est pas une règle stricte, cependant, et dépendra de l'analyse spécifique.
Essentiellement, une valeur R-Squared de 0,9 indiquerait que 90 % de la variance de la variable dépendante étudiée s'explique par la variance de la variable indépendante. Par exemple, si un fonds commun de placement a une valeur R au carré de 0,9 par rapport à son indice de référence, cela indiquerait que 90 % de la variance du fonds s'explique par la variance de son indice de référence.
Là encore, cela dépend du contexte. Supposons que vous recherchiez un fonds indiciel qui suivra un indice spécifique d'aussi près que possible. Dans ce scénario, vous voudriez que le R au carré du fonds soit aussi élevé que possible puisque son objectif est d'égaler - plutôt que de dépasser - l'indice. Si, en revanche, vous recherchez des fonds gérés activement, un R-carré élevé peut être considéré comme un mauvais signe, indiquant que les gestionnaires des fonds n'ajoutent pas suffisamment de valeur par rapport à leurs indices de référence.