Le R² (R au carré ou coefficient de détermination) est une mesure statistique clé qui indique la proportion de la variance d'une variable dépendante expliquée par une ou plusieurs variables indépendantes dans un modèle de régression. Contrairement à la corrélation, qui mesure la force de la relation entre deux variables, le R² quantifie à quel point la variance de l'une explique celle de l'autre. Par exemple, un R² de 0,50 signifie que 50 % de la variation observée de la variable dépendante est expliquée par le modèle.
La formule du R² est :
R² = 1 - (Variation inexpliquée / Variation totale)
Le calcul implique plusieurs étapes : collecter les données des variables dépendantes et indépendantes, estimer la ligne de régression de meilleur ajustement, calculer les valeurs prédites, les écarts aux valeurs réelles (erreurs au carré), sommer ces erreurs pour obtenir la variance inexpliquée, puis calculer la variance totale à partir des écarts à la moyenne. Le R² résulte ensuite de leur rapport.
En finance, le R² mesure le pourcentage des variations d'un fonds ou d'un titre expliquées par un indice de référence, comme le S&P 500 pour une action ou un indice obligataire pour un titre à revenu fixe. Les valeurs vont de 0 à 1 (0 % à 100 %). Un R² élevé (85-100 %) indique une performance alignée sur l'indice, rendant la bêta plus fiable. Un R² faible (<70 %) suggère une faible corrélation.
Le R² standard convient aux régressions simples (une variable indépendante). En régression multiple, il surestime l'ajustement car ajouter des variables l'augmente toujours. Le R² ajusté pénalise les variables inutiles, n'augmentant que si elles améliorent significativement le modèle, évitant le surajustement.
Le R² mesure la corrélation (explication des mouvements), tandis que la bêta quantifie l'ampleur de ces mouvements par rapport à l'indice (risque relatif). Ensemble, ils évaluent la performance : un R² élevé et une bêta <1 indiquent des rendements ajustés au risque supérieurs. Un bêta de 1 signifie une volatilité identique à l'indice.
Le R² ne valide pas la qualité du modèle, ne détecte pas les biais et ne distingue pas corrélation de causalité. Un R² élevé n'implique pas un bon modèle, et vice versa.
Elle dépend du domaine : en sciences sociales, 0,5 peut être fort ; en physique, >0,9 est attendu. En finance, >0,7 indique une forte corrélation, <0,4 une faible.
90 % de la variance de la variable dépendante est expliquée par les indépendantes. Pour un fonds, 90 % de ses variations s'expliquent par son indice.
Non : idéal pour les fonds indiciels (suivre l'indice), mais négatif pour les fonds actifs (manque de valeur ajoutée).
[]