L’idée d’investir selon les facteurs a émergé comme une promesse d’apporter une rigueur scientifique aux marchés financiers. Des notions telles que la valeur, le momentum, la qualité et la taille ont été identifiées comme des risques ind diversifiables, justifiant pourquoi certains actifs surpassent d’autres. Cependant, malgré des années de recherche et d’investissement, les résultats n’ont pas été à la hauteur des attentes.
Un rapport récent révèle que le problème ne réside pas tant dans les données elles-mêmes, mais plutôt dans la manière dont les modèles sont construits. En effet, beaucoup d’entre eux confondent corrélation et causalité, engendrant ainsi ce que l’on appelle un mirage factoriel.
Index du contenu:
Les résultats décevants de l’investissement factoriel
Depuis 2007, l’indice Bloomberg–Goldman Sachs US Equity Multi-Factor a affiché un ratio de Sharpe de seulement 0,17 (t-stat=0,69, p-valeur=0,25), ce qui est pratiquement équivalent à zéro une fois les coûts pris en compte. Pour les gestionnaires de fonds qui ont basé leurs produits sur ces modèles, cette situation se traduit par des années de sous-performance et une perte de confiance de la part des investisseurs.
La réponse traditionnelle à ce constat a été de pointer du doigt le phénomène d’overfitting des backtests, où les chercheurs exploitent les bruits des données jusqu’à obtenir des résultats qui semblent prometteurs. Bien que cela soit vrai, cela ne couvre pas la complexité de la situation. Une recherche récente de l’ADIA Lab, publiée par la CFA Institute Research Foundation, met en lumière une faille encore plus profonde : la misspécification systématique des modèles.
Les erreurs méthodologiques dans les modèles
La plupart des modèles axés sur les facteurs suivent un canon économétrique classique, utilisant des régressions linéaires, des tests de signification et d’autres outils qui mélangent associations et causalités. Les manuels d’économétrie enseignent que toutes les variables associées aux rendements doivent être incluses, sans considérer leur rôle dans le mécanisme causal.
Cela engendre une erreur méthodologique majeure. L’inclusion d’une collider (une variable influencée à la fois par le facteur et par les rendements) ou l’exclusion d’un confounder (une variable qui influence à la fois le facteur et les rendements) fausse les estimations des coefficients. Cela peut même inverser le signe du coefficient d’un facteur, incitant les investisseurs à acheter des titres qu’ils devraient vendre.
Les conséquences du mirage factoriel
La recherche de l’ADIA Lab souligne un phénomène connu sous le nom de zoo des facteurs : des centaines d’anomalies publiées qui échouent à s’appliquer hors échantillon. Cependant, le mirage factoriel est un problème plus subtil et dangereux, résultant non pas d’une simple exploitation des données, mais de modèles mal spécifiés, même s’ils respectent les principes de l’économétrie.
Les modèles intégrant des colliders peuvent sembler plus performants, affichant souvent des R² plus élevés et des p-values plus faibles, ce qui les rend attractifs malgré leur misspécification. La méthodologie traditionnelle favorise ces modèles, confondant une meilleure adéquation avec une correcte spécification.
Exemple de recherche biaisée
Imaginons deux chercheurs tentant d’estimer un facteur de qualité. L’un d’eux contrôle des variables telles que la rentabilité, l’endettement et la taille, tandis que l’autre inclut le retour sur capitaux propres, qui est influencé à la fois par la rentabilité (le facteur) et par la performance boursière (le résultat). En intégrant une collider, le second chercheur établit un lien fallacieux : une forte qualité semble maintenant corrélée à de hauts rendements passés. Dans les tests rétrospectifs, son modèle apparaît supérieur, mais en temps réel, cette illusion statistique peut entraîner des pertes de capital.
Pour les gestionnaires individuels, ces erreurs peuvent éroder silencieusement les rendements. À l’échelle du marché, elles perturbent l’allocation de capital et engendrent des inefficacités globales.
Vers une nouvelle méthodologie : la nécessité d’un raisonnement causal
Un rapport récent révèle que le problème ne réside pas tant dans les données elles-mêmes, mais plutôt dans la manière dont les modèles sont construits. En effet, beaucoup d’entre eux confondent corrélation et causalité, engendrant ainsi ce que l’on appelle un mirage factoriel.0
Un rapport récent révèle que le problème ne réside pas tant dans les données elles-mêmes, mais plutôt dans la manière dont les modèles sont construits. En effet, beaucoup d’entre eux confondent corrélation et causalité, engendrant ainsi ce que l’on appelle un mirage factoriel.1
Un rapport récent révèle que le problème ne réside pas tant dans les données elles-mêmes, mais plutôt dans la manière dont les modèles sont construits. En effet, beaucoup d’entre eux confondent corrélation et causalité, engendrant ainsi ce que l’on appelle un mirage factoriel.2
Un rapport récent révèle que le problème ne réside pas tant dans les données elles-mêmes, mais plutôt dans la manière dont les modèles sont construits. En effet, beaucoup d’entre eux confondent corrélation et causalité, engendrant ainsi ce que l’on appelle un mirage factoriel.3
