Les grands modèles de langage en finance : signal ou bruit ?
Ce que la littérature empirique permet réellement d’affirmer sur la valeur prédictive des LLM appliqués aux marchés.
Une promesse spectaculaire
Les grands modèles de langage produisent des analyses fluides, plausibles et rapides. De là à en faire des instruments de prévision financière, il n’y a qu’un pas — souvent franchi un peu vite. La fluidité d’un texte n’est pas une mesure de sa valeur prédictive.
Ce que disent les études
Les travaux empiriques disponibles convergent sur un point : les gains attribués aux LLM sont très sensibles au protocole de test. Lorsque l’on contrôle correctement les fuites d’information et le sur-apprentissage, l’avantage se réduit souvent à la marge.
Un modèle qui « explique » le passé n’a démontré aucune capacité à anticiper l’avenir.
La question des fuites de données
Le principal piège tient aux données d’entraînement : un modèle entraîné jusqu’à une date récente connaît, de fait, des événements qu’il est censé « prédire ». Sans découpage temporel strict, toute évaluation est trompeuse.
Conclusion
Les LLM sont des outils utiles pour synthétiser et explorer. Les ériger en oracles de marché relève de la confusion entre vraisemblance et preuve. La prudence reste de mise.