Sahel Lib

Sahel Lib

Ideas without borders

Articles scientifiques en ligne

Proposition d’un modèle hybride d’apprentissage profond intégrant des données de sentiment et des données historiques pour la prédiction

Estimated reading: 12 minutes 101 views

Abstrait

La croissance rapide et les fluctuations du marché des cryptomonnaies ont suscité un vif intérêt pour le développement de modèles prédictifs. Cependant, de nombreuses études existantes s’appuient uniquement sur des données de prix historiques ou utilisent des modèles d’apprentissage profond uniques, qui peinent souvent à saisir la nature complexe et dynamique du marché. De plus, l’utilisation limitée des informations de sentiment issues des sources d’actualité a restreint la précision des prédictions dans les travaux antérieurs. Pour pallier ces limitations, cet article explore une approche hybride d’apprentissage profond combinant CNN et GRU afin d’améliorer la précision et la fiabilité des prédictions de prix du Bitcoin (BTC), de l’Ethereum (ETH) et du Monero (XMR). Le modèle proposé intègre à la fois des données de prix historiques et l’analyse des sentiments de Google Actualités, extraite à l’aide d’outils largement utilisés tels que Flair, Vader et TextBlob. De nombreuses expériences menées sur divers ensembles de données démontrent que le modèle surpasse les approches existantes selon plusieurs métriques d’évaluation (MAE, MAPE, MSE, RMSE). En exploitant simultanément les caractéristiques spatiales et temporelles, le cadre capture des tendances complexes et s’adapte efficacement aux fluctuations du marché. Les résultats confirment que l’intégration de l’analyse des sentiments à l’apprentissage profond offre une solution plus robuste pour la prédiction des prix des cryptomonnaies que les études précédentes.

Introduction

Les marchés financiers désignent les systèmes et plateformes où les particuliers, les entreprises et les gouvernements peuvent acheter et vendre des actifs financiers tels que des actions, des obligations, des matières premières, des devises et des produits dérivés (Hull, 2009). Parmi ces marchés, le marché des cryptomonnaies est actuellement l’un des sujets les plus en vogue. Les cryptomonnaies sont des formes numériques de monnaie stockées et échangées via un réseau informatique indépendant, distinct des banques, des gouvernements et de toute autorité centrale (Rathee et al., 2023). Ces monnaies sont organisées par la technologie blockchain et servent de registre pour les transactions, notamment les transferts, les achats et les ventes. La nature décentralisée, l’immuabilité et la transparence de la blockchain et des cryptomonnaies ont contribué à leur popularité croissante. La tendance haussière et la multiplication des plateformes d’échange font des cryptomonnaies une option d’investissement intéressante. La cryptomonnaie la plus connue, le Bitcoin (BTC), a été lancée en 2009 et est restée la seule cryptomonnaie basée sur la blockchain pendant plus de deux ans (Bitcoin, 2008). Aujourd’hui, on compte plus de vingt mille cryptomonnaies. Le Bitcoin a récemment suscité un vif intérêt dans les domaines de l’économie, de la cryptographie et de l’informatique (Hamayel & Owda, 2021). Le réseau Bitcoin conserve un registre des transactions entre individus, chaque enregistrement étant chiffré et incluant le hachage chiffré du bloc précédent (Jiang, 2020). Le marché des cryptomonnaies se caractérise par une forte volatilité et de fréquentes fluctuations. Pour réaliser des profits substantiels dans cet environnement, une surveillance continue et l’accès à de vastes ensembles de données sont essentiels. De plus, compte tenu de la complexité inhérente au marché, le développement de modèles prédictifs robustes, capables d’anticiper avec précision les variations de prix, revêt une importance capitale.L’intelligence artificielle (IA) désigne un ensemble de techniques et d’algorithmes utilisés pour programmer les ordinateurs afin qu’ils puissent effectuer des tâches sans intervention humaine. Son principal objectif est de créer et d’améliorer les capacités intelligentes des machines. Parmi les concepts importants et répandus en IA figurent les algorithmes d’apprentissage profond (Fetzer, 1990). L’une des caractéristiques clés de ces algorithmes est leur capacité à reconnaître des schémas complexes tout en prenant simultanément en compte de multiples facteurs. Avant l’utilisation des algorithmes d’apprentissage profond pour prédire les prix des cryptomonnaies, on employait des algorithmes d’apprentissage automatique traditionnels tels que ARIMA, les algorithmes de régression, les arbres de décision, les forêts aléatoires et le gradient boosting (Derbentsev et al., 2020 ; Oyedele et al., 2023 ; Pekel, 2020 ; Peng et al., 2018 ; Phaladisailoed et Numnonda, 2018). Les cryptomonnaies présentent des schémas très complexes, ce qui fait de la prédiction de leurs prix un problème de séries temporelles particulièrement difficile. De nombreuses études ont utilisé des algorithmes d’apprentissage profond pour cette tâche, grâce à leur capacité accrue à générer des prévisions de prix plus précises. Dans cet article, une combinaison d’algorithmes d’apprentissage profond est utilisée pour prédire les prix du Bitcoin, de l’Ethereum (ETH) et du Monero (XMR). Il convient de noter que, d’après les résultats d’études (Mansourabady et al., 2024 ; Tabe et al., 2024), il est préférable d’utiliser une combinaison d’algorithmes d’apprentissage profond pour cette tâche, car aucun algorithme pris individuellement ne permet de découvrir suffisamment bien les caractéristiques importantes et de résoudre la complexité des données.À l’instar d’autres actifs tels que les actions et les métaux, les cours des cryptomonnaies sont influencés par divers facteurs, notamment les fausses informations, les tentatives de manipulation de marché et les politiques gouvernementales (Zhang et al., 2021). Investir sur des marchés financiers très volatils comme celui des cryptomonnaies peut engendrer des gains comme des pertes considérables. Ces fluctuations peuvent être liées à l’actualité et aux émotions, ce qui rend l’analyse des sentiments essentielle pour la prédiction des cours des cryptomonnaies (Aslam et al., 2022). Une quantité considérable de textes disponibles dans le monde peut contribuer à la prédiction des monnaies numériques. Bien que ces textes recèlent une mine d’informations, il devient de plus en plus difficile pour l’être humain d’y extraire les connaissances et informations nécessaires dans des délais précis (Chowdhary, 2020). L’objectif du traitement automatique du langage naturel est d’effectuer cette tâche de manière efficace et précise, plus rapidement et sans intervention humaine. La croissance rapide des applications internet, telles que les réseaux sociaux et les blogs, a entraîné une augmentation du volume d’informations et d’opinions générées (Wankhade et al., 2022). La demande de cryptomonnaies peut être influencée par l’opinion publique ou les politiques gouvernementales, entraînant des fluctuations de leur valeur (Aslam et al., 2022). À cet égard, le sentiment du public peut contribuer à déterminer la hausse ou la baisse de la valeur marchande des cryptomonnaies. L’analyse des sentiments, notamment pour les investissements en cryptomonnaies, est actuellement très populaire. Des études ont montré que les actualités et les tweets véhiculant des sentiments positifs ont un impact significatif sur la demande de cryptomonnaies, et inversement.La principale contribution de cette étude réside dans l’intégration de réseaux de neurones convolutifs (CNN), d’unités récurrentes à porte (GRU) et de couches denses, à partir de données historiques, ainsi que dans l’incorporation d’un module d’analyse des sentiments. Afin d’évaluer l’impact de cette analyse sur les performances du modèle, trois outils reconnus – VADER, TextBlob et Flair – ont été appliqués individuellement et leurs résultats comparés. Les données d’actualités utilisées pour l’extraction des sentiments proviennent de Google Actualités, offrant ainsi une source d’informations diversifiée et actualisée sur le marché. Cette analyse comparative permet de mieux comprendre les forces et les limites de chaque outil d’analyse des sentiments et contribue à améliorer la précision globale des prédictions. Les performances du modèle ont été évaluées à l’aide de quatre métriques standard : l’erreur absolue moyenne (MAE), l’erreur quadratique moyenne (MSE), la racine carrée de l’erreur quadratique moyenne (RMSE) et l’erreur absolue moyenne en pourcentage (MAPE). De plus, la comparaison avec les approches existantes dans des études connexes démontre la supériorité de la méthode proposée. Enfin, l’application du modèle à plusieurs cryptomonnaies, dont le BTC, l’ETH et le XMR, confirme la robustesse et la fiabilité des algorithmes proposés. Ces résultats soulignent l’efficacité de la combinaison de l’apprentissage profond et de l’analyse des sentiments pour des prévisions de cryptomonnaies plus fiables et fondées sur les données.La section suivante passe en revue les travaux antérieurs dans ce domaine. La troisième section décrit les données collectées et leurs étapes de prétraitement. La quatrième section présente les fondements théoriques de la compréhension des concepts d’apprentissage profond et de la méthode proposée. Dans la cinquième section, les performances du modèle proposé sont analysées et comparées à celles d’autres algorithmes. Enfin, la conclusion présente les résultats obtenus et les perspectives de recherche.

Revue de littérature

Cette section passe en revue les travaux antérieurs portant sur la prédiction des cryptomonnaies. Les modèles issus des meilleures études précédentes seront présentés dans les sections suivantes et mis en œuvre à des fins de comparaison.(Lim et al., 2016) ont montré que la prédiction des prix est utilisée non seulement pour les cryptomonnaies, mais aussi pour d’autres marchés et secteurs. Cet article traite de la prédiction des prix de l’immobilier à Singapour. Les chercheurs ont collecté des données chronologiques sur divers facteurs influençant les prix de l’immobilier, tels que…

Données

L’ensemble de données utilisé dans cette étude comprend deux composantes : des données historiques sur les prix des cryptomonnaies provenant de CoinMarketCap et des données d’actualités relatives aux cryptomonnaies collectées sur Google News.

Méthode proposée

La méthode proposée dans cette étude se compose de deux éléments principaux. Le premier vise à prédire le prix des cryptomonnaies le lendemain grâce à une combinaison d’architectures d’apprentissage profond, tandis que le second intègre l’analyse des sentiments exprimés dans l’actualité liée aux cryptomonnaies à l’aide d’outils tels que Flair, TextBlob et Vader, comme mentionné précédemment. Ces deux éléments sont ensuite combinés pour former un cadre prédictif unifié et robuste du prix des cryptomonnaies.

Résultats et comparaison

Dans cette section, les critères d’évaluation des méthodes mises en œuvre sont présentés. Ensuite, ces méthodes, utilisées pour une meilleure comparaison, sont passées en revue. Elles comprennent plusieurs algorithmes d’apprentissage profond et des modèles issus d’articles précédents, afin d’assurer une comparaison plus pertinente et d’évaluer en profondeur les performances du modèle proposé. Enfin, les résultats obtenus pour chaque cryptomonnaie sont analysés. Il est à noter que le code nécessaire à cette étude a été écrit en Python version 3.11.

Conclusion et perspectives

Cette étude présente un modèle hybride d’apprentissage profond combinant CNN et GRU avec l’analyse des sentiments pour prédire les cours des cryptomonnaies. Les résultats montrent que l’intégration de données historiques et de l’analyse des sentiments des actualités améliore significativement la précision des prédictions pour Bitcoin, Ethereum et Monero. L’utilisation d’une fenêtre de sept jours pour les cours passés s’est avérée particulièrement efficace pour identifier les tendances du marché, chaque cryptomonnaie présentant un comportement unique. Bien que la méthode proposée surpasse les approches existantes,

Déclaration de contribution à l’auteur CRediT

Fatemeh Tabe : Conceptualisation, Méthodologie, Logiciel, Analyse formelle, Validation, Ressources, Investigation, Visualisation. 

Ali Mansourabady : Conceptualisation, Méthodologie, Logiciel, Analyse formelle, Validation, Ressources, Investigation, Visualisation. 

Amir Hossein Rasekh : Conceptualisation, Validation, Analyse formelle, Investigation, Supervision. 

Betsabeh Tanoori : Conceptualisation, Validation, Analyse formelle, Investigation, Supervision.

Déclaration de conflit d’intérêts

Les auteurs déclarent n’avoir aucun conflit d’intérêts financiers ou personnels connu susceptible d’avoir influencé les travaux présentés dans cet article.

Références (42)

Share this Doc

Proposition d’un modèle hybride d’apprentissage profond intégrant des données de sentiment et des données historiques pour la prédiction

Or copy link

CONTENTS