{"id":4841,"date":"2020-05-18T22:47:43","date_gmt":"2020-05-18T22:47:43","guid":{"rendered":"https:\/\/wordpress-theme.spider-themes.net\/docly\/docs\/gullu-knowledge-base\/solved-issues\/simple-doc-title\/"},"modified":"2025-12-15T19:38:44","modified_gmt":"2025-12-15T19:38:44","slug":"simple-doc-title","status":"publish","type":"docs","link":"https:\/\/sahelib.atatec-design.com\/index.php\/docs\/gullu-knowledge-base\/solved-issues\/simple-doc-title\/","title":{"rendered":"L&#8217;homme, la machine et le march\u00e9\u00a0: un traitement automatique du langage naturel appliqu\u00e9 \u00e0 l&#8217;information sur la couverture \u00e9nerg\u00e9tique"},"content":{"rendered":"\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<h2 class=\"wp-block-heading\">Points forts<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Cette \u00e9tude examine la lecture algorithmique des informations financi\u00e8res en testant si les algorithmes de type \u00ab sac de mots \u00bb peuvent identifier les tendances des prix du march\u00e9 des entreprises \u00e9nerg\u00e9tiques couvertes.<\/li>\n\n\n\n<li>L&#8217;algorithme d\u00e9tecte une tendance plus marqu\u00e9e \u00e0 la baisse des b\u00eatas parmi les entreprises couvertes.<\/li>\n\n\n\n<li>L&#8217;algorithme est moins efficace que la classification humaine dans les applications plus complexes, comme l&#8217;identification des b\u00eatas conditionnels modifi\u00e9s des entreprises couvertes.<\/li>\n\n\n\n<li>Les mots cl\u00e9s pr\u00e9sentant la plus faible divergence par rapport au travail humain ou les meilleures performances dans une application plus simple n&#8217;excellent pas dans une t\u00e2che plus complexe.<\/li>\n<\/ul>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\">Abstrait<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Cette \u00e9tude examine l&#8217;efficacit\u00e9 de la lecture algorithmique en testant la capacit\u00e9 d&#8217;un algorithme \u00e0 identifier les informations relatives aux couvertures de risque dans les rapports annuels des entreprises \u00e9nerg\u00e9tiques. Au-del\u00e0 de la pratique courante consistant \u00e0 synth\u00e9tiser des informations qualitatives issues du langage humain \u00e0 l&#8217;aide d&#8217;algorithmes, nous introduisons une dimension d&#8217;\u00e9valuation suppl\u00e9mentaire en testant si ces algorithmes peuvent identifier les variations de prix du march\u00e9 document\u00e9es dans la litt\u00e9rature sur les couvertures, comparant ainsi les performances de la lecture automatique et de la lecture humaine. Notre analyse textuelle, bas\u00e9e sur une m\u00e9thode de comptage de mots-cl\u00e9s, r\u00e9v\u00e8le un taux de discordance de 21 % \u00e0 55 % par rapport \u00e0 la lecture humaine. Malgr\u00e9 ces \u00e9carts, l&#8217;identification algorithmique parvient \u00e0 d\u00e9tecter une tendance plus marqu\u00e9e \u00e0 la baisse des b\u00eatas parmi les entreprises couvertes. Cependant, les algorithmes sont moins performants que la classification humaine dans des applications plus complexes, telles que l&#8217;identification des b\u00eatas conditionnels modifi\u00e9s des entreprises couvertes. Nous constatons \u00e9galement que les mots-cl\u00e9s pr\u00e9sentant la plus faible discordance avec le travail humain, ainsi que ceux ayant obtenu les meilleurs r\u00e9sultats dans une application plus simple, ne sont pas performants dans une t\u00e2che plus complexe.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">ntroduction<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Le langage utilis\u00e9 dans les rapports d&#8217;entreprise v\u00e9hicule des informations relatives aux prix, traditionnellement interpr\u00e9t\u00e9es par des experts. Les m\u00e9thodes informatiques automatis\u00e9es offrent des alternatives \u00e9conomiques, mais leur exactitude doit \u00eatre v\u00e9rifi\u00e9e. La plupart des \u00e9tudes sur le traitement automatique du langage naturel appliqu\u00e9 \u00e0 l&#8217;information financi\u00e8re n&#8217;apportent que des r\u00e9ponses partielles \u00e0 cette question, car l&#8217;approche classique consiste \u00e0 extraire une variable qualitative, ce qui masque l&#8217;\u00e9valuation de l&#8217;exactitude.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><sup>Une<\/sup>&nbsp;tendance r\u00e9cente est l&#8217;introduction d&#8217;algorithmes d&#8217;apprentissage automatique plus complexes (Bochkay et al., 2023), ce qui aggrave le probl\u00e8me car les chercheurs ne peuvent d\u00e9terminer si la variable capture des informations contenues dans le langage ou d&#8217;autres aspects cach\u00e9s de la structure des mots (Loughran et McDonald, 2020).Cette \u00e9tude vise \u00e0 \u00e9valuer la validit\u00e9 de la lecture algorithmique en comparant les performances de la lecture humaine et de la lecture automatique pour identifier des informations plus quantifiables&nbsp;: les op\u00e9rations de couverture des entreprises. Dans un secteur relativement homog\u00e8ne o\u00f9 la couverture est fr\u00e9quente, la litt\u00e9rature existante pr\u00e9dit que les cours boursiers des entreprises couvertes pr\u00e9senteront des profils diff\u00e9rents de ceux des entreprises non couvertes. Ainsi, nous pouvons mesurer la performance d&#8217;une m\u00e9thode d&#8217;analyse textuelle en examinant si les lecteurs humains ou algorithmiques sont capables de d\u00e9tecter des diff\u00e9rences dans les fluctuations des cours. Nous pouvons \u00e9galement d\u00e9terminer si les algorithmes peuvent potentiellement se substituer \u00e0 la lecture humaine et dans quelles conditions ils sont performants.Nous nous int\u00e9ressons aux pratiques de couverture des entreprises \u00e9nerg\u00e9tiques cot\u00e9es en bourse et r\u00e9pertori\u00e9es dans la base de donn\u00e9es du Center for Research in Security Prices (CRSP) entre 1999 et 2020. Cet \u00e9chantillon repr\u00e9sente un ensemble relativement homog\u00e8ne, fortement expos\u00e9 aux fluctuations des prix de l&#8217;\u00e9nergie. Les entreprises ont facilement acc\u00e8s aux instruments de couverture, et les r\u00e9sultats sont observables sur les prix du march\u00e9. De m\u00eame, les \u00e9tudes sur la couverture analysent g\u00e9n\u00e9ralement le secteur de l&#8217;\u00e9nergie (par exemple, Haushalter, 2000&nbsp;; Jin et Jorion, 2006)&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><sup>.<\/sup>D\u00e9terminer si une entreprise pratique des op\u00e9rations de couverture exige une analyse approfondie de ses rapports. G\u00e9n\u00e9ralement, les informations relatives \u00e0 la couverture figurent en fin de rapport annuel, o\u00f9 les entreprises expliquent leurs positions sous forme de textes ou de tableaux. D&#8217;une part, des chercheurs de niveau master analysent les rapports annuels des entreprises \u00e9nerg\u00e9tiques et identifient les informations relatives \u00e0 la couverture. D&#8217;autre part, notre m\u00e9thode automatis\u00e9e utilise des algorithmes bas\u00e9s sur des mots-cl\u00e9s. Nous analysons ensuite dans quelle mesure ces deux approches concordent avec les r\u00e9sultats de prix de march\u00e9 \u00e9tablis dans la litt\u00e9rature sur la couverture, notamment les mesures b\u00eata traditionnelles et les b\u00eatas conditionnels associ\u00e9s au risque extr\u00eame.Nous constatons que les m\u00e9thodes automatis\u00e9es de s\u00e9lection par mots-cl\u00e9s pr\u00e9sentent des \u00e9carts non n\u00e9gligeables par rapport \u00e0 l&#8217;interpr\u00e9tation humaine, avec des taux de discordance allant de 21 % \u00e0 55 %. Malgr\u00e9 ces \u00e9carts, les deux m\u00e9thodes mettent en \u00e9vidence une corr\u00e9lation significative entre la couverture et la r\u00e9duction des b\u00eatas. Cependant, pour les variations de prix moins apparentes des b\u00eatas conditionnels, seule la classification humaine permet d&#8217;identifier les effets.Nos r\u00e9sultats sugg\u00e8rent que les algorithmes d&#8217;apprentissage automatique restent moins fiables pour d\u00e9tecter les comportements de couverture subtils. Nous constatons \u00e9galement qu&#8217;une faible divergence avec la lecture humaine ou de bonnes performances lors de tests simples ne garantissent pas le succ\u00e8s d&#8217;analyses complexes. Le mot-cl\u00e9 le plus performant dans notre analyse b\u00eata conditionnelle n&#8217;est pas celui qui pr\u00e9sente la plus faible divergence par rapport aux classifications humaines ni celui qui a obtenu la plus grande puissance statistique lors du test pr\u00e9c\u00e9dent.Ces r\u00e9sultats contribuent au d\u00e9veloppement d&#8217;approches plus \u00e9conomiques pour l&#8217;extraction de donn\u00e9es financi\u00e8res \u00e0 partir des publications des entreprises. Les tendances les plus \u00e9videntes, comme les coefficients b\u00eata simples, ne n\u00e9cessitent pas forc\u00e9ment d&#8217;algorithmes sophistiqu\u00e9s. Une approche possible pour les chercheurs est une approche par paliers&nbsp;: les m\u00e9thodes d&#8217;apprentissage automatique sont utilis\u00e9es pour les processus simples, tandis que l&#8217;intervention humaine est privil\u00e9gi\u00e9e pour les t\u00e2ches plus complexes. Par ailleurs, il est risqu\u00e9 de supposer que des algorithmes performants dans une application le resteront dans une autre. Sans supervision ad\u00e9quate, les algorithmes d&#8217;apprentissage automatique les plus complexes peuvent se r\u00e9v\u00e9ler opaques dans les analyses \u00e9conomiques. Les th\u00e9ories \u00e9conomiques \u00e9tablies, les d\u00e9couvertes empiriques ant\u00e9rieures et l&#8217;impact potentiel du projet permettent de d\u00e9terminer quelles t\u00e2ches requi\u00e8rent davantage de ressources humaines ou informatiques.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Extraits de section<\/h2>\n\n\n\n<h2 class=\"wp-block-heading\">S\u00e9lection des donn\u00e9es et des \u00e9chantillons<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Nous identifions les entreprises \u00e9nerg\u00e9tiques dans la base de donn\u00e9es CRSP avec les codes de la Classification industrielle standard (SIC) 1311, 1381, 1382, 1389 et 2911, tels que d\u00e9finis dans le tableau 1. Les donn\u00e9es de couverture sont extraites des rapports annuels, couvrant la p\u00e9riode de 1999 \u00e0 2020.Le processus de classification humaine comporte deux \u00e9tapes. Premi\u00e8rement, des chercheurs dipl\u00f4m\u00e9s examinent chaque rapport et en extraient le contenu pertinent. Deuxi\u00e8mement, les auteurs \u00e9valuent ces extraits afin de d\u00e9terminer si l&#8217;entreprise a eu recours \u00e0 des op\u00e9rations de couverture. Couverture non li\u00e9e \u00e0 l&#8217;\u00e9nergie<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Analyse b\u00eata traditionnelle<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Conform\u00e9ment \u00e0 Tufano (1996) et Jin et Jorion (2006), nous estimons si les actions couvertes ont des b\u00eatas plus faibles en utilisant le mod\u00e8le de march\u00e9.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img fetchpriority=\"high\" decoding=\"async\" width=\"838\" height=\"66\" src=\"https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03.png\" alt=\"\" class=\"wp-image-6673\" style=\"width:356px;height:auto\" srcset=\"https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03.png 838w, https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03-300x24.png 300w, https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03-768x60.png 768w, https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03-20x2.png 20w, https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03-32x3.png 32w, https:\/\/sahelib.atatec-design.com\/wp-content\/uploads\/2020\/05\/Capture-decran-2025-12-15-a-19.38.03-600x47.png 600w\" sizes=\"(max-width: 838px) 100vw, 838px\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Pour estimer les b\u00eatas des actions, le rendement du march\u00e9 est le rendement pond\u00e9r\u00e9 par la valeur des actions issu de la base de donn\u00e9es CRSP. Le rendement du march\u00e9 pour les b\u00eatas du p\u00e9trole est calcul\u00e9 \u00e0 partir du prix du West Texas Intermediate (WTI). Les rendements du WTI sont bas\u00e9s sur les donn\u00e9es de prix mensuelles disponibles aupr\u00e8s de la R\u00e9serve f\u00e9d\u00e9rale de Saint-Louis. Nous utilisons des estimations de b\u00eata sur 60 mois. <\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Conclusion<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Cette \u00e9tude \u00e9value l&#8217;analyse algorithmique de texte en comparant les classifications humaines et automatiques des op\u00e9rations de couverture dans les entreprises \u00e9nerg\u00e9tiques. Les machines reproduisent des sch\u00e9mas simples, comme la r\u00e9duction des b\u00eatas, m\u00eame avec des \u00e9carts sup\u00e9rieurs \u00e0 20 %. Cependant, elles ne parviennent pas \u00e0 d\u00e9tecter des effets plus subtils, tels que les b\u00eatas conditionnels.Alors que les \u00e9tudes pr\u00e9c\u00e9dentes ne comparent pas directement la lecture humaine aux approches algorithmiques, nous comparons les deux et identifions plusieurs points cl\u00e9s susceptibles d&#8217;am\u00e9liorer l&#8217;analyse textuelle. Nous constatons que<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">D\u00e9claration de l&#8217;IA g\u00e9n\u00e9rative et des technologies assist\u00e9es par l&#8217;IA dans le processus d&#8217;\u00e9criture<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">D\u00e9claration&nbsp;: Lors de la pr\u00e9paration de ce travail, les auteurs n\u2019ont utilis\u00e9 aucun outil de r\u00e9g\u00e9n\u00e9ration par intelligence artificielle, \u00e0 l\u2019exception du correcteur grammatical Grammarly. Apr\u00e8s utilisation de cet outil, ils ont relu et corrig\u00e9 le contenu selon les besoins et assument l\u2019enti\u00e8re responsabilit\u00e9 du contenu de l\u2019article publi\u00e9.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">R\u00e9f\u00e9rences\u00a0(10)<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>A.\u00a0Ang\u00a0<em>et al.<\/em><a href=\"https:\/\/www.sciencedirect.com\/science\/article\/pii\/S0304405X02000685\">Corr\u00e9lations asym\u00e9triques des portefeuilles d&#8217;actions<\/a>Journal d&#8217;\u00e9conomie financi\u00e8re(2002)<\/li>\n\n\n\n<li>YP\u00a0Chung\u00a0<em>et al.<\/em><a href=\"https:\/\/www.sciencedirect.com\/science\/article\/pii\/S0927539819300829\">Qu\u2019est-ce qui provoque la corr\u00e9lation asym\u00e9trique des rendements boursiers\u00a0?<\/a>Journal of Empir. Finance(2019)<\/li>\n\n\n\n<li>A.\u00a0Kayhan\u00a0<em>et al.<\/em><a href=\"https:\/\/www.sciencedirect.com\/science\/article\/pii\/S0304405X06001437\">Historique des entreprises et leurs structures de capital<\/a>Journal d&#8217;\u00e9conomie financi\u00e8re(2007)<\/li>\n\n\n\n<li>T.\u00a0Loughran\u00a0<em>et al.<\/em><a href=\"https:\/\/www.sciencedirect.com\/science\/article\/pii\/S1057521918308056\">Int\u00e9gration des informations p\u00e9troli\u00e8res dans les prix<\/a>Analyse financi\u00e8re des revues internationales(2019)<\/li>\n\n\n\n<li>I.\u00a0Babenko\u00a0<em>et al.<\/em>Couverture des risques et clauses de pr\u00eat(2023)<\/li>\n\n\n\n<li>SR\u00a0Baker\u00a0<em>et al.<\/em>Mesurer l&#8217;incertitude de la politique \u00e9conomiqueQJ \u00c9conomie.(2016)<\/li>\n\n\n\n<li>K.\u00a0Bochkay\u00a0<em>et al.<\/em>L&#8217;analyse textuelle en comptabilit\u00e9 : et apr\u00e8s ?Contemp. Account. Res.(2023)<\/li>\n\n\n\n<li>De la Parra, D. 2022. La fermet\u00e9 de la communication d&#8217;entreprise. Universit\u00e9 de Caroline du Nord \u00e0 Chapel Hill&#8230;<\/li>\n\n\n\n<li>M.\u00a0Grinblatt\u00a0<em>et al.<\/em>March\u00e9s financiers et strat\u00e9gie d&#8217;entreprise(2001)<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Abstrait Cette \u00e9tude examine l&#8217;efficacit\u00e9 de la lecture algorithmique en testant la capacit\u00e9 d&#8217;un algorithme \u00e0 identifier les informations relatives aux couvertures de risque dans les rapports annuels des entreprises \u00e9nerg\u00e9tiques. Au-del\u00e0 de la pratique courante consistant \u00e0 synth\u00e9tiser des informations qualitatives issues du langage humain \u00e0 l&#8217;aide d&#8217;algorithmes, nous introduisons une dimension d&#8217;\u00e9valuation suppl\u00e9mentaire [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":2323,"menu_order":22,"comment_status":"open","ping_status":"closed","template":"","doc_tag":[],"class_list":["post-4841","docs","type-docs","status-publish","hentry","no-post-thumbnail"],"acf":[],"_links":{"self":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/4841","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs"}],"about":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/types\/docs"}],"author":[{"embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/comments?post=4841"}],"version-history":[{"count":2,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/4841\/revisions"}],"predecessor-version":[{"id":6674,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/4841\/revisions\/6674"}],"up":[{"embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/2323"}],"wp:attachment":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/media?parent=4841"}],"wp:term":[{"taxonomy":"doc_tag","embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/doc_tag?post=4841"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}