{"id":4711,"date":"2020-05-10T20:47:34","date_gmt":"2020-05-10T20:47:34","guid":{"rendered":"https:\/\/wordpress-theme.spider-themes.net\/docly\/docs\/gullu-wp\/theme-settings\/labore-scelerisque-ornare-architecto\/"},"modified":"2025-12-15T15:15:20","modified_gmt":"2025-12-15T15:15:20","slug":"labore-scelerisque-ornare-architecto","status":"publish","type":"docs","link":"https:\/\/sahelib.atatec-design.com\/index.php\/docs\/gullu-knowledge-base\/theme-settings\/labore-scelerisque-ornare-architecto\/","title":{"rendered":"Structuration des crit\u00e8res histopronostiques tumoraux par traitement automatique du langage naturel"},"content":{"rendered":"\n<h3 class=\"wp-block-heading\" id=\"cesectitle0001\">Introduction<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Les crit\u00e8res histopronostiques fondent la d\u00e9marche de pronostication en oncologie. Les m\u00e9thodes d&#8217;extraction textuelle disponibles (r\u00e8gles et apprentissage machine) diff\u00e8rent en d\u00e9veloppement et ressources. Nous avons structur\u00e9 les crit\u00e8res histopronostiques issus de comptes rendus m\u00e9dicaux en comparant ces deux m\u00e9thodes d&#8217;extraction textuelle.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"cesectitle0002\">M\u00e9thodes<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Nous avons extrait les variables suivantes : envahissement tumoral ganglionnaire, vasculaire, p\u00e9rinerveux, de la marge chirurgicale, distance aux marges, stade pTNM, taille et diff\u00e9renciation tumorales, compl\u00e9tude de la r\u00e9section microscopique, \u00e0 partir de comptes rendus d&#8217;anatomopathologie (CRA) post-op\u00e9ratoires de cholangiocarcinomes associ\u00e9es \u00e0 l&#8217;entrep\u00f4t de donn\u00e9es de sant\u00e9 de l&#8217;AP-HP. Les visites correspondantes ont \u00e9t\u00e9 identifi\u00e9es par les codes CIM-10 C221 (DP, DR) et CCAM relatifs aux r\u00e9sections tumorales de cholangiocarcinome, les CRA v\u00e9rifi\u00e9s manuellement par un oncologue puis divis\u00e9s en deux parties \u00e9gales pour constituer les jeux de d\u00e9veloppement et de validation. Apr\u00e8s annotation manuelle du corpus par un oncologue, les deux m\u00e9thodes d&#8217;extraction textuelle ont \u00e9t\u00e9 \u00e9labor\u00e9es et leurs m\u00e9triques de performances (valeur pr\u00e9dictive positive (VPP) et sensibilit\u00e9) compar\u00e9es pour chaque entit\u00e9. L&#8217;effort de d\u00e9veloppement des r\u00e8gles a \u00e9t\u00e9 \u00e9valu\u00e9 pour chaque entit\u00e9.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"cesectitle0003\">R\u00e9sultats<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Entre 2017 et 2020, 290 ARC ont \u00e9t\u00e9 identifi\u00e9s et annot\u00e9s. Sur le jeu de validation, la VPP variait entre 81 % et 99 % pour les r\u00e8gles et entre 79 % et 100 % pour l&#8217;apprentissage machine ; la sensibilit\u00e9 variait entre 92 % et 100 % pour les r\u00e8gles et entre 94 % et 100 % pour l&#8217;apprentissage machine. Pour toutes les entit\u00e9s, les diff\u00e9rences de m\u00e9triques de performance entre les deux m\u00e9thodes n&#8217;ont pas d\u00e9pass\u00e9 5 % (\u00e0 l&#8217;exception de la VPP pour la variable \u00ab taille de la tumeur \u00bb). Pour \u00e9laborer les r\u00e8gles, deux entit\u00e9s ont n\u00e9cessairement l&#8217;analyse de cinq documents, cinq autres entit\u00e9s celle d&#8217;entre 29 et 45 CRA, et deux autres celle d&#8217;entre 74 et 117.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"cesectitle0004\">Conclusion<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Les crit\u00e8res histopronostiques tumoraux sont facilement structur\u00e9s par traitement automatique du langage naturel, quelle que soit la m\u00e9thode d&#8217;extraction textuelle. Les r\u00e8gles constituant une m\u00e9thode efficace dont le co\u00fbt de d\u00e9veloppement varie en fonction des entit\u00e9s. L&#8217;\u00e9valuation de celui-ci en amont d&#8217;une t\u00e2che d&#8217;extraction textuelle permet d&#8217;optimiser le d\u00e9veloppement.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Mots-cl\u00e9s<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Traitement automatique du langage naturel<\/li>\n\n\n\n<li>Extraction d&#8217;information<\/li>\n\n\n\n<li>Biomarqueurs tumoraux<\/li>\n\n\n\n<li>Apprentissage machine supervis\u00e9<\/li>\n\n\n\n<li>Entrep\u00f4t de donn\u00e9es<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex\"><\/div>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Introduction Les crit\u00e8res histopronostiques fondent la d\u00e9marche de pronostication en oncologie. Les m\u00e9thodes d&#8217;extraction textuelle disponibles (r\u00e8gles et apprentissage machine) diff\u00e8rent en d\u00e9veloppement et ressources. Nous avons structur\u00e9 les crit\u00e8res histopronostiques issus de comptes rendus m\u00e9dicaux en comparant ces deux m\u00e9thodes d&#8217;extraction textuelle. M\u00e9thodes Nous avons extrait les variables suivantes : envahissement tumoral ganglionnaire, vasculaire, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":2045,"menu_order":16,"comment_status":"open","ping_status":"closed","template":"","doc_tag":[],"class_list":["post-4711","docs","type-docs","status-publish","hentry","no-post-thumbnail"],"acf":[],"_links":{"self":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/4711","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs"}],"about":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/types\/docs"}],"author":[{"embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/comments?post=4711"}],"version-history":[{"count":2,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/4711\/revisions"}],"predecessor-version":[{"id":6633,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/4711\/revisions\/6633"}],"up":[{"embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/docs\/2045"}],"wp:attachment":[{"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/media?parent=4711"}],"wp:term":[{"taxonomy":"doc_tag","embeddable":true,"href":"https:\/\/sahelib.atatec-design.com\/index.php\/wp-json\/wp\/v2\/doc_tag?post=4711"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}