Bridging the Close/Distant Reading Divide : Analyses de corpus historiques sur la Chine moderne (19-20e siècles)
December 3, 2025
12:00
En ligne
Séance 2 (Jeudi 4 décembre, 12h-14h) — Bridging the Close/Distant Reading Divide : Analyses de corpus historiques sur la Chine moderne (19-20e siècles)
Cécile Armand, CNRS (IAO) 
Christian Henriot, Aix-Marseille Université (Irasia)
Depuis une trentaine d’années, les sources historiques numériques accessibles aux chercheurs de la Chine moderne se sont multipliées. Cette numérisation massive ouvre de nouvelles perspectives, mais soulève aussi des défis inédits, liés non seulement à l’échelle des corpus, mais aussi à leur multilinguisme, à la diversité des genres et des supports, ainsi qu’aux biais introduits par des programmes de numérisation souvent opaques. L’essor de l’intelligence artificielle (IA) a renforcé ce mouvement, invitant à repenser les corpus non plus seulement comme des textes à lire individuellement, mais comme des réservoirs de données requérant des méthodes de traitement automatiques. Pour autant, les outils computationnels demeurent encore largement sous-exploités, voire mal compris par les historiens, de sorte que la richesse de ces corpus et leur potentiel de transformation historiographique restent en grande partie inexplorés.
Cette session présentera les travaux du projet ENP-China, qui s’efforce de relever ces défis en intégrant pleinement les méthodes computationnelles au cœur de la recherche historique. Le projet s’attache à structurer et à enrichir sémantiquement de vastes corpus textuels (presse, annuaires, archives, journaux intimes, dictionnaires biographiques, données du web), disponibles en texte intégral, et à développer des méthodes adaptées pour extraire, organiser, et analyser l’information historique qu’ils contiennent. A travers une collaboration inédite entre historiens et chercheurs en informatique, ce travail a conduit au développement de la Modern China Textual Database (MCTB) et de l’application HistText, un outil basé sur l'IA dédié à la construction et à l’analyse de corpus sur mesure. Des études de cas viendront illustrer concrètement comment cet écosystème peut renouveler notre connaissance de la Chine moderne et contemporaine.

Note Login : 

1.Il y a deux boutons Login de connexion  : ‘Login Edition’ et ‘Login Intranet’.

Ce sont les mêmes Logins pour les deux accès, mais l’ouverture de l’interface est différente, vous verrez. “*Login Intranet*” mène à la page Intranet. C’est là que vous pouvez accéder les tutoriels.

 *”Login Edition“* mène à l’interface d’édition de vos pages.

2.Il ne faut pas oublier de se déconnecter: 

Pour vous déconnecter de l‘Intranet, descendez en bas de la page web, puis cliquez sur ‘Log Edition’. Vous serez alors redirigé directement vers la page Edition. Sur cette page, en haut à droite, placez le curseur sur votre nom, puis cliquez sur ‘Log Out’. Vous vous déconnecterez ainsi à la fois de la page Edition et de l’intranet.

Crédits & mentions légales IrAsia - Institut de Recherches Asiatiques

Université d’Aix-Marseille
F-13331 Marseille Cedex 3

Téléphone : +33 4 13 55 07 29
Courriel : irasia@univ-amu.fr

Directrice de la publication : Hye Gyeong Kim-de Crescenzo, directrice de l’IrAsia
Conception et réalisation : FengYi

Hébergeur

Data Center Sud, Aix-Marseille Université

Mentions légales

Protection des informations nominatives
Ce site Web, qui comporte des informations nominatives concernant notamment les personnels de l’IrAsia et de ses partenaires, a fait l’objet d’une déclaration auprès de la CNIL (avis n° 650931). Conformément à la loi n° 78-17 du 6 janvier 1978, relative à l’Informatique, aux fichiers et aux Libertés (articles 38, 39, 40), vous disposez d’un droit d’accès, de rectification et de suppression des données vous concernant, en ligne sur ce site. Pour exercer ce droit, vous pouvez vous adresser au webmaster.

Clause de non-responsabilité
La responsabilité de l’IrAsia ne peut, en aucune manière, être engagée quant au contenu des informations figurant sur ce site ou aux conséquences pouvant résulter de leur utilisation ou interprétation.

Propriété intellectuelle
La présentation et le contenu du présent site constituent, ensemble, une œuvre protégée par les lois en vigueur sur la propriété intellectuelle, dont l‘IrAsia est titulaire. Aucune reproduction et/ou représentation, partielle ou intégrale, ne pourra en être faite sans l’accord préalable et écrit de l‘IrAsia.
À ce titre, toute reproduction, représentation, adaptation, traduction et /ou modification, partielle ou intégrale, ou transfert vers un autre site sont interdits. Leur reproduction, partielle ou intégrale, sans l’accord écrit et préalable de l‘IrAsia est strictement interdite, à l’exception de celle réalisée pour les besoins de la presse.
Les dénominations ou appellations, les logos et visuels, les photos, sont des marques déposées et/ou propriété exclusive de leurs propriétaires respectifs.

Liens hypertextes
La mise en place de liens hypertextes par des tiers vers des pages ou des documents diffusés sur le site de l‘IrAsia, est autorisée sous réserve que les liens ne contreviennent pas aux intérêts de l‘IrAsia, et, qu’ils garantissent la possibilité pour l’utilisateur d’identifier l’origine et l’auteur du document.