Corpora Mandeica – Corpus annotés des langues mandé

Corpora Mandeica est un macro-projet de construction de corpus de textes annotés de langues mandé. Ces corpus proviennent des efforts conjoints des linguistes et informaticiens de différents pays. Ce macro-projet est né en avril 2018 suite à la fusion de deux projets qui existaient déjà auparavant: Corpus Bambara de Référence et Corpus Maninka de Référence ; à ceux-ci s'ajoute le Corpus du dan de l'Est, et prochainement, s'y ajouteront des corpus d'autres langues de la famille mandé.

Le macro-projet est coordonné par Valentin Vydrin ; les aspects informatiques sont assurés par Kirill Maslinsky (avec l'assistance d'Andrij Rovenchak et Jean Jacques Méric). Le projet est financé par l'Axe 6 du LabEx EFL et par un projet du programme de valorisation-2018.

Actuellement, Corpora Mandeica est composé des corpus suivants:

1. Corpus Bambara de Référence, avec les composantes et instruments suivants :

2. Corpus Maninka de Référence, avec trois composantes :

3. Corpus du dan de l'Est.

4. Corpus Mwan