Présentation

Le Corpus Bambara de Référence est un corpus massif de textes annotés en langue bambara. Cette langue du groupe mandingue, famille linguistique Mandé, macro-famille Niger-Congo est parlée par 12 à 14 millions de locuteurs en République du Mali.

Lors de l’ouverture au public en avril 2012, le corpus comportait des textes dont le volume avoisinait 1.100.000 mots, dont environ 100.000 dans le sous-corpus désambiguïsé.
Ce chiffre progresse constamment et la qualité de l’étiquetage s’améliore au fur et à mesure.
Notre objectif est d’atteindre 7 à 10 millions de mots, dont environ 1 million dans le sous-corpus désambiguisé.

Composition du corpus

Le Corpus est composé de textes de genres différents, publiés (périodiques, belles-lettres, littérature orale, manuels, guides pratiques, littérature de l’alphabétisation fonctionnelle, publications religieuses etc.) et non-publiés (lettres des lecteurs des journaux; textes enregistrés et transcrits par les chercheurs etc.) dont les auteurs proviennent de zones dialectales différentes.

Cette diversité permet de penser que le Corpus, en se développant, représentera plus fidèlement le bambara standard dans sa diversité.

Mise à jour, septembre 2016

Le volume total du corpus a atteint:
3 139 361 mots.
Le sous-corpus desambiguïsé comporte:
575 488 mots.
Le sous-corpus non-desambiguïsé comporte:
2 563 873 mots.

Des nouveaux textes ont été ajoutés au sous-corpus désambiguïsé :

  • Kibaru 532, mai 2016, 12297 mots

Des nouveaux textes ont été ajoutés au sous-corpus non-désambiguïsé :

Kuranɛ :
  • Kuranɛ, Suran 70: 736 mots
  • Kuranɛ, Suran 71: 655 mots
  • Kuranɛ, Suran 72: 905 mots
  • Kuranɛ, Suran 73: 654 mots
  • Kuranɛ, Suran 74: 791 mots
  • Kuranɛ, Suran 75: 537 mots
  • Kuranɛ, Suran 76: 694 mots
  • Kuranɛ, Suran 77: 653 mots
  • Kuranɛ, Suran 78: 513 mots
  • Kuranɛ, Suran 79: 637 mots
  • Kuranɛ, Suran 80: 480 mots
  • Kuranɛ, Suran 81: 354 mots
  • Kuranɛ, Suran 82: 228 mots
  • Kuranɛ, Suran 83: 559 mots
  • Kuranɛ, Suran 84: 343 mots

Kibaru :
  • No. 30, août 1974, 2739 mots
  • No. 213, octobre 1989, 5261 mots
  • No. 214, novembre 1989, 3874 mots
  • No. 216, janvier 1990, 3323 mots
  • No. 222, juillet 1990, 3803 mots
  • No. 223, août 1990, 4094 mots
  • No. 225, octobre 1990, 5819 mots
  • No. 226, novembre 1990, 4245 mots
  • No. 227, décembre 1990, 5202 mots
  • No. 228, janvier 1991, 4753 mots
  • No. 244, mai 1992, 3022 mots
  • No. 253, février 1993, 3359 mots
  • No. 257, juin 1993, 3886 mots
  • No. 273, oct. 1994, 6278 mots
  • No. 285, oct. 1995, 6718 mots
  • No. 290, mars 1996, 9937 mots
  • No. 291, avril 1996, 10512 mots
  • No. 297, octobre 1996, 10331 mots
  • No. 304, mai 1997, 11046 mots
  • No. 314, mars 1998, 10062 mots
  • No. 315, avril 1998, 9012 mots
  • No. 316, mai 1998, 9571 mots
  • No. 317, juin 1998, 8452 mots
  • No. 318, juillet 1998, 1054 mots
  • No. 319, août 1998, 10920 mots
  • No. 454, novembre 2009, 10935 mots
  • No. 533, juin 2016, 10062 mots
  • No. 534, jillet 2016, 9938 mots

Jɛkabaara :
  • Jɛkabaara Nos. 275-277, 279-283 ont été divisés par articles, les métadonnées ont été rajoutées

Anciennes mises à jour

Veuillez cliquer ici pour accéder à l’historique des mises à jour.