Présentation

Le Corpus Bambara de Référence est un corpus massif de textes annotés en langue bambara. Cette langue du groupe mandingue, famille linguistique Mandé, macro-famille Niger-Congo est parlée par 12 à 14 millions de locuteurs en République du Mali.

Lors de l’ouverture au public en avril 2012, le corpus comportait des textes dont le volume avoisinait 1.100.000 mots, dont environ 100.000 dans le sous-corpus désambiguïsé.
Ce chiffre progresse constamment et la qualité de l’étiquetage s’améliore au fur et à mesure.
Notre objectif est d’atteindre 7 à 10 millions de mots, dont environ 1 million dans le sous-corpus désambiguisé.

Composition du corpus

Le Corpus est composé de textes de genres différents, publiés (périodiques, belles-lettres, littérature orale, manuels, guides pratiques, littérature de l’alphabétisation fonctionnelle, publications religieuses etc.) et non-publiés (lettres des lecteurs des journaux; textes enregistrés et transcrits par les chercheurs etc.) dont les auteurs proviennent de zones dialectales différentes.

Cette diversité permet de penser que le Corpus, en se développant, représentera plus fidèlement le bambara standard dans sa diversité.

Mise à jour, juin 2016

Le volume total du corpus a atteint:
2 941 508 mots.
Le sous-corpus desambiguïsé comporte:
563.190 mots.
Le sous-corpus non-desambiguïsé comporte:
2 378 318 mots.

Un nettoyage du sos-corpus désambiguïsé a été entrepris; des nombreuses erreurs d'annotation ont été éliminées.

Des nouveaux textes ont été ajoutés au sous-corpus désambiguïsé :

  • Bailleul Ch. Sagesse bambara : proverbes et sentences. Bamako : Editions Donniya, 2005, 463 p. Chapitres 1 (4435 mots), 2a (4559 mots), 2b (6120 mots), 2c (10925 mots).
  • Jara, Usumani; Jara, Yakuba. Baganw ka minnɔgɔlaminɛ taamajan. Bamakɔ: Le figuier, 1996 (762 mots). lien web
  • Kamara, Idirisa. Donon kasira (Poyi). Bamakɔ: Sahelienne, 1996. (3527 mots).
  • Kuranɛ, Suran 5 (6942 mots).

Contes bambara :
  • Jara, Umaru Ɲanankɔrɔ. Juguya sara (650 mots).
  • Jara, Umaru Ɲanankɔrɔ. Ntalen (1725 mots).
  • Jara, Umaru Ɲanankɔrɔ. Sigidankelen ka labanko juguya (978 mots).
  • Jara, Umaru Ɲanankɔrɔ. Warabilenkɔrɔ ka walijuya (1640 mots).
  • Bagayogo, Amadou & Doumbia, Mariam. Báara, Ámàdu ní Máriyamu (593 mots).

Périodique Kibaru :
  • Kibaru 160-179, dec. 1986 (3592 mots).
  • Kibaru 258, juillet 1993 (10084 mots).
  • Kibaru 526, nov. 2015, p. 1-3 (3856 mots).
  • Kibaru 530, mars 2016 (9450 mots).
  • Kibaru 531, avril 2016 (10756 mots).

Des nouveaux textes ont été ajoutés au sous-corpus non-désambiguïsé :

  • Ebola poster (527 mots).
  • Tarawele, Daramani. Masala gafe. Bamakɔ: Kalan diya (6967 mots).
  • Tarawele, Daramani. Masalabolo. Bamakɔ: Kalan diya (16515 mots).
  • Tarawele, Daramani. Siginikalan n'a kɔfɛkalanw waleyacogo. Bamakɔ: Kalan diya (2013 mots).
  • Werner, David. Dɔgɔtɔrɔ tɛ sigida min na: Wulakɔnɔmɔgɔw ka yɛrɛfurakɛgafe (Là où il n'y a pas de docteur: Un manuel de soins de santé). Trad. par Bengali, Salifou; Bouaré, Fatoumata; Coulibaly, Abdoulaye; Dembélé, Diatrou. Bamako, 2016. Ɲɛbila, Sigida 1, 2, 3, 20, Ebola (26351 mots).

Kibaru :
  • No. 3, mai 1972 (2029 mots).
  • No. 4, juin 1972 (2712 mots).
  • No. 5, juillet 1972 (2196 mots).
  • No. 6, août 1972 (2367 mots).
  • No. 7, septembre 1972 (708 mots).
  • No. 8, octobre 1972 (2043 mots).
  • No. 9, novembre 1972 (2275 mots).
  • No. 10, décembre 1972 (2485 mots).
  • No. 11, janvier 1973 (2005 mots).
  • No. 104, octobre 1980 (2639 mots).
  • No. 123, mai 1982 (4344 mots).
  • No. 130, decembre 1982 (4000 mots).
  • No. 142-150, septembre 1986 (3553 mots).
  • No. 180, février 1987 (3493 mots).
  • No. 181, mars 1987 (3544 mots).
  • No. 183, avril 1987 (4283 mots).
  • No. 185, juin 1987 (4225 mots).
  • No. 186-188, septembre 1987 (4090 mots).
  • No. 189, octobre 1987 (6252 mots).
  • No. 194, mars 1988 (4744 mots).
  • No. 202-203, decembre 1988 (6155 mots).
  • No. 211, août 1989 (4364 mots).
  • No. 218, mars 1990 (2190 mots).
  • No. 219, avril 1990 (3176 mots).
  • No. 220, mai 1990 (3389 mots).
  • No. 221, juin 1990 (3716 mots).
  • No. 224, septembre 1990 (4253 mots).
  • No. 229, janvier 1991 (4483 mots).
  • No. 230, février 1991 (3403 mots).
  • No. 231, mars 1991 (4518 mots).
  • No. 232, avril 1991 (3290 mots).
  • No. 233, mai 1991 (3854 mots).
  • No. 234, juin 1991 (6027 mots).
  • No. 235, juillet 1991 (4180 mots).
  • No. 236, août 1991 (3884 mots).
  • No. 237, septembre 1991,4066 mots).
  • No. 238, octobre 1991 (1622 mots).
  • No. 241, février 1992 (3954 mots).
  • No. 242, mars 1992 (3931 mots).
  • No. 243, avril 1992 (2410 mots).
  • No. 245, juin 1992 (2948 mots).
  • No. 246, juillet 1992 (4242 mots).
  • No. 247, août 1992 (3812 mots).
  • No. 248, septembre 1992 (3349 mots).
  • No. 249, octobre 1992 (2499 mots).
  • No. 250, novembre 1992 (2746 mots).
  • No. 259, août 1993 (4579 mots).
  • No. 260, septembre 1993 (5216 mots).
  • No. 261, octobre 1993 (4761 mots).
  • No. 263, decembre 1993 (3671 mots).
  • No. 529, février 2016 (11358 mots).

Anciennes mises à jour

Veuillez cliquer ici pour accéder à l’historique des mises à jour.