Présentation

Le Corpus Bambara de Référence est un corpus massif de textes annotés en langue bambara. Cette langue du groupe mandingue, famille linguistique Mandé, macro-famille Niger-Congo est parlée par 12 à 14 millions de locuteurs en République du Mali.

Lors de l’ouverture au public en avril 2012, le corpus comportait des textes dont le volume avoisinait 1.100.000 mots, dont environ 100.000 dans le sous-corpus désambiguïsé.
Ce chiffre progresse constamment et la qualité de l’étiquetage s’améliore au fur et à mesure.
Notre objectif est d’atteindre 7 à 10 millions de mots, dont environ 1 million dans le sous-corpus désambiguisé.

Composition du corpus

Le Corpus est composé de textes de genres différents, publiés (périodiques, belles-lettres, littérature orale, manuels, guides pratiques, littérature de l’alphabétisation fonctionnelle, publications religieuses etc.) et non-publiés (lettres des lecteurs des journaux; textes enregistrés et transcrits par les chercheurs etc.) dont les auteurs proviennent de zones dialectales différentes.

Cette diversité permet de penser que le Corpus, en se développant, représentera plus fidèlement le bambara standard dans sa diversité.

Mise à jour, août 2014

Le volume total du corpus a atteint 1 994 479 mots.

Sous-corpus desambiguïsé:

Le sous-corpus desambiguïsé comporte 313 922 mots. De nouveaux textes y ont été ajoutés:

  • Bailleul, Ch.; Dumestre, G.; Vydrine, V. Npogotigiw ni bilisiw. St. Petersbourg, 1992. 1957 mots.
  • Trahison de Bakari Dian (par Diéli Baba Sissoko). In : Dumestre, Gérard. Geste de Ségou. Paris : Armand Colin, 1979, pp. 61-109. 4771 mots.
  • Bakaridjan ni Bilissi. In : Dumestre, Gérard. Geste de Ségou. Paris : Armand Colin, 1979, pp. 111-181, 7156 mots.
  • Keyita, Gabukɔrɔ. Sunjata Keyita ka maana. Bamakò: EDIM, 1979, 32 p. 3558 mots.
  • Mariko, Samu. Masunkulu. Maana ncinin ɲɔgɔndan sɛbɛnni bamanankan na (1993 ɲɔgɔndan). Bamako: Jamana, 1994. 6207 mots.

sous-corpus non-desambiguïsé:

Le sous-corpus non-desambiguïsé comporte
1 680 557 mots. Des nouveaux textes y ont été ajoutés :

  • Jabatɛ, Jeli Jafe. Genkurunin (Cɛfarinmaana). Bamakɔ: EDIS, 2007, 127 p., 19827 mots.
  • Jabatɛ, Jeli Jafe. Ŋɛɲɛkɔrɔ ka Tonnkan (Cɛfarinmaana). EDIS, 2007, 267 p., 47469 mots + Samaseku, Adama. Ɲɛbila, 512 mots.
  • Kulubali, Adama Jɔkolon. Ɲakurunin. Bamakɔ: EDIS, 2007, 66 p., 9024 mots.
  • Kuyatɛ, Worokiya. Nsiirin. Bamakɔ: EDIS, 2010, 6255 mots.
  • Ɲare, Sanba. Kanuya wale. 1. Dajuru. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010. 14716 mots.
  • Ɲare, Sanba. Kanuya wale. 2. Parantikɛ. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 15813 mots.
  • Ɲare, Sanba. Kanuya wale. 3. Firiyatɔw. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 13688 mots.
  • Ɲare, Sanba. Masasi. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 11670 mots.
  • Ɲare, Sanba. Ntomokun. Traduction par Jɔbu Tɛra. Bamakɔ: EDIS, 2010, 10733 mots.
  • Tarawele, Daramani. Tabusire 1. Bamakɔ, EDIS, 2010, 7220 mots.
  • Tarawele, Daramani. Tabusire 2. Bamakɔ, EDIS, 2010, 12 592 mots.
  • Tɛra, Jɔbu. Donso Mamari. Bamakɔ, EDIS, 2010, 7331 mots.

Périodiques:
  • Jɛkabaara 328, Feb. 2013, 8137 mots
  • Kibaru 81, Nov. 1978, 3888 mots
  • Kibaru 89, Juillet 1979, 2817 mots
  • Kibaru 101, Juillet 1980, 4038 mots
  • Kibaru 113, Juillet 1981, 3720 mots

Anciennes mises à jour

Veuillez cliquer ici pour accéder à l’historique des mises à jour.