Présentation

Le Corpus Bambara de Référence est un corpus massif de textes annotés en langue bambara. Cette langue du groupe mandingue, famille linguistique Mandé, macro-famille Niger-Congo est parlée par 12 à 14 millions de locuteurs en République du Mali.

Lors de l’ouverture au public en avril 2012, le corpus comportait des textes dont le volume avoisinait 1.100.000 mots, dont environ 28.000 dans le sous-corpus désambiguïsé.
Ce chiffre progresse constamment et la qualité de l’étiquetage s’améliore au fur et à mesure.
Notre objectif est d’atteindre 7 à 10 millions de mots, dont environ 1 million dans le sous-corpus désambiguisé.

Composition du corpus

Le Corpus est composé de textes de genres différents, publiés (périodiques, belles-lettres, littérature orale, manuels, guides pratiques, littérature de l’alphabétisation fonctionnelle, publications religieuses etc.) et non-publiés (lettres des lecteurs des journaux; textes enregistrés et transcrits par les chercheurs etc.) dont les auteurs proviennent de zones dialectales différentes.

Cette diversité permet de penser que le Corpus, en se développant, représentera plus fidèlement le bambara standard dans sa diversité.

Mise à jour, juin 2017

Le volume total du corpus a atteint:
4 113 006 mots.
Le sous-corpus desambiguïsé comporte:
903 585 mots.
Le sous-corpus non-desambiguïsé comporte:
3 209 421 mots.

Des nouveaux textes ont été ajoutés au sous-corpus désambiguïsé :

  • Bɛnkansɛbɛn min bɔra Alize sigikafɔw la ka ɲɛsin basigi ni bɛnɲinini ma Mali kɔnɔ (accord d’Alger). 2015, 9707 mots.
  • Bolociw. Bamako: EDIM, 1977, 2654 mots.
  • Dumestre, Gérard; Touré, Seydou. Maléfices et manigances: Chroniques maliennes. 111119 mots.

Kuranɛ :
  • Suran 7, 8204 mots
  • Suran 8, 3069 mots
  • Suran 9, 5910 mots

Görög, Veronika. Contes bambara du Mali. Paris : Publications orientalistes de France, 1979.

La désambiguïsation est terminée. Les contes suivantes ont été intégrés :

  • Suruku ye faama denmuso dumu, pp. 16-17, 419 mots
  • Nanbaranin ni a kòròmuso, pp. 63-66, 1588 mots
  • Nanbaranin ni nkuman, pp. 78-80, 931 mots
  • Wali nyè singanen, pp. 82-87, 1535 mots
  • Cènya nyògòn dan, pp. 99-101, 739 mots

Chansons :
  • Bagayogo, Amadou & Doumbia, Mariam . Tubalakɔnɔ. 553 mots.
  • Diabaté, Bakoroba. Lahaji Ka Musoninncininko. 1435 mots.
  • Diawara, Fatoumata. Boloko. 430 mots.
  • Diawara, Fatoumata. Kanu. 341 mots.
  • Diawara, Fatoumata. Timbuktu Faso. 200 mots.
  • Doucouré, Ismaïla, dit Master Soumy. Explique ton Islam. 955 mots.
  • Keïta, Salif. Folon. 138 mots.
  • Keïta, Salif. Papa. 413 mots.
  • Koïté, Habib. Maliba. 226 mots.
  • Koïté, Habib. Masakɛ. 296 mots.
  • Sangaré, Oumou. Jarabi nɛnɛ. 354 mots.
  • Sissoko, Baba. A bolila. 240 mots.
  • Traoré, Rokia. Duɲa. 316 mots.
  • Traoré, Rokia. Wanita. 321 mots.

Jɛkabaara :
  • Jɛkabaara 142, août 1997, 6874 mots
  • Jɛkabaara 145, novembre 1997, 9098 mots

Kibaru :
  • Kibaru 541, février 2017, 9361 mots
  • Kibaru 542, mars 2017, 9842 mots
  • Kibaru 543, avril 2017, 10306 mots
  • Kibaru 544, mai 2017, 11167 mots

Des nouveaux textes ont été ajoutés au sous-corpus non-désambiguïsé :

Jɛkabaara :
  • Jèkabaara 122, janvier 1996, 7171 mots
  • Jɛkabaara 123, fevrier 1996, 6830 mots
  • Jɛkabaara 124, mars 1996, 8811 mots
  • Jɛkabaara 125, avril 1996, 7897 mots
  • Jɛkabaara 129, août 1996, 6961 mots
  • Jɛkabaara 131, octobre 1996, 8043 mots
  • Jɛkabaara 132, novembre 1996, 7388 mots
  • Jɛkabaara 136, mars 1997, 7967 mots
  • Jɛkabaara 137, avril 1997, 6858 mots
  • Jɛkabaara 138, mai 1997, 6420 mots
  • Jɛkabaara 140, juillet 1997, 7621 mots
  • Jɛkabaara 143, septembre 1997, 6547 mots
  • Jɛkabaara 144, octobre 1997, 6729 mots
  • Jɛkabaara 146, décembre 1998, 8203 mots
  • Jɛkabaara 148 février 1998, 7475 mots
  • Jɛkabaara 149, mars 1998, 8467 mots
  • Jɛkabaara 150, avril 1998, 6131 mots
  • Jɛkabaara 151, mai 1998, 7484 mots
  • Jɛkabaara 153, juillet 1998, 5807 mots
  • Jɛkabaara 156, octobre 1998, 7160 mots
  • Jɛkabaara 157, novembre 1998, 6550 mots
  • Jɛkabaara 158, decembre 1998, 7441 mots
  • Jɛkabaara 159, janvier 1999, 6583 mots
  • Jɛkabaara 161, mars 1999, 6529 mots
  • Jɛkabaara 166, août 1999, 6776 mots
  • Jɛkabaara 167, septembre 1999, 7311 mots
  • Jɛkabaara 168, octobre 1999, 7235 mots
  • Jɛkabaara 170, décembre 1999, 7047 mots

Anciennes mises à jour

Veuillez cliquer ici pour accéder à l’historique des mises à jour.