Présentation

Le Corpus Bambara de Référence est un corpus massif de textes annotés en langue bambara. Cette langue du groupe mandingue, famille linguistique Mandé, macro-famille Niger-Congo est parlée par 12 à 14 millions de locuteurs en République du Mali.

Lors de l’ouverture au public en avril 2012, le corpus comportait des textes dont le volume avoisinait 1.100.000 mots, dont environ 28.000 dans le sous-corpus désambiguïsé.
Ce chiffre progresse constamment et la qualité de l’étiquetage s’améliore au fur et à mesure.
Notre objectif est d’atteindre 7 à 10 millions de mots, dont environ 1 million dans le sous-corpus désambiguisé.

Composition du corpus

Le Corpus est composé de textes de genres différents, publiés (périodiques, belles-lettres, littérature orale, manuels, guides pratiques, littérature de l’alphabétisation fonctionnelle, publications religieuses etc.) et non-publiés (lettres des lecteurs des journaux; textes enregistrés et transcrits par les chercheurs etc.) dont les auteurs proviennent de zones dialectales différentes.

Cette diversité permet de penser que le Corpus, en se développant, représentera plus fidèlement le bambara standard dans sa diversité.

Mise à jour, 17 février 2018

Le volume total du corpus a atteint:
4 788 302 mots.
Le sous-corpus desambiguïsé comporte:
974 346 mots.
Le sous-corpus non-desambiguïsé comporte:
3 813 956 mots.

Des innovations ont été apportées au Corpus Bambara de Référence:

1) Pour la première fois, on a appliqué au Sous-corpus non-désambiguïsé la procédure de désambiguïsation automatique partielle basée sur la liste des collocations et des contraintes syntaxiques élaborées par Jean Jacques Méric. Cela a permis de diminuer le taux d'homonymie dans ce sous-corpus (c.-à-d., le taux des mots pour lesquels plus qu'une variante d'analyse est proposée) de 60-70% à environ 31%, avec un taux d'erreurs introduites de moins de 5% (retours appréciés!).

2) Les mots auxiliaires tonalement récessifs (c.-à-d. la plupart des marques prédicatives, la marque possessive ka, la conjonction coordinative ni, etc., auquels aucun ton n'est attribué au niveau sous-jacent, et dont le ton superficiel varie en fonction du contexte) sont desormais présentés sans diacritique tonale.

3) Une nouvelle version web du dictionnaire Bamadaba est publiée en parallèle. Un certain nombre d'erreurs est corrigé ; des fichiers son et des images sont rajoutés pour certains lexèmes.

Des nouveaux textes ont été ajoutés au sous-corpus désambiguïsé :

  • Kulubali, Baabilen (Charles Bailleul). Ta-tɛ-Ɲa: Ta-Tè_Nya ou Monsieur Réussit-pas. Editions Donniya, Bamako, 2016, 12 p. 1994 mots.

Jɛkabaara :
  • Jɛkabaara 171, janvier 2000, 6470 mots
  • Jɛkabaara 273, juillet 2008, 9069 mots

Kibaru :
  • Kibaru 540, janvier 2017, 10319 mots
  • Kibaru 544, mai 2017, 11309 mots

Des nouveaux textes ont été ajoutés au sous-corpus non-désambiguïsé :

  • Dumestre, Gérard & Touré, Seydou. Chroniques amoureuses. Juin 1995: 18433 mots; Juillet 1995: 16312 mots; Août 1995: 16955 mots; Septembre 1995: 15113 mots; Octobre 1995: 14204 mots; Novembre 1995: 13 767 mots; Décembre 1995: 8521 mots; Janvier 1996: 326 mots

Jɛkabaara :
  • Jɛkabaara 172, février 2000, 8120 mots
  • Jɛkabaara 175, mai 2000, 8446 mots
  • Jɛkabaara 176, juin 2000, 7247 mots
  • Jɛkabaara 177, juillet 2000, 7188 mots
  • Jɛkabaara 179, septembre 2000, 7408 mots
  • Jɛkabaara 232, février 2005, 8117 mots
  • Jɛkabaara 234, avril 2005, 7679 mots
  • Jɛkabaara 235, mai 2005, 6912 mots
  • Jɛkabaara 237, juillet 2005, 7687 mots
  • Jɛkabaara 239, septembre 2005, 8955 mots
  • Jɛkabaara 297, juillet 2010, 5901 mots
  • Jɛkabaara 298, août 2010, 8082 mots
  • Jɛkabaara 299, sept. 2010, 5933 mots
  • Jɛkabaara 300, oct. 2010, 6111 mots
  • Jɛkabaara 301, nov. 2010, 5749 mots
  • Jɛkabaara 302, dec. 2010, 6201 mots
  • Jɛkabaara 303, janv. 2011, 5633 mots
  • Jɛkabaara 304, fevr. 2011, 5835 mots
  • Jɛkabaara 305, mars 2011, 5807 mots
  • Jɛkabaara 306, avril 2011, 6905 mots
  • Jɛkabaara 307, mai 2011, 6775 mots

Kibaru :
  • Kibaru 51, mai 1976, 2293 mots
  • Kibaru 53, juillet 1976, 2459 mots
  • Kibaru 59, janvier 1977, 2092 mots
  • Kibaru 61, mars 1977, 1139 mots
  • Kibaru 77, juillet 1978, 2640 mots
  • Kibaru 78, août 1978, 2089 mots
  • Kibaru 79, septembre 1978, 4191 mots
  • Kibaru 83, janvier 1979, 3075 mots
  • Kibaru 84, février 1979, 2158 mots
  • Kibaru 86, avril 1979, 2668 mots
  • Kibaru 88, juin 1979, 3124 mots
  • Kibaru 90, août 1979, 2671 mots
  • Kibaru 91, sept. 1979, 3131 mots
  • Kibaru 92, oct. 1979, 2465 mots
  • Kibaru 93, nov. 1979, 3502 mots
  • Kibaru 94, dec. 1979, 2629 mots
  • Kibaru 95, janv. 1980, 3390 mots
  • Kibaru 98, avril 1980, 3536 mots
  • Kibaru 102, août 1980, 3816 mots
  • Kibaru 103, septembre 1980, 3606 mots
  • Kibaru 107, janvier 1981, 4931 mots
  • Kibaru 108, fevrier 1981, 5630 mots
  • Kibaru 109, mars 1981, 4236 mots
  • Kibaru 110, avril 1981, 5181 mots
  • Kibaru 111, mai 1981, 3868 mots
  • Kibaru 112, juin 1981, 4985 mots
  • Kibaru 114, août 1981, 3711 mots
  • Kibaru 115, sept. 1981, 4332 mots
  • Kibaru 116, oct. 1981, 4788 mots
  • Kibaru 117, nov. 1981, 4313 mots
  • Kibaru 118, dec. 1981, 4016 mots
  • Kibaru 119, janvier 1982, 4514 mots
  • Kibaru 120, février 1982, 4708 mots
  • Kibaru 122, avril 1982, 5195 mots
  • Kibaru 129, nov. 1982, 5276 mots
  • Kibaru 131, janvier 1983, 4469 mots
  • Kibaru 132, fevrier 1983, 4767 mots
  • Kibaru 133, mars 1983, 4275 mots
  • Kibaru 134, avril 1983, 5317 mots
  • Kibaru 135, mai 1983, 4332 mots
  • Kibaru 136, juin 1983, 4017 mots
  • Kibaru 137, juillet 1983, 4879 mots
  • Kibaru 138, août 1983, 4596 mots
  • Kibaru 139, sept. 1983, 4749 mots
  • Kibaru 140, oct. 1983, 4326 mots
  • Kibaru 182, mars 1987, 3082 mots
  • Kibaru 184, mai 1987, 3882 mots
  • Kibaru 254, mars 1993, 2860 mots
  • Kibaru 255, avril 1993, 2629 mots
  • Kibaru 256, mai 1993, 2020 mots
  • Kibaru 262, nov. 1993, 3839 mots
  • Kibaru 264, janvier 1994, 3361 mots
  • Kibaru 265, février 1994, 3056 mots
  • Kibaru 266, mars 1994, 3655 mots
  • Kibaru 267, avril 1994, 3717 mots
  • Kibaru 268, mai 1994, 3286 mots
  • Kibaru 269, juin 1994, 5339 mots
  • Kibaru 270, juillet 1994, 6740 mots
  • Kibaru 271, août 1994, 5860 mots
  • Kibaru 272, septembre 1994, 6886 mots
  • Kibaru 274, novembre 1994, 5861 mots
  • Kibaru 275, décembre 1994, 6154 mots
  • Kibaru 276, janvier 1995, 6931 mots
  • Kibaru 277, fevrier 1995, 6909 mots
  • Kibaru 278, mars 1995, 6094 mots
  • Kibaru 279, avril 1995, 6220 mots
  • Kibaru 280, mai 1995, 6453 mots
  • Kibaru 281, juin 1995, 6728 mots
  • Kibaru 282, juillet 1995, 6419 mots
  • Kibaru 283, août 1995, 7047 mots
  • Kibaru 284, septembre 1995, 6178 mots
  • Kibaru 286, novembre 1995, 7010 mots
  • Kibaru 287, décembre 1995, 7434 mots
  • Kibaru 288, janvier 1996, 9513 mots
  • Kibaru 289, février 1996, 10508 mots
  • Kibaru 292, mai 1996, 9405 mots
  • Kibaru 293, juin 1996, 9506 mots
  • Kibaru 294, juillet 1996, 9975 mots
  • Kibaru 295, août 1996, 9335 mots
  • Kibaru 296, sept. 1996, 10701 mots
  • Kibaru 298, nov. 1996, 10468 mots

Anciennes mises à jour

Veuillez cliquer ici pour accéder à l’historique des mises à jour.