Présentation

Le Corpus Bambara de Référence est un corpus massif de textes annotés en langue bambara. Cette langue du groupe mandingue, famille linguistique Mandé, macro-famille Niger-Congo est parlée par 12 à 14 millions de locuteurs en République du Mali.

Lors de l’ouverture au public en avril 2012, le corpus comportait des textes dont le volume avoisinait 1.100.000 mots, dont environ 100.000 dans le sous-corpus désambiguïsé.
Ce chiffre progresse constamment et la qualité de l’étiquetage s’améliore au fur et à mesure.
Notre objectif est d’atteindre 7 à 10 millions de mots, dont environ 1 million dans le sous-corpus désambiguisé.

Composition du corpus

Le Corpus est composé de textes de genres différents, publiés (périodiques, belles-lettres, littérature orale, manuels, guides pratiques, littérature de l’alphabétisation fonctionnelle, publications religieuses etc.) et non-publiés (lettres des lecteurs des journaux; textes enregistrés et transcrits par les chercheurs etc.) dont les auteurs proviennent de zones dialectales différentes.

Cette diversité permet de penser que le Corpus, en se développant, représentera plus fidèlement le bambara standard dans sa diversité.

Mise à jour, mai 2014

Quelques erreurs de désambiguïsation ont été corrigées.
Dans le Guide d’utilisation, certaines parties ont été améliorées, surtout celles concernant les types de la recherche et la correspondance entre les types de recherche et les niveaux d’annotation.
Le volume total du corpus a atteint 1 770 378 mots.

Sous-corpus desambiguïsé:

Le sous-corpus desambiguïsé comporte 290 263 mots. De nouveaux textes y ont été ajoutés:

  • Audibert, Andrée. Ji ni kɛnɛya. Bamakɔ: EDIM, 1976, 30 p., 2717 mots.
  • Bird, Charles; Hutchison, John; Kanté, Mamadou. An ka bamanankan kalan : Beginning Bambara. Indiana University Linguistic Club, 1977 & Bird, Charles; Kanté, Mamadou. An ka bamanankan kalan : Intermediate Bambara. Indiana University Linguistic Club, 1976. 6456 mots.
  • Hadamaden josiraw dantigɛkan, 1948 [Declaration universelle des droits de l’homme], 1696 mots.
  • Konate, Musa. Ali Baba ni nsonkɛ binaani ka kɛlɛ. Bamako: Le figuier, 1996, 12 p., 1224 mots.
  • Konatɛ, Musa. Baru n’a basinamuso jugu. Bamako: Le Figuier, 1996, 13 p., 1123 mots.
  • Sise, Mamadu Yusufu. Basikililabaara. Bamakɔ : EDIM [1978], 24 p., 2651 mots.

Contes populaires:
  • Bambéra, Taïrou. Faamanjè ni Faantannjè. In : Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997, pp. 11-89. 13041 mots.
  • Fane, Baba. Cikèla ni bara. In : Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997, pp. 123-132. 8856 mots.
  • Diarra, Ousamane. Sama ni jugunin. (une conte transcrite par Monika Zeutschel). 816 mots.
  • Sangare, Cèman. Suruku ni kònyòmusow. In : Annik Thoyer (éd.). Le riche et le pauvre et autres contes bamanan du Mali. Paris : L’Harmattan, 1997, pp. ?? 4330 mots.
  • Görög, Veronika. Contes bambara du Mali. Paris : Publications orientalistes de France, 1979 : Donsokè Siriman, p. 104-108, 1591 mots.
  • Nanyuman ni cè min yèlèmana ka a a kè sebe ye, p. 39-41, 1139 mots.

Périodiques:
  • Kibaru 1, Mar. 1972, 1940 mots
  • Kibaru 12, Feb. 1973, 2486 mots
  • Kibaru 17, Juillet 1973, 2771 mots
  • Kibaru 41, Juillet 1975, 2870 mots
  • Kibaru 52, Juin 1976, 2508 mots
  • Kibaru 65, Juillet 1977, 1765 mots

sous-corpus non-desambiguïsé:

Le sous-corpus non-desambiguïsé comporte 1 480 115 mots. Des nouveaux textes y ont été ajoutés :

  • Jabi, Musa. Ngɔninkɔrɔ bama. (Yɔrɔ Kulibali bolo). Bamakɔ: Jamana, 2000, 36 p. 4274 mots.
  • Keyita, Gabukɔrɔ. Sunjata Keyita ka maana. Bamakò: EDIM, 1979, 32 p. 3558 mots.
  • Jara, Alihaji Modibo. Kuranɛ kɔrɔ bayɛlɛmanen bamanankan na. Naaniye fɔlɔ. 2011, 307 p. Suran 1, 2, 4, 5, 6. 38 741 mots.

Périodiques:
  • Kibaru 151, Oct. 1986, 4985 mots
  • Kibaru 313, Feb. 1998, 9099 mots
  • Saheli 00, nov. 1993, 6903 mots
  • Saheli 01, janv. 1994, 8186 mots
  • Saheli 03, mars 1994, 7703 mots
  • Saheli 05, mai 1994, 7964 mots
  • Saheli 07, juillet 1994, 7149 mots
  • Saheli 08, août 1994, 6708 mots

Anciennes mises à jour

Veuillez cliquer ici pour accéder à l’historique des mises à jour.