Le domaine arabe représente un cas d’école de continuum linguistique. Une vue d’ensemble du domaine linguistique arabe, permet de distinguer deux aires à l’intérieur du continuum dialectal : la zone occidentale regroupant les parlers du Maghreb et la zone orientale constituée des parlers Moyen-Orientaux. Chaque parler arabe présente des caractéristiques qui lui sont propres. Celles-ci peuvent être d’ordre syntaxique, lexical, segmental et prosodique. Avec la base de données acoustique Araber, notre objectif est de développer un outil présentant un large éventail de variantes  dialectales arabes permettant le développement   d’applications  à orientation linguistique. Différents types de corpus sont disponibles pour environ une centaine de locuteurs natifs originaires de différentes régions du monde arabophone : Corpus n° 1 : une traduction libre d’un texte court (‘La Bise et le Soleil’), Corpus n° 2 : une narration semi-guidée obtenue à partir d’une série d’images sans texte (‘The Frog story’).

Lire la suite… »