Corpus Pluriels » Corpus » Thèmes » Formes de discours
Françoise Gardès-Madray et Jacques Bres ont recueilli deux années durant, au coeur du bassin minier cévénol, les récits, témoignages, confidences des différents protagonistes des évènements de Ladrecht (miniers, femmes de miniers, grévistes, non-grévistes, représentants syndicats, politiques…) dans l’idée de donner place à la parole ouvrière.
Le corpus est destiné à l’étude (i) des questions de l’intervieweur, en distinguant entre les questions médiées et celles sans la médiation énonciative et (ii) des stratégies de l’invité politique pour répondre à une question intrusive embarrassante.
Les formes du français parlé dans l’agglomération parisienne en 2000 et qui doit permettre d’aborder sur des bases solides la question du rôle que jouent les pratiques linguistiques de Paris pour la France entière et pour la francophonie en général.
L’intérêt scientifique du projet 24 heures d’information radiophonique réside dans le travail de terrain mené sur un corpus fermé dans son exhaustivité (toute l’information radiophonique d’une journée ordinaire).
Ce projet, en cohérence avec le parcours recherche du nouveau master DiMIP (Discours institutionnels, médiatiques et politiques), porté par l’équipe Praxiling, se donne pour tâche de proposer une modélisation des pratiques interactionnelles dans les médias en les circonscrivant aux journaux parlés, bulletins, et débats liés à l’information, à partir d’une analyse linguistique basée sur la méthodologie de l’analyse du discours et des interactions fondée sur une approche multimodale. Le premier volet de l’analyse (2010-2011) porte sur l’alternance entre discours rapportés et citations enregistrées, l’étude de la coénonciation et des formes audibles de connivence avec les auditeurs, et l’analyse des dysfonctionnements interactionnels. Une illustration des résultats possibles est fournie par la confrontation des deux extraits audio (fichiers Amélie 1 et Amélie 2) et du fichier texte (Amélie 3).
Les troubles du langage constituent le mode d’entrée dans la pathologie. Si l’anomie (i.e. manque du mot) a donné lieu à un très grand nombre d’études basées sur les performances en dénomination de mots, le niveau discursif est souvent négligé. Or, certains critères pertinents pour l’analyse de la dégradation linguistique observée dans la maladie d’Alzheimer peuvent être capturés – aux niveaux infra et supra lexical – dans le discours des patients. Le corpus « Parole d’Alzheimer », constitué d’enregistrements numériques de haute qualité (44Khz, 16 bits, mono), rassemble des discours en parole spontanée de patients Alzheimer (une trentaine à l’heure actuelle) à différents stades de démences (narrations libres, description d’image) ainsi que des discours obtenus auprès de sujets âgés sains appariés en âge, sexe et niveau socio-culturel. L’ensemble du corpus est transcrit manuellement (Transcriber, CLAN, fichiers txt).
Le domaine arabe représente un cas d’école de continuum linguistique. Une vue d’ensemble du domaine linguistique arabe, permet de distinguer deux aires à l’intérieur du continuum dialectal : la zone occidentale regroupant les parlers du Maghreb et la zone orientale constituée des parlers Moyen-Orientaux. Chaque parler arabe présente des caractéristiques qui lui sont propres. Celles-ci peuvent être d’ordre syntaxique, lexical, segmental et prosodique. Avec la base de données acoustique Araber, notre objectif est de développer un outil présentant un large éventail de variantes dialectales arabes permettant le développement d’applications à orientation linguistique. Différents types de corpus sont disponibles pour environ une centaine de locuteurs natifs originaires de différentes régions du monde arabophone : Corpus n° 1 : une traduction libre d’un texte court (‘La Bise et le Soleil’), Corpus n° 2 : une narration semi-guidée obtenue à partir d’une série d’images sans texte (‘The Frog story’).