écouter parler

Etudier le système des langues permet de développer leur traitement automatique

Les points communs entre les langues (appelés universaux) permettent de les décrire comme des systèmes. C’est sur ces observations que se basent les recherches en Traitement automatique des langues (TAL) conduisant notamment à développer des applications Web de commande vocale.
Les premières tentatives d’élaboration de machines de traduction automatique ont eu lieu durant la Seconde Guerre mondiale.
Des chercheurs américains voulaient alors déchiffrer des messages codés de l’armée japonaise. Les langues naturelles étaient donc envisagées comme des codes, partant notamment du principe que la sémantique et la syntaxe sont des universaux du langage. Aujourd’hui encore, si les ordinateurs s’avèrent efficaces pour traduire des phrases simples, nous en voyons les limites pour des phrases complexes. L’intervention de l’homme est toujours nécessaire pour régler différents problèmes tels que l’ambiguïté de certains mots par exemple.
Le recours à l’ordinateur est par ailleurs indispensable pour effectuer des recherches dans des corpus. Ces vastes ensembles de textes ou de paroles permettent d’étudier différents aspects de la langue.
Enfin, concernant les outils de reconnaissance vocale, la difficulté pour les machines est de distinguer des mots parmi un signal sonore leur parvenant comme un tissu continu. Mais lorsque l’on souhaite produire de la parole de façon automatique, différentes questions phonétiques se posent pour parvenir à « imiter » la voix de l’homme.
L’intelligence artificielle permet ensuite aux machines d’effectuer des choix et déductions à partir d’un stock de connaissances. Le choix peut être par exemple d’utiliser tel mot plutôt que tel autre, en fonction de ce qui le précède dans la phrase.

Un lien pour aller plus loin : capsule vidéo de la chaine de vulgarisation « Linguisticae » (9 mn)

[cred_form form= »modifiez-un-article »]

« Euh » ; « genre » ; « ah » : on garde !

Irrégularités, faux-départ et tics de langage font partie de la langue et sont tout autant étudiés que d’autres phénomènes plus conscients. « Euh », « hum », « hem » : ces disfluences verbales seront conservées dans les enregistrements du Laboratoire Mobile des Langues puisqu’elles font partie de la langue naturelle. Contrairement à l’écrit où nous pouvons effacer et corriger nos erreurs sans en conserver de traces, la langue orale peut être qualifiée de brouillon permanent : nos interlocuteurs entendent continuellement nos corrections. Et bien souvent, nous corrigeons nos propres erreurs de sens ou de prononciation avant que quelqu’un d’autre n’ait eu le temps de le faire.
Nous cherchons à éliminer nos tics de langage dans des contextes formels (médias, conférences, entretiens d’embauche, etc.) mais ils sont très présents dans nos discussions quotidiennes dont ils représentent jusqu’à 20 % des mots utilisés.
Si les disfluences ne sont pas les mêmes d’une langue à l’autre, leurs fonctions sont comparables et elles revêtent une multitude de sens. Le son « euh » est par ailleurs considéré comme l’une des syllabes les plus reconnues au monde, indépendamment de la géographie, de la langue, de la culture ou de la nationalité.

A titre d’exemple, voici ci-dessous un extrait de conversation captée à l’aide de la Capsule Conversationnelle en 2019 au LAB’O, incubateur numérique à Orléans.

Autre illustration en vidéo : extrait d’une interview de Patrick Modiano, Prix Nobel de littérature, par Mediapart (5 mn)
Un lien pour aller plus loin : article signé par deux chercheurs de l’Université d’Aix-Marseille

[cred_form form= »modifiez-un-article »]

Chaque enregistrement constitue une part de « matière sonore »

Les conversations collectées dans le Laboratoire Mobile des Langues pourront être exploitées de façon séparée pour différents travaux de recherche ou artistiques. Mais elles formeront également une matière sonore globale permettant des études descriptives, comparatives et autres collages à vocation plus artistique. L’interface interactive du camion conversationnel offre une grande diversité d’enregistrements à écouter : un voyage sonore au cœur de discussions ordinaires en français et en langues de France entre 1911 et aujourd’hui. Lorsque les publics sont sollicités à leur tour pour participer à la collecte, écouter au préalable d’autres témoins leur fait prendre conscience du flux continu de la langue… que s’en ira rejoindre leur propre voix.

[cred_form form= »modifiez-un-article »]

Les conversations ordinaires offrent une représentation de la langue « naturelle »

Avec l’explosion des contenus audiovisuels, les enregistrements de discours « construits » dans un objectif précis ne manquent pas. Mais pour pouvoir observer le français tel qu’il se parle « naturellement », il est utile de collecter des discussions du quotidien.
Le langage dit « naturel » est celui parlé par les humains. Il est apparu entre 200 000 et 50 000 ans avant notre ère.
Ce n’est que depuis 7 000 ans environ que ce langage a pris une forme écrite et que certaines langues se sont imposées comme « dominantes ».
Ce qu’on appelle désormais le français populaire ne se résume pas à une sorte d’argot qui serait à l’opposé de « la belle langue classique ». Il se compose de l’ensemble des usages des conversations ordinaires pour lesquelles nous pouvons dégager des caractéristiques communes, quel que soit l’âge ou l’origine sociale et géographique des locuteurs.
Pour le philosophe anglais John Austin, toute réflexion peut se baser sur les distinctions présentes dans le langage ordinaire. En effet, celui-ci est organisé du point de vue d’intérêts pratiques et il intègre « toutes sortes de superstitions, d’erreurs et de fantasmes ».

Source : Diego Marconi, La philosophie du langage au 20e siècle
http://www.lyber-eclat.net/lyber/marconi/24.html

[cred_form form= »modifiez-un-article »]

Les langues varient selon des critères géographiques, historiques ou encore socio-culturels

Aujourd’hui « guérir » signifie « délivrer quelqu’un (ou l’être soi-même) d’une maladie ».
Pourtant, au 12e siècle, le sens de ce mot n’avait rien à voir avec la santé. Il signifiait « garantir» ou « protéger ».

Les langues sont en mouvement. Au sein de chacune d’elle, nous pouvons observer des variations diverses, c’est-à-dire des écarts entre des manières comparables de s’exprimer. Nous parlons de variation diatopique pour ce qui concerne les différences géographiques, de variation diachronique pour l’évolution historique et de variation diastratique pour ce qui est du milieu social et culturel des locuteurs. Les phénomènes de variation provoquent dans la durée différents changements linguistiques. L’ambition du Laboratoire Mobile des Langues est de collecter des enregistrements qui rendent compte tant que possible de ces variations du français. Il est donc important de pouvoir faire étape dans des lieux accueillant des locuteurs de profils divers (âges, groupes sociaux, etc.). Cela constitue un atout pour les différents travaux de recherche sur la langue. Il est également utile de collecter des discussions dans des contextes comparables afin de pouvoir les comparer entre elles.

Source : https://histoire.savoir.fr/evolution-semantique/

Deux liens pour aller plus loin :
capsule vidéo de la chaine de vulgarisation « Linguisticae » (11 mn)
conférence vidéo de Françoise Gadet (51 mn)

[cred_form form= »modifiez-un-article »]

Diversité du français et des langues de France

« Ce patron de PME breton parle la langue régionale dans sa famille et le français dans sa vie professionnelle. »

Le français connait des modes d’expression variés dans l’hexagone. Le pays est par ailleurs plurilingue puisque diverses langues régionales et étrangères s’y côtoient.
Les langues dites « régionales » sont parlées sur une partie du territoire national depuis plus longtemps que le français. Elles sont aujourd’hui pas moins de 25 en métropole et de 40 en Outre-mer, dont près des ¾ en Nouvelle Calédonie.
Les langues issues de l’immigration, pratiquées par de nombreux Français mais n’ayant pas de caractère officiel à l’étranger, sont dites « non-territoriales » et font partie du patrimoine culturel national. C’est par exemple le cas du berbère ou du romani mais pas du portugais et du chinois. Ces deux dernières sont en effet des langues officielles d’États et ne sont pas menacées.
Dans un contexte linguistique aussi divers, nombre de Français sont donc bilingues ou plurilingues. On appelle « diglossie » le fait que des individus parlent, pour des raisons sociopolitiques, deux langues avec une position hiérarchique différente dans un même territoire. La langue en question (celle qui n’est pas le français) est souvent réservée à des circonstances ou à des interlocuteurs précis comme une partie de la famille ou un cercle professionnel.

Deux liens pour aller plus loin :
capsule vidéo sur la place du français dans le monde (4 mn)
reportage de l’écrivain André Ariès sur le provençal en 1978 (12 mn)

[cred_form form= »modifiez-un-article »]

Langage, langue et parole : une distinction fondamentale

L’Homme a la faculté de langage.
Chacun acquiert une langue au sein de la communauté dans laquelle il grandit.
Nous nous exprimons ensuite individuellement grâce à la parole.

Les concepts de langage, langue et parole sont à la base de la linguistique. Ils ont été décrits par l’un de ses grands théoriciens, Ferdinand de Saussure. Le langage correspond à la capacité à communiquer, la langue en est l’outil et la parole son utilisation concrète et individuelle.
La linguistique comme discipline peut parfois paraitre un peu floue aux yeux du grand public. L’autre appellation qu’on lui donne communément – science du langage – donne une indication sur le concept central qu’elle étudie. Le langage est donc un système de signes destiné à transmettre des informations. Les langues du monde sont appelées « langages naturels » , par opposition aux « langages artificiels » dont fait notamment partie l’informatique. Mais le terme « langage » signifie également la faculté à exprimer nos pensées, avec une certaine intention. Cette performance met en œuvre plusieurs organes du corps et des zones précises du cerveau.
La langue quant-à-elle est un moyen de mise en œuvre collective du langage, par un groupe social ou une communauté linguistique. La distinction entre langage et langue est une particularité du français : en anglais par exemple, « language » recouvre ces deux concepts.
La parole est pour sa part individuelle. Pour autant, elle est régie par des normes sociales et des habitudes. La parole est donc fortement dépendante de la situation de communication. Si ce concept de « parole » est réservé à l’oral, on utilise celui de « discours » pour décrire l’ensemble des usages de l’écrit et de l’oral.

Un lien pour aller plus loin : capsule vidéo de la chaine de vulgarisation « Linguisticae » (6 mn)

[cred_form form= »modifiez-un-article »]

Avec qui ?

Des contributions individuelles pour former un portrait sonore collectif

S’inscrivant dans une démarche de sciences contributives, ce projet portant sur le français et les langues de France place des centaines de citoyens au centre de la collecte. En étant à la fois acteurs et sujets de ces travaux de recherche, ces derniers voient leur participation comme étant à la fois indispensable et limitée dans le temps et dans l’espace.
Chaque ville-étape implique un lieu (musée, médiathèque, école, marché, maison de quartier, etc.) et peut donner lieu à un projet local mené avec un artiste afin de construire un réseau de recherches culturelles participatives. Les acteurs identifiés sur chacun des territoires créent donc avec le public, déclenchant des interactions captées comme autant de matériaux sonores singuliers.
De façon plus concrète, le Camion Conversation disposera d’une interface interactive dans laquelle chacun pourra naviguer pour écouter les enregistrements réalisés précédemment mais aussi des éléments patrimoniaux plus anciens de la langue parlée.

Deux liens pour aller plus loin :
capsule vidéo sur l’économie contributive (9 mn)
conférence vidéo de Bernard Stiegler sur les sciences contributives et l’économie contributive (34 mn)

[cred_form form= »modifiez-un-article »]

Comment ?

Les conversations ordinaires : un patrimoine vivant à sauvegarder

Les façons de parler propres à chaque époque et à chaque région constituent un patrimoine méconnu. L’ambition du Laboratoire Mobile des Langues est d’en réaliser un portrait sonore qui permettra à la BNF (Bibliothèque nationale de France) de les conserver et de les valoriser. Cette collecte s’inscrit dans la continuité du travail de Ferdinand Brunot qui, le premier, s’est préoccupé d’enregistrer et conserver les traces sonores de la langue française en créant les fameuses Archives de la parole dès 1911. L’auteur de la grande Histoire de la langue française a pour cela sillonné le territoire hexagonal avec son phonographe afin d’enregistrer, d’étudier et de conserver des témoignages en langue parlée. Les voix de Guillaume Apollinaire, Emile Durkheim et Alfred Dreyfus ont ainsi été immortalisées aux côtés de celles de nombreux locuteurs « anonymes ». Avec le Laboratoire mobile des langues, une borne interactive numérique a remplacé le phonographe mais la démarche documentaire reste comparable. Le dispositif d’enregistrement est placé à l’intérieur du Camion Conversation, aménagé pour offrir un cadre convivial aux conversations et autres pratiques langagières captées. Au fur et à mesure de sa constitution, le corpus oral – enregistrements, transcriptions et métadonnées – est mis en ligne immédiatement sur un portail Web dédié. Son accès bien souvent gratuit a par ailleurs pour but de faciliter son exploitation par le plus grand nombre. L’objectif est d’offrir une visibilité aux langues de France mais aussi de participer à la vitalité des travaux pluridisciplinaires autour de ces dernières.

Un lien pour aller plus loin : conférence vidéo d’Olivier Baude (18 mn)

[cred_form form= »modifiez-un-article »]

Pourquoi ?

Des recherches pour l’enseignement aux applications de commande vocale

Le Laboratoire Mobile des Langues, également appelé Camion Conversation, sillonne l’hexagone pour enregistrer le français parlé et les langues en contact avec celui-ci.
Sa première collecte comportera une cinquantaine d’étapes : l’un de ses points d’orgue consistera en l’ouverture de la Cité internationale de la langue française à Villers-Cotterêts en 2022. Les enregistrements réalisés fourniront du matériau sonore pour différents travaux de recherche afin, par exemple, de faire évoluer l’enseignement du Français langue étrangère (FLE) ou le Traitement automatique des langues (TAL). Pour ce qui est du FLE donc, l’objectif est d’utiliser les enregistrements comme support de cours avec les apprenants afin que ces derniers puissent s’imprégner de la langue telle qu’elle se parle réellement.
Il s’agit de collecter des conversations ordinaires sur l’ensemble du territoire afin de constituer la plus grande base de données, permanente et dynamique, sur le français et les langues parlées dans l’hexagone. En plus de ses ambitions de recherche et d’innovation en linguistique, cette collecte s’accompagne de vocations artistiques, culturelles ainsi que de conservation et de valorisation d’un patrimoine vivant : celui des langues parlées.

A titre d’exemple, voici deux extraits de conversations captées à l’aide de la Capsule Conversationnelle en 2019…

  • au CFA du BTP du Loiret :
  • au LAB’O, incubateur numérique à Orléans :

Un lien pour aller plus loin : article sur l’une de nos prochaines collectes à l’Inalco Paris en novembre 2020

[cred_form form= »modifiez-un-article »]