Etudier le système des langues permet de développer leur traitement automatique
Les points communs entre les langues (appelés universaux) permettent de les décrire comme des systèmes. C’est sur ces observations que se basent les recherches en Traitement automatique des langues (TAL) conduisant notamment à développer des applications Web de commande vocale.
Les premières tentatives d’élaboration de machines de traduction automatique ont eu lieu durant la Seconde Guerre mondiale.
Des chercheurs américains voulaient alors déchiffrer des messages codés de l’armée japonaise. Les langues naturelles étaient donc envisagées comme des codes, partant notamment du principe que la sémantique et la syntaxe sont des universaux du langage. Aujourd’hui encore, si les ordinateurs s’avèrent efficaces pour traduire des phrases simples, nous en voyons les limites pour des phrases complexes. L’intervention de l’homme est toujours nécessaire pour régler différents problèmes tels que l’ambiguïté de certains mots par exemple.
Le recours à l’ordinateur est par ailleurs indispensable pour effectuer des recherches dans des corpus. Ces vastes ensembles de textes ou de paroles permettent d’étudier différents aspects de la langue.
Enfin, concernant les outils de reconnaissance vocale, la difficulté pour les machines est de distinguer des mots parmi un signal sonore leur parvenant comme un tissu continu. Mais lorsque l’on souhaite produire de la parole de façon automatique, différentes questions phonétiques se posent pour parvenir à « imiter » la voix de l’homme.
L’intelligence artificielle permet ensuite aux machines d’effectuer des choix et déductions à partir d’un stock de connaissances. Le choix peut être par exemple d’utiliser tel mot plutôt que tel autre, en fonction de ce qui le précède dans la phrase.
Un lien pour aller plus loin : capsule vidéo de la chaine de vulgarisation « Linguisticae » (9 mn)