Utilisation de la translittération de noms propres de l’arabe vers le latin pour l’amélioration de la qualité de traduction français-arabe

DR.NASREDINE SEMMAR
LABORATOIRE VISION ET INGENIERIE DES CONTENUS
(FRANCE)
HOUDA SAADANE
LIDILEM / Université Stendhal – Grenoble III

Résumé

Nous présentons dans cet article, d’une part, un système de translittération de noms propres de l’arabe vers l’écriture latine, et d’autre part, un outil d’alignement de mots simples et composés à partir de corpus de textes parallèles français-arabe. Nous nous intéressons plus particulièrement à l’étude de l’impact de l’utilisation de la translittération sur la qualité du lexique bilingue produit par l’outil d’alignement de mots. Nous avons évalué l’outil d’alignement de mots intégrant la translittération en utilisant deux approches : une évaluation de la qualité d’alignement à l’aide d’un alignement de référence construit manuellement et une évaluation de l’impact de cet alignement sur la qualité de traduction du système de traduction automatique statistique Moses. Les résultats obtenus montrent que la translittération améliore aussi bien la qualité de l’alignement de mots que celle de la traduction.

MOTS-CLES : Translittération, alignement de mots, traduction automatique statistique, évaluation.

Abstract   

We present in this paper, on the one hand, a system for automatic transliteration of proper names from Arabic to Latin script, and on the other hand, a tool to align single and compound words from French-Arabic parallel text corpora. We particularly focus on the impact of using transliteration to improve the performance of the word alignment tool. We have evaluated the word alignment tool integrating transliteration using two methods: A manual evaluation of the alignment quality and an evaluation of the impact of this alignment on the translation quality by using the statistical machine translation system Moses. The obtained results show that transliteration of proper names from Arabic to Latin improves the quality of both alignment and translation.

KEYWORDS: Transliteration, word alignment, statistical machine translation, evaluation