حوسبة اللغة العربية بين المقاربة اللغوية و المقاربة الإحصائية

سهيلة بربارة
جامعة الجزائر 2
(الجزائر)

شكّلت الترجمة على مرّ العصور أداة قوية للتواصل بين الناس وللاحتكاك في ما بين الحضارات كما تضاعفت أهميتها بجميع أبعادها و تأجّج الطلب عليها في القرن الحالي و ها نحن مقبلين على القرن الواحد و العشرين الذي سيشهد لا محالة تزايدا في الطلب على عمل الترجمة في وقت قياسي ، ثمّ إنّ ظاهرة المثاقفة التي يعيشها عصرنا الحالي  تجعل من الترجمة عملية أكثر تعقيدا و تعدّدا.

تمخّض عن المطالب المتواصلة لتبادل المعلومات والاتصال في لغات مختلفة نتيجة التسارع التكنولوجي، و التحاق جميع الجهات الفاعلة بالشبكة العنكبوتية العالمية، ضغط كبير لضرورة تبادل المعلومات في لغات مختلفة و في وقت قياسي لتمكين تسهيل تلبية الاحتياجات الأكثر إلحاحا في مختلف مناحي حياة الإنسان (التجارية والعسكرية والتقنية والثقافية والاجتماعية … الخ)

إذا كانت هذه التبادلات تتم في الوقت الماضي البعيد، من خلال الترجمة البشرية، فقد أصبحت منذ تزايد سرعة الحواسيب و كفاءتها و ارتباطها بشبكة الإنترنت، تستعين  بأدوات رقمية للتسريع من عملية إنجاز أعمال الترجمة و لا سيما في المجالات التقنية وعالم الخدمات التجارية المتسم بالنصوص ذات المصطلحات المتكررة و الخالية من الصور الإبداعية و البلاغية التي يعجز الحاسوب عن تمثيلها.

منذ الإرهاصات الأولى من ولادة مشروع آلة تُترجم سواء على يد  بيتر سميرنوف ترويانسكي Petr Smirnov Trojianski، و جورج أرترستروني  Georges Artsruni، أو من خلال النظرية التي طورها

وارن ويفر Warren Weaver عن الترجمة الآلية في عام 1949، والتي نقل الخبير الأمريكي جون هاتشينز  John Hutshins  في مدوناته الشهيرة و كذا الاختبار الأول لبرنامج وضعه معهد ماساتشوستس  للترجمة الآلية في عام 1954 في الولايات المتحدة الأمريكية، سرعان ما أصبحت لغات عديدة تخضع لمعالجة حاسوبية على أساس تمثيل  مستويات التحليل اللغوي التقليدي  لتنتقل بعملية الترجمة من مجرد ترجمة مفردة بمفردة إلى مستوى ترجمة الجمل و النصوص بالاستناد إلى النظريات اللسانية و لا سيما  نظرية  تشومسكي في النحو التوليدي و التحويلي التي  مكنت بيتر توما  Peter Toma من  تصميم نظام سستران  SYSTRAN عام 1968 الذي استغلته شركة غوغل العملاقة في برنامجها للترجمة الآلية حتى سنة 2007 حيث أحدث منعرجا في المقاربة المعتمدة لتصميم برامج الترجمة الآلية من خلال ابتكار فريق غوغل للبحث في الترجمة الآلية و على رأسه فرانز جوزيف أوتش Franz Josef Och وحدة نمطية للترجمة الآلية لا تقوم على أدوات التحليل اللغوي، ولكن على المنهج الإحصائي الذي أحدث ثورة في عالم الترجمة الآلية باستبدال أدوات التحليل اللغوية بذاكرة الترجمة لتخزين كميات ضخمة من المتون المُترجَمة بشريا بين أزواج من اللغات للوصول إلى ترجمة سياقية  أفضل و التي كانت منعدمة في نظام سستران القديم.

في خضم تلك التحولات التي عرفها عالم الترجمة، لم يُشرع الاهتمام باللغة العربية إلاّ في الثمانينات من جانب بعض المؤسسات الأجنبية ولأغراض تجارية.

وبفضل شركة البرمجيات والتكنولوجيا العالمية ATA  و الكائن مقرها في لندن، حظيت اللغة العربية بدراسة مطابقة لما أسماه الأستاذ ماثيو غيدير Mattieu Guidere  في حديثه عن اللغة العربية،  بالمقاربة الخاصة  particularistic مقارنةً بالمقاربة العامة Universalistic .

بالتالي ، طوّرت شركة ATA برمجيات عديدة  بما في ذلك مجموعة “الوافي” و هي أحدث التطورات الهامة في مجال الترجمة الآلية من اللغة العربية و إليها و هي مرجع قيم يتسنى الاقتداء به و تحسين مقاربته اللغوية   لأنّه في الوقت الحاضر، لا تزال  وحدة جوجل لترجمة النصوص هي المنظومة التي تقدم نتاجا مقبولا من اللغة العربية وإليها.

في الواقع، و مع مطلع القرن الواحد و العشرين، أصبحت الضرورة ملحة بالارتقاء باللغة العربية في مجال الترجمة الآلية  من المعالجة الحاسوبية السطحية إلى المعالجة العميقة من أجل تصميم وحدة ترجمة تشارك نظيراتها الأجنبية  في المقاربات المتاحة من المنهج اللغوي و الإحصائي و الهجين في غياب منظومة مثلى لها. و طرح الساعة هو :ما هي المقاربة الأمثل التي يمكن إسقاطها على الوحدة النمطية العربية للترجمة الآلية ؟

الكلمات الدالة: الترجمة الآلية، المعالجة الحاسوبية، المقاربة اللغوية، المقاربة الإحصائية، المقاربة الهجينة، وحدة نمطية للترجمة.