در متنهای به زبان عربی، حرکتهای کلمات در تعیین نقش معنایی و نحوی کلمه بسیار موثرتر از زبان فارسی هستند.
در بسیاری از متون عربی، حرکتهای کلمات حذف میشوند که این مسئله برای کاربر انسانی مسلط به زبان عربی غالبا مشکلی ایجاد نخواهد کرد. اما در مورد کاربرانی که به تازگی عربی را فرا گرفتهاند و یا بر آن مسلط نیستند این مسئله بسیار ابهامزا خواهد بود. همچنین برای پردازش متن زبان عربی توسط کامپیوتر، در برخی موارد نیاز به این حرکتگذاری وجود خواهد داشت. همین چالش موجب ایجاد مسئلهای به نام «حرکتگذاری خودکار متن عربی» شد.
در واقع در این پروژه قرار است متن بدون حرکت به عنوان ورودی به سامانه داده شود و این سامانه بتواند با دقت بالا متن را حرکتگذاری نماید.
- Alghamdi, Mansour, Zeeshan Muzaffar, and Hazim Alhakami. "Automatic restoration of arabic diacritics: a simple, purely statistical approach." Arabian Journal for Science and Engineering 35.2 (2010): 125.
- Hifny, Yasser. "Smoothing Techniques for Arabic Diacritics Restoration." submitted to ESOLE (2012).
- Rashwan, Mohsen AA, et al. "A stochastic arabic diacritizer based on a hybrid of factorized and unfactorized textual features." Audio, Speech, and Language Processing, IEEE Transactions on 19.1 (2011): 166-175.