الرئيسية » 
المستوى السادس: مهام وطرق المعالجة اللغوية الأساسية » 
المعالجة الأولية للنص

١. تقسيم الجمل
Sentence segmentation
٢. التقطيع
Tokenization
٣. التطبيع
Normalization (lowercasing, punctuation)
٤. إزالة كلمات التوقف
Stop word removal
٥. تصحيح الإملاء
Spelling correction
٦. تنظيف النص
Text cleaning