الرئيسية » 
المستوى العاشر: موضوعات المعالجة اللغوية المتخصصة والمتقدمة » 
التقييم والقياس

١. التقييم الذاتي مقابل الخارجي
Intrinsic vs. extrinsic evaluation
٢. المعايير القياسية
Standard benchmarks (GLUE, SuperGLUE, BIG-Bench)
٣. تصميم التقييم البشري
Human evaluation design
٤. تحليل الأخطاء
Error analysis