الرئيسية
»
المستوى العاشر: موضوعات المعالجة اللغوية المتخصصة والمتقدمة
»
التقييم والقياس
١.
التقييم الذاتي مقابل الخارجي
Intrinsic vs. extrinsic evaluation
٢.
المعايير القياسية
Standard benchmarks (GLUE, SuperGLUE, BIG-Bench)
٣.
تصميم التقييم البشري
Human evaluation design
٤.
تحليل الأخطاء
Error analysis