الرئيسية
»
المستوى العاشر: موضوعات المعالجة اللغوية المتخصصة والمتقدمة
»
المعالجة اللغوية متعددة الوسائط
١.
نماذج الرؤية واللغة
Vision-Language models
٢.
توليد وصف الصور
Image captioning
٣.
الإجابة على الأسئلة البصرية
Visual QA
٤.
التعرف على الكلام السمعي البصري
Audio-visual speech recognition