الرئيسية » 
المستوى العاشر: موضوعات المعالجة اللغوية المتخصصة والمتقدمة » 
المعالجة اللغوية متعددة الوسائط

١. نماذج الرؤية واللغة
Vision-Language models
٢. توليد وصف الصور
Image captioning
٣. الإجابة على الأسئلة البصرية
Visual QA
٤. التعرف على الكلام السمعي البصري
Audio-visual speech recognition