Computational Linguistics
Computational Linguistics (ع)
title: Computational Linguistics (ع) weight: 2 color: black
tutorials.md
title: دُرُوس عَرَبِيَّة - فِيدْيُو draft: true
Natural Language Processing | معالجة اللغات الطبيعية
- NLP Introduction مقدمة إلى معالجة اللغات الطبيعية
- Text Forms أشكال النصوص
- Datasets مجموعات البيانات
- Tokenization 1 تفريق النص 1
- Tokenization 2 تفريق النص 2
- Tokenization 3 تفريق النص 3
- PoS Tagging 1 وسم أجزاء الكلام 1
- PoS Tagging 2 وسم أجزاء الكلام 2
- PoS Tagging 3 وسم أجزاء الكلام 3
- Stopwords 1 الكلمات الموقوفة 1
- Stopwords 2 الكلمات الموقوفة 2
- Stemming vs Lemmatization التصريف مقابل الاشتقاق
- General & Specific Features الميزات العامة والخاصة
- Bag of Words حقيبة الكلمات
- TF-IDF 1 التكرار النسبي-عكسي 1
- TF-IDF 2 التكرار النسبي-عكسي 2
- Wordvector متجهات الكلمات
- Named Entity Recognition (NER)1 التعرف على الكيانات المسماة 1
- Named Entity Recognition (NER) 2 التعرف على الكيانات المسماة 2
- Named Entity Recognition (NER) 3 التعرف على الكيانات المسماة 3
- Cosine Similarity 1 التشابه التمامي 1
- Cosine Similarity 2 التشابه التمامي 2
Machine Learning | تعلم الآلة
- Algorithms الخوارزميات
- Supervised Machine Learning التعلم الآلي الموجّه
- UnSupervised Machine Learning التعلم الآلي غير الموجّه
- Semi-Supervised Machine Learning التعلم الآلي شبه الموجّه
- Classification التصنيف
Scraping | تجريف المواقع
- Web Scraping 1 تجريف الويب 1
- Web Scraping 2 تجريف الويب 2
- Web Scraping 3 تجريف الويب 3
- Web Scraping 4 تجريف الويب 4
Twitter Scraping | تجريف تويتر
- Scraping Twitter 1 تجريف تويتر 1
- Scraping Twitter 2 تجريف تويتر 2
- Scraping Twitter 3 تجريف تويتر 3
- Scraping Twitter 4 تجريف تويتر 4
- Scraping Twitter 5 تجريف تويتر 5
- Scraping Twitter 6 تجريف تويتر 6
- Scraping Twitter 7 تجريف تويتر 7
- Scraping Twitter 8 تجريف تويتر 8
Python | بايثون
- Python 1| String Types أنواع السلاسل النصية
- Python 2| Methods & Formatting الطرق والتنسيق
- Python 3| ID-Type-Value المعرف-النوع-القيمة
- Python 4| Basic Operations العمليات الأساسية
- Python 5| Basic Operations 2 العمليات الأساسية 2
- Python 6| Indexing الفهرسة
- Python 7| Mutability القابلية للتغيير
- Python 8 | Importing text استيراد النصوص
- Python 9| Search in Corpus البحث في المدونة
- Python 10 | Word Context 1 سياق الكلمة 1
- Python 11 | Word Context 2 سياق الكلمة 2
- Search Datasets البحث في مجموعات البيانات
File Formats (Extensions) | شرح إمتدادات الملفات
- File Extensions امتدادات الملفات
- .CSV 1 تنسيق CSV 1
- .CSV 2 تنسيق CSV 2
- .JSON 1 تنسيق JSON 1
- .JSON 2 تنسيق JSON 2
- .RAR تنسيق RAR
- .HTML تنسيق HTML
- .ZIP تنسيق ZIP
- .XLS/.XLSX تنسيق XLS/XLSX
- .DOC/.DOCX تنسيق DOC/DOCX
- .TXT تنسيق TXT
- .PDF تنسيق PDF
Text Visualization | تصوير وعرض النصوص
Regular Expressions | التعابير النمطية
- Regex 1 التعابير النمطية 1
- Regex 2 التعابير النمطية 2
- Regex 3 التعابير النمطية 3
- Regex 4 التعابير النمطية 4
- Regex 5 | Pipes & Anchors الأنابيب والمراسي
- Regex 6 | Character Classes فئات الأحرف
Dataframes | جدول\إطار البيانات
Corpus Linguistics | مدونات متوازية
- Parallel Corpus 1 المدونات المتوازية 1
- Parallel Corpus 2 المدونات المتوازية 2
- Parallel Corpus 3 المدونات المتوازية 3
- Parallel Corpus 5 المدونات المتوازية 5
- Parallel Corpus 6 المدونات المتوازية 6
Data Augmentation | تضخيم البيانات
- Data Augmentation 1 | Back Translation الترجمة العكسية
- Data Augmentation 1 | Back Translation 2 الترجمة العكسية 2
- Data Augmentation 2 | Synonym Replacement استبدال المرادفات
- Data Augmentation 3 | Bi-gram Flipping قلب الثنائيات
- Data Augmentation 4 | TF-IDF Word Replacement استبدال الكلمات باستخدام TF-IDF
- Data Augmentation 5 | Entity Replacement استبدال الكيانات
Corpus Linguistics | لسانيات المدونة
- Statistics & Corpus Linguistics 1 الإحصاء ولسانيات المدونة 1
- Statistics & Corpus Linguistics 2 | Context السياق
- Common Collocations المتلازمات الشائعة
- NLTK Text النصوص باستخدام NLTK
- Corpus Linguistics 1| Lecture 1 محاضرة 1
- Corpus Linguistics 2| Lecture 2 محاضرة 2
- Corpus Linguistics 3 | Corpus Cleaning تنظيف المدونة
Information Retrieval | إسترجاع البيانات
NLP With Python Book | كتاب (NLP with Python)
- NLP With Python 1 معالجة اللغات الطبيعية باستخدام بايثون 1
- NLP With Python 2 معالجة اللغات الطبيعية باستخدام بايثون 2
- NLP With Python 3 معالجة اللغات الطبيعية باستخدام بايثون 3
Linguistics | مدخل إلى اللسانيات:
- Linguistics 1 | Introduction مقدمة
- Linguistics 2 | Pragmatics التداولية
- Linguistics 3 | Semantics علم الدلالة
Free Arabic Books
title: Free Arabic Books description: كُتُبٌ عَرَبِيَّةٌ مَجَّانِيَّةٌ، مِنْ مَصَادِرَ مُتَنَوِّعَةٍ direction: rtl layout: list-ar
تصفح الكتب بـ ’إسم المُؤَلِّف\المُتَرجِم\المُصَنِّف‘ أو بالبحث عن إسم الكتاب:
cl-mag.md
title: مجلة اللغويات الحاسوبية والمعالجة الآلية للغة العربية link: https://library.ksaa.gov.sa/index/journal/6
الذكاء الإصطناعي والخوارزميات
title: الذكاء الإصطناعي والخوارزميات layout: ar-books
Algorithms.md
title: “الخوارزميات” artitle: “الخوارزميات” pubhouses: “مؤسسة هنداوي” bauthors: [“بانوس لوريداس”, “إبراهيم سند أحمد”, “شيماء طه الريدي”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Algorithms”] slug: “alg” type: “book-ml”
Applications-of-Artificial-Intelligence-in-the-Service-of-the-Arabic-Language.md
title: “تطبيقات الذكاء الاصطناعي في خدمة اللغة العربية” artitle: “تطبيقات الذكاء الاصطناعي في خدمة اللغة العربية” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“أمجد يوسف أبوجبارة”, “غريب واجب غريبي”, “أحمد الحايك”, “يوسف سالم العريان”, “عرفان أحمد”, “أحمد حمدي أبو عبسة”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Applications”, “Artificial”, “Intelligence”, “Service” ,“Arabic”,“Language”] slug: “aaisal” type: “book-ai”
Arabic-and-Artificial-Intelligence.md
title: “العربية والذكاء الاصطناعي” artitle: “العربية والذكاء الاصطناعي” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“أحمد راغب”, “المعتز بالله السعيد”, “محمد عطية”, “نعيم عبدالغني”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Arabic”, “Artificial”, “Intelligence”] slug: “aai” type: “book-ai”
Artificial-Intelligence-Algorithms-in-Arabic-Text-Analysis.md
title: “خوارزميات الذكاء الاصطناعي في تحليل النص العربي” artitle: “خوارزميات الذكاء الاصطناعي في تحليل النص العربي” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“عبدالله بن صالح الراجح”, “وليد بن عبدالله الصانع”, “عبدالرحمن بن محمد العصيمي”, “أيمن بن أحمد الغامدي”, “عبدالله بن يحيى الفيفي”, “فارس بن صالح القنيعير”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Artificial”, “Intelligence”, “Algorithms” ,“Arabic”,“Text”, “Analysis”] slug: “aiaata” type: “book-ml”
Data-Science-by-Examples.md
title: “علم البيانات عن طريق الامثلة” artitle: “علم البيانات عن طريق الامثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Data”,“Science”,“by”, “Examples”] slug: “dsbe” type: “book-ds”
Practical-Projects-on-Artificial-Intelligence.md
title: “عشرة مشاريع عملية عن الذكاء الاصطناعي” artitle: “عشرة مشاريع عملية عن الذكاء الاصطناعي” pubhouses: “أكاديمية حسوب” bauthors: [“محمد لحلح”, “خالد الشمعة”, “باسل الخطيب”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Practical”, “Projects”, “Artificial”, “Intelligence”] slug: “ppai” type: “book-ai”
Transfer-Learning-in-Computer-Vision.md
title: “نقل التعلم في الرؤية الحاسوبية” artitle: “نقل التعلم في الرؤية الحاسوبية” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Transfer”, “Learning”, “in”, “Computer”, “Vision”] slug: “tlicv” type: “book-dl”
اللسانيات الحاسوبية
title: اللسانيات الحاسوبية direction: rtl layout: ar-books
Automatic-Procesing-Of-Arabic-Texts-Issues-and-Solutions.md
title: “المعالجة الآلية للغة العربية - المشاكل والحلول” artitle: “المعالجة الآلية للغة العربية - المشاكل والحلول” bauthors: [“أ.د. سلوى حماد”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2025” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Automatic”, “Processing”, “Arabic”, “Texts”] slug: “apat” type: “book-nlp”
Automatic-Processing-of-Arabic-Texts.md
title: “المعالجة اﻵلية للنصوص العربية” artitle: “المعالجة اﻵلية للنصوص العربية” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“وليد مجدي”, “أحمد رافع”, “المعتز بالله السعيد”, “محسن رشوان”, “أسامة إمام”, “علي علي فهمي”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Automatic”, “Processing”, “Arabic”, “Texts”] slug: “apat” type: “book-nlp”
Basic-Applications-in-the-Automatic-Processing-of-the-Arabic-Language.md
title: “تطبيقات أساسية في المعالجة اﻵلية للغة العربية” artitle: “تطبيقات أساسية في المعالجة اﻵلية للغة العربية” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“محمد عفيفي”, “علي علي فهمي”, “شريف مهدي عبده”, “محمد عطية”, “المعتز بالله السعيد”, “محسن رشوان”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Basic”, “Applications”, “Automatic”, “Processing” ,“Arabic”,“Language”] slug: “baapal” type: “book-nlp”
Computational-Language-Resources.md
title: “الموارد اللغوية الحاسوبية” artitle: “الموارد اللغوية الحاسوبية” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“عبدالعاطي هواري”, “سامح الأنصاري”, “المعتز بالله السعيد”, “محسن رشوان”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Computational”, “Language”, “Resources”] slug: “clr” type: “book-linguistics”
Computerized-Arabic-Language-Technologies.md
title: “تقنيات اللغة العربية الحاسوبية” artitle: “تقنيات اللغة العربية الحاسوبية” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“عمرو جمعة”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2016” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Computerized”,“Arabic”, “Language” ,“Technologies”] slug: “calt” type: “book-nlp”
Introduction-to-Arabic-language computing.md
title: “مقدمة في حوسبة اللغة العربية” artitle: “مقدمة في حوسبة اللغة العربية” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“محسن رشوان”,“محمد عطية”,“أحمد راغب”,“سامح الأنصاري”,“معتز بالله السعيد”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Introduction”,“Arabic”, “language” ,“computing”] slug: “italc” type: “book-nlp”
Natural-Language-Processing-for-the-Semantic-Web.md
title: “معالجة اللغات الطبيعية للويب الدلالي” artitle: “معالجة اللغات الطبيعية للويب الدلالي” pubhouses: “مركز الملك عبد الله لخدمة اللغة العربية” bauthors: [“خالد بن عبدالرحمن الميمان”, “كالينا بونتشيفا”, “إيزابيل أوغنتشتاين”, “ديانا ماينارد”] book: “true” languages: “عربي” layout: “single-books” pubyears: “2019” bcategories: [“معالجة اللغات الطبيعية”] tags: [“Natural”,“Language”, “Processing” ,“Semantic”,“Web”] slug: “nlpsw” type: “book-nlp”
Sentiment-Analysis-By-Example.md
title: “تحليل المشاعر و التنقيب في الآراء عن طريق الامثلة” artitle: “تحليل المشاعر و التنقيب في الآراء عن طريق الامثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”, “بايثون”] tags: [“sentiment”,“Analysis”, “Opinion” ,“Mining”,“Python”] slug: “saombe” type: “book-nlp”
أساسيات الحوسبة والبرمجة
title: أساسيات الحوسبة والبرمجة direction: rtl layout: ar-books
Code-in-Python.md
title: “البرمجة بلغة بايثون” artitle: “البرمجة بلغة بايثون” pubhouses: “أكاديمية حسوب” bauthors: [“ليزا تاغليفيري”, “محمد بغات”, “عبد اللطيف ايمش”, “جميل بيلوني”, “فرج الشامي”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Code”, “in”, “Python”] slug: “cip” type: “book-py”
Computing-Fundamentals.md
title: “أساسيات الحوسبة” artitle: “أساسيات الحوسبة” pubhouses: “شعاع للنشر والعلوم” bauthors: [“خالد بكرو”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Computing”, “Fundamentals”] slug: “cf” type: “book-basics”
Database-Design.md
title: “تصميم قواعد البيانات” artitle: “تصميم قواعد البيانات” pubhouses: “أكاديمية حسوب” bauthors: [“إيدرين وات”, “أيمن طارق القاضي”, “علا عباس”, “جميل بيلوني”, “آيات اليطقان”, “نيلسون إنج”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Database”, “Design”] slug: “dd” type: “book-db”
Digital-Systems-Essentials.md
title: “أساسيات النظم الرقمية” artitle: “أساسيات النظم الرقمية” pubhouses: “شعاع للنشر والعلوم” bauthors: [“خالد بكرو”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Digital”, “Systems”, “Essentials”] slug: “dse” type: “book-basics”
Python-by-Examples.md
title: “بايثون عن طريق الامثلة” artitle: “بايثون عن طريق الامثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Python”,“by”, “Examples”] slug: “pbe” type: “book-py”
Time-Series-Analysis-and-Forecasting-by-Examples.md
title: “السلاسل الزمنية التحليل والتنبؤ عن طريق الامثلة” artitle: “السلاسل الزمنية التحليل والتنبؤ عن طريق الامثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Time”,“Series”, “Analysis” ,“Forecasting”, “Examples”] slug: “tsafe” type: “book-ml”
التعلم العميق
title: التعلم العميق layout: ar-books
20-DeepLearning-Projects-Using-Python.md
title: “20 مشروعا للتعلم العميق باستخدام بايثون” artitle: “20 مشروعا للتعلم العميق باستخدام بايثون” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”,“آمان خروال”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“DeepLearning”,“Projects”, “Using” ,“Python”] slug: “dlpup” type: “book-dl”
Deep-Learning-By-Example.md
title: “التعلم العميق عن طريق الأمثلة” artitle: “التعلم العميق عن طريق الأمثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“التعلم العميق”] tags: [“Deep Learning”,“Python”] slug: “dlbe” type: “book-dl”
Deep-learning-principles-concepts-and-methods.md
title: “التعلم العميق المبادئ والمفاهيم والاساليب” artitle: “التعلم العميق المبادئ والمفاهيم والاساليب” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”,“ميلاد وزان”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“التعلم الآلي”] tags: [“Deep Learning”,“Python”] slug: “dlpcam” type: “book-dl”
DeepLearning-and-its-Uses-in-Healthcare.md
title: “التعلم العميق واستخداماته في الرعاية الصحية” artitle: “التعلم العميق واستخداماته في الرعاية الصحية” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“DeepLearning”,“its”, “uses” ,“in”,“healthcare”] slug: “dliuh” type: “book-dl”
DeepLearning-from-Basics-to-Building-a-Deep-Neural-Network-in-Python.md
title: “التعلم العميق من الأساسيات إلى بناء شبكة عصبية عميقة بلغة البايثون” artitle: “التعلم العميق من الأساسيات إلى بناء شبكة عصبية عميقة بلغة البايثون” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”,“ميلاد وزان”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“DeepLearning”,“Basics”, “Building” ,“NeuralNetwork”,“Python”] slug: “dlbbnp” type: “book-dl”
Dive-Deep-into-DeepLearning-Part-Three.md
title: “التعمق في التعلم العميق الجزء الثالث” artitle: “التعمق في التعلم العميق الجزء الثالث” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”, “أستون زانغ”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Dive”,“Deep”, “into” ,“DeepLearning”, “Partthree”] slug: “ddidp3” type: “book-dl”
Dive-Deep-into-DeepLearning-Part-Two.md
title: “التعمق في التعلم العميق الجزء الثاني” artitle: “التعمق في التعلم العميق الجزء الثاني” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”, “أستون زانغ”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Dive”,“Deep”, “into” ,“DeepLearning”, “Parttwo”] slug: “ddidp2” type: “book-dl”
تعلم الآلة
title: تعلم الآلة direction: rtl layout: ar-books
A-Glossary-of-MachineLearning-DeepLearning-and-Data-Science-Terms.md
title: “معجم مصطلحات التعلم الآلي والتعلم العميق وعلم البيانات” artitle: “معجم مصطلحات التعلم الآلي والتعلم العميق وعلم البيانات” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Glossary”, “MachineLearning”, “DeepLearning”, “Data”, “Science”,“Terms”] slug: “gmldldst” type: [“book-dl”, “book-ml”]
Artificial-Intelligence-and-MachineLearning.md
title: “مدخل إلى الذكاء الاصطناعي وتعلم اﻵلة” artitle: “مدخل إلى الذكاء الاصطناعي وتعلم اﻵلة” pubhouses: “أكاديمية حسوب” bauthors: [“محمد لحلح”, “فرج الشامي”, “جميل بيلوني”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Artificial”, “Intelligence”, “and”, “MachineLearning”] slug: “aiml” type: “book-ml”
Data-Science-and-MachineLearning-by-Examples.md
title: “علم البيانات وتعلم الآلة عن طريق الامثلة” artitle: “علم البيانات وتعلم الآلة عن طريق الامثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“Data”,“Science”,“MachineLearning”,“by”,“Examples”] slug: “dsmlbe” type: “book-ml”
Machine-learning-examples.md
title: “التعلم الآلي عن طريق الامثلة” artitle: “التعلم الآلي عن طريق الامثلة” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“التعلم الآلي”] tags: [“Machine Learning”,“Python”] slug: “mlbe” type: “book-ml”
MachineLearning-Projects-Using-Python.md
title: “مشاريع تعلم الآلة باستخدام بايثون” artitle: “مشاريع تعلم الآلة باستخدام بايثون” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”, “ليزا تاغليفيري”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“MachineLearning”,“Projects”, “Using” ,“Python”] slug: “mlpup” type: “book-ml”
MachineLearning-and-Data-Science.md
title: “تعلم الآلة وعلم البيانات” artitle: “تعلم الآلة وعلم البيانات” pubhouses: “د. علاء طعيمة” bauthors: [“علاء طعيمة”,“ميلاد وزان”] book: “true” languages: “عربي” layout: “single-books” pubyears: "" bcategories: [“معالجة اللغات الطبيعية”] tags: [“MachineLearning”,“and”, “Data” ,“Science”] slug: “mlds” type: “book-ml”
Arabic Databases
title: Arabic Databases
islamic-data.md
title: Islamic Data Warehouse link: https://islamic-data.vercel.app/
Searching Arabic texts techniques
title: Searching Arabic texts techniques
egrep.md
title: The (egrep) Tool
This guide explains how to use the egrep tool to search inside Arabic text files on Linux/Unix systems. It’s especially useful for linguists, translators, and those interested in text analysis.
Basics of Searching Arabic Text
# Simple search for an Arabic word
egrep 'word' file.txt
# Case-insensitive search
egrep -i 'word' file.txt
# Show line numbers with the result
egrep -n 'word' file.txt
# Search for a full sentence or phrase
egrep 'this is a full sentence' file.txt
Searching for Specific Words
# Search for multiple words (logical OR)
egrep 'word1|word2|word3' file.txt
# Search for a word at the beginning of a line
egrep '^word' file.txt
# Search for a word at the end of a line
egrep 'word$' file.txt
# Search for exact word matches (using word boundaries)
egrep '\bword\b' file.txt
Searching Using Ranges
# Search for letters within a specific range (e.g. from Alef to Ṣād)
egrep '[أ-ص]' file.txt
# Search for any approximate Arabic letter
egrep '[ء-ي]' file.txt
# Search for words starting with a specific letter
egrep '\b[اأإآ]' file.txt
Searching for Specific Characters or Symbols
# Search for diacritics (short vowels)
egrep '[ًٌٍَُِّْٰ]' file.txt
# Search for different types of hamzas
egrep '[أإآءؤئ]' file.txt
# Search for alif maqsura
egrep 'ى' file.txt
# Search for tanween markers
egrep '[ًٌٍ]' file.txt
# Search for Arabic/Indic digits
egrep '[٠-٩]' file.txt
# Search for both Indic and Western digits
egrep '[٠-٩0-9]' file.txt
Advanced Search Patterns
# Search for a word with optional diacritics (using ? for optional repetition)
egrep 'سَ?لَ?مَ?' file.txt
# Search for words ending with diacritics
egrep '[ء-ي][ًٌٍَُِّْٰ]+' file.txt
# Search for a line containing one word followed by another
egrep 'word.*word2' file.txt
# Ignore diacritics in the search
egrep 'س[^ًٌٍَُِّْٰ]*ل[^ًٌٍَُِّْٰ]*م' file.txt
Important Notes About Encoding
Make sure the file is UTF-8 encoded:
file -i file.txt
Convert from Windows-1256 encoding to UTF-8:
iconv -f WINDOWS-1256 -t UTF-8 file.txt > file_utf8.txt
To avoid display issues:
LANG=ar_SA.UTF-8 egrep 'word' file.txt
Install better Arabic locale support (depends on your distro):
sudo apt install locales
sudo dpkg-reconfigure locales
Quick Reference
| Description | Command |
|---|---|
| Simple search | egrep ‘word’ file |
| Case-insensitive search | egrep -i ‘word’ file |
| Show line numbers | egrep -n ‘word’ file |
| Search multiple words | egrep ‘word1 |
| Word at beginning of line | egrep ‘^word’ file |
| Word at end of line | egrep ‘word$’ file |
| Any Arabic letter | egrep ‘[ء-ي]’ file |
| Diacritics | egrep ‘[ًٌٍَُِّْٰ]’ file |
| Alif Maqsura | egrep ‘ى’ file |
| Arabic/Indic digits | egrep ‘[٠-٩]’ file |
| Convert encoding to UTF-8 | iconv -f WINDOWS-1256 -t UTF-8 file.txt > file_utf8.txt |
Additional Tips
Count occurrences of a word
egrep -o 'word' file.txt | wc -l
Combine egrep with less for interactive viewing
egrep 'word' file.txt | less
Search multiple files recursively
egrep -r 'word' folder/
Enable result highlighting (if disabled)
GREP_OPTIONS='--color=auto'