كيفية تدريب نماذج تعلم الآلة باستخدام Python

16 مايو، 2025

0 95 3 دقائق

في عالم الذكاء الاصطناعي وتكنولوجيا البيانات، يُعد تعلم الآلة (Machine Learning) من أبرز المجالات التي تُحدث ثورة في العديد من الصناعات. ومن أفضل اللغات المستخدمة لتطوير وتدريب النماذج هو لغة Python ، لما توفره من مكتبات قوية ومجتمع داعم كبير.

في هذا المقال، سنتناول خطوات تدريب نموذج تعلم آلي باستخدام Python بدءًا من تحضير البيانات وحتى تقييم النموذج وأخيرًا استخدامه للتنبؤ.

ما هو تعلم الآلة؟

تعلم الآلة هو فرع من الذكاء الاصطناعي يهدف إلى تطوير أنظمة قادرة على التعلم من البيانات دون أن يتم برمجتها صراحةً. يتم ذلك عن طريق بناء نماذج رياضية تكتشف الأنماط في البيانات وتطبقها لصنع قرارات أو تنبؤات مستقبلية.

المتطلبات الأساسية قبل البدء

قبل أن نبدأ في تدريب النماذج، يجب أن تكون لديك المعرفة التالية:

أساسيات البرمجة بلغة Python.
مفاهيم الإحصاء والاحتمالات.
فهم أساسي لمفاهيم تعلم الآلة (مثل التصنيف، الانحدار، التجميع).
معرفة باستخدام Jupyter Notebook أو أي بيئة تطوير Python.

الخطوات الكاملة لتدريب نموذج تعلم آلي باستخدام Python

1. ✅ جمع البيانات (Data Collection)

البيانات هي حجر الأساس في أي مشروع تعلم آلي. يمكنك الحصول عليها من:

ملفات CSV أو Excel.
قواعد بيانات SQL.
APIs خارجية.
مواقع الإنترنت (Web Scraping).

مثال: استيراد بيانات من ملف CSV

python

import pandas as pd

# تحميل البيانات

df = pd.read_csv(‘data.csv’)

# عرض أول 5 صفوف

print(df.head())

2. 🧹 تنظيف البيانات (Data Cleaning)

البيانات الحقيقية غالبًا ما تحتوي على قيم مفقودة أو غير صحيحة. هنا نقوم بتنظيف البيانات عبر:

إزالة القيم المفقودة.
معالجة القيم الشاذة.
تحويل البيانات النصية إلى رقمية (Encoding).
إعادة ترتيب البيانات.

مثال: معالجة القيم المفقودة

python

# ملء القيم المفقودة بالمتوسط

df.fillna(df.mean(), inplace=True)

3. 📊 تحليل البيانات واستكشافها (Exploratory Data Analysis – EDA)

نستخدم أدوات مثل matplotlib و seaborn لفهم العلاقات بين المتغيرات.

python

import seaborn as sns

import matplotlib.pyplot as plt

sns.pairplot(df)

plt.show()

4. 🔍 اختيار الميزات (Feature Selection) وتجهيزها (Feature Engineering)

اختيار الأعمدة (Features) المؤثرة فقط.
تقسيم البيانات إلى متغيرات مستقلة (X) ومتغير مستهدف (y).
تطبيع البيانات إذا لزم الأمر.

مثال: تقسيم البيانات

python

X = df.drop(‘target’, axis=1) # المتغيرات المستقلة

y = df[‘target’] # المتغير المستهدف

5. ⚙️ تقسيم البيانات إلى مجموعات التدريب والاختبار (Train/Test Split)

نقوم بتقسيم البيانات إلى جزأين:

مجموعة تدريب (Training Set): لتُعلّم النموذج.
مجموعة اختبار (Test Set): لتقييم أداء النموذج.

python

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

6. 🏗️ اختيار النموذج وتدريبه (Model Training)

توجد مكتبة شهيرة تُدعى scikit-learn تقدم عددًا كبيرًا من النماذج الجاهزة.
مثال: استخدام نموذج الانحدار اللوجستي لتصنيف البيانات.

python

from sklearn.linear_model import LogisticRegression

model = LogisticRegression()

model.fit(X_train, y_train)

7. 🧪 تقييم النموذج (Model Evaluation)

نستخدم مجموعة الاختبار لتقييم أداء النموذج. بعض المقاييس الشائعة:

الدقة (Accuracy)
المصفوفة السياقية (Confusion Matrix)
تقرير التصنيف (Classification Report)

python

from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

y_pred = model.predict(X_test)

print(“الدقة:”, accuracy_score(y_test, y_pred))

print(“مصفوفة السياق:\n”, confusion_matrix(y_test, y_pred))

print(“تقرير التصنيف:\n”, classification_report(y_test, y_pred))

8. 📈 تحسين الأداء (Hyperparameter Tuning)

نستخدم أدوات مثل GridSearchCV أو RandomizedSearchCV لتحسين أداء النموذج عبر البحث عن أفضل المعايير الفائقة.

python

from sklearn.model_selection import GridSearchCV

param_grid = {‘C’: [0.1, 1, 10], ‘penalty’: [‘l1’, ‘l2’]}

grid = GridSearchCV(LogisticRegression(solver=’liblinear’), param_grid, cv=5)

grid.fit(X_train, y_train)

best_model = grid.best_estimator_

9. 💾 حفظ النموذج (Model Saving)

بعد تدريب النموذج، يمكن حفظه لاستخدامه لاحقًا باستخدام مكتبة joblib.

python

import joblib

joblib.dump(best_model, ‘best_model.pkl’)

ثم تحميله لاحقًا:

python

loaded_model = joblib.load(‘best_model.pkl’)

10. 🧠 استخدام النموذج للتنبؤ (Making Predictions)

الآن بعد أن تم تدريب النموذج، يمكنك استخدامه للتنبؤ ببيانات جديدة.

python

new_data = [[5.1, 3.5, 1.4, 0.2]] # بيانات جديدة

prediction = loaded_model.predict(new_data)

print(“التنبؤ:”, prediction)

أمثلة على مشاكل تعلم آلي شائعة

نوع المشكلة	النموذج المناسب	مثال عملي
التصنيف	Random Forest, SVM	تصنيف رسائل البريد الإلكتروني
الانحدار	Linear Regression	التنبؤ بالأسعار
التجميع (Clustering)	K-Means	تقسيم العملاء إلى مجموعات
الكشف عن الشذوذ	Isolation Forest	اكتشاف الاحتيال المصرفي

المكتبات الشهيرة المستخدمة في تعلم الآلة مع Python

المكتبة	الوظيفة
`scikit-learn`	النماذج الإحصائية والأدوات الأساسية
`pandas`	معالجة البيانات
`numpy`	العمليات الرياضية
`matplotlib/seaborn`	الرسوم البيانية
`xgboost/lightgbm`	نماذج قوية للتصنيف والانحدار
`keras/tensorflow`	تعلم العميق