📐 دليل بصري مُبسَّط

نظرية إمكانية التعميم

من الملاحظة الواحدة إلى القرار الموثوق — رحلة في فهم مصادر الخطأ في القياس

🌐

كون الملاحظات

Universe of Admissible Obs.

🔬

دراسة G

Generalizability Study

📊

مكونات التباين

Variance Components

⚖️

دراسة D

Decision Study

الخلفية المعرفية

من أين جاءت نظرية إمكانية التعميم؟

لم تنشأ هذه النظرية من فراغ — بل استمدّت جذورها من نظريتين راسختتين في القياس والإحصاء، ثم تجاوزتهما معاً.

📏 نظرية الاختبار التقليدية Classical Test Theory (CTT)

📉 تحليل التباين Analysis of Variance (ANOVA)

✨ نظرية إمكانية التعميم Generalizability Theory (G Theory)

🔬 دراسة التعميم (G) تقدير مكونات التباين

⚖️ دراسة القرار (D) اتخاذ قرارات موثوقة

💡
النقطة الجوهرية
نظرية إمكانية التعميم ليست مجرد حاصل جمع النظريتين — هي أكثر منهما في بعض جوانب التفكير المفاهيمي، وأقل منهما في بعض التطبيقات الإحصائية. ما يميزها حقاً هو إطارها المفاهيمي الفريد الذي يُجبر الباحث على التفكير بعمق في طبيعة القياس.

السيناريو التعليمي

قصة ماري سميث 📝

كل مفاهيم النظرية ستُشرح عبر مثال عملي واحد: تقييم الكفاءة في التعبير الكتابي

👩‍🔬 ماري سميث — باحثة في القياس التربوي

تريد ماري بناء أداة قياس لتقييم مهارة التعبير الكتابي. قبل أن تجمع أي بيانات، عليها أن تحدد عالمها القياسي — أي تصف الشروط التي تراها مقبولة لهذا القياس.

📋

وجه الموضوع (Topic Facet)

أي موضوع مقالي يمكن طرحه للطلاب يُعد شرطاً مقبولاً. لا تُلزم نفسها بموضوع بعينه.

👩‍⚖️

وجه المقيِّم (Rater Facet)

أي مقيِّم مؤهَّل يمكنه تصحيح الكتابة يُعد شرطاً مقبولاً. لا تُلزم نفسها بمقيِّم بعينه.

🧑‍🎓

موضوع القياس (المجتمع)

الطلاب الذين يُقيَّمون هم المجتمع (Population)، وتُميز النظرية بين "المجتمع" و"الكون".

⚙️

التقاطع (Crossed Design)

كل مقيِّم يصحح كل موضوع = تصميم متقاطع، يُرمز له: p × t × r

المفهوم المحوري

ما هو كون الملاحظات المقبولة؟

Universe of Admissible Observations — القلب النابض لنظرية إمكانية التعميم

⚠️

تمييز جوهري

في نظرية إمكانية التعميم، تُستخدم كلمة "كون" حصرياً لشروط القياس (الموضوعات والمقيِّمين هنا)، بينما تُستخدم كلمة "مجتمع" لموضوعات القياس (الأشخاص). هذا التمييز الاصطلاحي جوهري ودقيق.

🎯

وجه القياس (Facet)

مجموعة من شروط القياس المتشابهة. في مثالنا: الموضوعات وجه، والمقيِّمون وجه آخر. يمكن أن يكون لديك وجوه متعددة.

✅

الشرط المقبول

أي موضوع أو مقيِّم "مقبول" لدى الباحث للاستخدام في القياس. "المقبول" هنا محدَّد بالباحث وليس بمعيار عالمي.

♾️

اللانهاية النظرية

يُفترض نظرياً أن الكون كبير جداً (يقترب من اللانهاية). هذا الافتراض يُمكِّن من حساب مكونات التباين بشكل صحيح.

🔀

التقاطع vs التداخل

إذا كل مقيِّم يصحح كل موضوع → تقاطع (t × r). إذا كل مقيِّم خُصِّص لموضوع واحد فقط → تداخل (r:t).

🌐

نسبية الكون

ما هو "مقبول" لباحث قد لا يكون مقبولاً لباحث آخر. كون ماري (أساتذة دكتوراه) يختلف عمّن يريد معلمي ثانوية.

📐

الصلة العلمية

يجب على الباحثين الآخرين التحقق من أن تعريف ماري للكون يتوافق مع أهدافهم البحثية قبل استخدام نتائجها.

أنواع التصاميم

متقاطع أم متداخل؟

الفرق بين التصميمين جوهري في كيفية تحليل البيانات وتفسير النتائج

🔀 التصميم المتقاطع (Crossed)

كل مقيِّم يصحح كل الموضوعات لـكل الطلاب

r₁

r₂

r₃

t₁

✓

t₂

✓

t₃

✓

✅ كل التوليفات (tᵢ × rⱼ) متاحة
الرمز: p × t × r

مزيته: يسمح بتحليل كامل لمكونات التباين بما فيها تأثيرات التفاعل t × r

📦 التصميم المتداخل (Nested)

كل مقيِّم مخصَّص لموضوع واحد فقط — المقيِّمون متداخلون داخل الموضوعات

r₁

r₂

r₃

t₁

✓

—

t₂

—

✓

—

t₃

—

✓

⚠️ توليفات محدودة فقط
الرمز: p × (r:t)

قيده: لا يمكن تفكيك تأثيرات r وr×t منفصلين — تبقى مُدمجة في مكوّن واحد

المكوّنات السبعة

تفكيك الدرجة إلى مصادرها

أي درجة تُلاحَظ تحمل في طياتها تأثيرات متشابكة يمكن فصلها رياضياً

معادلة الدرجة الملحوظة:

X_ptr = μ + ν_p + ν_t + ν_r + ν_pt + ν_pr + ν_tr + ν_ptr,e

معادلة التباين الكلي:

σ²(X_ptr) = σ²(p) + σ²(t) + σ²(r) + σ²(pt) + σ²(pr) + σ²(tr) + σ²(ptr)

القيم المقدَّرة من دراسة G لماري سميث (تصميم p × t × r) — مرتبة تنازلياً حسب الحجم

σ²(p)

0.25

تباين بين الطلاب أنفسهم (المُراد قياسه)

σ²(pt)

0.15

⚠️ تفاعل شخص×موضوع: ترتيب الطلاب يتغير بتغيُّر الموضوع

σ²(ptr)

0.12

خطأ عشوائي متبقٍّ (مدمج مع التفاعل الثلاثي)

σ²(t)

0.06

اختلاف الموضوعات في متوسط صعوبتها

σ²(pr)

0.04

تفاعل شخص×مقيِّم: اختلاف ترتيب الطلاب بين مقيِّمين

σ²(r)

0.02

اختلاف المقيِّمين في متوسط شدة تصحيحهم

σ²(tr)

0.00

تفاعل الموضوع×المقيِّم (لا يكاد يُذكر هنا)

🔍
الاستنتاج الجوهري من هذه الأرقام

            الموضوعات تمثل مصدر تباين أكبر بكثير من المقيِّمين — فـ σ²(t) أكبر 3 مرات من σ²(r)، وσ²(pt) أكبر نحو 4 مرات من σ²(pr). 
            
            الدلالة العملية: لتحسين موثوقية القياس، زيادة عدد الموضوعات أكثر نفعاً من زيادة عدد المقيِّمين!

دراسة G

كيف تُجري دراسة التعميم؟

أربع خطوات منهجية من تصميم الدراسة إلى تفسير مكونات التباين

تعريف الكون وتحديد الأوجه

حدد أوجه القياس التي تهمك (موضوعات، مقيِّمون، أيام...). قرر ما إذا كانت علاقتها متقاطعة أم متداخلة. في مثالنا: p × t × r — 3 أشخاص، موضوعات، مقيِّمون.

جمع البيانات وتحليل التباين (ANOVA)

اختر عينات مناسبة من n_p أشخاص، n_t موضوعات، n_r مقيِّمين. طبِّق ANOVA للحصول على متوسطات المربعات MS لكل تأثير.

استخراج مكونات التباين بمعادلات EMS

استخدم معادلات متوسطات المربعات المتوقعة (Expected Mean Squares) لتقدير كل مكوّن تباين: σ²(p)، σ²(t)، σ²(pt)، إلخ. هذه هي نتائج دراسة G.

التفسير والانتقال لدراسة D

فسِّر الأرقام: أيُّ الأوجه يُسبب أكثر التباين؟ أيُّها يتفاعل مع الأشخاص (= خطأ قياس)؟ ثم استخدم النتائج في دراسة القرار (D) لتصميم إجراء قياس أمثل.

المقارنة الأساسية

دراسة G مقابل دراسة D

كلتاهما أداة لا غنى عنها — لكن لكلٍّ منهما غرضها وطبيعتها

الجانب	دراسة G (التعميم)	دراسة D (القرار)
الهدف الأساسي	تقدير مكونات التباين في الكون	اتخاذ قرارات قياسية موثوقة
ما تُقدِّره	σ²(p), σ²(t), σ²(r), σ²(pt) ...	معامل G، مؤشر الثبات Φ، خطأ المعيار
الأوجه	غالباً عشوائية (Random)	قد تكون ثابتة أو عشوائية حسب الهدف
السؤال الذي تجيب عليه	"ما مصادر التباين وأحجامها؟"	"كم نحتاج من الموضوعات والمقيِّمين؟"
التسلسل المنطقي	أولاً ← تُنفَّذ قبل D	ثانياً ← تعتمد على نتائج G
الاستخدام في التحسين	تشخيصي	تحسيني ← تصميم أمثل

الخلاصة

ما الذي تعلمناه؟

الأفكار الجوهرية التي يجب أن تبقى معك بعد قراءة هذا المقال

🌐

الكون يُحدِّده الباحث

لا يوجد "كون عالمي" للموضوعات أو المقيِّمين. ما يُعتبر مقبولاً لباحث قد لا يكون مقبولاً لآخر. هذا مصدر قوة وليس ضعفاً.

🔬

دراسة G = تشخيص القياس

هي المرحلة الاستكشافية التي تكشف أيُّ الأوجه يُحدث أكبر التباين في درجات الطلاب. بدونها، قراراتنا في تصميم الاختبار ستكون في الهواء.

📊

7 مكونات تباين في تصميم p×t×r

الدرجة الواحدة تحمل تأثير: الشخص، الموضوع، المقيِّم، وأربعة تفاعلات بينهم. الفهم الصحيح لهذه المكونات هو مفتاح التفسير السليم.

🎯

التفاعل = مصدر الخطأ الحقيقي

σ²(pt) وσ²(pr) هي مكونات التفاعل المُربكة — فهي تعني أن ترتيب الطلاب يتبدّل بتغيُّر الموضوعات أو المقيِّمين، وهذا يُخفض موثوقية القياس.