📐 الفصل الأول — القسم 1.1.2

من درجة الكون
إلى قرار موثوق

كيف ننتقل من نتائج دراسة G إلى تصميم دراسة D — وكيف نقيس الخطأ ونحسب موثوقية القياس؟

σ²(τ)
تباين درجة الكون
σ²(Δ)
الخطأ المطلق
σ²(δ)
الخطأ النسبي
Eρ²
معامل التعميم
Φ
مؤشر الاعتمادية

الخريطة الكاملة

رحلة من G إلى D

قبل الغوص في التفاصيل — إليك الصورة الكاملة لكيفية ترابط المفاهيم

🔬 دراسة G
تقدير σ²(p), σ²(t), σ²(r)...
⚖️ اختيار n'ₜ, n'ᵣ
حجم عينة دراسة D
📉 تباين الخطأ
σ²(Δ) و σ²(δ)
📊 المعاملات
Eρ² و Φ
✅ القرار الأمثل
تصميم إجراء القياس
🔑
المنطق الأساسي
دراسة G تعطيك مكونات التباين "الخام" من العالم اللانهائي. دراسة D تطبّق معادلات بسيطة لتحويلها إلى إجراء قياس محدد (n'ₜ موضوعاً و n'ᵣ مقيِّماً). ثم تحسب الخطأ والمعاملات لتقرر إن كان هذا التصميم كافياً لأغراضك.
المفهوم الجوهري

ما هي درجة الكون؟

Universe Score — الدرجة "الحقيقية" التي يسعى القياس للوصول إليها

كل شخص لو قاسيناه على جميع موضوعات الكون وجميع مقيِّميه — متوسط تلك الدرجات = درجة الكونه

👩‍🎓
سارة
t₁,r₁3.2
t₂,r₂3.8
t₃,r₁3.5
... ∞...
μₚ ≈ 3.5
👨‍🎓
خالد
t₁,r₁2.1
t₂,r₂2.9
t₃,r₁2.4
... ∞...
μₚ ≈ 2.5
👩‍🎓
ليلى
t₁,r₁4.5
t₂,r₂4.0
t₃,r₁4.8
... ∞...
μₚ ≈ 4.4
📊
تباين درجات الكون
σ²(τ) = σ²(p)
يعكس الفروق الحقيقية
بين الأشخاص
σ̂²(τ) = 0.25
تعريف درجة الكون للنموذج العشوائي p × T × R
μₚ ≡ ET ER XpTR = μ + νₚ
💡
الفرق عن نظرية الاختبار التقليدية
في النظرية التقليدية: الدرجة الحقيقية = متوسط افتراضي على إعادات لانهائية لنفس الاختبار. في نظرية G: درجة الكون = متوسط عبر جميع شروط كون التعميم (موضوعات × مقيِّمون). الفرق الجوهري: نظرية G تُحدد بوضوح ما الذي يُعمَّم إليه.
دراسة D

القاعدة الذهبية: من G إلى D

مكونات التباين في G تُقلَّص بحجم العينة للحصول على مكونات D — معادلة بسيطة وقوية

📐 القاعدة — المعادلة 1.6 σ̂²(ᾱ)

لتحويل أي مكوّن تباين من دراسة G إلى دراسة D، انظر: هل يحتوي التأثير على (t)؟ أم (r)؟ أم كليهما؟ ثم اقسم على حجم العينة المقابل.

⚙️ التأثير يحتوي على t فقط
σ̂²(ᾱ) = σ̂²(α) / n'ₜ
أمثلة: σ²(t)، σ²(pt)
اقسم على عدد الموضوعات
⚙️ التأثير يحتوي على r فقط
σ̂²(ᾱ) = σ̂²(α) / n'ᵣ
أمثلة: σ²(r)، σ²(pr)
اقسم على عدد المقيِّمين
⚙️ التأثير يحتوي على t و r معاً
σ̂²(ᾱ) = σ̂²(α) / (n'ₜ × n'ᵣ)
أمثلة: σ²(tr)، σ²(ptr)
اقسم على حاصل ضرب الاثنين
📌 تطبيق المثال — سميث تختار n'ₜ = 3 موضوعات و n'ᵣ = 2 مقيِّمين
σ²(p)
÷ (لا شيء)
.25
σ²(T) = .06 ÷ 3
.02
σ²(R) = .02 ÷ 2
.01
σ²(pT) = .15 ÷ 3
.05
σ²(pR) = .04 ÷ 2
.02
σ²(TR) = .00 ÷ 6
.00
σ²(pTR) = .12 ÷ 6
.02
÷ 3×2 = 6
ptr → pTR
تباين الخطأ

نوعان من الخطأ — لا نوع واحد

الخطأ المطلق عندما تهمك الدرجة نفسها. الخطأ النسبي عندما يهمك ترتيبك بين الآخرين.

🎯
الخطأ المطلق
هل درجة أحمد كـ3.5
تعكس قدرته الحقيقية؟
السؤال: كم تنحرف عن درجة الكون؟
يُستخدم عند التفسير المرجعي للمحك
📊
الخطأ النسبي
هل أحمد أفضل من سارة؟
هل ترتيبه ثابت بين الموضوعات؟
السؤال: كم تنحرف عن انحرافه المتوقع؟
يُستخدم عند المقارنة بين الأفراد
σ²(Δ)

تباين الخطأ المطلق

Absolute Error Variance
الخطأ = الفرق بين الدرجة الملحوظة ودرجة الكون
Δₚ = XpTR − μₚ

يتضمن جميع مكونات التباين عدا σ²(p) — أي كل ما ليس الشخص نفسه

σ²(p)
درجة الكون — ليست خطأ
σ²(T)
صعوبة الموضوع
σ²(R)
شدة المقيِّم
σ²(pT)
تفاعل شخص×موضوع
σ²(pR)
تفاعل شخص×مقيِّم
σ²(TR)
تفاعل موضوع×مقيِّم
σ²(pTR)
خطأ متبقٍّ
🔢
عند n'ₜ=3, n'ᵣ=2
σ̂(Δ) = .35
خطأ معياري مطلق — مجال ثقة 68%: الدرجة ± 0.35
σ²(δ)

تباين الخطأ النسبي

Relative Error Variance
الخطأ = الفرق بين انحراف الشخص الملحوظ وانحرافه الحقيقي
δₚ = (XpTR − μTR) − (μₚ − μ)

يتضمن فقط التأثيرات التي تؤثر على ترتيب الأشخاص النسبي — التفاعلات مع الشخص

σ²(p)
درجة الكون
σ²(T)
لا يغير الترتيب (يؤثر على الجميع)
σ²(R)
لا يغير الترتيب (يؤثر على الجميع)
σ²(pT)
يغيّر ترتيب الأشخاص!
σ²(pR)
يغيّر ترتيب الأشخاص!
σ²(TR)
لا يتفاعل مع الأشخاص
σ²(pTR)
خطأ متبقٍّ
🔢
عند n'ₜ=3, n'ᵣ=2
σ̂(δ) = .30
دائماً ≤ الخطأ المطلق لأنه يتضمن مكونات أقل
🧠
لماذا σ̂(δ) أصغر من σ̂(Δ) دائماً؟
لأن σ²(T) وσ²(R) — رغم أنهما يُضيفان خطأً للدرجات المطلقة — لا يُغيِّران ترتيب الأشخاص النسبي. فإذا كان الموضوع صعباً على الجميع، فإن ذلك لا يُقلب ترتيبهم. لهذا يُستبعدان من حساب الخطأ النسبي، فيصبح الخطأ أصغر.
تجربة حية

جرّب بنفسك: أثر حجم العينة

حرّك المؤشرات وشاهد كيف يتغير الخطأ والمعاملات — وأيُّهما أكثر تأثيراً: الموضوعات أم المقيِّمون؟

3
2
σ̂(Δ) = 0.35
σ̂(δ) = 0.30
Eρ̂² = 0.74
Φ̂ = 0.68
σ²(T) σ²(R) σ²(pT) σ²(pR) σ²(pTR)
💡
الاستنتاج
حرّك المؤشرات لمشاهدة تحليل حي
المعاملات

Eρ² وΦ — متى تستخدم أيهما؟

كلاهما مقياس للاعتمادية، لكنهما يُجيبان على سؤالين مختلفين

Eρ²
معامل التعميم
G Coefficient / Generalizability Coefficient
Eρ² = σ²(τ) / [σ²(τ) + σ²(δ)]

يُقاس بنسبة تباين درجات الكون إلى مجموع تباين الكون والخطأ النسبي. وهو نظير معامل الثبات في النظرية التقليدية.

متى يُستخدم؟ عندما يهمك ترتيب الأشخاص مقارنة بغيرهم — اختبارات التنافس والتصنيف.

0.74
عند n'ₜ=3, n'ᵣ=2
= .25 / (.25 + .09)
قراءة: 74% من التباين حقيقي
Φ
مؤشر الاعتمادية
Dependability Index / Phi
Φ = σ²(τ) / [σ²(τ) + σ²(Δ)]

يستخدم الخطأ المطلق σ²(Δ) بدلاً من النسبي. لهذا هو دائماً أصغر من Eρ² أو يساويه.

متى يُستخدم؟ عندما يهمك المستوى المطلق للأداء — اجتياز/رسوب، مرجعي للمحك.

0.68
عند n'ₜ=3, n'ᵣ=2
= .25 / (.25 + .12)
أصغر من Eρ² (0.74) دائماً

🗺️ دليل اختيار المعامل المناسب

السياق نوع القرار السؤال المعامل المناسب
اختبار ترتيبي تنافسي نسبي من الأفضل؟ Eρ²
اختبار اجتياز/رسوب مطلق هل تجاوز الحد؟ Φ
شهادة مهنية بمعيار محدد مطلق هل أتقن المهارة؟ Φ
تقييم بحثي للفروق نسبي أيُّ المجموعات أفضل؟ Eρ²
قياس مستوى أداء مقابل معيار كلاهما مستوى + ترتيب Eρ² و Φ معاً
تصاميم مختلفة

دراسة G ≠ دراسة D بالضرورة!

من أهم مزايا نظرية إمكانية التعميم: يمكنك تقدير المكونات بتصميم واحد، ثم تطبيق نتائجه على تصاميم مختلفة لدراسة D

🔬

دراسة G (متقاطعة كاملاً)

p × t × r

جمعت سميث بيانات متقاطعة كاملة لتقدير جميع مكونات التباين. هذا يتطلب مواردَ أكثر لكنه يُعطي أقصى معلومات.

⚖️

دراسة D (يمكن أن تكون مختلفة)

p × (R:T) أو p × T × R

قد تختار سميث تصميماً متداخلاً في الممارسة الفعلية (كل مقيِّم لموضوع محدد) لأسباب لوجستية. مكونات G تسمح بتقدير ذلك.

↔️

كون التعميم أضيق

قد تُقرر سميث تثبيت الموضوعات (Fixed T) في إجراء القياس — هذا يُضيِّق كون التعميم ويُغير صيغة حساب الخطأ وما يدخل في σ²(τ).

📏

المرونة هي الميزة الأكبر

نظرية G لا تكتفي بالسماح بهذه الاختلافات — بل تشجّع الباحثين على اختبار سيناريوهات متعددة قبل اتخاذ القرار النهائي بشأن تصميم إجراء القياس.

خلاصة المقال

الدروس المستخلصة

ما يجب أن يبقى معك بعد قراءة هذا القسم

🔗 القاعدة الذهبية للتحويل

للانتقال من مكونات G إلى مكونات D: اقسم على n'ₜ إن كان التأثير يحتوي t، وعلى n'ᵣ إن يحتوي r، وعلى حاصل ضربهما إن يحتوي كليهما. σ²(p) لا يتغير أبداً.

📐 درجة الكون = الهدف الأسمى

كل إجراء قياس يسعى لتقدير درجة الكون — المتوسط الافتراضي عبر جميع شروط الكون. تباينها σ²(τ) = σ²(p) هو مقياس التباين الحقيقي بين الأشخاص.

⚖️ خطأن — لا خطأ واحد

σ²(Δ) للتفسيرات المطلقة (المحك) يتضمن جميع مصادر الخطأ. σ²(δ) للتفسيرات النسبية (الترتيب) يتضمن فقط تفاعلات الشخص. والأول دائماً ≥ الثاني.

🎯 معاملان — لسؤالين مختلفين

Eρ² للمقارنات النسبية (يستخدم σ²(δ)). Φ للتفسيرات المطلقة (يستخدم σ²(Δ)). الفرق بينهما يُشير إلى تأثير العوامل كـ σ²(T) وσ²(R) على الدرجات المطلقة.

🏆
الاستنتاج العملي الأهم من مثال سميث
زيادة عدد الموضوعات تُخفض الخطأ وترفع المعاملات بشكل أسرع بكثير من زيادة عدد المقيِّمين، لأن σ²(t)=.06 > σ²(r)=.02 وكذلك σ²(pt)=.15 > σ²(pr)=.04.

القاعدة الذهبية في التصميم: خصِّص الموارد المحدودة حيث توجد أكبر مصادر التباين.