كيف ننتقل من نتائج دراسة G إلى تصميم دراسة D — وكيف نقيس الخطأ ونحسب موثوقية القياس؟
قبل الغوص في التفاصيل — إليك الصورة الكاملة لكيفية ترابط المفاهيم
Universe Score — الدرجة "الحقيقية" التي يسعى القياس للوصول إليها
كل شخص لو قاسيناه على جميع موضوعات الكون وجميع مقيِّميه — متوسط تلك الدرجات = درجة الكونه
مكونات التباين في G تُقلَّص بحجم العينة للحصول على مكونات D — معادلة بسيطة وقوية
لتحويل أي مكوّن تباين من دراسة G إلى دراسة D، انظر: هل يحتوي التأثير على (t)؟ أم (r)؟ أم كليهما؟ ثم اقسم على حجم العينة المقابل.
الخطأ المطلق عندما تهمك الدرجة نفسها. الخطأ النسبي عندما يهمك ترتيبك بين الآخرين.
يتضمن جميع مكونات التباين عدا σ²(p) — أي كل ما ليس الشخص نفسه
يتضمن فقط التأثيرات التي تؤثر على ترتيب الأشخاص النسبي — التفاعلات مع الشخص
حرّك المؤشرات وشاهد كيف يتغير الخطأ والمعاملات — وأيُّهما أكثر تأثيراً: الموضوعات أم المقيِّمون؟
كلاهما مقياس للاعتمادية، لكنهما يُجيبان على سؤالين مختلفين
يُقاس بنسبة تباين درجات الكون إلى مجموع تباين الكون والخطأ النسبي. وهو نظير معامل الثبات في النظرية التقليدية.
متى يُستخدم؟ عندما يهمك ترتيب الأشخاص مقارنة بغيرهم — اختبارات التنافس والتصنيف.
يستخدم الخطأ المطلق σ²(Δ) بدلاً من النسبي. لهذا هو دائماً أصغر من Eρ² أو يساويه.
متى يُستخدم؟ عندما يهمك المستوى المطلق للأداء — اجتياز/رسوب، مرجعي للمحك.
| السياق | نوع القرار | السؤال | المعامل المناسب |
|---|---|---|---|
| اختبار ترتيبي تنافسي | نسبي | من الأفضل؟ | Eρ² |
| اختبار اجتياز/رسوب | مطلق | هل تجاوز الحد؟ | Φ |
| شهادة مهنية بمعيار محدد | مطلق | هل أتقن المهارة؟ | Φ |
| تقييم بحثي للفروق | نسبي | أيُّ المجموعات أفضل؟ | Eρ² |
| قياس مستوى أداء مقابل معيار | كلاهما | مستوى + ترتيب | Eρ² و Φ معاً |
من أهم مزايا نظرية إمكانية التعميم: يمكنك تقدير المكونات بتصميم واحد، ثم تطبيق نتائجه على تصاميم مختلفة لدراسة D
جمعت سميث بيانات متقاطعة كاملة لتقدير جميع مكونات التباين. هذا يتطلب مواردَ أكثر لكنه يُعطي أقصى معلومات.
قد تختار سميث تصميماً متداخلاً في الممارسة الفعلية (كل مقيِّم لموضوع محدد) لأسباب لوجستية. مكونات G تسمح بتقدير ذلك.
قد تُقرر سميث تثبيت الموضوعات (Fixed T) في إجراء القياس — هذا يُضيِّق كون التعميم ويُغير صيغة حساب الخطأ وما يدخل في σ²(τ).
نظرية G لا تكتفي بالسماح بهذه الاختلافات — بل تشجّع الباحثين على اختبار سيناريوهات متعددة قبل اتخاذ القرار النهائي بشأن تصميم إجراء القياس.
ما يجب أن يبقى معك بعد قراءة هذا القسم
للانتقال من مكونات G إلى مكونات D: اقسم على n'ₜ إن كان التأثير يحتوي t، وعلى n'ᵣ إن يحتوي r، وعلى حاصل ضربهما إن يحتوي كليهما. σ²(p) لا يتغير أبداً.
كل إجراء قياس يسعى لتقدير درجة الكون — المتوسط الافتراضي عبر جميع شروط الكون. تباينها σ²(τ) = σ²(p) هو مقياس التباين الحقيقي بين الأشخاص.
σ²(Δ) للتفسيرات المطلقة (المحك) يتضمن جميع مصادر الخطأ. σ²(δ) للتفسيرات النسبية (الترتيب) يتضمن فقط تفاعلات الشخص. والأول دائماً ≥ الثاني.
Eρ² للمقارنات النسبية (يستخدم σ²(δ)). Φ للتفسيرات المطلقة (يستخدم σ²(Δ)). الفرق بينهما يُشير إلى تأثير العوامل كـ σ²(T) وσ²(R) على الدرجات المطلقة.