درجات الكون ودراسة القرار

الخريطة الكاملة

رحلة من G إلى D

قبل الغوص في التفاصيل — إليك الصورة الكاملة لكيفية ترابط المفاهيم

🔬 دراسة G
تقدير σ²(p), σ²(t), σ²(r)...

→

⚖️ اختيار n'ₜ, n'ᵣ
حجم عينة دراسة D

→

📉 تباين الخطأ
σ²(Δ) و σ²(δ)

→

📊 المعاملات
Eρ² و Φ

→

✅ القرار الأمثل
تصميم إجراء القياس

🔑

المنطق الأساسي

دراسة G تعطيك مكونات التباين "الخام" من العالم اللانهائي. دراسة D تطبّق معادلات بسيطة لتحويلها إلى إجراء قياس محدد (n'ₜ موضوعاً و n'ᵣ مقيِّماً). ثم تحسب الخطأ والمعاملات لتقرر إن كان هذا التصميم كافياً لأغراضك.

المفهوم الجوهري

ما هي درجة الكون؟

Universe Score — الدرجة "الحقيقية" التي يسعى القياس للوصول إليها

كل شخص لو قاسيناه على جميع موضوعات الكون وجميع مقيِّميه — متوسط تلك الدرجات = درجة الكونه

👩‍🎓

سارة

t₁,r₁3.2

t₂,r₂3.8

t₃,r₁3.5

... ∞...

μₚ ≈ 3.5

→

👨‍🎓

خالد

t₁,r₁2.1

t₂,r₂2.9

t₃,r₁2.4

... ∞...

μₚ ≈ 2.5

→

👩‍🎓

ليلى

t₁,r₁4.5

t₂,r₂4.0

t₃,r₁4.8

... ∞...

μₚ ≈ 4.4

→

📊

تباين درجات الكون

σ²(τ) = σ²(p)

يعكس الفروق الحقيقية
بين الأشخاص

σ̂²(τ) = 0.25

تعريف درجة الكون للنموذج العشوائي p × T × R

μₚ ≡ E_T E_R X_pTR = μ + νₚ

💡

الفرق عن نظرية الاختبار التقليدية

في النظرية التقليدية: الدرجة الحقيقية = متوسط افتراضي على إعادات لانهائية لنفس الاختبار. في نظرية G: درجة الكون = متوسط عبر جميع شروط كون التعميم (موضوعات × مقيِّمون). الفرق الجوهري: نظرية G تُحدد بوضوح ما الذي يُعمَّم إليه.

دراسة D

القاعدة الذهبية: من G إلى D

مكونات التباين في G تُقلَّص بحجم العينة للحصول على مكونات D — معادلة بسيطة وقوية

📐 القاعدة — المعادلة 1.6 σ̂²(ᾱ)

لتحويل أي مكوّن تباين من دراسة G إلى دراسة D، انظر: هل يحتوي التأثير على (t)؟ أم (r)؟ أم كليهما؟ ثم اقسم على حجم العينة المقابل.

⚙️ التأثير يحتوي على t فقط

σ̂²(ᾱ) = σ̂²(α) / n'ₜ

أمثلة: σ²(t)، σ²(pt)
اقسم على عدد الموضوعات

⚙️ التأثير يحتوي على r فقط

σ̂²(ᾱ) = σ̂²(α) / n'ᵣ

أمثلة: σ²(r)، σ²(pr)
اقسم على عدد المقيِّمين

⚙️ التأثير يحتوي على t و r معاً

σ̂²(ᾱ) = σ̂²(α) / (n'ₜ × n'ᵣ)

أمثلة: σ²(tr)، σ²(ptr)
اقسم على حاصل ضرب الاثنين

📌 تطبيق المثال — سميث تختار n'ₜ = 3 موضوعات و n'ᵣ = 2 مقيِّمين

σ²(p)

÷ (لا شيء)

.25

σ²(T) = .06 ÷ 3

.02

σ²(R) = .02 ÷ 2

.01

σ²(pT) = .15 ÷ 3

.05

σ²(pR) = .04 ÷ 2

.02

σ²(TR) = .00 ÷ 6

.00

σ²(pTR) = .12 ÷ 6

.02

÷ 3×2 = 6

ptr → pTR

تباين الخطأ

نوعان من الخطأ — لا نوع واحد

الخطأ المطلق عندما تهمك الدرجة نفسها. الخطأ النسبي عندما يهمك ترتيبك بين الآخرين.

🎯

الخطأ المطلق

هل درجة أحمد كـ3.5
تعكس قدرته الحقيقية؟
السؤال: كم تنحرف عن درجة الكون؟

يُستخدم عند التفسير المرجعي للمحك

⇔

📊

الخطأ النسبي

هل أحمد أفضل من سارة؟
هل ترتيبه ثابت بين الموضوعات؟
السؤال: كم تنحرف عن انحرافه المتوقع؟

يُستخدم عند المقارنة بين الأفراد

σ²(Δ)

تباين الخطأ المطلق

Absolute Error Variance

الخطأ = الفرق بين الدرجة الملحوظة ودرجة الكون

Δₚ = X_pTR − μₚ

يتضمن جميع مكونات التباين عدا σ²(p) — أي كل ما ليس الشخص نفسه

✗

σ²(p)

درجة الكون — ليست خطأ

✓

σ²(T)

صعوبة الموضوع

✓

σ²(R)

شدة المقيِّم

✓

σ²(pT)

تفاعل شخص×موضوع

✓

σ²(pR)

تفاعل شخص×مقيِّم

✓

σ²(TR)

تفاعل موضوع×مقيِّم

✓

σ²(pTR)

خطأ متبقٍّ

🔢

عند n'ₜ=3, n'ᵣ=2

σ̂(Δ) = .35

خطأ معياري مطلق — مجال ثقة 68%: الدرجة ± 0.35

σ²(δ)

تباين الخطأ النسبي

Relative Error Variance

الخطأ = الفرق بين انحراف الشخص الملحوظ وانحرافه الحقيقي

δₚ = (X_pTR − μ_TR) − (μₚ − μ)

يتضمن فقط التأثيرات التي تؤثر على ترتيب الأشخاص النسبي — التفاعلات مع الشخص

✗

σ²(p)

درجة الكون

✗

σ²(T)

لا يغير الترتيب (يؤثر على الجميع)

✗

σ²(R)

لا يغير الترتيب (يؤثر على الجميع)

✓

σ²(pT)

يغيّر ترتيب الأشخاص!

✓

σ²(pR)

يغيّر ترتيب الأشخاص!

✗

σ²(TR)

لا يتفاعل مع الأشخاص

✓

σ²(pTR)

خطأ متبقٍّ

🔢

عند n'ₜ=3, n'ᵣ=2

σ̂(δ) = .30

دائماً ≤ الخطأ المطلق لأنه يتضمن مكونات أقل

🧠

لماذا σ̂(δ) أصغر من σ̂(Δ) دائماً؟

لأن σ²(T) وσ²(R) — رغم أنهما يُضيفان خطأً للدرجات المطلقة — لا يُغيِّران ترتيب الأشخاص النسبي. فإذا كان الموضوع صعباً على الجميع، فإن ذلك لا يُقلب ترتيبهم. لهذا يُستبعدان من حساب الخطأ النسبي، فيصبح الخطأ أصغر.

تجربة حية

جرّب بنفسك: أثر حجم العينة

حرّك المؤشرات وشاهد كيف يتغير الخطأ والمعاملات — وأيُّهما أكثر تأثيراً: الموضوعات أم المقيِّمون؟

📋 عدد الموضوعات (n'ₜ) 3

👩‍⚖️ عدد المقيِّمين (n'ᵣ) 2

σ̂(Δ) = 0.35

σ̂(δ) = 0.30

Eρ̂² = 0.74

Φ̂ = 0.68

σ²(T) σ²(R) σ²(pT) σ²(pR) σ²(pTR)

💡

الاستنتاج

حرّك المؤشرات لمشاهدة تحليل حي

المعاملات

Eρ² وΦ — متى تستخدم أيهما؟

كلاهما مقياس للاعتمادية، لكنهما يُجيبان على سؤالين مختلفين

Eρ²

معامل التعميم

G Coefficient / Generalizability Coefficient

Eρ² = σ²(τ) / [σ²(τ) + σ²(δ)]

يُقاس بنسبة تباين درجات الكون إلى مجموع تباين الكون والخطأ النسبي. وهو نظير معامل الثبات في النظرية التقليدية.

متى يُستخدم؟ عندما يهمك ترتيب الأشخاص مقارنة بغيرهم — اختبارات التنافس والتصنيف.

0.74

عند n'ₜ=3, n'ᵣ=2
= .25 / (.25 + .09)
قراءة: 74% من التباين حقيقي

Φ

مؤشر الاعتمادية

Dependability Index / Phi

Φ = σ²(τ) / [σ²(τ) + σ²(Δ)]

يستخدم الخطأ المطلق σ²(Δ) بدلاً من النسبي. لهذا هو دائماً أصغر من Eρ² أو يساويه.

متى يُستخدم؟ عندما يهمك المستوى المطلق للأداء — اجتياز/رسوب، مرجعي للمحك.

0.68

عند n'ₜ=3, n'ᵣ=2
= .25 / (.25 + .12)
أصغر من Eρ² (0.74) دائماً

🗺️ دليل اختيار المعامل المناسب

السياق	نوع القرار	السؤال	المعامل المناسب
اختبار ترتيبي تنافسي	نسبي	من الأفضل؟	Eρ²
اختبار اجتياز/رسوب	مطلق	هل تجاوز الحد؟	Φ
شهادة مهنية بمعيار محدد	مطلق	هل أتقن المهارة؟	Φ
تقييم بحثي للفروق	نسبي	أيُّ المجموعات أفضل؟	Eρ²
قياس مستوى أداء مقابل معيار	كلاهما	مستوى + ترتيب	Eρ² و Φ معاً

تصاميم مختلفة

دراسة G ≠ دراسة D بالضرورة!

من أهم مزايا نظرية إمكانية التعميم: يمكنك تقدير المكونات بتصميم واحد، ثم تطبيق نتائجه على تصاميم مختلفة لدراسة D

🔬

دراسة G (متقاطعة كاملاً)

p × t × r

جمعت سميث بيانات متقاطعة كاملة لتقدير جميع مكونات التباين. هذا يتطلب مواردَ أكثر لكنه يُعطي أقصى معلومات.

⚖️

دراسة D (يمكن أن تكون مختلفة)

p × (R:T) أو p × T × R

قد تختار سميث تصميماً متداخلاً في الممارسة الفعلية (كل مقيِّم لموضوع محدد) لأسباب لوجستية. مكونات G تسمح بتقدير ذلك.

↔️

كون التعميم أضيق

قد تُقرر سميث تثبيت الموضوعات (Fixed T) في إجراء القياس — هذا يُضيِّق كون التعميم ويُغير صيغة حساب الخطأ وما يدخل في σ²(τ).

📏

المرونة هي الميزة الأكبر

نظرية G لا تكتفي بالسماح بهذه الاختلافات — بل تشجّع الباحثين على اختبار سيناريوهات متعددة قبل اتخاذ القرار النهائي بشأن تصميم إجراء القياس.

خلاصة المقال

الدروس المستخلصة

ما يجب أن يبقى معك بعد قراءة هذا القسم

🔗 القاعدة الذهبية للتحويل

للانتقال من مكونات G إلى مكونات D: اقسم على n'ₜ إن كان التأثير يحتوي t، وعلى n'ᵣ إن يحتوي r، وعلى حاصل ضربهما إن يحتوي كليهما. σ²(p) لا يتغير أبداً.

📐 درجة الكون = الهدف الأسمى

كل إجراء قياس يسعى لتقدير درجة الكون — المتوسط الافتراضي عبر جميع شروط الكون. تباينها σ²(τ) = σ²(p) هو مقياس التباين الحقيقي بين الأشخاص.

⚖️ خطأن — لا خطأ واحد

σ²(Δ) للتفسيرات المطلقة (المحك) يتضمن جميع مصادر الخطأ. σ²(δ) للتفسيرات النسبية (الترتيب) يتضمن فقط تفاعلات الشخص. والأول دائماً ≥ الثاني.

🎯 معاملان — لسؤالين مختلفين

Eρ² للمقارنات النسبية (يستخدم σ²(δ)). Φ للتفسيرات المطلقة (يستخدم σ²(Δ)). الفرق بينهما يُشير إلى تأثير العوامل كـ σ²(T) وσ²(R) على الدرجات المطلقة.

🏆

الاستنتاج العملي الأهم من مثال سميث

زيادة عدد الموضوعات تُخفض الخطأ وترفع المعاملات بشكل أسرع بكثير من زيادة عدد المقيِّمين، لأن σ²(t)=.06 > σ²(r)=.02 وكذلك σ²(pt)=.15 > σ²(pr)=.04.

القاعدة الذهبية في التصميم: خصِّص الموارد المحدودة حيث توجد أكبر مصادر التباين.

من درجة الكونإلى قرار موثوق

رحلة من G إلى D

ما هي درجة الكون؟

القاعدة الذهبية: من G إلى D

نوعان من الخطأ — لا نوع واحد

تباين الخطأ المطلق

تباين الخطأ النسبي

جرّب بنفسك: أثر حجم العينة

Eρ² وΦ — متى تستخدم أيهما؟

🗺️ دليل اختيار المعامل المناسب

دراسة G ≠ دراسة D بالضرورة!

دراسة G (متقاطعة كاملاً)

دراسة D (يمكن أن تكون مختلفة)

كون التعميم أضيق

المرونة هي الميزة الأكبر

الدروس المستخلصة

🔗 القاعدة الذهبية للتحويل

📐 درجة الكون = الهدف الأسمى

⚖️ خطأن — لا خطأ واحد

🎯 معاملان — لسؤالين مختلفين

من درجة الكون
إلى قرار موثوق