Generalizability Theory — Brennan
دليل بصري شامل للرموز والمفاهيم الأساسية في نظرية القياس الأكثر قدرةً على استيعاب تعدد مصادر الخطأ وتكميمها
كل رمز في نظرية إمكانية التعميم يحمل معنى دقيقاً. فهم هذه الرموز هو المفتاح لقراءة معادلات التباين وتفسير نتائج الدراسات.
| الرمز | المعنى |
|---|---|
| n | حجم عينة دراسة G لوجهٍ من الأوجه — عدد مستويات الوجه المُدرَجة في الدراسة |
| N | حجم الوجه في كون الملاحظات المقبولة — العدد الإجمالي في المجتمع |
| α | أثر، أو المؤشرات الداخلة في أثر معيّن — مجموعة الوجوه التي يشملها التأثير |
| α̇ | المؤشرات غير الداخلة في α — مكملة α في التصميم الكامل |
| ω | جميع المؤشرات في تصميم دراسة G — الفضاء الكامل للتأثيرات |
| Xω | درجة ملحوظة في تصميم دراسة G — القياس الفعلي المأخوذ في ظل التصميم |
| μα | متوسط المجتمع و/أو الكون بالنسبة إلى α — القيمة الحقيقية المتوسطة |
| να | أثر الدرجة المرتبط بـ α — الانحراف عن المتوسط الكوني المنسوب إلى α |
| π(α̇) | حاصل ضرب أحجام العينات للمؤشرات غير الموجودة في α — لحساب التباين المتوقع |
| df(α) | درجات الحرية الخاصة بـ α — تحدد موثوقية تقديرات مكونات التباين |
| SS(α) | مجموع المربعات لـ α — أساس حساب متوسطات المربعات في ANOVA |
| MS(α) | متوسط المربعات لـ α — نسبة SS إلى درجات الحرية |
| EMS(α) | متوسط المربعات المتوقع لـ α — الصيغة النظرية التي تربط MS بمكونات التباين |
| σ²(α) | مكوّن تباين التأثيرات العشوائية في دراسة G لـ α — الكمية الأساسية في النظرية |
| σ²(α|M) | مكوّن تباين دراسة G لـ α في ظل نموذج M — عند تحديد نموذج إحصائي مقيّد |
| الرمز | المعنى |
|---|---|
| n' | حجم عينة دراسة D لوجهٍ من الأوجه — قد يختلف عن n في دراسة G |
| N' | حجم الوجه في أكوان التعميم — قد يكون محدوداً أو غير محدود (∞) |
| τ | موضوع القياس — غالباً τ = p (الشخص) لكنه قد يكون أي وجه آخر |
| ᾱ | أثر في دراسة D — الشرطة فوق الحرف تشير إلى أن الاهتمام بمتوسطات الدرجات |
| σ²(ᾱ) | مكوّن تباين دراسة D لـ α — يُحسب بقسمة مكون G على أحجام عينة D |
| σ²(X̄) | تباين الخطأ عند استخدام X̄ تقديراً لـ μ — يتضمن التباين بين الإجراءات |
| ES²(τ) | تباين الدرجة الملحوظة المتوقع — يساوي σ²(τ) + σ²(δ) في التفسير النسبي |
| σ²(δp) | تباين الخطأ النسبي الشرطي للشخص p — يتفاوت بين الأشخاص في الأساليب غير المتوازنة |
| σ²(Δp) | تباين الخطأ المطلق الشرطي للشخص p — مقياس دقة القياس لشخص بعينه |
إن السعي في المشروعات العلمية يقتضي عناية دقيقة بإجراءات القياس، إذ إن الغرض من هذه الإجراءات هو الحصول على معلومات عن سمات أو خصائص معينة للأشياء. غير أن المعلومات المتحصلة من أي إجراء قياس تكون عرضة للخطأ بدرجة ما. ويتضح ذلك حتى في إجراءات قياس تبدو غير مثيرة للجدل، مثل الإجراء المستخدم لربط قيمة عددية بطول جسم ما. فمن الواضح أن القياسات المتحصلة قد تختلف باختلاف ظروف قياس متعددة، مثل المسطرة المستخدمة، أو الشخص الذي يسجل القياس، أو ظروف الإضاءة، وما شابه ذلك.
ومع أن جميع القياسات قابلة للخطأ إلى حد ما، فإن العلماء يسعون إلى طرائق تزيد من دقة القياس. ولتحقيق ذلك، فإنهم كثيراً ما يأخذون متوسط القياسات عبر مجموعة فرعية من شروط القياس المحددة سلفاً. ويُعد هذا المتوسط تقديراً للقياس «المثالي» الذي كان سيُحصل عليه افتراضاً إذا أُخذ المتوسط عبر جميع شروط القياس. ومن ثم يبرز سؤال جوهري هو: «كم عدد المرات، ولأي شروط قياس، نحتاج لكي نصل إلى قياس تتوافر فيه دقة مقبولة؟»
«من يملك ساعة واحدة يعرف الوقت، أما من يملك ساعتين فليس متأكداً تماماً من الوقت!»
وثمة طريقة أخرى يلجأ إليها العلماء أحياناً لزيادة دقة القياس، وهي تثبيت شرط واحد أو أكثر من شروط القياس. غير أن اختيار شرط محدد لكل القياسات ينطوي على تقييد لمجموعة شروط القياس التي يُراد التعميم إليها. فتثبيت شرط من شروط القياس يقلل الخطأ ويزيد من دقة القياسات، لكنه يفعل ذلك على حساب تضييق نطاق تفسير تلك القياسات.
«الخطأ» لا يعني الوقوع في غلطة. ما يُعد خطأً في إجراء قياس ما هو — جزئياً — مسألة تعريف. ثمة فرق بين أن نقول إن الخطأ جانب كامن في إجراء القياس، وبين أن نُكمِّم هذا الخطأ ونحدد أي شروط القياس تسهم فيه. والقيام بذلك يقتضي تحديد ما الذي يشكل قياساً «مثالياً» — أي: عبر أي شروط قياس يُقصد التعميم.
وفي التربية وعلم النفس، أُدرجت هذه الأنواع من القضايا تاريخياً تحت عنوان «الثبات». أما نظرية إمكانية التعميم فإنها توسع المفاهيم التقليدية للثبات وتحررها من ضيقها. فالنظرية الكلاسيكية تفترض أن القياس الملحوظ يمكن تفكيكه إلى درجة «حقيقية» T وحدّ خطأ عشوائي واحد غير متمايز E — وهو تبسيط لا يعكس تعقيد مصادر الخطأ الفعلية.
خطأ واحد غير متمايز — لا يميز بين مصادر الخطأ المتعددة كالمقيِّم والموضوع والتفاعل
تفكيك المصادر — كل مصدر من مصادر التباين يُقدَّر بشكل منفصل وصريح
قدّم Fisher (1925) تحليل التباين، فأحدث ثورة في التفكير الإحصائي من خلال مفهوم التجربة العاملية التي تُصنَّف فيها شروط الملاحظة وفق عدة أبعاد. ومن يتبنى خط Fisher في التفكير لا بد أن يتخلى عن مفهوم الخطأ غير المتمايز. فالخطأ الذي كان يُنظر إليه سابقاً على أنه كتلة غير محددة أصبح الآن منسوباً إلى مصادر متعددة، ويمكن لتجربة مناسبة أن تقدّر مقدار التباين الناشئ من كل مصدر قابل للضبط.
من إشكالية الثبات في الاختبارات إلى إطار متكامل لتكميم مصادر الخطأ — رحلة استغرقت أكثر من عقدين
تُمكِّن نظرية إمكانية التعميم الباحث من تحديد مصادر عدم الاتساق في الدرجات الملحوظة — وتقدير مقدارها. وهي توسع النظرية الكلاسيكية من خلال توظيف طرائق تحليل التباين التي تتيح تفكيك مصادر الخطأ المتعددة التي تسهم في E غير المتمايزة.