التعليقات

الارتباط والسبب في الإحصاء

الارتباط والسبب في الإحصاء



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ذات يوم في الغداء ، كانت شابة تأكل وعاءًا كبيرًا من الآيس كريم ، وسار إليها أحد أعضاء هيئة التدريس وقال لها: "كان من الأفضل أن تكون حذرًا ، هناك علاقة إحصائية عالية بين الآيس كريم والغرق". أعطاه نظرة مشوشة ، كما أوضح المزيد. "أيام مع معظم مبيعات الآيس كريم انظر أيضا معظم الناس يغرق".

عندما أنهت الآيس كريم ، ناقش الزميلان حقيقة أنه لمجرد أن أحد المتغيرات يرتبط إحصائياً بمتغير آخر ، فهذا لا يعني أن أحدهما هو سبب الآخر. في بعض الأحيان هناك متغير يختبئ في الخلفية. في هذه الحالة ، يتم إخفاء يوم السنة في البيانات. يتم بيع المزيد من الآيس كريم في أيام الصيف الحارة مقارنة بأيام الشتاء الثلجية. المزيد من الناس يسبحون في الصيف ، وبالتالي يغرقون أكثر في الصيف مقارنةً بالشتاء.

احذر من المتغيرات الكامنة

الحكاية أعلاه هي مثال رئيسي لما يعرف باسم المتغير الكامنة. كما يوحي اسمها ، يمكن أن يكون المتغير الكامنة بعيد المنال ويصعب اكتشافه. عندما نجد أن مجموعتي بيانات رقمية مرتبطتان بقوة ، يجب أن نسأل دائمًا ، "هل يمكن أن يكون هناك شيء آخر يسبب هذه العلاقة؟"

فيما يلي أمثلة على الارتباط القوي الناجم عن متغير الكامنة:

  • متوسط ​​عدد أجهزة الكمبيوتر للشخص الواحد في البلد ومتوسط ​​العمر المتوقع لذلك البلد.
  • عدد رجال الاطفاء عند الحريق والضرر الناجم عن الحريق.
  • ارتفاع طالب المدرسة الابتدائية ومستواه في القراءة.

في جميع هذه الحالات ، تكون العلاقة بين المتغيرات قوية جدًا. يشار إلى هذا عادة بمعامل الارتباط الذي له قيمة قريبة من 1 أو -1. لا يهم مدى قرب معامل الارتباط من 1 أو -1 ، لا يمكن لهذه الإحصائية أن تبين أن أحد المتغيرات هو سبب المتغير الآخر.

الكشف عن المتغيرات الكامنة

بطبيعتها ، من الصعب اكتشاف المتغيرات الكامنة. إحدى الاستراتيجيات ، إن وجدت ، هي فحص ما يحدث للبيانات مع مرور الوقت. يمكن أن يكشف ذلك عن الاتجاهات الموسمية ، مثل مثال الآيس كريم ، الذي يتم حجبه عندما يتم تجميع البيانات معًا. هناك طريقة أخرى هي النظر إلى القيم المتطرفة ومحاولة تحديد ما يجعلها مختلفة عن البيانات الأخرى. في بعض الأحيان يقدم هذا تلميحًا لما يحدث وراء الكواليس. أفضل مسار للعمل هو أن تكون استباقية ؛ افتراضات السؤال وتجارب التصميم بعناية.

لماذا يهم؟

في سيناريو الافتتاح ، افترض أن أحد أعضاء الكونجرس ذي النوايا الحسنة والمجهول إحصائياً اقترح حظر جميع الآيس كريم لمنع الغرق. مثل هذا المشروع من شأنه إزعاج قطاعات كبيرة من السكان ، وإجبار العديد من الشركات على الإفلاس ، وإلغاء الآلاف من الوظائف مع إغلاق صناعة الآيس كريم في البلاد. على الرغم من أفضل النوايا ، فإن مشروع القانون هذا لن يقلل من عدد الوفيات الغارقة.

إذا كان هذا المثال يبدو بعيد المنال ، ففكر فيما يلي ، وهو ما حدث بالفعل. في أوائل القرن العشرين ، لاحظ الأطباء أن بعض الأطفال يموتون في ظروف غامضة أثناء نومهم بسبب مشاكل في الجهاز التنفسي. وكان هذا يسمى الموت سرير ، والآن يعرف باسم الدول الجزرية الصغيرة النامية. شيء واحد تمسك به من تشريح الجثث التي أجريت على أولئك الذين ماتوا من SIDS كان الغدة الصعترية الموسع ، غدة تقع في الصدر. من الارتباط بين الغدد الصعترية المتضخمة عند الرضع SIDS ، افترض الأطباء أن الغدة الصعترية الكبيرة بشكل غير طبيعي تسبب في التنفس غير السليم والموت.

كان الحل المقترح هو تقليص الغدة الصعترية التي تحتوي على نسبة عالية من الإشعاع ، أو لإزالة الغدة تمامًا. كان لهذه الإجراءات معدل وفيات مرتفع وأدت إلى مزيد من الوفيات. الأمر المحزن هو أن هذه العمليات لم يكن من الضروري القيام بها. وقد أظهرت الأبحاث اللاحقة أن هؤلاء الأطباء كانوا مخطئين في افتراضاتهم وأن الغدة الصعترية ليست مسؤولة عن SIDS.

الارتباط لا يعني السببية

ما سبق يجب أن يجعلنا نتوقف عندما نعتقد أن الأدلة الإحصائية تستخدم لتبرير أشياء مثل الأنظمة الطبية والتشريعات والمقترحات التعليمية. من المهم أن يتم العمل الجيد في تفسير البيانات ، خاصة إذا كانت النتائج التي تنطوي على ارتباط ستؤثر على حياة الآخرين.

عندما يذكر أي شخص ، "تشير الدراسات إلى أن A هو سبب B وأن بعض الإحصاءات تدعمه" ، تكون جاهزًا للرد ، "لا يعني الارتباط العلاقة السببية". كن دائمًا على اطلاع دائم على ما يتربص أسفل البيانات.


شاهد الفيديو: الإرتباط الخطي البسيط. علم الإحصاء (أغسطس 2022).