انواع متغیرها

یکی از اولین گام ها در انتخاب آزمون آماری مناسب، تعیین نوع متغیر مورد بررسی می باشد.

متغیرها را در سه گونه متفاوت به شرح زیرمی توان دسته بندی نمود:

متغیرهای اندازه گیری[1]
متغیرهای اسمی[2]
متغیرهای رتبه دار[3]

در متغیر اندازه گیری از اعداد برای بیان مقدار متغیراندازه گیری شده استفاده می گردد، برای مثال طول 3/3 میلی مترو یا عملکرد 50 از100نمره. متغیر های اسمی تحت اسامی بیان می گردند مانند گونه های متفاوت ژن در جانوران. درمتغیرهای رتبه دار براساس موقعیت و مرتبه معین می گردند مانند سوم ویا پنجم.

متغیر اندازه گیری

متغیری است که قابلیت اندازه گیری را داشته باشد. این متغیر با عناوین دیگری تحت عنوان متغیر عددی[4] ویا کمی[5] نیز شناخته می شود. متغیرهای اندازه گیری به دو گروه پیوسته و گسسته تقسیم می شوند. برای مثال طول قد با اعداد پیوسته بیان می شود ولی تعداد دندان ها با اعداد گسسته.برای آزمون های آماری که در اینجا مورد بحث و بررسی قرار می گیرد، جای نگرانی برای تفاوت بین اعداد گسسته و پیوسته وجود ندارد. تنها یک استثنا وجود دارد. آن زمانی هست که تعداد مشاهدات گسسته اندک بوده که در آنصورت لازم است تا با متغیر مزبور به مانند متغیر اسمی رفتار شود.برای مثال چنانچه تعداد مهره های پشت در گونه ای از جانوران بین 22 تا 55 باشد، متغیر مورد نظر یک متغیر اندازه گیری است و برای آزمون معنی داری تفاوت میانگین تعداد مهر ها در بین نرها وماده ها از ازمون ها t و یا anova استفاده می شود ولی اگر تعداد مشاهدات در نمونه جمع آوری شده فقط شامل دو عدد باشد. در این صورت متغیر مورد نظر به مانند متغیر اسمی رفتار شده و برای آزمون از آزمون های فیشر، G و یا کای دو استفاده می گردد. از این رو براساس قاعده سرانگشتی[6] چنانچه متغیر اندازه گیری دارای 2 مقدار باشد، توصیه می گردد تا با متغیر اندازه گیری به مانند متغیر اسمی رفتار شود.

متغیر اسمی

متغیرهای اسمی، مشاهدات را به دسته های گسسته طبقه بندی می نماید. برای مثال می توان به مواردی مانندجنسیت(زن یا مرد)، وضعیت مچ دست(نرمال، پیچ خوردگی، شکستگی و کشیدگی) ویا ژن(نوعAA، نوعAa، نوعaa) اشاره نمود.

بر اساس قاعده سر انگشتی، هر مشاهده متغیر اسمی را می توان به صورت کلمه و نه عددتوضیح داد. از این رو متغیر اسمی با دو مقدار به صورت متغیر اسمی تعریف می شود.برای نمونه حالت های “غایب” در مقابل “حاضر” و یا “کم” در مقابل “زیاد” را می توان در نظر گرفت. بنا براین متغیر اسمی داده ها را در گروه های مجزا طبقه بندی می کند. متغیرهای اسمی اغلب به صورت درصد ویا نسبت خلاصه می شوند.

متغیرهای اسمی با اسامی متفاوتی شناخته می شود که از آن جمله می توان به “رسته ای[7]“، “متغیر کیفی[8]“، “گسسته[9]” اشاره نمود.

متغیر رتبه دار

این متغیر با عنوان متغیر ترتیبی[10] هم شناخته می شود. در این متغیر، مشاهدات به ترتیب از کوچکترین به بزرگترین قرار می گیرند گرچه مقدار دقیق آن ها نامعلوم است. مثلا اگر بخواهید بررسی نمایید که آیا نرها و ماده ها درجانوری مثل خرخاکی که می توانند خود را به صورت گلوله درآورند، در یک زمان خود را از شکل گلوله درمی آورند می توانید از این متغیر استفاده نمایید. بدین صورت که اگر زمان دقیق خروج از حالت گلوله شدن را نداشته باشد، اما ترتیب را به صورت اولین، دومین و …… راثبت نمایید، از متغیر رتبه دار برای آزمون استفاده نمودید.

دلیل اصلی اهمیت متغیرهای رتبه دار آن است که آزمون های آماری که برای این متغیرها طراحی شده است ( آزمون های نا پارامتری ) در مقایسه با آزمون های آماری که برای متغیرهای اندازه گیری طراحی شده اند از فروض کمتری برای داده ها برخوردار هستند. از این رو بسیار مرسوم است که داده های متغیر اندازه گیری به رتبه دار تبدیل شده و از آزمون های ناپارامتری استفاده شود.

برای نمونه در مثال خر خاکی ها اگرزمان از حالت گلوله خارج شدن بین 1 تا 2 دقیقه باشد اما برای دو تا از نرها 30 دقیقه طول بکشد، میانگین نرها با این دو مشاهده به شدت تحت تاثیر قرار می گیرد. به نحوی که می تواند تفاوت زمانی بین نرها و ماده ها را معنی دار نشان دهد. اما اگر این مطالعه برحسب رتبه انجام شود، دو مشاهده آخر آن قدر تاثیر گذار نخواهند بود که نتیجه را تغییر دهند. از این رو اگر اختلاف به واقع معنی دار نباشد، احتمال آن که نتیجه گمراه کننده ای بدست آید کمتر خواهد بود.

اندازه گیری برخی از متغیرها غیرممکن هستند. به عنوان مثال، درد اغلب با رتبه ذهنی اندازه گیری می شود.

برای نمونه در این مورد 0 “بدون درد” و 10 “بدترین حالت درد” می توان درنظر گرفت. حال سوال این است که متغیر رتبه بندی شده است یا خیر؟ البته که این یک متغیر اندازه گیری است، حتی اگر”اندازه گیری” توسط مغز فرد انجام شود. مهم این است که آن را در مقیاس “فاصله” استفاده شده است; تفاوت بین درد با امتیاز 2 و 3 همان تفاوت بین درد با امتیاز 7 و 8 است.

درد متغیر رتبه بندی شده خواهد بود اگر درد در زمان های مختلف با یکدیگر مقایسه شود; به فرض، اگر فردی می توانست بگوید که سه شنبه بدترین درد، پنج شنبه بعد از آن دوم بود، چهارشنبه بعد از پنج شنبه و غیره…. این رتبه بندی ها

مقیاس بازه ای ندارد.بدین معنا که تفاوت بین سه شنبه و پنجشنبه ممکن است بسیاربزرگتر، یا بسیار کوچکتر، از تفاوت بین پنجشنبه و چهارشنبه. علاوه برآن، اگر تعداد بسیار کمی گزینه وجود داشته باشد، بهتر است آن را به عنوان یک متغیر اسمی درنظر بگیریم.

[1] measurement

[2] nominal

[3] ranked

[4] numeric

[5] quantitative

[6] thump rule

[7] categorical

[8] Attribute or qualitative variable

[9] discrete

[10] ordinal