دانستنی های علمی و آماری و گوناگون

علمی، آماری، پژوهشی، اجتماعی و ....

یکی از دوستان درخواست کردند که در رابطه با رگرسیون مطلبی رو توی وبلاگ قرار بدم و درباره رگرسیون گام به گام توضیح خواسته بودند.

اگر بخواهیم واژه رگرسيون(Regression) را از لحاظ لغوی تعریف نماییم ، این واژه در فرهنگ لغت به معني پسروی، برگشت و بازگشت است. اما اگر آن را از دید آمار و ریاضیات تعریف کنیم اغلب جهت رساندن مفهوم "بازگشت به يک مقدار متوسط يا ميانگين” به کار مي رود. بدين معني که برخي پديده ها به مرور زمان از نظر کمي به طرف يک مقدار متوسط ميل مي کنند.
بيش از 100 سال پيش در سال 1877 فرانسيس گالتون (Francis Galton) در مقاله اي که در همين زمينه منتشر کرد اظهار داشت که متوسط قد پسران داراي پدران قد بلند ، کمتر از قد پدرانشان مي باشد . به نحو مشابه متوسط قد پسران داراي پدران کوتاه قد نيز بيشتر از قد پدرانشان گزارش شده است. به اين ترتيب گالتون پديده بازگشت به طرف ميانگين را در داده هايش مورد تأکيد قرار داد . براي گالتون رگرسيون مفهومي زيست شناختي داشت اما کارهاي او توسط کارل پيرسون (Karl Pearson) براي مفاهيم آماري توسعه داده شده . گرچه گالتون براي تأکيد بر پديده "بازگشت به سمت مقدار متوسط" از تحليل رگرسيون استفاده کرد، اما به هر حال امروزه واژه تحليل رگرسيون جهت اشاره به مطالعات مربوط به روابط بين متغيرها به کار برده مي شود . 
در حقيقت تحليل رگرسيوني فن و تکنيکي آماري براي بررسي و مدل سازي ارتباط بين متغيرها است. رگرسيون تقريباً در هر زمينه اي از جمله مهندسي، فيزيک، اقتصاد، مديريت، علوم زيستي، بيولوژي و علوم اجتماعي براي برآورد و پيش بيني مورد نياز است . مي توان گفت تحليل رگرسيوني، پرکاربردترين روش در بين تکنيک هاي آماري است. 
برای انجام یک تحلیل رگرسیونی ابتدا تحليل گر حدس مي زند که بين دو متغير، نوعي ارتباط وجود دارد، در حقيقت حدس مي زند که يک رابطه به شکل يک خط بين دو متغير وجود دارد و سپس به جمع آوري اطلاعات کمي از دو متغير مي پردازد و اين داده ها را به صورت نقاطي در يک نمودار دو بعدي رسم مي کند. 



همانطور که بیان گردید رگرسیون یکی از مهمترین تکنیک ها برای تحلیل داده ها و استخراج اطلاعات است، اما نکته ای که باعث گردیده این تکنیک از جایگاه مهمی در تحلیل ها برخوردار باشد شیوه های مختلف تحلیل های رگرسیونی است. به عنوان مثال رگرسیون خطی ساده، رگرسیون خطی چندگانه، رگرسیون فازی، رگرسیون لجستیک و ... نمونه هایی از انواع رگرسیون محسوب می شود. این تنوع باعث شده که بتوان به راحتی هر نوع داده ای ( اغلب از نوع داده های پیوسته ) را تحلیل کرد و به راحتی نتیجه گیری نمود. که در ادامه هر یک از این روش ها به طور کامل تبیین خواهد گردد.

علت دیگری که باعث شده این روش علاقه مندان بیشتری پیدا کند، نرم افزارهای متنوعی است که قابلیت انجام این تحلیل ها را دارند. به عنوان مثال می توان نرم افزار Excel (که ساده ترین نرم افزار است) و SPSS ، S-Plus ( S+) ، SASو ... نام برد.



نوشته شده در تاريخ دوشنبه 1389/11/25 توسط مهدی سلطانی