فیدیبو نماینده قانونی دانشگاه امام صادق (ع) و بیش از ۶۰۰ ناشر دیگر برای عرضه کتاب الکترونیک و صوتی است .
کتاب خودآموز تحلیل آماری پیشرفته با SPSS, LISREL, AMOS

کتاب خودآموز تحلیل آماری پیشرفته با SPSS, LISREL, AMOS

نسخه الکترونیک کتاب خودآموز تحلیل آماری پیشرفته با SPSS, LISREL, AMOS به همراه هزاران کتاب دیگر از طریق فیدیبو به صورت کاملا قانونی در دسترس است.


فقط قابل استفاده در اپلیکیشن‌های iOS | Android | Windows فیدیبو

با کد تخفیف fdb40 این کتاب را در اولین خریدتان با ۴۰٪ تخفیف یعنی ۷,۰۲۰ تومان دریافت کنید!

درباره کتاب خودآموز تحلیل آماری پیشرفته با SPSS, LISREL, AMOS

گفته شد که هر پدیده‌ای از نظمی پیروی می‌کند و همچنین اشاره شد که توزیع نرمال نظم بسیاری از واقعیات را می‌تواند تبیین کند. حال سؤالی که مطرح است این است که این توزیع‌ها به چه دردی می‌خورند؟ اینکه بدانیم واقعیت پدیده‌ای مثلاً از توزیع نرمال پیروی می‌کنه چه فایده‌ای دارد؟ در جواب این پرسش باید گفت که وقتی ما نظم وقوع یک پدیده را شناسایی کرده و می‌فهمیم که فلان توزیع بیانگر نظم وقوع پدیده‌ای مانند دیر کردن استاد سر کلاس است‌، می‌توان از این نظم برای پیش‌بینی آینده استفاده نمود. در واقع دانستن توزیع آماری وقوع پدیده‌ها به این درد می‌خورد که می‌توان آینده وقوع آن پدیده را پیش‌بینی نمود و این همان کار علم است. با انتگرال‌گیری از منحنی‌های پیوسته توزیع‌های آماری از جمله توزیع نرمال می‌توان فهمید که احتمال وقوع اندازه‌های مختلف یک پدیده چقدر است. مثلاً اگر اشتباهات یک کارگاه تولیدی از نظم نرمال پیروی کرده باشد، می‌توان پیش‌بینی نمود که امروز چقدر احتمال دارد که این شرکت فلان مقدار خطا داشته باشد و ضایعات تولید کند و اگر از مقدار گفته شده بیشتر است این از یک امر غیر طبیعی پیروی می‌کند و می‌بایست این دلیل غیر طبیعی را کشف نمود.

ادامه...

بخشی از کتاب خودآموز تحلیل آماری پیشرفته با SPSS, LISREL, AMOS

شما به آخر نمونه کتاب رسیده‌اید، برای خواندن نسخه کامل، کتاب الکترونیک را خریداری نمایید و سپس با نصب اپلیکیشن فیدیبو آن را مطالعه کنید:


سخن ناشر

فلسفه وجودی دانشگاه امام صادق(ع) که از سوی ریاست دانشگاه به کرات مورد توجه قرار گرفته، تربیت نیروی انسانی ای متعهد، باتقوا و کارآمد در عرصه عمل و نظر است تا از این طریق دانشگاه بتواند نقش اساسی خود را در سطح راهبردی به انجام رساند.
از این حیث «تربیت» را می توان مقوله ای محوری یاد نمود که وظایف و کارویژه های دانشگاه، در چارچوب آن معنا می یابد؛ زیرا که «علم» بدون «تزکیه» بیش از آنکه ابزاری در مسیر تعالی و اصلاح امور جامعه باشد، عاملی مشکل ساز خواهد بود که سازمان و هویت جامعه را متاثر و دگرگون می سازد.
از سوی دیگر «سیاست ها» تابع اصول و مبادی علمی هستند و نمی توان منکر این تجربه تاریخی شد که استواری و کارآمدی سیاست ها در گرو انجام پژوهش های علمی و بهره مندی از نتایج آنهاست. از این منظر پیشگامان عرصه علم و پژوهش، راهبران اصلی جریان های فکری و اجرایی به حساب می آیند و نمی توان آینده درخشانی را بدون توانایی های علمی ـ پژوهشی رقم زد و سخن از «مرجعیت علمی» در واقع پاسخ گویی به این نیاز بنیادین است.
دانشگاه امام صادق(ع) درواقع یک الگوی عملی برای تحقق ایده دانشگاه اسلامی در شرایط جهان معاصر است. الگویی که هم اکنون ثمرات نیکوی آن در فضای ملی و بین المللی قابل مشاهده است. طبعاً آنچه حاصل آمده محصول نیت خالصانه و جهاد علمی مستمر مجموعه بنیان گذاران و دانش آموختگان این نهاد است که امید می رود با اتکاء به تاییدات الهی و تلاش همه جانبه اساتید، دانشجویان و مدیران دانشگاه، بتواند به مرجعی تمام عیار در گستره جهانی تبدیل گردد.
معاونت پژوهشی دانشگاه امام صادق(ع) باتوجه به شرایط، امکانات و نیازمندی جامعه در مقطع کنونی با طرحی جامع نسبت به معرفی دستاوردهای پژوهشی دانشگاه، ارزیابی سازمانی ـ کارکردی آن ها و بالاخره تحلیل شرایط آتی اقدام نموده که نتایج این پژوهش ها درقالب کتاب، گزارش، نشریات علمی و.... تقدیم علاقه مندان می گردد. هدف از این اقدام ـ ضمن قدردانی از تلاش خالصانه تمام کسانی که با آرمان و اندیشه ای بزرگ و ادعایی اندک در این راه گام نهادند ـ درک کاستی ها و اصلاح آنها است تا از این طریق زمینه پرورش نسل جوان و علاقه مند به طی این طریق نیز فراهم گردد؛ هدفی بزرگ که در نهایت مرجعیت مکتب علمی امام صادق(ع) را در گستره بین المللی به همراه خواهد داشت (ان شاءالله).

وللّه الحمد
معاونت پژوهشی دانشگاه

فصل اول : کلیات آمار

تاریخچه ای از نگرش های علمی قدیم و جدید

پیش از دوران نوزایی یا رنسانس(۱) در اروپا، مبنای علم استدلال و ابزار گسترش علم، منطق بود. به این نوع از نگاه به علم، نگاه اسکولاستیک(۲) یا مکتب مدرسی گفته می شود.
در اروپا و در قرون وسطی، علم و حکمت تنها در مدارس و کلیساها تدریس می شد؛ بنابراین مجموعه علم و حکمت، منتسب به مدرسه (مدرسی) و به نام اسکولاستیک معروف شد و طرفداران این مکتب نیز مَدرَسیّون یا رواقیّون لقب یافتند. این مکتب، از قرن نهم میلادی به وجود آمد و تا قرن پانزدهم رواج داشت. نقش مکتب اسکولاستیک در شکل دادن به نظام اقتصادی در قرون وسطی را نباید نادیده گرفت. دو ویژگی را برای این مکتب می توان برشمرد:
۱. اندیشه ارسطو به خوبی شناخته شد و آموزه های ارسطویی به عنوان عالی ترین مرجع فکری مدرسی ها مورد توجّه قرار گرفت.
۲. مکتب مدرسی، توجه خاص به استدلال قیاسی و احتجاج نظری داشت.
با این حال با شروع رنسانس، فیلسوفی بنام فرانسیس بیکن(۳) در انگلستان مبنای علم را «تجربه» قرار داد و اندکی بعد و در فرانسه رنه دکارت(۴) از نگاهی کمی گرایانه به بنیان های علم استدلالی حمله ور شد. وی فیلسوفی بود که بر بی حاصلی منطق در دریافت علوم تاکید فراوان داشت و چنین استدلال می نمود که منطق با همه درستی و استواری مجهولی را معلوم نمی کند و فایده حقیقی آن دانستن اصطلاحات و دارا شدن قوه فهم ، تفهیم و بیان است زیرا که برهان استخراج نتیجه از مقدمات می باشد. بنابراین هرگاه مقدمات معلوم نباشد، نتیجه ای هم به وجود نخواهد آمد و تنها با قواعد منطقی، معلومی نمی توان به دست آورد ولی اگر مقدمات درست وجود داشته باشد ، نتیجه خود به طور بدیهی وجود داشته و نیازی به کوشش و بحث منطقیان نخواهد بود.
با این مقدمات دکارت علم را فقط به معلوماتی اطلاق می کرد که کاملاً مبرهن و یقینی باشند و جای هیچ شک و شبهه ای باقی نگذارند و از آنجا که او ریاضیات را نمونه کامل علم می دانست ، معتقد بود برای کشف مجهولات می بایست به همان روشی که ریاضی دانان پیش می روند باید کار کرد و برای همین در کشف مجهولات و تعیین ماهیت یا حدود پدیده ها بیان می کرد که تا می توانیم باید این حدود را به عدد و ریاضیات درآوریم.
در مجموع می توان گفت که سعی دکارت بیش تر ریاضی وار کردن شناسایی اشیای مادی بود. بدین طریق، او کوشید کمیّات را جانشین کیفیّات کند و از این رهگذر، منطق ارسطویی را برچیده، منطق و روش خود را استوار سازد. در شناسایی یقینی اشیای مادی، نزد دکارت، دیگر خبری از کیفیات نبود؛ همه چیز بر اساس منطقی جدید پایه ریزی می شد که بر اساس اندازه گیری و سنجش صورت می پذیرفت. این کار دکارت، در معرفت اشیاء، به تمام جنبه های معرفتی او نیز سرایت کرد. بی تردید، آنچه در فلسفه دکارت ریاضیات عمومی(۵) نامیده می شد، تعمیم هندسه تحلیلی(۶) دکارت بر تمام جوانب علم معرفت آدمی است.

دستورات چهارگانه دکارت

از آنجا که ریاضیات برای خود یک سلسله قواعد و پیش فرض ها دارد، دکارت نیز برای منطق جدید خویش قواعدی بنا نمود. او در بخش دوم رساله گفتار در روش(۷) ، اصول و اساس روش خود را به چهار قاعده محدود نمود که آن چهار قاعده عبارت اند از:
  • قاعده اول (بداهت): نباید هیچ چیزی را به عنوان حقیقت پذیرفت، مگر اینکه روشن و بدیهی باشد؛ یعنی وجدان آن را به شهود دریابد.
  • قاعده دوم (تحلیل): باید هر یک از مسائل و مشکلات را تا آنجا که ممکن است و برای بهتر حل کردن آن ضرورت دارد به اجزای خودش تجزیه کرد و هر یک را جداگانه مورد بررسی قرار داد.
  • قاعده سوم (ترکیب): باید افکار خود را به ترتیب به کار انداخت و از ساده ترین و آسان فهم ترین امور آغاز کرد و به تدریج خود را به معرفت پیچیده ترین و مرکب ترین آن ها رسانید.
  • قاعده چهارم (شماره امور): شماره امور باید چنان کامل و بازدید مسائل چنان کلی و جامع باشد که اطمینان حاصل شود چیزی از نظر دور نمانده و فراموش نشده است. این قاعده دنباله و نتیجه سه قاعده اول است.

نگرش تجربی ـ استقرایی فرانسیس بیکن و تفاوت با نگرش ریاضی دکارت

کمی پیش از رنه دکارت ، فیلسوف انگلیسی، فرانسیس بیکن نیز درصدد بود تا شیوه قدما و متاخران را کنار بگذارد؛ زیرا به زعم وی نیز از شیوه ایشان، معلومات جدیدی حاصل نمی شود. روشی که بیکن برای کسب معلومات به کار برد روش تجربه، مشاهده و آزمایش بود که در آن به تجربه و استقراء مشاهدات توجه شایسته می شد و در این روش، معلومات را به طور کامل به صورت تجربه و مشاهدات تجربه عینی در می آورد و به همین لحاظ، روش او به کار علوم طبیعی می آمد. در حالی که دکارت بر آن بود که روش کسب معلومات باید به تمام حوزه های معرفتی بسط داده شود. در روش بیکن، حواس آدمی روزنه ورود داده های مشاهده پذیر بود و معرفت آدمی از طریق استقرای مشاهدات، حاصل می شد. معرفت آدمی از جهان خارج به دست می آمد و او با مشاهده و استقرا، به معرفت جدید دست می یافت. در مقابل دکارت با قایل شدن تقدم برای عقل در برابر تجربه، همه چیز را از خود فکر یا ذهن آغاز می کرد. هدف دکارت عقلانی کردن معرفت و علم آدمی و دادن جهت عقلی به معلومات و کسب معرفت یقینی بود. و از آنجا که دکارت به یقینی بودن ریاضیات اعتقاد کامل داشت و ریاضیات را حد اعلای معرفت آدمی می دانست، معتقد بود معرفت به دست آمده از آن ضروری است و فکر می کرد که در کسب معلومات جدید، باید به روش علمای ریاضی عمل کرد.
با توجه به تفاوت روش و موضوع علم بیکن با فلاسفه پیش از خود ، وی در مورد روش آن ها چنین می گوید:
«روش گذشتگان علم، روش درستی نبوده لذا از علم نتیجه قابلی نگرفته اند و هر نتیجه هم به دست آمده بر سبیل اتفاق بوده است. اشکالات روش پیشینیان یکی در پی نداشتن نتایج عملی است؛ دوم اینکه راه مورد استفاده آن ها را برای رسیدن به معلومات راه درستی نبوده است. چرا که آن ها از قیاس استفاده می کردند که مجهولات به وسیله آن معلوم نمی شود و حقیقت از آن کشف نمی شود».
از نظر او، فایده منطق قدیم ساکت کردن دشمن در مباحثه بوده اما روش مورد نظر بیکن، مطالعه در طبیعت و استخراج قوانین و صور کلی آن ها است؛ او معتقد بود:
«استدلال و تعقل بی ماخذ و بی بنیاد تخیلات و موهومات است و علمی که از آن نتیجه می شود توجیه و تحقیق واقعیات نیست، مجهولات و موضوعات ذهن خود ماست و با احوال حقیقی طبیعت مناسبتی ندارد».
می توان گفت که در اثر تاثیر روش های تبیین شده توسط دکارت و فرانسیس بیکن و پیروان مکاتب ایشان در فرانسه و انگلستان علم دچار پیشرفت های سریع و صریح در سده های اخیر شد. مباحث حرکتی و علّی در فلسفه موجب پیدایش فرمول ها و روابط با عنوان علم فیزیک ، شیمی و غیره شد. با این روش علمی بود که پژوهشگران بر آن شدند برای هر پدیده ای اندازه ای عددی داشته باشند و برای همین هم نیاز شد تا مقیاسی برای این اندازه گیری داشته باشند و برای همین پدیده هایی مانند سرعت ، قدرت ، فاصله و غیره، همگی دارای یک مقیاس برای اندازه گیری شدند. این امر موجب شد تا مفهومی به نام متغیر جای پدیده ها را بگیرد. متغیر وابسته با یک نماد ریاضی جای معلول را گرفت و متغیر مستقل با نمادی دیگر و با مقیاسی عددی جای علت را به خود اختصاص داد.
به عنوان مثال در فلسفه بیان می شد که هر جسم متحرک دارای نیرویی است که این نیرو از حرکت و جسم بودن آن گرفته شده که می تواند جسم ساکن را به حرکت درآورد. از دیدگاه علم جدید و کمی سازی علم این موضوع به قانون نیوتن تبدیل شد. که در آن حاصل ضرب میزان جرم یک جسم متحرک در شتاب حرکتی آن موجب ایجاد نیرویی می شود که این نیرو می تواند جسم دیگر را به حرکت درآورد. این قانون کمی شده سه متغیر نیرو (F) ، شتاب (a) و جرم (m) را به صورت متغیرهایی درآورده و رابطه علی ـ معلولی آن ها را به صورت فرمول زیر ارائه کرد:
F=m.a
چنین موضوعی با دیدگاه دیگر قانون انیشتین را شکل داد که در آن انرژی با جرم و سرعت در رابطه است و داریم:
E=m.c2
در این روش علمی سرعت، شتاب ، جرم، انرژی و نیرو، دارای مقیاسی برای اندازه گیری شدند و بدین ترتیب با کمک رابطه ریاضی بین آن ها با هر میزان از این متغیرها می توان مقدار دیگران را پیش بینی نمود. همان طور که دیده می شود در پی این کمی سازی قابلیت پیش بینی نیز به خواص پیشین تحقیقات علی ـ معلولی یعنی حذف و تضعیف معلول نامطلوب و تقویت و ایجاد معلول نامطلوب اضافه شد. یعنی با داشتن مقدار یک یا چند متغیر می توان دیگر مقدار دیگر متغیرها را بدون اندازه گیری شناسایی نمود. به علاوه همان طور که دیده می شود به دنبال ریاضی کردن پدیده ها بود که در علت یابی برای یک معلول مهم درجه علیت نیز مشخص شد. اینکه چه علتی تا چه درجه ای و با چه میزان عددی موجب پیدایش یک معلول می شود. با توجه به این امر ، علم با دقت بیشتری از قبل رشد کرد و عالمان و دانشمندان از کلی گویی و مبهم گویی به جزئی نگری و دقت رسیدند. به همین علت دقت کشف های علمی نیز بیش از پیش شده و بنابراین کارکرد های علم همچون پیش بینی ، تبیین و ارائه راه حل و غیره نیز با دقت بیشتری صورت گرفت .

تعریف علم جدید و رابطه آن با آمار

اگر قرار باشد معنی علم را با تفسیر تجربی که بیکن و دیگران صورت داده اند ، تعریف کنیم باید گفت که می توان علم را هر آنچیزی دانست که بتوان تجربه کرده و آن را دقیقاً ثبت کرد. در این تعریف کار علم شناسایی پدیده های محسوس جهان و روابط بین آن هاست. چنین علمی را علم تجربی و به اصلاح مشهور ساینس(۸) می نامند. در این تعریف هر آنچه که نمی تواند محسوس باشد در دایره علم نمی گنجد.
در تعریف دیگر علم را هر نوع از آگاهی می دانند که می تواند در مورد پدیده های محسوس و غیر محسوس سرایت داشته باشد. در این نوع از تعریف علم به معنای آگاهی و به اصطلاح نالج(۹) دانسته می شود. در این نوع از تعریف موضوعاتی مانند عرفان ، فقه ، ادبیات و مباحث دینی نیز جزء علم دانسته می شوند.
حال باید دانست همان طوری که منطق ابزار علم با نگرش قدیمی دانسته می شد ، آمار ابزاری در کنار منطق و قدرتمندتر از آن به کمک علم تجربی با نگرش جدید آمده و روابط بین پدیده ها را به صورت کمی در آورده و بین آن ها رابطه ریاضی (فرمول) ایجاد می کند. به نظر می رسد آمار ابزاری است که هم می تواند تجربی بودن و محسوس بودن علم را که نظر فرانسیس بیکن و مکتب فلسفی انگلستان بود را پشتیبانی کند و هم ریاضی وار کردن شناخت جهان را که خواسته رنه دکارت و برخی از پیروانش در فرانسه بود. آمار روابط بین پدیده های مادی و محسوس را به صورت ریاضی بیان می کند. در واقع همان طور که در تعریف رنسانسی علم کار علم مشخص کردن رابطه بین پدیده هاست ، کار آمار نیز به اندازه ، شمارش و ریاضی درآوردن این رابطه ها ست و بنابراین همان طور که دیده می شود روابط بین علم جدید و تجربی و آمار بسیار در هم تنیده است.

آمار توصیفی و استنباطی

علم آمار را می توان از منظر احتمالی بودن یا غیر احتمالی بودن و یا از نظر سطح بررسی به دو دسته زیر تقسیم نمود:
۱- آمار توصیفی(۱۰): آماری که در آن تمامی آحاد جامعه یا تمام پدیده ها مورد بررسی قرار گرفته و اندازه گیری می شوند. نتایج این نوع از آمار در صورت عدم اشتباه در اندازه گیری ها غیر احتمالی بوده و می تواند قطعی باشد.
۲- آمار استنباطی(۱۱): آماری که تنها بخشی از جامعه یا پدیده به صورت گزینشی مورد بررسی قرار گرفته و اندازه گیری می شوند. در این نوع از آمار نتایج با درصدی از احتمال خطا به تعداد بیشتری تعمیم داده می شود. این نوع از آمار احتمالی است.
به طور مثال وقتی می خواهیم میانگین در آمد دانشجویان کلاس را محاسبه کنیم، اگر درآمد همه افراد را محاسبه کنیم و پارامترهایی مانند میانگین ، انحراف معیار، ضریب تغییرات ، ضریب چولگی و دیگر پارامترهای مورد نظر را حساب کنیم از آمار توصیفی استفاده کرده ایم. ولی زمانی که می خواهیم آمار حقوق کارکنان نفت کل کشور را به دست بیاوریم، به صورت گزینشی عمل کرده، نمونه هایی را مورد اندازه گیری قرار می دهیم و سپس سعی داریم نتایج به دست آمده از این نمونه ها را با درصدی از احتمال درستی (و یا درصدی از احتمال خطا) به تمامی جامعه آماری یعنی کارکنان نفت کشور تعمیم دهیم. به این روش استنباطی آماری یا آمار استنباطی می گوییم.

آمار پارامتریک و ناپارامتریک

آمار استنباطی خود به دو دسته آمار پارامتریک و ناپارامتریک تقسیم می شود.
آمار پارامتریک(۱۲): آماریست استنباطی که در آن یکسری شروط برقرار است. مهمترین شرط نرمال بودن داده هاست . در این نوع از آمار فرمول ها پیچیدگی کمتری دارند و از طریق اندازه ها کار می کند.
آمار ناپارامتریک(۱۳): اگر جامعه شرط هایی مثل نرمال بودن را نداشته باشد از آمار ناپارامتریک استفاده می کنیم که در آن فرمول ها پیچیدگی بیشتری دارند. در اینجا به جای استفاده از خود اندازه های نمونه ها از طریق رتبه نمونه ها در کل نمونه گیری کار محاسبات صورت می گیرد . به عنوان مثال به جای اینکه با اندازه وزن افراد سر و کار داشته باشیم ابتدا افراد نمونه را از نظر وزن از نفر اول تا مثلاً صدم مرتب کرده و به هر یک از افراد به جای اندازه وزنشان یک رتبه یک تا صد می دهیم. سپس کارها و محاسبات آماری را با این اعداد رتبه صورت می دهیم نه با اندازه های وزن افراد.

جامعه آماری

جامعه آماری(۱۴) قسمتی از جهان است که می خواهیم در آن حیطه جهان را از موضوعی و از منظری مورد شناسایی قرار دهیم . جامعه آماری مجموعه ایست از واحدهای محسوس جهان واقعی که لااقل در یک ویژگی با هم مشترک باشند. مثل مجموعه دانشجویان یا مجموعه کارکنان شرکت مخابرات.

نمونه آماری

نمونه آماری(۱۵) عضوی است از جامعه که نماینده ویژگی مورد نظر از جامعه باشد. وقتی تعداد معدودی از اعضای یک جامعه را انتخاب می کنیم یعنی نمونه گیری کرده ایم و افرادی را انتخاب کردیم که یک ویژگی تایید شده از جامعه را دارا بوده اند و آن مثلاً عضو شرکت مخابرات بودن است.

دلیل نمونه گیری (هزینه، وقت، خرابی جامعه و...)

گفته شد که در آمار استنباطی با انجام کار نمونه گیری نتایج را با درصدی از اطمینان به کل جامعه سرایت می دهیم. دلیل نمونه گیری را می توان در موضوعاتی همچون لزوم کاهش هزینه، کاهش زمان تحلیل و نتیجه گیری و کاهش خرابی جامعه دانست. به عنوان مثال اگر بخواهیم تمام تولیدات لامپ یک شرکت را آزمایش کنیم این کار بی معنی است چون دیگر لامپ ها یک بار مصرف شده و از بین می روند و عمرشان کم می شود.

توزیع آماری چیست؟

اگر اعتقاد داشته باشیم که جهان منظم است و هر چیزی بدون نظم نیست و اگر این فرض را بپذیریم که هر نظمی را می توان با روابط ریاضی نشان داد پس می توان هر واقعیت ، پدیده یا رفتاری را به صورت ریاضی ، احتمالات و روابط مشروط نشان داد .
توزیع های آماری روابطی ریاضی هستند که در این جهت شکل گرفته اند. یک توزیع آماری نشان دهنده یک نظم رفتاری در لااقل یکی از رفتارهای پدیده های محسوس می باشد. در همین راستا تمام توزیع های آماری به صورت یک تابع نمایش داده می شوند که به آن تابع توزیع تصادفی می گوییم. این توابع همان طوری که نظمشان را به صورت یک نمودار نشان می دهند در دنیای ریاضیات به صورت یک فرمول ریاضی خود را نشان می دهند که متناظر همان تابع رسم شده می باشند.
اگر بخواهیم یک توزیع آماری را به روش مختصات دکارتی یعنی در دو بعد مدرج شده در فضای رسم یک صفحه نشان دهیم ، اندازه های متغیر تصادفی (پدیده) (هر موجودیتی در جهان که اندازه هایش در طول زمان تغییر می کند) را در محور x و احتمال وقوع آن پدیده را در محور y قرار می دهیم.
به طور مثال می توان توابع توزیعی برای هر یک از پدیده های وزن ، قد یا نمرات دانشجویان رسم نمود. البته قبل از این کار باید فرمول این توزیع ها را که همان نظم وقوع آن هاست را دانسته و یا کشف نمود. توزیع های آماری را می توان از منظر نوع پیدایش و ظهور در عالم واقعی و خارج از ذهن به دو دسته توزیع های آماری گسسته و توزیع های آماری پیوسته تقسیم بندی نمود.

توزیع های آمار گسسته

یک توزیع، توزیع آماری گسسته توزیعی است که در آن پدیده ها به گونه ای و با مقیاسی تعریف شده اند که ظهور واقعی آن ها با هر عددی قابل اندازه گیری نیست. به عنوان مثال وقتی مقیاس اندازه گیری انسان ها نفر قرار داده شده باشد ما انسان ها را تنها با اعداد صحیح می توانیم شمارش کنیم و به همین دلیل پدیده تعداد انسان پدیده ای است که اگر نظمی را بخواهیم در مورد آن بیان کنیم نظم مورد نظر حالت گسسته خواهد داشت چون مثلاً یک نفر و نصفی بی معنی است. پس در کل می توان گفت در توزیع های گسسته محور x ها (اندازه پدیده یا متغیر تصادفی) تعداد محدودی به خود می گیرد. مثل برگ درخت که تعدادش مشخص است. مثلاً ۵ /۱ یا ۷۵/ ۱ برگ نداریم. شکل این نوع از توزیع به صورت نقطه نقطه خواهد بود. نمودار ۱-۱ نمونه ای از یک توزیع آماری گسسته را نشان می دهد. فرض کنیم این ستون ها بیانگر نظم موجود در ریزش برگ درختان در یک روز پائیزی می باشند. در این نمودار محور افقی تعداد ریزش برگ از یک درخت در یک روز بوده و محور عمودی احتمال آن تعداد ریزش را نشان می دهد. در این تصویر به عنوان مثال تعداد ریزش کم (مثل یک یا دو عدد) برگ درخت احتمال کمتری را نشان می دهد چون ارتفاع این نقاط در محور عمودی کم است. بیشترین احتمال ریزش برگ درخت در عدد ۷ می باشد. هر چه از عدد هفت به دو طرف دور می شویم احتمال آن تعداد ریزش برگ درخت کمتر می شود، به طوری که کمترین احتمال ریزش ۱۲ عدد برگ و همچنین دو عدد برگ درخت می باشد. این نمودار همچنین نشان می دهد که برگ این درخت بیش از ۱۲ عدد و کمتر از ۲ عدد نخواهد ریخت. بدیهی است که مجموع این احتمالات ممکن باید برابر عدد ۱ شود. بنابراین ارتفاع این ستون ها را مجموعاً باید برابر عدد یک دانست. این موضوع در تمامی توابع احتمال چه گسسته و چه پیوسته صدق می کند.



نمودار ۱-۱: نمونه ای از یک توزیع آماری گسسته

برای نشان دادن توزیع های آماری گسسته هم می توان از نمودارهای ستونی و هم از نمودار های نقطه ای استفاده نمود. نمودار ۲-۱ نمونه ای از نمایش یک توزیع آماری به صورت نقطه ای را نشان می دهد.



نمودار ۲-۱: نمونه ای از یک توزیع آماری گسسته به صورت نقطه ای

انواع توزیع های آماری گسسته

توزیع های گسسته انواع مختلفی دارند. توزیع هایی همچون توزیع دو جمله ای(۱۶) ، پواسن(۱۷) ، هندسی(۱۸) ، دوجمله ای منفی(۱۹)، فوق هندسی(۲۰) و یکنواخت گسسته(۲۱) نمونه هایی از توزیع های آماری گسسته هستند. از آنجا که این کتاب قصد وارد شدن به جزئیات توزیع های آماری را ندارد، تنها به معرفی مختصر توزیع آماری دو جمله ای به عنوان مشهورترین توزیع آماری گسسته اکتفا می شود.

توزیع دو جمله ای نمونه یک توزیع آماری گسسته مشهور

یک توزیع دو جمله ای برای پدیده هایی کاربرد دارد که در آن دو حالت بیشتر وجود ندارد. یکی از این دو حالت خواسته ماست که به آن موفقیت و حالت دوم طرف مقابل آن است که شکست نام دارد. وضعیت به گونه ای است که پیروزی و شکست از هم مستقل می باشند. مثل بازی در فوتبال جام حذفی که در آن تیم ما یا پیروز خواهد بود یا شکست خواهد خورد. یا واقعیت باران آمدن در یک روز که یا خواهد آمد و یا نخواهد آمد.
نمودار این توزیع بنا بر اینکه احتمال موفقیت چقدر باشد و اینکه آزمایش چند بار تکرار شود متفاوت خواهد بود. نمودار ۳-۱ سه حالت مختلف از این توزیع را نشان می دهد. به عنوان مثال در این نمودار ، نمودار کوتاهتر که در سمت راست قرار دارد. حالتی است که در آن احتمال موفقیت ۵۰% بوده و آزمایش ۴۰ بار تکرار شده است. مثلاً دانشجویی ۵۰% احتمال داشته باشد که در هر امتحان موفق شود. حال اگر او ۴۰ بار امتحان بدهد احتمال موفقیت او به صورت نمودار سمت راست خواهد بود. همان طور که دیده می شود بیشترین احتمال در این خواهد بود که او در این ۴۰ بار امتحان ۲۰ بار موفق شود چون در نمودار دیده می شود برای عدد ۲۰ بار نقطه مربوطه دارای بالاترین ارتفاع (احتمال وقوع) می باشد.



نمودار ۳-۱: شکل توزیع دو جمله ای در سه حالت انتخابی از حالات مختلفی آن

توزیع آماری پیوسته

توزیع های پیوسته توزیع هایی هستند که در آن ها محور x ها یا متغیر تصادفی (اندازه پدیده) هر اندازه و مقداری به خود می گیرد. مثل زمان دیرآمدن استاد که هر عدد و زمانی می تواند باشد. توزیع های آماری مشهوری همچون توزیع نرمال(۲۲) ، تی استیودنت(۲۳) ، اف(۲۴) ، کای دو(۲۵) و نمایی(۲۶) وجود دارند که در این فصل تنها به توزیع آماری نرمال به عنوان مشهورترین و پر کاربردترین توزیع آماری پرداخته می شود.
قبلاً اشاره شد که هر توزیع آماری (چه پیوسته و چه گسسته) یک فرمول دارد. اولین چیزی که باید بدانیم این است که اگر از منحنی های توزیع آماری پیوسته انتگرال بگیریم، انتگرال زیرمنحنی باید برابر ۱ شود.



اگر از تابع( f(x از a (سمت چپ جایی که خط شروع شده ـ کوچک ترین عددی که می تواند تابع به خودش بگیرد) تا b (سمت راست جایی که خط تمام می شود ـ بزرگ ترین عددی که می تواند تابع به خود بگیرد) انتگرال بگیریم. انتگرالش برابر با ۱ می شود.
حالا این b، a براساس شرایط مسئله متغیر است (از نقطه a تا b نمودار انتگرال می گیریم).

توزیع نرمال

از نظر تاریخی توزیع نرمال ابتدا در قرن هجدهم و در مقاله ای توسط آبراهام دموار(۲۷) ارائه شد. با این حال نتایج تحلیل های صورت گرفته در زمینه توزیع نرمال در کتاب «تئوری تحلیلی احتمالات» در سال ۱۸۱۲ توسط لاپلاس(۲۸) توسعه یافت. به همین دلیل توزیع نرمال گاهی با عنوان تئوری دموار ـ لاپلاس خوانده می شود. کاربرد واقعاً مفید این توزیع در سال ۱۸۰۹ آشکار شد، وقتی که کارل فردریک گاوس (۲۹)ریاضیدان مشهور آلمانی آن را به عنوان بخش سازنده و مکمل روش خود برای پیشگویی مکان پدیده های نجومی به کار برد. از آن تاریخ به بعد این توزیع را توزیع گوسی نیز می نامند. در نیمه دوم قرن ۱۹ اغلب آماردانان بر این باور شدند که بسیاری از دادها دارای هیستوگرام هایی هستند که ساختار زنگی شکل گوسی دارند. در واقع این اعتقاد پدید آمد که هر مجموعه داده ای که طبیعی یا نرمال باشد توزیع آن چنین شکلی دارد (مثل قد، وزن یا هوش افراد مختلف جامعه). از این دوران به بعد به پیروی از کارل پیرسون(۳۰) آماردانان انگلیسی در اغلب موارد منحنی گوسی را به طور ساده منحنی نرمال نامیدند. نمودار این توزیع را می توان در نمودار ۴-۱ ملاحظه نمود. همان طور که دیده می شود تابع چگالی احتمال این توزیع تصادفی تک مدی است و مکان قله آن در نقطه میانگین آن قرار دارد. همچنین میانه و میانگین این توزیع یکسان است. شکل و اندازه این توزیع به دو پارامتر میانگین و انحراف معیار وابسته است. در تصویر ۴-۱ چهار شکل مختلف از نمودار توزیع نرمال با میانگین ها و انحراف معیارهای مختلف نشان داده شده است.
اگر در این توزیع میانگین برابر صفر و انحراف معیار برابر یک باشد ، نمودار ایجاد شده را نمودار نرمال استاندارد می نامیم. تصویر ۵-۱ نیز حالات مختلف مقایسه ای توزیع نرمال و همچنین فرمول ریاضی این توزیع را نشان می دهد. که در این فرمول داریم:



π عدد پی= ۳.۱۴ = ثابت است.
e =
 ۲.۷۱ = عدد نپرین = ثابت است.
σ = انحراف معیار= یعنی اعداد ما به طور متوسط چقدر از میانگین فاصله دارند.
μ= میانگین
X= متغیر تصادفی



نمودار ۴-۱: شکل توزیع نرمال در چهار حالت انتخابی از حالات مختلفی آن



نمودار ۵-۱ : فرمول نرمال استاندارد و حالات مختلف آن

خواص توزیع نرمال (توزیع z)

۱- سطح زیر منحنی بالای محور xها، برابر یک است.



تمام توزیع های آماری این خاصیت را دارند و انتگرال سطح زیر منحنی آن ها برابر یک است. در واقع انتگرال زیر منحنی یک تابع توزیع ( از جمله نرمال ) برابر جمع احتمالات مربوط به رویدادهای ممکن آن است که البته باید این جمع برابر یک باشد. دلیل این امر در این است که انتگرال برابر مساحت زیر منحنی بوده و مساحت زیر منحنی نیز جمع احتمالات می باشد. لازم به ذکر اینکه ∞- نقطه شروع تابع و ∞+ نقطه اتمام تابع می باشد.

۲- به ازای تمام مقادیر fx≥0 ،x
یعنی هر مقداری که متغیر تصادفی x ( پدیده مورد نظر ) بگیرد یک احتمال مثبت برایش متصور است. به عبارت دیگر اگر قرار باشد یک پدیده به وقوع بپیوندد آنگاه در مقدار ممکنی که احتمال وقوع دارد ، آن احتمال برابر عددی مثبت است یعنی ما احتمال منفی نداریم. یعنی تابع محور xها را قطع نمی کند و منحنی بالای محور xهاست.

۳- حداکثر مقدار تابع در x= μ یعنی میانگین تابع اتفاق می افتد.
به بیان دیگر : اگرx= μ اولا f''(x)=0 , ثانیا f''(x)<0
مثال- قد افراد از توزیع نرمال پیروی می کند (قد افراد طبیعت ساخت است) مثلاً؛
کوتاه ترین قد کلاس ۱۴۰ ← احتمالش کم است.
بلندترین قد کلاس ۱۸۰ ← احتمالش کم است.
ولی بیشترین احتمال ، متوسط بودن قد است. در این جا همان میانگین یا μ اتفاق می افتد. بیشترین احتمال وقوع x برابر با μ میانگین است. هر چقدر از μ به سمت چپ و راست حرکت می کنیم احتمال کمتر می شود.

۴- تابع حول میانگین (μ) متقارن است (f(x+μ)=F-(x+μ
یعنی اگر از نقطه میانگین روی منحنی تابع نرمال یک خط بکشیم و منحنی را از روی این خط تا کنیم دو سر شکل کاملاً بر هم منطبق می شود.

۵- فرمول امید ریاضی و واریانس
امید ریاضی و واریانس x به ترتیبμ و σاست. به بیان دیگر:





۶- با دورتر شدن از μ چه در سمت راست و چه در سمت چپ، منحنی به محور xها نزدیک می شود. یعنی در دو طرف احتمالات کم می شود ولی هیچگاه به صفر نرسیده و محور x ها را قطع نمی کند . یعنی اگر حد بگیریم به سمت ∞+ و ∞-، به صفر میل می کند، ولی هیچ وقت محور x ها را قطع نمی کند.
در این جا محورx ها یک مجانب افقی است.



۷- در این توزیع، میانگین، مد و میانه با هم برابرند.
مد: جایی که بیشترین اتفاق افتاده است که در این نقطه احتمال وقوع بیشتر از سایر نقاط می باشد.
میانه: عددی که جامعه آماری را به دو قسمت مساوی تقسیم می کند.
۸- پراکندگی جامعه آماری در این توزیع به صورت زیر می باشد:
الف) احتمال فاصله ای به اندازه «یک انحراف معیار در هر طرف میانگین» برابر با ۶۸۳ /۰ است.



یعنی اگر ما میانگین را در نقطه اوج در نظر بگیریم یک انحراف معیار 𝛔) برویم به سمت چپ و یک انحراف معیار (𝛔δ) برویم به سمت راست ۶۸% داده ها در این منطقه هاشور خورده قرار می گیرد.
به طور مثال ـ فرض می کنیم میانگین قد کلاس ۱۸۰سانت است و با انحراف معیار ۱۰، ۶۸% دانشجویان بین قد ۱۷۰ تا ۱۹۰ سانت هستند.



یعنی انتگرال قسمت هاشور خورده را محاسبه کنیم ۶۸/ ۰ می شود.
ب) احتمال فاصله ای به اندازه «۲ انحراف معیار در هر طرف میانگین» برابر با ۹۵۴ /۰ است.



ج) احتمال فاصله ای به اندازه «۳ انحراف معیار در هر طرف میانگین» برابر با ۹۹۷/ ۰ است.



مثلاً در فرض بالا(قد افراد) داریم:



نمودار ۶-۱ این خاصیت را نشان می دهد.



نمودار ۶-۱ : پراکندگی جامعه آماری در توزیع نرمال

نظرات کاربران درباره کتاب خودآموز تحلیل آماری پیشرفته با SPSS, LISREL, AMOS

عالی و کاربردی
در 1 ماه پیش توسط حمید کاظملو