فیدیبو نماینده قانونی انتشارات بصیرت و بیش از ۶۰۰ ناشر دیگر برای عرضه کتاب الکترونیک و صوتی است .

کتاب آمار

نسخه الکترونیک کتاب آمار به همراه هزاران کتاب دیگر از طریق فیدیبو به صورت کاملا قانونی در دسترس است. تنها لازم است اپلیکیشن موبایل و یا نرم افزار ویندوزی رایگان فیدیبو را نصب کنید.

درباره کتاب آمار

آمار در معرض سوءفهمی ناخوشایند اما اساسی است که مردم را در باب ذات اساسی آن به اشتباه می‌اندازد. این باور اشتباه این است که آمار نیازمند استفادۀ‌ گسترده از ریاضیات ملال‌آور است و اینکه، در نتیجه، آمار رشته‌ای خشک و بی‌انعطاف است و خالی از خیال و خلاقیت و هیجان. اما این تلقی تصویر کاملاً نادرستی از‌ نظام جدید آمار است. این تصویر مبتنی بر درکی است که به بیش از نیم قرن گذشته بازمی‌گردد. خصوصاً این تصویر کاملاً از این واقعیت چشم می‌پوشد که کامپیوتر این نظام را تغییر شکل داده و آ‌ن را از مشغله‌های ریاضی به نظامی تبدیل کرده است که مبتنی بر استفاده از نرم‌افزارهای پیشرفته برای کاوش در داده‌ها به منظور حصول فهم و روشنگری است. این نظام جدید در پی امور ذیل است: استفاده از ابزارها برای کمک به ادراک، فراهم آوردن طرقی برای روشن‌تر شدن امور، راه‌هایی برای فهم، ابزارهایی برای نگاهبانی و راهبری، و نظام‌هایی برای تصمیم‌سازی. همۀ این امور و بیش از این، وجوهی از این نظام جدیدند.
هدف این کتاب آن است که به خواننده‌اش فهمی از این نظام جدید بدهد.

ادامه...
  • ناشر انتشارات بصیرت
  • تاریخ نشر
  • زبان فارسی
  • حجم فایل 1.85 مگابایت
  • تعداد صفحات ۱۵۹ صفحه
  • شابک

معرفی رایگان کتاب آمار

شما به آخر نمونه کتاب رسیده‌اید، برای خواندن نسخه کامل، کتاب الکترونیک را خریداری نمایید و سپس با نصب اپلیکیشن فیدیبو آن را مطالعه کنید:



۱. در احاطه آمار

در پاسخ افرادی که اعتقاد دارند آمار دروغ است معمولاً گفته فردریک ماستلر را یادآور می شوم که می گوید: درست است به کمک آمار می توان دروغ گفت اما دروغ گفتن بدون آن کار ساده تری است.
آمار نوین
مطلب را با ادعایی آغاز می کنم که احتمالاً بسیاری از خوانندگان را متعجب می سازد: آمار هیجان انگیزترین نظام در تمام نظام هاست. در این کتاب سعی شده تا با ذکر مثال هایی درستی این ادعا و دلیل درستی آن بیان شود. امیدوارم بتوانم بعضی از سوءبرداشت های قدیمی درباره طبیعت آمار را تغییر داده و همچنین نشان دهم این نظام نوین چیست، چه توانایی های حیرت انگیزی دارد و تا چه حد در همه عرصه ها حضور دارد.
در این فصل مقدماتی تصمیم دارم دو مطلب را انتقال دهم: اولین مورد، شمای کلی انقلابی است که در چند دهه اخیر به وقوع پیوسته. اینکه چگونه آمار از یک نظام خشک قدیمی که با محاسبات طولانی بر روی مجموعه های بزرگ اعداد سروکار داشت به یک تکنولوژی مدرن و توسعه یافته که از ابزار های نرم افزاری پیشرفته استفاده می کند ترقی یافت. اینکه چگونه امروزه آماردان ها از این ابزارها برای بررسی داده ها و یافتن ساختارها و الگوهای جدید استفاده می کنند، چگونه این تکنولوژی را به کار می برند تا لایه های پیچیدگی و ابهام را کنار زده و حقایق را آشکار کنند. آمار نوین همانند تمام تکنولوژی های دیگر مثل تلسکوپ، میکروسکوپ، اشعه ایکس، رادار و اسکن های پزشکی چیزهایی را نمایان می کند که بر چشم های غیرمسلح پوشیده است. این نظام در پیچیدگی ها و رموز دنیای امروز به ما توان دیدن می بخشد و کمک می کند تا حقایق را کشف کنیم.
بنابراین اولین مطلبی که می خواهم در این فصل بیان کنم این است که این نظام پیشرفته چه قدرتی دارد، از کجا آمده و چه کارهایی می تواند انجام دهد. اما مطلب دومی که مدنظر است، حضور همه جانبه آمار است. هیچ کدام از عرصه های زندگی از دسترس آن دور نمانده است. علم پزشکی نوین بر پایه آمار بنا شده است. آزمایش های تصادفی کنترل شده(۱) به عنوان یکی از ساده ترین، قدرتمندترین و موثرترین ابزارهای تحقیقاتی شناخته می شود (فهم فرآیندهایی که به کمکشان می توان مانع آسیب دیدن افراد از امراض شد). دولت های پیشرفته به تحلیل های آماری داده ها که جامعه و اقتصاد را توصیف می کنند وابسته اند: حتی این بحث وجود دارد که تمام دولتمردان باید دوره های اجباری آمار را پشت سر بگذارند. کشاورزان، فعالان صنایع غذایی و فروشندگان بزرگ برای تصمیم گیری درباره اینکه چه چیزی پرورش دهند، چگونه آن را فرآوری کرده و برای فروش بسته بندی نمایند، به طور ضمنی از نتایج آماری استفاده می کنند. مهندسان برای تعیین ارتفاع سدها، آماره های هواشناسی را تحلیل می کنند. آنها از این نظام برای افزایش قابلیت اطمینان استفاده می کنند تا کامپیوتر هایی بسازند که مطمئن باشند به دفعات دچار مشکل نمی شوند. سیستم های کنترل کننده ترافیک هوایی بر پایه مدل های آماری پیچیده ای که به صورت آنلاین کار می کنند ساخته شده اند. ابزارها و ایده های آماری تقریباً در تمامی جنبه های زندگی مدرن به طور پنهان وجود دارند اگرچه ممکن است درک این مطلب چندان هم ساده نباشد.
برخی تعاریف
یکی از تعاریف کاربردی خوب برای نظام آمار می تواند این تعریف باشد: آمار تکنولوژی به دست آوردن مفاهیم از داده هاست. با این حال هیچ تعریف کاملی برای آن وجود ندارد. به طور خاص، این تعریف، مفاهیم احتمال و شانس را در نظر نمی گیرد. مفاهیمی که از تکیه گاه های اصلی نظام آمار در کاربردهای بی شمار آن هستند. تعریف کاربردی دیگر برای آمار می تواند تکنولوژی کار با عدم قطعیت ها باشد. با این حال تعاریف دقیق تر اهمیت نقشی را که آمار ایفا می کند بهتر نشان می دهد. می توان گفت نظام آمار برای پیش بینی آینده و به دست آوردن نتیجه درباره مجهولات و رسیدن به جمع بندی درباره داده ها نقش کلیدی دارد. کنار هم قرار دادن این تعاریف به خوبی ماهیت این نظام را مشخص می کند. کاربردهای مختلف، موجب ظهور این نظام در مسائل متفاوت می شود. برای مثال تصمیم گیری، پیش بینی، کنترل بلادرنگ،(۲) کشف جرایم وآنالیز ژنتیک و... همه از کاربردهای آمار هستند. چیزی که درباره این تعاریف لازم به یادآوری است این است که عمداً از واژه تکنولوژی به جای علم استفاده شده است. تکنولوژی، کاربرد یک علم و دست آوردهای آن است و این چیزی است که در مورد آمار صادق است: کاربرد دانش ما درباره شرایط عدم قطعیت و در مورد اینکه چگونه از داده های خام اطلاعات کسب کنیم. با این حال باز هم گاهی از آن به عنوان علم یاد می شود. یکی از بهترین مجلات در زمنیه آمار، مجله علم آمار(۳) است.
تا اینجا در این کتاب و خصوصاً در بند قبل به نظام آمار اشاره شد. اما واژه statistics در زبان انگلیسی معنای دیگری هم دارد. این کلمه جمع کلمه statistic به معنای آماره است. آماره یک مفهوم عددی یا جزئی است. برای مثال خلاصه ای از داده ها که جمعیتی را توصیف می کند: مثلاً اندازه جمعیت، نرخ رشد جمعیت، میزان جرم و جنایت و.... بنابراین از یک دیدگاه این کتاب، آمار درباره مفاهیم عددی مجزا است. اما از دیدگاهی واقعی تر به چیزی فراتر از آن مربوط می شود. در واقع به چگونگی جمع آوری، تحلیل و نتیجه گیری از این مفاهیم می پردازد. به این معنی که اگر خواننده ای فکر می کند در این کتاب با انبوهی از جداول عددی مواجه می شود در اشتباه است. اما خواننده ای که امید دارد بداند چگونه در کسب و کارها تصمیم گیری می شود، چگونه ستاره شناسان گونه های جدید ستارگان را کشف می کنند، چگونه محققان علم پزشکی ژنی را که مربوط به یک بیماری خاص است تشخیص می دهند، چگونه بانک ها تصمیم می گیرند به کسی اعتبارات بدهند یا نه، چگونه موسسات و شرکت های بیمه در مورد میزان حق بیمه تصمیم گیری می کنند، چگونه فیلتر هایی ساخته می شوند که از ورود هرزنامه ها و تبلیغات ناخواسته به ایمیل شما جلوگیری می کنند و... به مقصودش خواهد رسید.
تمام این مطالب نشان می دهد که چرا کلمهstatistics هم می تواند مفرد باشد و هم جمع: نظامی وجود دارد که statistics (آمار) است در حالی که تعداد زیادی عدد وجود دارد که statistics (آماره ها) هستند.
درباره معنای لغوی آمار به اندازه کافی صحبت شد! در تعریفی که در ابتدا ارائه شد واژه داده(۴) هم به کار رفته است. این کلمه جمع کلمه لاتین datum به معنای دادن یا چیزی که داده شده است.
داده ها معمولا به شکل اعداد هستند. نتایج اندازه گیری ها، شمارش ها یا فرآیند های دیگر. می توان گفت، داده ها بیان ساده ای از چیزی هستند که مورد مطالعه قرار می دهیم. اگر این مطالعه درباره دانش آموزان یک مدرسه باشد و به طور خاص بخواهیم توانایی تحصیلی و توانایی آنها برای مشاغل مختلف را اندازه بگیریم می توانیم نمراتشان در نتایج امتحانات و آزمون های مختلف را مورد مقایسه قرار دهیم. این نمرات شاخصی برای توانایی ها و تمایلات آنها در اختیار محقق قرار می دهد. بدیهی است این توصیفات کامل نخواهند بود. ممکن است کسی در اثر بیماری نمره پایینی گرفته باشد. همین طور نبودن نمره برای دیگری هم صرفاً نشان می دهد آن شخص در آزمون شرکت نکرده و درباره توانایی هایش اطلاعات خاصی نمی دهد. بعداً درباره کیفیت داده (۵)ها بیشتر صحبت خواهد شد. موضوع کیفیت داده ها به دلیل این قاعده کلی اهمیت دارد (که در تمام طول زندگی جاری است نه فقط در آمار)، که اگر مواد اولیه خوب برای کار کردن در اختیار نداشته باشیم احتمالاً نتایج خوبی به دست نخواهیم آورد. آماردان ها می توانند کارهای خارق العاده ای در استخراج اطلاعات از داده ها انجام دهند، اما معجزه نمی کنند.
البته خیلی اوقات داده ها مستقیماً به صورت اعداد به دست نمی آیند. به نظر می رسد اکثر داده های خام به صورت تصاویر، کلمات، یا حتی سیگنال های صوتی یا الکترونیکی باشند. تصاویر ماهواره ای، تشریح اثرات جانبی داروها در هنگام مصرف یا صدایی که در زمان صحبت کردن پراکنده می شود به شکل اعداد به نظر نمی رسند، با این حال آزمایشات دقیق نشان می دهد که این چیزها وقتی اندازه گیری و ثبت می شوند به بیان های عددی یا بیان هایی که به نوبه خود قابل تبدیل به اعداد هستند بدل می شوند. مثلاً تصاویر از جمله تصاویر ماهواره ای از میلیون ها عنصر کوچک به عنوان پیکسل تشکیل شده اند که هر کدام بیانگر شدت (عدد) رنگ های مختلف هستند. متن ها می توانند بر اساس کلمات و شباهت بین کلمات و عبارات آنها پردازش شوند. موتورهای جست وجوگر اینترنت مثل گوگل از این روش ها استفاده می کنند. صدای ما بر اساس مقدار عددی اندازه و شدت موجی بیان می شود که سازنده اجزای کلام است. در حالت کلی اگرچه اکثر داده ها عددی و به صورت کمّی نیستند اما اغلب طی مراحلی به اعداد کمّی تبدیل می شوند. اغلب آماره ها نیز در ارتباط با داده های عددی هستند.
دروغ آمار
جمله: «سه نوع دروغ داریم: دروغ، دروغ شاخدار و آمار» که در ابتدای فصل آمد عمدتاً به مارک تواین و بنجامین دیزراییلی نسبت داده می شود. افراد دیگری هم چنین نظراتی داشته اند: ساده شدن کار دروغگو ها از نتایج تاسف بار ستایش از آمار است (تام بورنان). آمار، تردستی با اعداد است (آدری هابرا و ریچارد رانیون). اگر در آمار دست ببرید می توانید هر چیزی را اثبات کنید (آرتور هیلی) و....
چیزی که به وضوح پیداست این است که در مورد آمار بدگمانی هایی وجود دارد. چراکه آماردان ها اغلب کسانی هستند که باید شرایط حاد را بررسی کرده و در مورد آن هشدار دهند و حتی گاهی ممکن است حامل خبرهای بدی باشند. این افراد زمانی که در محیط های تحقیقاتی مثل دانشکده های پزشکی یا علوم اجتماعی فعالیت می کنند، ممکن است به این نتیجه برسند که برای دستیابی به جواب یک سوال خاص داده کافی در اختیار ندارند، یا حتی به پاسخی برسند که دلخواهشان نیست. البته امکان دارد این اتفاق از دیدگاه محققان خوشایند نباشند اما اینکه آمار را مقصر بدانیم و سرزنش کنیم هم چندان منصفانه نیست.
در بسیاری از موارد این گونه بدگمانی ها توسط کسانی ایجاد شده که آماره ها را به دلخواه خود انتخاب می کنند. اگر بیش از یک راه برای نتیجه گیری از مجموعه ای از داده ها که هر کدام به جنبه های مختلفی می پردازند وجود داشته باشد، افراد مختلف می توانند به نتیجه های متفاوتی برسند. آمار جرم و جنایت مثال خوبی برای این مطلب است. در انگلستان مهم ترین منبع آمار جرایم سازمان British Crime Survey است. این سازمان از یک مجموعه تصادفی از افراد سوالاتی در مورد اینکه در سال گذشته در مورد چه جرم هایی تحت پیگرد قرار گرفته اند می پرسد و از این طریق میزان جرایم را تخمین می زند. در مقابل سازمان Recorded Crime Statistics آماری ارائه می دهد که بیشتر شامل حملات خطرناک به خانه ها و ادارات بوده و توسط پلیس ثبت شده است. طبق تعریف، این آمار جرائم کوچک را در نظر نمی گیرد. البته پرواضح است، جرائمی که به پلیس گزارش نشده اند نیز در این آمار قرار نمی گیرند. با این تفاوت ها جای تعجب نیست اگر حاصل دو مجموعه از آماره ها با هم متفاوت باشند تا آنجا که حتی دسته ای مشخص از جرائم با توجه به یک مجموعه از نمودارها در طول زمان در حال کاهش بوده و با توجه به دسته ای دیگر افزایش را نشان دهند.
آمار جرم و جنایت دلیل دیگر وجود بدگمانی نسبت به آمار را نشان می دهند. در حالی که این اعداد به عنوان شاخصی برای بررسی عملکرد یک سیستم مدنظر قرار می گیرند، امکان دارد افرادی هدفشان بهبود این اعداد و ارقام حتی با لطمه زدن به جنبه های دیگر سیستم باشد. در این حالت امکان دارد این اعداد به طور نامناسبی تغییر یابند تا عملکرد سیستم را خوب نشان دهند. اما در واقع کارایی خود را برای بررسی عملکرد سیستم از دست خواهند داد. مثلاً پلیس می تواند با تمام نیرو جلوی دزدی از فروشگاه ها را بگیرد و آمار مربوط به این جرم را کاهش دهد اما این کار ممکن است سبب رشد انواع دیگر جرائم شود. بنابراین در این حالت، میزان سرقت از فروشگاه ها به عنوان شاخصی برای نرخ جرائم کاربردی ندارد. این پدیده از زمان چارلز گوتهارت که از مشاوران اسبق بانک انگلستان است به نام قانون گوتهارت(۶) نام گرفت.
نکته قابل تامل این است که این مشکلات به خودی خود ربطی به آمار ندارند، بلکه به نوع استفاده از آماره ها، انتخاب نادرست روش جمع آوری آماره ها و معنای واقعی آنها مربوط می شود و همین طور برداشت های اشتباهی که درباره چگونگی جمع آوری آماره ها و معنای واقعی آنها وجود دارد. بدگمانی به چیزهایی که درک نمی کنیم هم امری کاملاً طبیعی است. راه حل از بین بردن این بی اعتمادی هم، اصلاح این برداشت های اشتباه است.
یکی دیگر از ریشه های این بدبینی به طبیعت علم و تبعات پیشرفت آن برمی گردد. ممکن است روزی در یکی از مجلات علمی ببینیم که مثلاً یک نوع خاص غذا برای سلامتی ضرر دارد اما روز بعد دقیقاً عکس آن را مشاهده کنیم. طبیعی است این موضوع سردرگمی ایجاد می کند و موجب بروز این احساس می شود که دانشمندان جواب این سوالات را نمی دانند و چندان قابل اعتماد نیستند. از طرفی تحقیقات علمی از حجم عظیمی از تحلیل های آماری استفاده می کنند، و این باعث می شود بخشی از این بدگمانی ها بر دوش آمار قرار بگیرد. اما این ذات پیشرفت علمی است که کشفیات جدید باعث تغییر دانسته ها می شوند. مثلاً ممکن است تا زمانی فکر می کردیم، وجود چربی در رژیم غذایی برای بدن مضر است اما مطالعات بعدی نشان دادند گونه های متفاوتی از چربی وجود دارند که بعضی مفید و بعضی مضر هستند. این مطلب از آنچه که به نظر می رسد پیچیده تر است. بنابراین امکان دارد از اینکه چگونه اطلاعات اولیه با هم تداخل کرده و در نهایت نتایج ظاهراً متناقض می دهند، تعجب کنیم.
دلیل دیگر بدبینی، وجود اشتباهات و سوء تفاهم های ابتدایی در مورد مفاهیم پایه ای آمار است. مثلاً جملات زیر را در نظر بگیرید و بررسی کنید چگونه می توانند موجب بدبینی شوند (جواب ها در یادداشت پایانی کتاب آمده اند).
۱. در گزارشی آمده است که تشخیص زودهنگام بیماری مدت زمان زنده ماندن را افزایش می دهد، بنابراین برنامه های غربالگری سودمند هستند.
۲. مطلع می شویم قیمت کالا یا خدمات خاصی برای افراد واجد شرایط ۲۵% تخفیف دارد اما ما واجد شرایط نیستیم و باید ۲۵% بیشتر از قیمت تعیین شده پرداخت کنیم.
۳. در جایی مشاهده می کنیم که بر اساس برون یابی از افزایش طول عمر در صد سال گذشته، پیش بینی می شود امید به زندگی در قرن آینده به صدوپنجاه سال خواهد رسید.
۴. گفته می شود از ۱۹۵۰ تا کنون تعداد دانش آموزان امریکایی که دست به شلیک با تفنگ زده اند سالانه دو برابر شده است.
گاهی اوقات برداشت های اشتباه چندان هم ابتدایی نیستند و از مفاهیم نسبتاً عمیق آماری نشات می گیرد. مغالطه دادستان(۷) مثال خوبی در این زمینه است، که سردرگمی میان احتمال درست بودن چیزی را (مثلاً متهم گناهکار باشد) وقتی مدارکی در دست داریم (مثلاً دستکش متهم در صحنه جرم موجود باشد) در مقابل احتمال یافتن این مدارک با فرض اینکه متهم گناهکار باشد (درست بودن آن چیز) بیان می کند. چنین مسئله ای به غیر از دادگاه در موارد دیگری هم رایج است و ما بعداً به آن خواهیم پرداخت.
بدیهی است اگر بدبینی یا بی اعتمادی نسبت به آمار وجود دارد، به ضعف خود آمار و روش های محاسبات آن مربوط نبوده بلکه به نوع استفاده ما از آن مربوط خواهد بود. اینکه نظام آماری و آماردان هایی که این مفاهیم را از داده ها استخراج کرده اند مقصر بدانیم منصفانه نیست، بلکه این قصور متوجه افرادی است که نمی دانند این اعداد چه چیزی را بیان می کنند و همین طور کسانی که آگاهانه از این نتایج سوء استفاده می کنند. وقتی کسی توسط تفنگی کشته می شود، تفنگ را مقصر نمی دانیم بلکه کسی را که با آن شلیک کرده مقصر دانسته و محاکمه می کنیم.
داده ها
تا اینجا دیدیم، داده ها مواد خامی هستند که آماره ها به وسیله آنها محاسبه می شوند و نظام آمار بر پایه آنها بنا شده است که اغلب به صورت اعداد بیان می شوند. اما در واقع داده ها چیزی فراتر از اعداد محض اند. برای اینکه بتوانیم معنی و مفهوم مفیدی از تحلیل آماری کسب کنیم باید این اعداد، معنی دار باشند. مثلاً باید بدانیم اندازه گیری ها، اندازه چه چیزی را نشان می دهند. یا چه چیزی را شمارش کرده ایم. برای اینکه نتایج دقیق و قابل اعتمادی از تحلیل های آماری به دست آید، باید اطلاعاتی درباره چگونگی به دست آمدن این اعداد نیز داشته باشیم. آیا تمام افراد به پرسش ها پاسخ گو بوده اند یا فقط بعضی از آنها به سوالات جواب داده اند. اگر فقط بخشی از آنها به سوالات پاسخ داده اند، آیا این افراد، کاملاً معرّف جمعیت مورد مطالعه هستند یا نه. همین طور باید بدانیم، ابزارهای اندازه گیری قابل اعتمادند یا دارای محدودیت هستند، و برای اعداد بزرگ تر از محدوده خود اندازه گیری دقیقی ارائه نمی دهند. مثلاً آیا می توان مطمئن بود، عددی که پرستاری برای ضربان نبض بیمار ثبت کرده درست است یا نه؟ بی نهایت سوال از این دست وجود دارد و ما باید نسبت به آنهایی که در نتیجه گیری ها تاثیرگذارند حساس بوده و هشدارهای لازم را دریافت کنیم.
می توان به داده ها به عنوان مدارک و شواهد نگاه کرد. بدون آنها تئوری ها و ایده های مان در مورد دنیای اطراف تفکرات محض اند. داده ها هستند که زمینه پیوند نظریات با واقعیات را فراهم می کنند. به کمک آنهاست که می توانیم دانسته های خود را ارزیابی قرار کنیم. برای مقایسه میان داده ها و ایده ها و اینکه چقدر همدیگر را تایید می کنند از روش های آماری استفاده می کنیم. نتایج ضعیف، ما را به فکر فرومی برند تا به نظریات دقیق تری برسیم؛ نظریاتی که با آنچه در واقعیت اتفاق می افتد تطابق بیشتر داشته باشند. البته لازم به ذکر است نتایج ضعیف ممکن است در اثر داده های بی کیفیت نیز حاصل شده باشند. بنابراین نباید این مطلب را از یاد ببریم که: ممکن است نظریات درست باشند اما این ابزارهای اندازه گیری باشند که به نحوی مشکل ایجاد می کنند. در حالت کلی وجود تطابق میان داده های مشاهده شده و داده هایی که طبق تئوری ها باید وجود داشته باشد، نشان می دهد در مسیر درست قرار داریم به این معنی که تئوری ها صحت آنچه که در واقعیت در جریان است را منعکس می کنند.
بدیهی است در عمل باید بتوان بر اساس تئوری ها دست به پیش بینی هایی زد که صحتشان به کمک داده ها قابل سنجش باشد. پس از بررسی ها اگر ندانیم باید منتظر چه چیزی باشیم یا اگر پیش بینی ها آن قدر کلی بودند که هر داده ای تئوری ها را تایید می کرد این تئوری ها چندان کاربردی نخواهند بود: یعنی هر چیزی می تواند رخ دهد. روان شناسی و نجوم در این زمینه مورد انتقاد قرار گرفته اند.
علاوه بر این داده ها شرایط را طوری فراهم می کنند که در این دنیای پیچیده مسیر خود را بیابیم و بهترین تصمیم ها را برای کسب بهترین نتایج بگیریم. اندازه گیری ها را در نظر می گیریم ، به شمارش می پردازیم و روش های آماری را برای کسب اطلاعات از داده ها به کار می گیریم تا بفهمیم دنیای خارج چگونه رفتار می کند و چه باید بکنیم تا آن گونه که ما می خواهیم رفتار کند. خلبان خودکار هواپیماها، سیستم های ناوبری ماهواره ای در خودروها، شاخص های آماری مثل تورم و رشد ناخالص داخلی (GDP)، بیماران تحت مراقبت در بخش مراقبت های ویژه، و ارزیابی سیاست های اجتماعی پیچیده مثال های خوبی از این موضوع هستند.
با توجه به اینکه امروزه پیوند میان نظریات و مشاهدات درباره دنیای واقعی را نقش اساسی داده ها می دانیم، چندان دور از ذهن نیست که داده ها و تکنولوژی به دست آوردن اطلاعات از آنها را به عنوان زیر بناهای جهانی سازی مدرن در نظر بگیریم. به همین دلیل است که برای یکی از کتاب هایم با عنوان تولید اطلاعات عنوانی فرعی با این مضمون در نظر گرفته ایم: چگونه داده ها دنیا را اداره می کنند.
آمار گسترده
با اینکه ریشه های آمار به مدت ها قبل بازمی گردد اما خود این نظام در واقع بیشتر از دو قرن قدمت ندارد. انجمن سلطنتی آمار(۸) در سال ۱۸۳۴ و انجمن آمار امریکا(۹) در سال ۱۸۳۹ پایه گذاری شدند، در حالی که اولین دانشکده آمار در سال ۱۹۱۱ در دانشگاه کالج(۱۰) در لندن پایه گذاری شده است. آمار کهن شاخه های گوناگونی داشت و سرانجام این نظام نوین از ترکیب آنها به دست آمد. یکی از این شاخصه ها مفهوم احتمال بود که در قرن ۱۷ در پاسخ به سوالاتی که در شرط بندی ها مطرح بود به وجود آمد. دیگری مربوط به این حقیقت بود که اندازه گیری ها به ندرت بدون خطا انجام می شدند و به تحلیل هایی نیاز بود تا نتایج معقول و معنی داری به دست آیند. در سال های اولیه این موضوع مخصوصاً در نجوم و ستاره شناسی اهمیت داشت. یکی دیگر از این زمینه ها استفاده تدریجی حکومت ها از داده های آماری برای اداره جوامع بود. در حقیقت این استفاده بود که منجر به پیدایش کلمه statistics شد. امروزه هر کشور پیشرفته ای سازمان ملی آمار مخصوص به خود را دارد.
در طول این پیشرفت و گسترش، نظام آمار چندین مرحله را پشت سر گذاشت. اولین مرحله که تا اواخر قرن نوزدهم به طول انجامید مرحله کاوش استدلالی در میان داده ها بود. در نیمه اول قرن بیستم این نظام سرو شکل ریاضی به خود گرفت تا حدی که بسیاری آن را یکی از شاخه های ریاضی می دانستند (چراکه با اعداد سروکار داشت). در حقیقت هنوز هم اغلب آماردانان آکادمیک جزء اعضاء دانشکده های ریاضی هستند. در نیمه دوم قرن بیستم شاهد ظهور پدیده ای به نام کامپیوتر بودیم. این تغییر بود که آمار را از یک کار طاقت فرسا به یک کار هیجان انگیز ارتقا داد. قبل از پیدایش کامپیوتر، افراد باید مهارت های محاسباتی ویژه ای می داشتند و ساعات های زیادی را صرف انجام محاسبات دستی بی شمار می کردند. وجود کامپیوتر این نیازها و محدودیت ها را مرتفع کرد. تفاوتی که بدین ترتیب ایجاد شد مثل تفاوت پیاده روی و رانندگی بود: سفرهایی که پیش از این، روزها به طول می انجامید اکنون ظرف چند دقیقه انجام می شد و سفرهایی هم که به علت مسافت زیاد حتی در اندیشه ها جای نمی گرفت امروز شدنی بود.
در نیمه دوم قرن بیستم شاهد ظهور شاخه های دیگری از تحلیل داده ها بر مبنایی غیر از آمار کلاسیک، و علی الخصوص بر مبنای علوم کامپیوتر بودیم که شامل یادگیری ماشین،(۱۱) شناسایی الگو(۱۲) و داده کاوی(۱۳) بود. در حالی که این نظام ها در حال پیشرفت بودند گاهی اوقات تنش هایی بین این شاخه ها و شاخه های مختلف آمار وجود داشت. در حقیقت زمینه های مختلفی که توسط شاخه های گوناگون به وجود آمده بودند همگی ابزارهایی را برای تحلیل داده ها به اشتراک گذاشتند تا آنجا که امروزه در آمار نوین آزادانه از همه این ابزارها استفاده می شود. در ادامه در فصول دیگر برخی از این ابزارها را توضیح می دهیم. با این پیش فرض، تعریف گسترده ای برای آمار در این کتاب در نظر گرفته شده است. این تعریف از تعریف آمار گسترده که توسط آماردان برجسته جان چمبرز ارائه شده پیروی می کند. او آمار گسترده را هر چیزی که به یادگیری از داده مربوط می شود تعریف می کند، از جمع آوری و برنامه ریزی اولیه گرفته تا ارائه و گزارش نهایی. بنابراین تلاش برای تعیین حد و مرزهایی میان نظام های مختلف تحلیل داده، کاری عبث و بیهوده است.
بنابراین آمار نوین نه درباره محاسبات که در ارتباط با تحقیقات است. حتی بعضی افراد آمار را به عنوان روش علمی در عمل توصیف کرده اند. اگر چه همان طور که پیشتر ذکر شد، در دانشگاه ها، آماردان ها در دپارتمان های ریاضی هستند اما در دانشکده های پزشکی، دانشکده های علوم اجتماعی، اقتصاد و تعداد زیادی دپارتمان دیگر از مهندسی گرفته تا روان شناسی هم حضور دارند. خارج از دانشگاه ها هم تعداد زیادی از آنها در بخش های دولتی، صنعت، بخش داروسازی، بازاریابی، مخابرات، بانکداری و بسیاری زمینه های دیگر مشغول به فعالیت هستند. اغلب مدیران نیز بر مهارت های آماری که به کمک آنها داده هایشان را تفسیر می کنند تکیه دارند. داده هایی که مجموعه، شرکت، محصول یا پرسنلشان را توصیف می کند. آنها محاسبات فراوان ریاضی انجام نمی دهند، بلکه از روش ها وابزارهای آماری بهره می گیرند تا دید درستی نسبت به موضوع موردنظرشان دست پیدا کنند. در این مسیر باید موضوعات غیرریاضی زیادی را مدنظر قرار دهند، از قبیل کیفیت داده ها، چگونگی جمع آوری آنها، تعریف مسئله، تعیین اهداف کلی (درک، پیش بینی، تصمیم گیری و غیره)، تعیین اینکه چگونه شرایط عدم اطمینان روی نتایج تاثیر می گذارد و بسیاری موضوعات دیگر.
امیدواریم روشن شده باشد که آمار در تمام قلمروهای زندگی حضور دارد. این موضوع تاثیر متقابلی بر پیشرفت این نظام داشته است. بدین ترتیب که روش های آماری در زمینه های جدید به کار گرفته می شود و مشکلات مخصوص، نیازمندی ها و مشخصات این زمینه ها منجر به تکامل و پیدایش ساختارها و روش های جدید آماری شده و سپس همین که این ابزارها و روش ها گسترش می یافتند در زمینه های دیگر مورد استفاده قرار گرفتند.

چند مثال

مثال ۱: جلوگیری از هرزنامه(۱۴) ها (اسپم ها)
اسپم به ایمیل های ناخواسته با تعداد انبوه گفته می شود که به صورت خودکار به میلیون ها کاربر در سراسر جهان فرستاده می شود. این پیغام ها اغلب تبلیغاتی بوده و حتی ممکن است کلاهبرداری نیز باشند. این ایمیل ها معمولاً شامل پیشنهاد راه های سریع ثروتمند شدن، نسخه های پزشکی و دارویی، راهنمایی های بازارهای مالی و راهنمایی های مشکوک جنسی می باشند. قاعده پشت مطلب این است که اگر به تعداد کافی به افراد ایمیل بزنید، بعضی از آنها علاقه مند خواهند شد و پیشنهادات را می پذیرند. به جز ایمیل هایی که از سوی سازمان های خاص برای دریافت اطلاعات صادر می شود بقیه اغلب مورد توجه نیستند و هیچ کس تمایل ندارد وقت خود را صرف خواندن و پاک کردن این ایمیل ها بکند. به همین دلیل فیلترهایی به نام فیلترهای اسپم به وجود آمده اند. این فیلترها برنامه های کامپیوتری هستند که به صورت خودکار پیغام های درون ایمیل را بررسی می کنند و تشخیص می دهند که این ایمیل اسپم است یا نه. می توان این فیلترها را طوری برنامه ریزی کرد که پیغام های مشکوک را به پوشه های مناسب هدایت کنند تا بعداً آنها را بررسی کنیم یا اعمال مناسب دیگری روی آنها انجام دهیم. درباره اسپم هایی که به طور روزانه ارسال می شوند آمار دقیقی وجود ندارد. اما در زمان نگارش این کتاب این تخمین وجود دارد که روزانه بیش از نود میلیارد اسپم در سراسر دنیا منتشر می شوند و از آنجا که این عدد ماه به ماه به صورت قابل توجهی در حال افزایش است ممکن است زمانی که شما این کتاب را می خوانید این عدد بسیار بسیار بزرگ تر شده باشد.
راه های گوناگونی برای جلوگیری از این هرزنامه ها وجود دارد. در ساده ترین حالت به دنبال کلمات کلیدی خاصی در این ایمیل ها هستیم برای مثال اگر پیغامی شامل کلمه viagra بود ممکن است مانع ورود آن شویم. تشخیص اسپم، زمینه ای کاملاً رقابتی است. به محض اینکه هرزنامه نویس ها پی می برند پیغامشان توسط یک روش خاص فیلتر شده به دنبال راهی می گردند تا از آن روش واز آن فیلتر عبور کنند. به عنوان مثال ممکن است عمداً به جای کلمه viagra، کلمه v1agra یا v-iagra را به کار ببرند و این در حالتی است که افراد متوجه معنی این کلمات می شوند اما برنامه های کامپیوتری خودکار این کلمات را تشخیص نمی دهند.
فیلترهای پیشرفته از ابزارهایی استفاده می کنند که بر پایه مدل های آماری بنا شده اند. مدل هایی که محتوای این هرزنامه ها را در نظر می گیرند. برای مثال این فیلترها تخمینی از احتمال اینکه کلمه یا کلمات خاصی در هرزنامه وجود داشته باشد در نظر می گیرند و سپس پیغامی که تعداد زیادی از کلمات با احتمال بالا را در بر داشته باشد به عنوان هرزنامه معرفی می کند. مدل های احتمالاتی دیگری نیز وجود دارند که احتمال پشت سر هم قرار گرفتن کلمات را در نظر می گیرند و به کمکشان قادریم مجموعه ای از کلمات و عبارات مشکوک را پیدا کنیم. روش های دیگری هم وجود دارند که از مدل های آماری برای تصاویر استفاده می کنند و از این طریق به تشخیص پیغام های مزاحم می پردازند.
مثال ۲: ماجرای سالی کلارک
در سال ۱۹۹۹ یک وکیل جوان انگلیسی به نام سالی کلارک به جرم قتل عمد دو پسر خود به حبس ابد محکوم شد. فرزند اول در سال ۱۹۹۶ در سن ۱۱ هفتگی و فرزند دوم در سال ۱۹۹۸ در ۸ هفتگی از دنیا رفتند. رای هیات منصفه در این باره درس عبرتی درباره کج فهمی و استفاده اشتباه از آمار شد. این اتفاق زمانی رخ داد که آقای روی میدو متخصص اطفال به عنوان کارشناس پرونده ادعا کرد احتمال مرگ دو کودک در اثر بیماری کات دس(۱۵) یک در هفتاد و سه میلیون است. او این عدد را به سادگی از ضرب احتمال وقوع این دو رخداد به صورت جداگانه به دست آورده بود. در حالی که به علت نداشتن اطلاعات کافی این حقیقت را در نظر نگرفته بود که در یک خانواده، با وقوع این بیماری برای اولین بار، احتمال وقوع آن برای بار دوم بسیار افزایش پیدا می کند.
تحقیقات قبلی نشان می دادند، احتمال آنکه کودکی به صورت تصادفی در خانواده ای مثل خانواده کلارک جان خود را بر اثر این بیماری از دست بدهد حدود یک در هشت هزار و پانصد است. حال اگر فرض کنیم، وقوع این رخداد، احتمال وقوع دیگری را تغییر نمی دهد، در این صورت احتمال اینکه در یک خانواده دو نفر بر اثر این بیماری جان خود را از دست دهند برابر ۱/۸۵۰۰×۱/۸۵۰۰ می باشد که در حدود یک در هفتاد و سه میلیون است. اما این فرض، اشتباه بزرگی است. تحلیل های آماری دقیق نشان می دهد، احتمال چنین مرگ و میری پس از وقوع آن برای اولین بار بسیار افزایش پیدا می کند. در واقع محاسبات نشان می دهد در کشوری به اندازه انگلستان باید سالانه شاهد چندین مورد از این مرگ و میرهای چندگانه باشیم. در سایت سازمان بررسی علل مرگ و میر کودکان چنین آمده است. به ندرت پیش می آید دو نفر در یک خانواده به علت کات دس جان خود را از دست بدهند. اما گاهی ممکن است به علت اختلالات موروثی از قبیل نقص متابولیک شاهد این پدیده باشیم.
در این ماجرا مدارک دیگری نیز وجود داشتند که بیگناهی خانم کلارک را نشان می دادند. سرانجام مشخص شد که فرزند دوم او یک بیماری باکتریایی داشته و بدین ترتیب مستعد مرگ ناگهانی بوده است. خانم کلارک در سال ۲۰۰۳ با رای شورای استیناف آزاد شد و در ماه مارس ۲۰۰۷ در سن ۴۲سالگی به طرز غم انگیزی از دنیا رفت. توضیحات بیشتر درباره این اشتباه وحشتناک در مقاله خانم هلن در وب سایتی که در انتهای کتاب برای مطالعه بیشتر وجود دارد آمده است.
مثال ۳: خوشه های ستارگان
با افزایش توانایی ما برای کاوش در میان کهکشان ها این حقیقت آشکار شد که اجرام فضایی تمایل دارند به صورت مجموعه ای و سلسله مراتبی شکل بگیرند. بدین ترتیب که ستاره ها، خوشه ها را می سازند، خوشه های ستارگان نیز به نوبه خود خوشه های بزرگ تر را پدید می آورند و بدین ترتیب یکی پس از دیگری ساخته می شوند. برای مثال کهکشان ما که خوشه ای از ستاره هاست، عضوی از مجموعه ای است که حدود سی کهکشان دارد و این سی کهکشان خود عضوی از یک خوشه بسیار بزرگ تر هستند. در مقیاس بزرگ تر دنیای ما شبیه حبابی است که در لایه بیرونی آن و خارج از فضای بسیار بزرگ درون آن رشته هایی از اَبَرخوشه ها وجود دارند. اما چگونه چنین مطلبی را کشف کردیم؟ حتی اگر قوی ترین تلسکوپ ها را به کار ببریم باز هم فقط آسمانی پر از ستاره خواهیم دید. پاسخ این است که کار کردن با این ساختارهای خوشه ای و در واقع کشف جزئیات آن به تکنیک های آماری نیاز دارد. یک دسته از این تکنیک ها شامل محاسبه فاصله بین هر ستاره با نزدیک ترین ستاره ها به آن است. ستاره هایی که بیش از آنچه انتظار داریم در نزدیکیشان ستاره وجود دارد احتمالاً در یک منطقه متراکم مثل یک خوشه هستند.
البته کار به این سادگی ها هم نیست. ابرهای غبار بین هسته ای در فضا به صورت یکنواخت پخش نشده اند و باعث بروز خطا در اندازه گیری فاصله ها می شوند. از طرفی اجسام کم نور فقط زمانی دیده می شوند که به اندازه کافی نزدیک زمین باشند. یک رشته باریک از کهکشان ها که از زمین دیده می شود، می تواند یک خوشه بسیار متراکم باشد. برای پی بردن به حقایقی که در پس این اشیاء ظاهری وجود دارد به اصلاحات آماری پیچیده ای نیاز داریم.
درک ساختار جهان هستی باعث می شود بفهمیم که چگونه به وجود آمده و در آینده چگونه گسترش خواهد یافت.
مثال ۴: ساخت مواد شیمیایی
قبلاً گفتیم آماردان ها می توانند کارهای بزرگی انجام دهند ولی قادر به معجزه نیستند. به طور خاص کیفیت نتایج کار آنها بستگی به کیفیت داده ها دارد. با در نظر گرفتن مسئله، نکته جالب اینجاست که زیرنظام هایی در آمار وجود دارند که کارشان یافتن روش های جمع آوری بهترین داده هاست و در فصل ۳ مورد بحث قرار خواهند گرفت. یکی از این روش ها، طراحی تجربی(۱۶) یا طراحی عملی است. تکنیک های طراحی عملی مربوط به شرایطی است که می توان بعضی از متغیرهای مورد مطالعه را تغییر داد و کنترل کرد. برای مثال در فرآیند تولید یک پلیمر خاص می توان فشار، دما، و زمان واکنش شیمیایی را به دلخواه تنظیم کرد. تغییر در مقدار این سه متغیر در نهایت منجر به تغییر کیفیت محصول نهایی می شود. اما سوال این است که بهترین مجموعه برای مقادیر این متغیرها چیست؟
به کمک طراحی تجربی می توان بیشترین اطلاعات را از منابع در دسترس به دست آورد.
در حالت کلی پاسخ این سوال ساده است. به سادگی مجموعه ای از پلیمرها را با در نظر گرفتن مقادیر مختلف برای متغیرهای آن تولید می کنیم. بدین ترتیب می توانیم، منحنی های پاسخ را بیابیم. منحنی هایی که کیفیت پلیمر حاصل شده را نسبت به هر دسته از مقادیر نشان می دهد. در نهایت بهترین کیفیت و مقادیر متغیرهای متناظر با آن را در نظر می گیریم.
اما اگر فرآیند موردنظر طوری باشد که برای تولید هر محصول مجبور باشیم چند روز زمان صرف کنیم دیگر پیدا کردن متغیرها از این روش امکان پذیر نیست. مثلاً اگر تولید هر محصول ۳ روز طول بکشد و بخواهیم ۱۰۰ نمونه برای این آزمایش تولید کنیم تقریباً یک سال زمان می برد. خوشبختانه طراحی های هوشمندانه تری هم وجود دارند که با مجموعه های کوچک تر از اعداد که به دقت انتخاب شده اند تقریباً به همان اطلاعات خواهیم رسید. گاهی اوقات تعداد نسبتاً کمی آزمایش، اطلاعات کافی در اختیارمان قرار می دهند تا بهترین مقادیر را برای متغیرها به دست آوریم.
مثال ۵: میزان رضایتمندی مشتریان
برای اداره موثر یک مجموعه خرده فروشی و رسیدن به سود دلخواه و رشد در طول زمان بایستی به اندازه کافی به مشتریان، محصولات و سرویس هایی که می خواهند توجه کنیم. در غیر این صورت این مشتریان به سراغ رقیبانی خواهند رفت که کالای موردنظرشان را تامین می کنند و نتیجه این شکست، کاهش درآمد و سود خواهد بود. راه جلوگیری از این شکست جمع آوری اطلاعاتی است که به کمک آنها بدانیم مشتریان قبل از اینکه هزینه ای بکنند چه چیزهایی را مدنظر قرار می دهند. می توان با پرسش از مشتریان میزان رضایتمندی آنان را برآورد کرد و فهمید که آیا از محصولات و سرویس های ارائه شده راضی هستند یا نه، و اینکه این رضایتمندی چگونه می تواند افزایش پیدا کند.
در نگاه اول به نظر می آید برای رسیدن به جوابی مطمئن که رفتار همه مشتریان را منعکس می کند باید از همه آنها نظرسنجی کنیم. واضح است که این کار بسیار زمان گیر و هزینه بر خواهد بود. خوشبختانه روش های آماری وجود دارد که به کمک آنها می توانیم فقط با نظرسنجی از تعداد محدودی از مشتریان به نتایج دقیقی برسیم. در واقع این نتایج ممکن است حتی گاهی دقیق تر از زمانی باشند که همه مشتریان را در نظرسنجی سهیم می کنیم. البته در این سنجش ها باید نهایت دقت صورت بگیرد. همین طور بایستی مراقب باشیم نتیجه گیری هایمان بر پایه یک فضای نمونه نامناسب از مشتریان شکل نگیرد. مثلاً اگر فقط مجموعه ای از مشتریان که پول زیادی برای خرید خرج می کنند را بررسی کرده باشیم، نتایج به دست آمده برای درک رفتار مشتریان در حالت کلی، چندان کاربردی ندارند. مجدداً یادآوری می کنم روش های آماری توسعه یافته ای وجود دارند که جلوی چنین اشتباهاتی را می گیرند و نتایج درست و قابل اطمینانی به دست می دهند.
مثال ۶: کشف کلاهبرداری های بانکی
نقل و انتقالات بانکی تماماً به صورت قانونی صورت نمی گیرند. افراد کلاهبرداری وجود دارند که به سرمایه های بانک و سپرده های مردم دستبرد می زنند. از این رو کشف و جلوگیری از این کلاهبرداری ها از اهمیت ویژه ای برخوردار است. ممکن است بسیاری از خوانندگان با تماس هایی از طرف بانک های خود مواجه شده باشند که مثلاً آیا یک نقل و انتقال خاص را انجام داده اند یا نه؟ این تماس ها معمولاً بر اساس پیش بینی هایی که مدل های آماری ارائه می دهند و در آن رفتار نرمال مشتری ها توصیف می شود، انجام می شوند. وقتی رفتاری نامتعارف صورت می گیرد احتمال بروز موردی مشکوک وجود دارد و باید آن را بررسی کرد.
برای این کار مدل های گوناگونی وجود دارد بعضی از این مدل ها بر پایه الگوهای رفتاری هستند که به خودی خود مشکوک می باشند، مثلاً استفاده همزمان از یک کارت در دو نقطه که به لحاظ جغرافیایی با هم فاصله زیادی دارند. مدل های دیگری نیز وجود دارند که دارای جزئیات بیشتری هستند و بر اساس رفتاری که افراد برحسب عادت از خود نشان می دهند عمل می کنند، مثلاً به اینکه افراد چه موقع، چه مقدار، برای چه محصولی و در چه نوع فروشگاه یا حراجی پول هزینه می کنند، حساسند.
البته هیچ مدل پیشگویی کامل نیست. معمولاً بلافاصله پس از اینکه شخصی خرید غیرمنتظره ای انجام دهد، الگوی نقل و انتقالات کارت اعتباری اش تغییر می کند. علاوه بر این، تنها درصد کمی از نقل و انتقالات کلاهبرداری هستند. چیزی در حدود یک هزارم و این کار تشخیصشان را بسیار مشکل می کند.
تشخیص و جلوگیری از این کلاهبرداری ها یک جنگ همیشگی است: وقتی یکی از این راه های دزدی مسدود می شود، فرد کلاهبردار راه و روش خود را عوض نمی کند و سراغ کسب و کاری قانونی نمی رود، بلکه به دنبال روش های دیگری برای دزدی و کلاهبرداری می گردد، بنابراین مدل های آماری همیشه باید در حال توسعه و بهبود باشند.
مثال ۷: تورم
همه ما با این مسئله آشنا هستیم که قیمت ها به مرور زمان افزایش پیدا می کند اما چگونه می توانیم هزینه زندگی امروز را با گذشته مقایسه کنیم. بر ای اینکار باید قیمت یک کالای خاص را در زمان فعلی و گذشته با هم مقایسه کنیم. متاسفانه پیچیدگی هایی وجود دارد. مثلاً فروشگاه های مختلف برای یک کالای خاص، قیمت های متفاوتی ارائه می دهند. افراد مختلف، کالاهای مختلفی را خریداری می کنند. حتی یک فرد خاص هم الگوی خرید خود را تغییر می دهد. محصولات جدید در فروشگاه ها عرضه می شوند و محصولات قدیمی به مرور زمان دیگر یافت نمی شوند. اما چگونه می توانیم تشخیص دهیم که زندگی امروز پرهزینه تر است یا گذشته؟
اقتصاددان ها و آماردان ها شاخص هایی ارائه می دهند که به کمک آنها هزینه زندگی را اندازه می گیریم. مثلاً شاخص قیمت خرده فروشی(۱۷) و شاخص قیمت مصرف کننده.(۱۸) این شاخص ها بر پایه یک سبد ملی شامل (صدها) کالا که افراد خریداریشان می کنند محاسبه می شوند در حالی که همیشه برآوردهایی برای قیمت هر کدام از این کالاها و وزنشان در سبد کالا انجام می شود. مدل های آماری توسعه یافته، قیمت اقلام مختلف کالاها را با هم ترکیب می کنند، تا یک عدد کلی به دست دهند. عددی که در طول زمان معیار مقایسه قرار می گیرد. معیاری که علاوه بر اینکه شاخصی برای تورم است، برای تعیین میزان مالیات، دستمزد و حقوق مورد استفاده قرار می گیرد.
نتیجه گیری
ممکن است این مسئله همیشه برای افراد بی اطلاع روشن نباشد، اما نظام آماری در متن اکتشافات علمی، فعالیت های تجاری، اداره حکومت ها، سیاست های اجتماعی، کارخانه داری و تولیدات، پزشکی و اغلب دیگر جنبه های فعالیت بشر قرار می گیرد. علاوه بر این با پیشرفت دنیا این نقش مهم و مهم تر می شود. برای مثال پیشرفت شاخه های جدید پزشکی مستلزم همکاری آماردان هاست. چنین پدیده ای امروزه در صنعت بانکداری هم در حال وقوع است. جایی که توافق نامه های بین المللی به مدل های آماری برای ریسک احتیاج دارند. با توجه به این نقش محوری کاملاً روشن است که هیچ جامعه پیشرفته ای نباید از قوانین پایه ای آمار بی اطلاع باشد.
آمار نوین به همراه ابزارهای نرم افزاری توسعه یافته اش برای جست وجو و پردازش داده ها، کمک می کند تا قلمروهای هیجان انگیز جدیدی را جست وجو کنیم. در حقیقت تشخیص اینکه آمار ابزاری برای جست وجوی مجهولات است و نه یک سری محاسبات طاقت فرسای ریاضی، اهمیت زیادی دارد.

نظرات کاربران درباره کتاب آمار