هدف علم داده بهبود تصمیمگیری بر مبنای تصمیمات و بینشهایی است که از مجموعه دادههای بزرگ استخراج شدند. علم داده بهعنوان یک زمینه کاری، مجموعهای از اصول، تعاریف مسئله، الگوریتمها و فرآیندهای مربوط به استخراج الگوهای غیرقابل مشاهده و سودمند از مجموعه دادههای بزرگ را در بر میگیرد. علم داده با رشتههای دادهکاوی و یادگیری ماشین ارتباط نزدیکی دارد اما نسبت به آنها دارای حوزه کاربرد گستردهتری است. امروزه علم داده تصمیمگیری، تقریبا همه بخشهای جوامع پیشرفته را تحت تاثیر قرار داده است. علم داده با روشهای متعددی میتواند زندگی روزمره شما را تحت تاثیر قرار دهد که عبارتند از: تعیین تبلیغات و آگهیهایی که به صورت آنلاین برای شما ارسال میشوند، نوع فیلمها، کتابها و روابط دوستانهای که به شما پیشنهاد میشوند، کدام ایمیلها در پوشه اسپم قرار میگیرند، پیشنهاداتی که هنگام تمدید خدمات تلفن همراه دریافت میکنید، هزینه بیمه درمانی، ترتیبدهی و زمانبندی چراغهای راهنمایی منطقه سکونت شما، نحوه طراحی داروهای مورد نیازتان و اینکه پلیس کدام موقعیتهای شهر را هدفگیری کرده است.
رشد روزافزون استفاده از علم داده در جوامع ناشی از ظهور کلاندادهها و رسانههای اجتماعی، تسریع در انجام محاسبات، کاهش شدید در ارزش حافظه رایانه و توسعه روشهای کارآمدتر برای تجزیه و تحلیل و مدلسازی مانند یادگیری عمیق است. مجموع این عوامل بدین معناست که جمعآوری، ذخیرهسازی و پردازش دادهها هرگز برای سازمانها آسان نبوده. همچنین این نوآوریهای تخصصی و کاربرد گستردهتر علم داده به این معناست که چالشهای اخلاقی مربوط به استفاده از علم داده و محافظت از حریم خصوصی افراد تا این حد اساسی و مهم نبوده است. هدف این کتاب ارائه مقدمهای در مورد علم داده میباشد که عناصر ضروری این رشته را بهطور دقیق و کامل پوشش میدهد و درک اصولی این رشته را فراهم میکند.