آموزش استنتاج آماری برای تصمیم‌گیری داده‌محور

استنتاج آماری یکی از پایه‌های اساسی تحلیل داده‌ها و تصمیم‌گیری‌های مبتنی بر آمار است که به ما امکان می‌دهد از داده‌های نمونه‌ای به نتایج کلی درباره‌ی یک جمعیت یا حقیقت علمی برسیم. این فرایند می‌تواند ... بیشتر

جدید
زیرنویس
24 دانشجو
مقدماتی
Coursera

Brian Caffo

+ 2 مدرس دیگر

به‌روزرسانی: ۱۴۰۳/۱۲/۲۱

محتوای دوره
پیش‌نیاز‌ها
درباره دوره
درباره استاد

آنچه در این دوره می‌آموزید

درک مفاهیم بنیادین استنتاج آماری

توانایی انتخاب و اعمال روش‌های مناسب در تحلیل داده‌ها

تقویت مهارت‌های عملی در استفاده از روش‌های آماری

افزایش توانایی تفسیر نتایج و اتخاذ تصمیمات داده‌محور

محتوای دوره

4 فصل 40 جلسه 5 ساعت ویدیو
احتمال و مقادیر مورد انتظار
  معرفی
مشاهده
"07:05
  مقدمه‌ای بر احتمال
مشاهده
"06:13
  توابع جرم احتمال
"07:14
  توابع چگالی احتمال
"13:27
  احتمال شرطی
"03:23
  قاعده بیز
"07:52
  استقلال
"03:04
  مقادیر مورد انتظار
"05:14
  مثال‌های ساده از مقادیر مورد انتظار
"02:12
  مقادیر مورد انتظار برای توابع چگالی احتمال
"07:46
تغییرپذیری، توزیع و مجانبت
بازه‌ها، آزمون‌ها و مقادیر P
توان، بوت‌استرپینگ و آزمون‌های جایگشتی

پیش‌نیاز‌ها

این دوره به نحوی تهیه و تدوین شده است که مباحث آن به ساده‌ترین شکل ممکن بیان شوند و مخاطبان دوره بتوانند به‌سادگی متوجه موضوعات مطرح شده شوند. به همین جهت برای شرکت در این دوره هیچ پیش‌نیاز به خصوصی وجود ندارد و افراد با هر سطحی از آگاهی و تحصیلات می‌توانند از مباحث این دوره نهایت استفاده را داشته باشند.

درباره دوره

استنتاج آماری یکی از پایه‌های اساسی تحلیل داده‌ها و تصمیم‌گیری‌های مبتنی بر آمار است که به ما امکان می‌دهد از داده‌های نمونه‌ای به نتایج کلی درباره‌ی یک جمعیت یا حقیقت علمی برسیم. این فرایند می‌تواند از طریق مدل‌سازی آماری، استراتژی‌های مبتنی بر داده، و بهره‌گیری از طراحی‌های تجربی و تصادفی‌سازی انجام شود.

علاوه بر این، استنتاج آماری تحت تأثیر نظریه‌های مختلفی از جمله فروانی‌گرایی، بیزی، درست‌نمایی و روش‌های مبتنی بر طراحی قرار دارد که هرکدام رویکردها و مزایای خاص خود را دارند. با این حال، پیچیدگی‌هایی مانند داده‌های از دست رفته، عوامل مخدوش‌کننده‌ی آشکار و پنهان، و انواع سوگیری‌ها، درک و پیاده‌سازی صحیح این تکنیک‌ها را دشوار می‌کند.

بسیاری از افراد در مسیر یادگیری استنتاج آماری، با انبوهی از تکنیک‌ها، فلسفه‌های مختلف و تفاوت‌های ظریف نظری روبه‌رو می‌شوند که می‌تواند آن‌ها را در یک هزارتوی گیج‌کننده از روش‌های تحلیلی گرفتار کند. هدف دوره "Statistical Inference"، ارائه‌ی یک مسیر روشن و عملی برای یادگیری اصول بنیادین استنتاج آماری است تا دانشجویان و متخصصان بتوانند به‌صورت آگاهانه روش‌های مناسب را انتخاب کرده و در تحلیل داده‌های خود به کار گیرند.

این دوره با معرفی اصول احتمال آغاز می‌شود و در آن، مفاهیم کلیدی مانند توابع جرم احتمال (PMF) و توابع چگالی احتمال (PDF)، احتمال شرطی، قاعده‌ی بیز و مفهوم استقلال پوشش داده می‌شوند.

پس از آن، مقادیر مورد انتظار، انواع واریانس و خطای استاندارد میانگین معرفی شده و با ارائه‌ی مثال‌های عملی، درک عمیق‌تری از این مفاهیم ایجاد می‌شود. سپس، توزیع‌های مهم آماری از جمله توزیع دو جمله‌ای، نرمال و پواسون بررسی می‌شوند که پایه و اساس بسیاری از تحلیل‌های آماری را تشکیل می‌دهند. در ادامه، با ورود به مبحث مجانبت، قانون اعداد بزرگ (LLN) و قضیه‌ی حد مرکزی (CLT)، دانشجویان یاد می‌گیرند که چگونه داده‌های نمونه‌ای را به شکل دقیق‌تری تحلیل کنند و ویژگی‌های جمعیت‌های بزرگ‌تر را بر اساس آن استنتاج نمایند.

با پیشروی در مباحث دوره، مفهوم بازه‌های اطمینان و آزمون‌های فرض بررسی می‌شود تا شرکت‌کنندگان درک درستی از ارزیابی فرضیات آماری و نحوه‌ی تصمیم‌گیری بر اساس داده‌ها به دست آورند. سپس، مقدار P و نحوه‌ی تفسیر آن در آزمون‌های آماری مورد بررسی قرار می‌گیرد تا شرکت‌کنندگان بتوانند به‌صورت علمی و مستدل درباره‌ی رد یا عدم رد فرضیه‌ها تصمیم‌گیری کنند.

همچنین، مفاهیم پیشرفته‌تری مانند قدرت آزمون، محاسبه‌ی آن و تأثیر واریانس نابرابر بر آزمون‌های تی ارائه خواهد شد. در بخش‌های پایانی، موضوعاتی مانند مقایسه‌های متعدد و روش‌های تصحیح خطا در آن‌ها، بوت‌استرپینگ به عنوان یکی از روش‌های قدرتمند برآورد آماری، و آزمون‌های جایگشتی برای بررسی تفاوت‌ها بدون فرضیات توزیعی خاص، به تفصیل آموزش داده می‌شود.

در پایان این دوره، شرکت‌کنندگان نه‌تنها به درک جامعی از استنتاج آماری و اصول تحلیل داده‌ها دست خواهند یافت، بلکه مهارت لازم برای استفاده از این دانش در حل مسائل عملی و اتخاذ تصمیم‌های مبتنی بر داده را نیز کسب خواهند کرد.

اطلاعات بیشتر

دوره‌های پیشنهادی

درباره استاد

Brian Caffo
3 دوره
41 دانشجو

Brian Caffo، دکترا استاد زیست‌آمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز است. او در سال ۲۰۰۱ از گروه آمار دانشگاه فلوریدا فارغ‌التحصیل شد و در زمینه‌های آمار محاسباتی و نورواینفورماتیک فعالیت می‌کند. دکتر کافو یکی از بنیان‌گذاران گروه پژوهشی SMART (Smart Statistics, www.smart-stats.org) است که بر توسعه روش‌های آماری پیشرفته تمرکز دارد. او به دلیل دستاوردهای برجسته علمی و آموزشی خود، موفق به دریافت جایزه ریاست‌جمهوری برای دانشمندان و مهندسان جوان (PECASE) شده است. علاوه بر این، او جوایز سیب طلایی دانشکده بلومبرگ (Golden Apple Award) و جایزه آموزش AMTRA را نیز به دلیل تعهد و تأثیرگذاری در آموزش آمار زیستی دریافت کرده است.

اطلاعات بیشتر

دیگر دوره‌های Brian Caffo

Jeff Leek
3 دوره
41 دانشجو

Jeff Leek مدیر ارشد داده (Chief Data Officer)، معاون رئیس و رئیس بنیاد J Orin Edson در دپارتمان زیست‌آمار علوم بهداشت عمومی در مرکز سرطان فرد هاچینسون است. پیش از این، او استاد زیست‌آمار و آنکولوژی در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و هم‌مدیر آزمایشگاه علوم داده جانز هاپکینز بوده است. دکتر لیک مدرک دکترای زیست‌آمار خود را از دانشگاه واشنگتن دریافت کرده و به دلیل مشارکت‌های برجسته در تحلیل داده‌های ژنومی و توسعه روش‌های آماری برای پزشکی شخصی‌سازی‌شده شناخته می‌شود. تحلیل‌های داده‌ای او به درک بهتر مکانیسم‌های مولکولی رشد مغز، خودنوسازی سلول‌های بنیادی و پاسخ ایمنی بدن به آسیب‌های شدید کمک کرده است. پژوهش‌های او در برترین مجلات علمی و پزشکی مانند Nature، Proceedings of the National Academy of Sciences، Genome Biology و PLoS Medicine منتشر شده‌اند.

او دوره تحلیل داده را به‌عنوان بخشی از مجموعه دروس اصلی روش‌های آماری سالانه برای دانشجویان زیست‌آمار در دانشگاه جانز هاپکینز طراحی کرد. این دوره، هر سال که توسط دکتر لیک تدریس شده، موفق به دریافت جایزه برتری در آموزش شده است؛ جایزه‌ای که توسط دانشجویان جانز هاپکینز به بهترین دوره آموزشی اعطا می‌شود.

اطلاعات بیشتر

دیگر دوره‌های Jeff Leek

Roger D. Peng
3 دوره
41 دانشجو

Roger D. Peng, استاد زیست‌آمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و یکی از ویراستاران وبلاگ Simply Statistics است. او مدرک دکترای آمار خود را از دانشگاه کالیفرنیا، لس‌آنجلس (UCLA) دریافت کرده و یکی از پژوهشگران برجسته در زمینه آلودگی هوا، ارزیابی خطرات بهداشتی و روش‌های آماری برای داده‌های محیط‌زیستی محسوب می‌شود. دکتر پنگ در سال ۲۰۱۶ برنده جایزه معتبر Mortimer Spiegelman از انجمن بهداشت عمومی آمریکا شد؛ جایزه‌ای که به آمارشناسانی اعطا می‌شود که مشارکت‌های چشمگیری در زمینه آمار سلامت داشته باشند. او دوره برنامه‌نویسی آماری را در دانشگاه جانز هاپکینز طراحی کرد تا دانشجویان را با ابزارهای محاسباتی موردنیاز برای تحلیل داده‌ها آشنا کند.

دکتر پنگ یکی از رهبران ملی در حوزه روش‌ها و استانداردهای پژوهش‌های بازتولیدپذیر است و به‌عنوان ویراستار بخش پژوهش‌های بازتولیدپذیر در ژورنال Biostatistics فعالیت می‌کند. پژوهش‌های او ماهیتی بین‌رشته‌ای دارند و مقالاتش در معتبرترین مجلات علمی و آماری از جمله Journal of the American Medical Association و Journal of the Royal Statistical Society منتشر شده‌اند. او بیش از دوازده بسته نرم‌افزاری را توسعه داده که شامل پیاده‌سازی روش‌های آماری برای مطالعات محیط‌زیستی، ابزارهای پژوهش‌های بازتولیدپذیر و توزیع داده‌ها است. دکتر پنگ همچنین کارگاه‌ها، آموزش‌های تخصصی و دوره‌های کوتاه‌مدت در زمینه محاسبات آماری و تحلیل داده‌ها برگزار کرده و نقش مهمی در ترویج روش‌های مدرن تحلیل داده و استانداردهای علمی ایفا کرده است.

اطلاعات بیشتر

دیگر دوره‌های Roger D. Peng

سوالات پرتکرار

پس از سپری شدن زمان دوره، به محتوای دوره دسترسی خواهم داشت؟

بله؛ پس از سپری شدن مدت زمان دوره شما به محتوای دوره دسترسی خواهید داشت و می توانید از ویدئوها، تمارین، پروژه و دیگر محتوای دوره در صورت وجود استفاده کنید ولی امکان تصحیح تمارین توسط پشتیبان و دریافت گواهی نامه برای شما وجود نخواهد داشت.

تمام حقوق این وب‌سایت برای شرکت ندای دانش همراه ایرانیان (مکتب‌خونه‌‌‌‌) است.