استنتاج آماری یکی از پایههای اساسی تحلیل دادهها و تصمیمگیریهای مبتنی بر آمار است که به ما امکان میدهد از دادههای نمونهای به نتایج کلی دربارهی یک جمعیت یا حقیقت علمی برسیم. این فرایند میتواند ... بیشتر
Brian Caffo
+ 2 مدرس دیگر
بهروزرسانی: ۱۴۰۳/۱۲/۲۱
درک مفاهیم بنیادین استنتاج آماری
توانایی انتخاب و اعمال روشهای مناسب در تحلیل دادهها
تقویت مهارتهای عملی در استفاده از روشهای آماری
افزایش توانایی تفسیر نتایج و اتخاذ تصمیمات دادهمحور
این دوره به نحوی تهیه و تدوین شده است که مباحث آن به سادهترین شکل ممکن بیان شوند و مخاطبان دوره بتوانند بهسادگی متوجه موضوعات مطرح شده شوند. به همین جهت برای شرکت در این دوره هیچ پیشنیاز به خصوصی وجود ندارد و افراد با هر سطحی از آگاهی و تحصیلات میتوانند از مباحث این دوره نهایت استفاده را داشته باشند.
استنتاج آماری یکی از پایههای اساسی تحلیل دادهها و تصمیمگیریهای مبتنی بر آمار است که به ما امکان میدهد از دادههای نمونهای به نتایج کلی دربارهی یک جمعیت یا حقیقت علمی برسیم. این فرایند میتواند از طریق مدلسازی آماری، استراتژیهای مبتنی بر داده، و بهرهگیری از طراحیهای تجربی و تصادفیسازی انجام شود.
علاوه بر این، استنتاج آماری تحت تأثیر نظریههای مختلفی از جمله فروانیگرایی، بیزی، درستنمایی و روشهای مبتنی بر طراحی قرار دارد که هرکدام رویکردها و مزایای خاص خود را دارند. با این حال، پیچیدگیهایی مانند دادههای از دست رفته، عوامل مخدوشکنندهی آشکار و پنهان، و انواع سوگیریها، درک و پیادهسازی صحیح این تکنیکها را دشوار میکند.
بسیاری از افراد در مسیر یادگیری استنتاج آماری، با انبوهی از تکنیکها، فلسفههای مختلف و تفاوتهای ظریف نظری روبهرو میشوند که میتواند آنها را در یک هزارتوی گیجکننده از روشهای تحلیلی گرفتار کند. هدف دوره "Statistical Inference"، ارائهی یک مسیر روشن و عملی برای یادگیری اصول بنیادین استنتاج آماری است تا دانشجویان و متخصصان بتوانند بهصورت آگاهانه روشهای مناسب را انتخاب کرده و در تحلیل دادههای خود به کار گیرند.
این دوره با معرفی اصول احتمال آغاز میشود و در آن، مفاهیم کلیدی مانند توابع جرم احتمال (PMF) و توابع چگالی احتمال (PDF)، احتمال شرطی، قاعدهی بیز و مفهوم استقلال پوشش داده میشوند.
پس از آن، مقادیر مورد انتظار، انواع واریانس و خطای استاندارد میانگین معرفی شده و با ارائهی مثالهای عملی، درک عمیقتری از این مفاهیم ایجاد میشود. سپس، توزیعهای مهم آماری از جمله توزیع دو جملهای، نرمال و پواسون بررسی میشوند که پایه و اساس بسیاری از تحلیلهای آماری را تشکیل میدهند. در ادامه، با ورود به مبحث مجانبت، قانون اعداد بزرگ (LLN) و قضیهی حد مرکزی (CLT)، دانشجویان یاد میگیرند که چگونه دادههای نمونهای را به شکل دقیقتری تحلیل کنند و ویژگیهای جمعیتهای بزرگتر را بر اساس آن استنتاج نمایند.
با پیشروی در مباحث دوره، مفهوم بازههای اطمینان و آزمونهای فرض بررسی میشود تا شرکتکنندگان درک درستی از ارزیابی فرضیات آماری و نحوهی تصمیمگیری بر اساس دادهها به دست آورند. سپس، مقدار P و نحوهی تفسیر آن در آزمونهای آماری مورد بررسی قرار میگیرد تا شرکتکنندگان بتوانند بهصورت علمی و مستدل دربارهی رد یا عدم رد فرضیهها تصمیمگیری کنند.
همچنین، مفاهیم پیشرفتهتری مانند قدرت آزمون، محاسبهی آن و تأثیر واریانس نابرابر بر آزمونهای تی ارائه خواهد شد. در بخشهای پایانی، موضوعاتی مانند مقایسههای متعدد و روشهای تصحیح خطا در آنها، بوتاسترپینگ به عنوان یکی از روشهای قدرتمند برآورد آماری، و آزمونهای جایگشتی برای بررسی تفاوتها بدون فرضیات توزیعی خاص، به تفصیل آموزش داده میشود.
در پایان این دوره، شرکتکنندگان نهتنها به درک جامعی از استنتاج آماری و اصول تحلیل دادهها دست خواهند یافت، بلکه مهارت لازم برای استفاده از این دانش در حل مسائل عملی و اتخاذ تصمیمهای مبتنی بر داده را نیز کسب خواهند کرد.
اطلاعات بیشتر
Brian Caffo، دکترا استاد زیستآمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز است. او در سال ۲۰۰۱ از گروه آمار دانشگاه فلوریدا فارغالتحصیل شد و در زمینههای آمار محاسباتی و نورواینفورماتیک فعالیت میکند. دکتر کافو یکی از بنیانگذاران گروه پژوهشی SMART (Smart Statistics, www.smart-stats.org) است که بر توسعه روشهای آماری پیشرفته تمرکز دارد. او به دلیل دستاوردهای برجسته علمی و آموزشی خود، موفق به دریافت جایزه ریاستجمهوری برای دانشمندان و مهندسان جوان (PECASE) شده است. علاوه بر این، او جوایز سیب طلایی دانشکده بلومبرگ (Golden Apple Award) و جایزه آموزش AMTRA را نیز به دلیل تعهد و تأثیرگذاری در آموزش آمار زیستی دریافت کرده است.
اطلاعات بیشتر
Jeff Leek مدیر ارشد داده (Chief Data Officer)، معاون رئیس و رئیس بنیاد J Orin Edson در دپارتمان زیستآمار علوم بهداشت عمومی در مرکز سرطان فرد هاچینسون است. پیش از این، او استاد زیستآمار و آنکولوژی در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و هممدیر آزمایشگاه علوم داده جانز هاپکینز بوده است. دکتر لیک مدرک دکترای زیستآمار خود را از دانشگاه واشنگتن دریافت کرده و به دلیل مشارکتهای برجسته در تحلیل دادههای ژنومی و توسعه روشهای آماری برای پزشکی شخصیسازیشده شناخته میشود. تحلیلهای دادهای او به درک بهتر مکانیسمهای مولکولی رشد مغز، خودنوسازی سلولهای بنیادی و پاسخ ایمنی بدن به آسیبهای شدید کمک کرده است. پژوهشهای او در برترین مجلات علمی و پزشکی مانند Nature، Proceedings of the National Academy of Sciences، Genome Biology و PLoS Medicine منتشر شدهاند.
او دوره تحلیل داده را بهعنوان بخشی از مجموعه دروس اصلی روشهای آماری سالانه برای دانشجویان زیستآمار در دانشگاه جانز هاپکینز طراحی کرد. این دوره، هر سال که توسط دکتر لیک تدریس شده، موفق به دریافت جایزه برتری در آموزش شده است؛ جایزهای که توسط دانشجویان جانز هاپکینز به بهترین دوره آموزشی اعطا میشود.
اطلاعات بیشتر
Roger D. Peng, استاد زیستآمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و یکی از ویراستاران وبلاگ Simply Statistics است. او مدرک دکترای آمار خود را از دانشگاه کالیفرنیا، لسآنجلس (UCLA) دریافت کرده و یکی از پژوهشگران برجسته در زمینه آلودگی هوا، ارزیابی خطرات بهداشتی و روشهای آماری برای دادههای محیطزیستی محسوب میشود. دکتر پنگ در سال ۲۰۱۶ برنده جایزه معتبر Mortimer Spiegelman از انجمن بهداشت عمومی آمریکا شد؛ جایزهای که به آمارشناسانی اعطا میشود که مشارکتهای چشمگیری در زمینه آمار سلامت داشته باشند. او دوره برنامهنویسی آماری را در دانشگاه جانز هاپکینز طراحی کرد تا دانشجویان را با ابزارهای محاسباتی موردنیاز برای تحلیل دادهها آشنا کند.
دکتر پنگ یکی از رهبران ملی در حوزه روشها و استانداردهای پژوهشهای بازتولیدپذیر است و بهعنوان ویراستار بخش پژوهشهای بازتولیدپذیر در ژورنال Biostatistics فعالیت میکند. پژوهشهای او ماهیتی بینرشتهای دارند و مقالاتش در معتبرترین مجلات علمی و آماری از جمله Journal of the American Medical Association و Journal of the Royal Statistical Society منتشر شدهاند. او بیش از دوازده بسته نرمافزاری را توسعه داده که شامل پیادهسازی روشهای آماری برای مطالعات محیطزیستی، ابزارهای پژوهشهای بازتولیدپذیر و توزیع دادهها است. دکتر پنگ همچنین کارگاهها، آموزشهای تخصصی و دورههای کوتاهمدت در زمینه محاسبات آماری و تحلیل دادهها برگزار کرده و نقش مهمی در ترویج روشهای مدرن تحلیل داده و استانداردهای علمی ایفا کرده است.
اطلاعات بیشتر