آموزش ابزارهای پایه در علم داده

دوره "The Data Scientist’s Toolbox" یک نقطه شروع بنیادین برای ورود به دنیای علم داده است؛ دنیایی که در آن داده خام به تصمیم‌های آگاهانه و راه‌حل‌های عملی تبدیل می‌شود. در این مسیر، ابتدا با ... بیشتر

0 دانشجو
مقدماتی
Coursera

Brian Caffo

+ 2 مدرس دیگر

به‌روزرسانی: ۱۴۰۴/۰۴/۲۴

محتوای دوره
پیش‌نیاز‌ها
درباره دوره
درباره استاد

آنچه در این دوره می‌آموزید

راه‌اندازی محیط‌های کاری شامل R، RStudio، GitHub و ابزارهای کاربردی دیگر

درک مفاهیم پایه‌ای داده، مسائل تحلیلی و ابزارهای مورد استفاده در علم داده

توضیح مفاهیم کلیدی طراحی مطالعه و ساختار تحقیقاتی

ایجاد مخزن (Repository) در GitHub برای مدیریت و اشتراک‌گذاری پروژه‌ها

محتوای دوره

4 فصل 18 جلسه 1:45 ساعت ویدیو
مبانی علم داده
  چرا ویدیوهای خودکار؟
مشاهده
"05:17
  علم داده چیست؟
مشاهده
"09:02
  داده چیست؟
"06:37
  چگونه کمک بگیریم؟
"10:05
  فرایند علم داده
"08:40
برنامه‌نویسی با R و محیط RStudio
مدیریت نسخه و همکاری با Git و GitHub
نگارش علمی و کار با کلان‌داده‌ها با R Markdown

پیش‌نیاز‌ها

این دوره به نحوی تهیه و تدوین شده است که مباحث آن به ساده‌ترین شکل ممکن بیان شوند و مخاطبان دوره بتوانند به‌سادگی متوجه موضوعات مطرح شده شوند. به همین جهت برای شرکت در این دوره هیچ پیش‌نیاز به خصوصی وجود ندارد و افراد با هر سطحی از آگاهی و تحصیلات می‌توانند از مباحث این دوره نهایت استفاده را داشته باشند.

درباره دوره

دوره "The Data Scientist’s Toolbox" یک نقطه شروع بنیادین برای ورود به دنیای علم داده است؛ دنیایی که در آن داده خام به تصمیم‌های آگاهانه و راه‌حل‌های عملی تبدیل می‌شود. در این مسیر، ابتدا با مفاهیم کلیدی علم داده آشنا خواهید شد: از چیستی داده و اهمیت آن در تصمیم‌گیری گرفته تا سؤالات رایجی که تحلیل‌گران و دانشمندان داده با آن‌ها مواجه می‌شوند.

درک تفاوت بین انواع پرسش‌های تحلیلی، آشنایی با فرایند طراحی آزمایش، و آموختن نحوه تفکر علمی در مواجهه با داده، همه بخشی از محتوای مفهومی این دوره هستند. همچنین با مفهوم «کلان‌داده» آشنا می‌شوید و می‌آموزید چگونه با چالش‌های حجیم بودن داده در دنیای واقعی مواجه شوید. این بخش از دوره تلاش می‌کند به شما دیدی ساختاریافته و تحلیلی نسبت به داده بدهد تا بتوانید با درک عمیق‌تری وارد مرحله‌ی استفاده از ابزارهای تخصصی شوید.

در بخش دوم، تمرکز بر آموزش عملی ابزارهایی است که هر دانشمند داده در دنیای واقعی به آن‌ها نیاز دارد. از نصب و راه‌اندازی زبان برنامه‌نویسی R و محیط توسعه RStudio گرفته تا استفاده از کنترل نسخه با Git و GitHub برای ردیابی تغییرات و مدیریت حرفه‌ای پروژه‌های تحلیلی.

همچنین با R Markdown آشنا می‌شوید، ابزاری قدرتمند برای مستندسازی و گزارش‌نویسی تحلیلی که امکان ترکیب کد، متن، نمودار و خروجی را در یک سند منسجم فراهم می‌کند. یاد می‌گیرید چگونه پروژه‌های خود را ساختاریافته شروع کرده، به‌طور مؤثر با دیگران همکاری کنید، و نتایج تحلیل خود را شفاف، بازتولیدپذیر و حرفه‌ای ارائه دهید.

این دوره نه‌فقط آموزش یک‌سری ابزار فنی است، بلکه یک رویکرد ذهنی، منطقی و حرفه‌ای برای کار با داده را در اختیار شما قرار می‌دهد.مهارتی حیاتی برای موفقیت در هر مسیر حرفه‌ای مرتبط با داده.

اطلاعات بیشتر

درباره استاد

Brian Caffo
4 دوره
63 دانشجو

Brian Caffo، دکترا استاد زیست‌آمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز است. او در سال ۲۰۰۱ از گروه آمار دانشگاه فلوریدا فارغ‌التحصیل شد و در زمینه‌های آمار محاسباتی و نورواینفورماتیک فعالیت می‌کند. دکتر کافو یکی از بنیان‌گذاران گروه پژوهشی SMART (Smart Statistics, www.smart-stats.org) است که بر توسعه روش‌های آماری پیشرفته تمرکز دارد. او به دلیل دستاوردهای برجسته علمی و آموزشی خود، موفق به دریافت جایزه ریاست‌جمهوری برای دانشمندان و مهندسان جوان (PECASE) شده است. علاوه بر این، او جوایز سیب طلایی دانشکده بلومبرگ (Golden Apple Award) و جایزه آموزش AMTRA را نیز به دلیل تعهد و تأثیرگذاری در آموزش آمار زیستی دریافت کرده است.

اطلاعات بیشتر

دیگر دوره‌های Brian Caffo

Jeff Leek
4 دوره
63 دانشجو

Jeff Leek مدیر ارشد داده (Chief Data Officer)، معاون رئیس و رئیس بنیاد J Orin Edson در دپارتمان زیست‌آمار علوم بهداشت عمومی در مرکز سرطان فرد هاچینسون است. پیش از این، او استاد زیست‌آمار و آنکولوژی در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و هم‌مدیر آزمایشگاه علوم داده جانز هاپکینز بوده است. دکتر لیک مدرک دکترای زیست‌آمار خود را از دانشگاه واشنگتن دریافت کرده و به دلیل مشارکت‌های برجسته در تحلیل داده‌های ژنومی و توسعه روش‌های آماری برای پزشکی شخصی‌سازی‌شده شناخته می‌شود. تحلیل‌های داده‌ای او به درک بهتر مکانیسم‌های مولکولی رشد مغز، خودنوسازی سلول‌های بنیادی و پاسخ ایمنی بدن به آسیب‌های شدید کمک کرده است. پژوهش‌های او در برترین مجلات علمی و پزشکی مانند Nature، Proceedings of the National Academy of Sciences، Genome Biology و PLoS Medicine منتشر شده‌اند.

او دوره تحلیل داده را به‌عنوان بخشی از مجموعه دروس اصلی روش‌های آماری سالانه برای دانشجویان زیست‌آمار در دانشگاه جانز هاپکینز طراحی کرد. این دوره، هر سال که توسط دکتر لیک تدریس شده، موفق به دریافت جایزه برتری در آموزش شده است؛ جایزه‌ای که توسط دانشجویان جانز هاپکینز به بهترین دوره آموزشی اعطا می‌شود.

اطلاعات بیشتر

دیگر دوره‌های Jeff Leek

Roger D. Peng
4 دوره
63 دانشجو

Roger D. Peng, استاد زیست‌آمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و یکی از ویراستاران وبلاگ Simply Statistics است. او مدرک دکترای آمار خود را از دانشگاه کالیفرنیا، لس‌آنجلس (UCLA) دریافت کرده و یکی از پژوهشگران برجسته در زمینه آلودگی هوا، ارزیابی خطرات بهداشتی و روش‌های آماری برای داده‌های محیط‌زیستی محسوب می‌شود. دکتر پنگ در سال ۲۰۱۶ برنده جایزه معتبر Mortimer Spiegelman از انجمن بهداشت عمومی آمریکا شد؛ جایزه‌ای که به آمارشناسانی اعطا می‌شود که مشارکت‌های چشمگیری در زمینه آمار سلامت داشته باشند. او دوره برنامه‌نویسی آماری را در دانشگاه جانز هاپکینز طراحی کرد تا دانشجویان را با ابزارهای محاسباتی موردنیاز برای تحلیل داده‌ها آشنا کند.

دکتر پنگ یکی از رهبران ملی در حوزه روش‌ها و استانداردهای پژوهش‌های بازتولیدپذیر است و به‌عنوان ویراستار بخش پژوهش‌های بازتولیدپذیر در ژورنال Biostatistics فعالیت می‌کند. پژوهش‌های او ماهیتی بین‌رشته‌ای دارند و مقالاتش در معتبرترین مجلات علمی و آماری از جمله Journal of the American Medical Association و Journal of the Royal Statistical Society منتشر شده‌اند. او بیش از دوازده بسته نرم‌افزاری را توسعه داده که شامل پیاده‌سازی روش‌های آماری برای مطالعات محیط‌زیستی، ابزارهای پژوهش‌های بازتولیدپذیر و توزیع داده‌ها است. دکتر پنگ همچنین کارگاه‌ها، آموزش‌های تخصصی و دوره‌های کوتاه‌مدت در زمینه محاسبات آماری و تحلیل داده‌ها برگزار کرده و نقش مهمی در ترویج روش‌های مدرن تحلیل داده و استانداردهای علمی ایفا کرده است.

اطلاعات بیشتر

دیگر دوره‌های Roger D. Peng

سوالات پرتکرار

پس از سپری شدن زمان دوره، به محتوای دوره دسترسی خواهم داشت؟

بله؛ پس از سپری شدن مدت زمان دوره شما به محتوای دوره دسترسی خواهید داشت و می توانید از ویدئوها، تمارین، پروژه و دیگر محتوای دوره در صورت وجود استفاده کنید ولی امکان تصحیح تمارین توسط پشتیبان و دریافت گواهی نامه برای شما وجود نخواهد داشت.