دوره "The Data Scientist’s Toolbox" یک نقطه شروع بنیادین برای ورود به دنیای علم داده است؛ دنیایی که در آن داده خام به تصمیمهای آگاهانه و راهحلهای عملی تبدیل میشود. در این مسیر، ابتدا با ... بیشتر
Brian Caffo
+ 2 مدرس دیگر
بهروزرسانی: ۱۴۰۴/۰۴/۲۴
راهاندازی محیطهای کاری شامل R، RStudio، GitHub و ابزارهای کاربردی دیگر
درک مفاهیم پایهای داده، مسائل تحلیلی و ابزارهای مورد استفاده در علم داده
توضیح مفاهیم کلیدی طراحی مطالعه و ساختار تحقیقاتی
ایجاد مخزن (Repository) در GitHub برای مدیریت و اشتراکگذاری پروژهها
این دوره به نحوی تهیه و تدوین شده است که مباحث آن به سادهترین شکل ممکن بیان شوند و مخاطبان دوره بتوانند بهسادگی متوجه موضوعات مطرح شده شوند. به همین جهت برای شرکت در این دوره هیچ پیشنیاز به خصوصی وجود ندارد و افراد با هر سطحی از آگاهی و تحصیلات میتوانند از مباحث این دوره نهایت استفاده را داشته باشند.
دوره "The Data Scientist’s Toolbox" یک نقطه شروع بنیادین برای ورود به دنیای علم داده است؛ دنیایی که در آن داده خام به تصمیمهای آگاهانه و راهحلهای عملی تبدیل میشود. در این مسیر، ابتدا با مفاهیم کلیدی علم داده آشنا خواهید شد: از چیستی داده و اهمیت آن در تصمیمگیری گرفته تا سؤالات رایجی که تحلیلگران و دانشمندان داده با آنها مواجه میشوند.
درک تفاوت بین انواع پرسشهای تحلیلی، آشنایی با فرایند طراحی آزمایش، و آموختن نحوه تفکر علمی در مواجهه با داده، همه بخشی از محتوای مفهومی این دوره هستند. همچنین با مفهوم «کلانداده» آشنا میشوید و میآموزید چگونه با چالشهای حجیم بودن داده در دنیای واقعی مواجه شوید. این بخش از دوره تلاش میکند به شما دیدی ساختاریافته و تحلیلی نسبت به داده بدهد تا بتوانید با درک عمیقتری وارد مرحلهی استفاده از ابزارهای تخصصی شوید.
در بخش دوم، تمرکز بر آموزش عملی ابزارهایی است که هر دانشمند داده در دنیای واقعی به آنها نیاز دارد. از نصب و راهاندازی زبان برنامهنویسی R و محیط توسعه RStudio گرفته تا استفاده از کنترل نسخه با Git و GitHub برای ردیابی تغییرات و مدیریت حرفهای پروژههای تحلیلی.
همچنین با R Markdown آشنا میشوید، ابزاری قدرتمند برای مستندسازی و گزارشنویسی تحلیلی که امکان ترکیب کد، متن، نمودار و خروجی را در یک سند منسجم فراهم میکند. یاد میگیرید چگونه پروژههای خود را ساختاریافته شروع کرده، بهطور مؤثر با دیگران همکاری کنید، و نتایج تحلیل خود را شفاف، بازتولیدپذیر و حرفهای ارائه دهید.
این دوره نهفقط آموزش یکسری ابزار فنی است، بلکه یک رویکرد ذهنی، منطقی و حرفهای برای کار با داده را در اختیار شما قرار میدهد.مهارتی حیاتی برای موفقیت در هر مسیر حرفهای مرتبط با داده.
اطلاعات بیشتر
Brian Caffo، دکترا استاد زیستآمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز است. او در سال ۲۰۰۱ از گروه آمار دانشگاه فلوریدا فارغالتحصیل شد و در زمینههای آمار محاسباتی و نورواینفورماتیک فعالیت میکند. دکتر کافو یکی از بنیانگذاران گروه پژوهشی SMART (Smart Statistics, www.smart-stats.org) است که بر توسعه روشهای آماری پیشرفته تمرکز دارد. او به دلیل دستاوردهای برجسته علمی و آموزشی خود، موفق به دریافت جایزه ریاستجمهوری برای دانشمندان و مهندسان جوان (PECASE) شده است. علاوه بر این، او جوایز سیب طلایی دانشکده بلومبرگ (Golden Apple Award) و جایزه آموزش AMTRA را نیز به دلیل تعهد و تأثیرگذاری در آموزش آمار زیستی دریافت کرده است.
اطلاعات بیشتر
Jeff Leek مدیر ارشد داده (Chief Data Officer)، معاون رئیس و رئیس بنیاد J Orin Edson در دپارتمان زیستآمار علوم بهداشت عمومی در مرکز سرطان فرد هاچینسون است. پیش از این، او استاد زیستآمار و آنکولوژی در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و هممدیر آزمایشگاه علوم داده جانز هاپکینز بوده است. دکتر لیک مدرک دکترای زیستآمار خود را از دانشگاه واشنگتن دریافت کرده و به دلیل مشارکتهای برجسته در تحلیل دادههای ژنومی و توسعه روشهای آماری برای پزشکی شخصیسازیشده شناخته میشود. تحلیلهای دادهای او به درک بهتر مکانیسمهای مولکولی رشد مغز، خودنوسازی سلولهای بنیادی و پاسخ ایمنی بدن به آسیبهای شدید کمک کرده است. پژوهشهای او در برترین مجلات علمی و پزشکی مانند Nature، Proceedings of the National Academy of Sciences، Genome Biology و PLoS Medicine منتشر شدهاند.
او دوره تحلیل داده را بهعنوان بخشی از مجموعه دروس اصلی روشهای آماری سالانه برای دانشجویان زیستآمار در دانشگاه جانز هاپکینز طراحی کرد. این دوره، هر سال که توسط دکتر لیک تدریس شده، موفق به دریافت جایزه برتری در آموزش شده است؛ جایزهای که توسط دانشجویان جانز هاپکینز به بهترین دوره آموزشی اعطا میشود.
اطلاعات بیشتر
Roger D. Peng, استاد زیستآمار در دانشکده بهداشت عمومی بلومبرگ دانشگاه جانز هاپکینز و یکی از ویراستاران وبلاگ Simply Statistics است. او مدرک دکترای آمار خود را از دانشگاه کالیفرنیا، لسآنجلس (UCLA) دریافت کرده و یکی از پژوهشگران برجسته در زمینه آلودگی هوا، ارزیابی خطرات بهداشتی و روشهای آماری برای دادههای محیطزیستی محسوب میشود. دکتر پنگ در سال ۲۰۱۶ برنده جایزه معتبر Mortimer Spiegelman از انجمن بهداشت عمومی آمریکا شد؛ جایزهای که به آمارشناسانی اعطا میشود که مشارکتهای چشمگیری در زمینه آمار سلامت داشته باشند. او دوره برنامهنویسی آماری را در دانشگاه جانز هاپکینز طراحی کرد تا دانشجویان را با ابزارهای محاسباتی موردنیاز برای تحلیل دادهها آشنا کند.
دکتر پنگ یکی از رهبران ملی در حوزه روشها و استانداردهای پژوهشهای بازتولیدپذیر است و بهعنوان ویراستار بخش پژوهشهای بازتولیدپذیر در ژورنال Biostatistics فعالیت میکند. پژوهشهای او ماهیتی بینرشتهای دارند و مقالاتش در معتبرترین مجلات علمی و آماری از جمله Journal of the American Medical Association و Journal of the Royal Statistical Society منتشر شدهاند. او بیش از دوازده بسته نرمافزاری را توسعه داده که شامل پیادهسازی روشهای آماری برای مطالعات محیطزیستی، ابزارهای پژوهشهای بازتولیدپذیر و توزیع دادهها است. دکتر پنگ همچنین کارگاهها، آموزشهای تخصصی و دورههای کوتاهمدت در زمینه محاسبات آماری و تحلیل دادهها برگزار کرده و نقش مهمی در ترویج روشهای مدرن تحلیل داده و استانداردهای علمی ایفا کرده است.
اطلاعات بیشتر