چیستی متدولوژی علم داده و علت نیاز دانشمندان به آن
به کارگیری شش مرحلهی فرآیند بینصنعتی برای کاوش داده (CRISP-DM) برای تحلیل
ارزیابی و انتخاب مدل مناسب در میان مدلهای تحلیلی پیشبینیکننده، توصیفی و طبقهبندی
تعیین تابع دادهی مناسب برای متدولوژی تحلیل علم داده خود
این دوره به نحوی تهیه و تدوین شده است که مباحث آن به سادهترین شکل ممکن بیان شوند و مخاطبان دوره بتوانند بهسادگی متوجه موضوعات مطرح شده شوند. به همین جهت برای شرکت در این دوره هیچ پیشنیاز به خصوصی وجود ندارد و افراد با هر سطحی از آگاهی و تحصیلات میتوانند از مباحث این دوره نهایت استفاده را داشته باشند.
اگر یک میانبر برای تبدیل شدن به یک دانشمند داده وجود داشته باشد، یادگیری نحوهی فکر کردن و کار کردن مانند یک دانشمند داده موفق، همان میانبر است.
در این دوره، متدولوژی را یاد میگیرید و سپس آن را برای مقابله با هر سناریوی علم داده به کار میبندید. شما دو متدولوژی قابل توجه علم داده را بررسی خواهید کرد: متدولوژی بنیادی علم داده و متدولوژی شش مرحلهای CRISP-DM و نحوهی به کارگیری آنها را خواهید آموخت. اکثر دانشمندان دادهی باتجربه برای حل مسائل علم داده از این متدها یا متدهای مشابه استفاده میکنند.
ابتدا با نحوهی شکلگیری مسئلهی کسبوکار/پژوهشی آشنا میشوید. یاد میگیرید که دانشمندان داده چگونه دادهها را به دست میآورند، آماده میکنند و تحلیل میکنند. کشف میکنید که چگونه اعمال شیوههای متدولوژی علم داده به اطمینان از مرتبط بودن دادههای استفادهشده برای حل مسئله و دستکاری مناسب آنها برای پاسخ به سوال کمک میکند. سپس، در مورد ساخت مدل داده، استقرار آن مدل، روایت داستانی داده و دریافت بازخورد یاد خواهید گرفت. با استفاده از سناریویی الهامگرفته از دنیای واقعی و از طریق آزمایشگاههای پیشروندهای که در دفترچههای یادداشت Jupyter و با استفاده از پایتون میزبانی میشوند، مانند یک دانشمند داده فکر خواهید کرد و مهارتهای متدولوژی علم داده خود را توسعه خواهید داد.
Alex Aklson، دانشمند داده در گروه تجارت دیجیتال شرکت IBM کانادا است. او به طور گسترده در پروژههای هیجانانگیز علم داده مشارکت داشته است، از جمله طراحی یک سیستم هوشمند برای تشخیص شروع زوال عقل در بزرگسالان با استفاده از روندهای طولی سرعت راه رفتن و فعالیتهای خانگی. الکس پیش از پیوستن به IBM، به عنوان دانشمند داده در شرکت دیتا اسکوپ آنالیتیکس، یک شرکت مشاوره علم داده در شیکاگو، ایلینوی، فعالیت میکرد، جایی که راهحلها و محصولات را با رویکردی انسانمحور و دادهمحور طراحی میکرد. او مدرک دکترای خود را در مهندسی زیستپزشکی از دانشگاه تورنتو دریافت کرده است.
Polong Lin، دیتاسایتیست در IBM است و بر روی ترویج علم داده و ایجاد مشارکتها تمرکز دارد. او یکی از بنیانگذاران بوتکمپ علم داده در IBM است و در حال حاضر بزرگترین گروه Meetup کانادا برای علم داده را در تورنتو رهبری میکند.