آموزش ابزارهایی برای علم داده

علم داده، رشته‌ای پویا و رو به رشد است که به سرعت در حال تغییر و تحول است. دانشمندان داده با استفاده از ابزارهای مختلف، به حل مسائل پیچیده در دنیای واقعی می‌پردازند. این دوره ... ادامه

ارائه دهنده:  Coursera  Coursera
سطح: مقدماتی
 پلاس
  
زمان مورد نیاز برای گذارندن دوره:  3 ساعت
مجموع محتوای آموزشی:  3 ساعت ویدئو
 (قابل دانلود می‌باشد)
course-feature   زیرنویس فارسی

آنچه در این دوره می‌آموزیم:

 شرح کامل ابزارهای یک دیتا ساینتیست شامل: کتابخانه‌ها و پکیج‌ها، دیتا ست‌ها، مدل‌های یادگیری ماشین و ابزارهای کلان داده

 آشنایی با زبان‌هایی که معمولاً توسط دانشمندان داده یا دیتا ساینتیست استفاده می شود مانند Python، R و SQL

 یادگیری نحوه کار با نوت بوک‌های Jupyter و RStudio و چگونگی استفاده از ویژگی‌های آن‌ها

 ایجاد و مدیریت کد منبع برای علم داده با استفاده از مخازن Git و GitHub

پیش‌نیاز‌ها

این دوره به نحوی تهیه و تدوین شده است که مباحث آن به ساده‌ترین شکل ممکن بیان شوند و مخاطبان دوره بتوانند به‌سادگی متوجه موضوعات مطرح شده شوند. به همین جهت برای شرکت در این دوره هیچ پیش‌نیاز به خصوصی وجود ندارد و افراد با هر سطحی از آگاهی و تحصیلات می‌توانند از مباحث این دوره نهایت استفاده را داشته باشند.

سرفصل‌های دوره آموزش ابزارهایی برای علم داده

مروری بر ابزارهای علم داده

در این فصل، با انواع و دسته‌های مختلف ابزارهایی که دانشمندان داده استفاده می‌کنند و نمونه‌های محبوب هر کدام آشنا خواهید شد. همچنین با گزینه‌های Open Source، Cloud-based و Commercial به عنوان ابزارهای علم داده آشنا خواهید شد.

  معرفی دوره
"04:14  
  دسته بندی ابزارهای علم داده
"07:48  
  ابزارهای منبع باز برای علم داده - بخش اول
"08:08  
  ابزارهای منبع باز برای علم داده - بخش دوم
"05:15  
  ابزارهای تجاری برای علم داده
"06:51  
  ابزارهای مبتنی بر ابر برای علم داده
"08:11  
زبان‌های علم داده

برای کاربرانی که به تازگی سفر علم داده خود را شروع کرده‌اند، دامنه زبان‌های برنامه نویسی می‌تواند بسیار زیاد باشد. بنابراین، ابتدا کدام زبان را باید یاد بگیرید؟ این فصل آگاهی را در مورد معیارهایی که تعیین می‌کند چه زبانی را باید یاد بگیرید به ارمغان می‌آورد. مزایای Python، R، SQL و سایر زبان‌های رایج مانند Java، Scala، C++، JavaScript و Julia را خواهید آموخت. شما نحوه استفاده از این زبان‌ها را در Data Science بررسی خواهید کرد. همچنین برای یافتن اطلاعات بیشتر در مورد زبان‌ها برخی از سایت‌ها را بررسی خواهید کرد.

  زبان‌های علم داده
"02:40  
  مقدمه‌ای بر پایتون
"04:24  
  مقدمه‌ای بر زبان R
"04:19  
  مقدمه‌ای بر SQL
"04:13  
  زبان های دیگر برای علم داده
"06:25  
پکیج‌ها، API ها، دیتاست‌ها و مدل‌ها

در این فصل با کتابخانه‌های مختلف در علم داده آشنا می‌شوید. علاوه بر این، یک API را در رابطه با درخواست و پاسخ REST درک خواهید کرد. علاوه بر این، در فصل، مجموعه داده‌های باز را در Data Asset eXchange کاوش خواهید کرد. در نهایت، نحوه استفاده از مدل یادگیری ماشینی را برای حل یک مشکل و پیمایش Model Asset eXchange یاد خواهید گرفت.

  کتابخانه‌هایی برای علم داده
"05:32  
  رابط‌های برنامه نویسی کاربردی (API)
"04:50  
  مجموعه داده‌ها - قدرت بخشیدن به علم داده
"05:50  
  به اشتراک‌گذاری داده‌های سازمانی - تبادل دارایی داده
"04:28  
  مدل‌های یادگیری ماشین – یادگیری از مدل‌ها برای پیش‌بینی
"07:25  
  مدل مبادله دارایی
"06:20  
Jupyter notebooks و Jupyterlab

با پیشرفت داده‌های دیجیتال، Jupyter Notebook به دانشمند داده یا دستا ساینتیست اجازه می‌دهد تا آزمایش‌ها و نتایج داده‌های خود را که دیگران می‌توانند دوباره استفاده کنند، ثبت کند. این فصل Jupyter notebook و Jupyter Lab را معرفی می کند. نحوه کار با کرنل‌های مختلف را در جلسه notebook و معماری پایه Jupyter را یاد خواهید گرفت. علاوه بر این، ابزارهای موجود در محیط Anaconda Jupyter را شناسایی خواهید کرد. در نهایت، این فصل یک نمای کلی از محیط‌های Jupyter مبتنی بر فضای ابری و ویژگی‌های علم داده آن‌ها را ارائه می‌دهد.

  مقدمه‌ای بر Jupyter Notebooks
"03:36  
  شروع کار با Jupyter
"04:10  
  کرنل‌های Jupyter
"02:14  
  معماری Jupyter
"02:14  
  محیط‌های اضافی Anaconda Jupyter
"05:42  
  محیط‌های اضافی مبتنی بر فضای بری Jupyter
"04:19  
RStudio و GitHub

R یک زبان برنامه نویسی آماری است و ابزاری قدرتمند برای پردازش و دستکاری داده‌ها است. این فصل با مقدمه‌ای بر R و RStudio شروع می‌شود. شما با بسته‌های مختلف بصری سازی R و نحوه ایجاد نمودارهای بصری با استفاده از تابع نمودار آشنا خواهید شد. علاوه بر این، سیستم‌های کنترل نسخه توزیع‌شده به ابزارهای حیاتی در توسعه نرم‌افزار و توانمندسازهای کلیدی برای کدگذاری اجتماعی و مشارکتی تبدیل شده‌اند. در حالی که سیستم‌های نسخه‌سازی توزیع‌شده زیادی وجود دارد، Git یکی از محبوب‌ترین آنهاست. در ادامه این فصل، مهارت‌های مفهومی و عملی ضروری برای کار با Git و GitHub را توسعه خواهید داد. شما با یک نمای کلی از Git و GitHub شروع می کنید، سپس یک حساب GitHub و یک مخزن پروژه ایجاد می کنید، فایل ها را به آن اضافه می کنید و تغییرات خود را با استفاده از رابط وب انجام می دهید. در مرحله بعد، با گردش‌های کاری Git که شامل شاخه‌ها و درخواست‌های کششی (PRs) و ادغام می‌شود آشنا می‌شوید.

  مقدمه‌ای بر R و RStudio
"03:18  
  توطئه در RStudio
"03:45  
  نمای کلی Git/GitHub
"04:37  
  مقدمه‌ای بر GitHub
"05:04  
  مخازن GitHub
"04:10  
  GitHub - شروع به کار
"03:36  
  GitHub - کار با شعبه‌ها
"05:52  
(اختیاری) استودیو IBM Watson

Watson Studio یک پلتفرم مشترک برای جامعه علم داده است و توسط تحلیلگران داده، دانشمندان داده، مهندسان داده، توسعه دهندگان و مباشران داده برای تجزیه و تحلیل داده‌ها و ساخت مدل‌ها استفاده می‌شود. در این فصل با Watson Studio و IBM Cloud Pak برای داده به عنوان یک سرویس آشنا خواهید شد. سپس یک سرویس IBM Watson Studio و یک پروژه در Watson Studio ایجاد خواهید کرد. پس از ایجاد پروژه، یک Jupyter Notebook ایجاد می‌کنید و یک فایل داده را بارگذاری می‌کنید. همچنین قالب‌ها و کرنل‌های مختلف را در یک Jupyter Notebook کشف خواهید کرد. در نهایت، حساب Watson Studio خود را به GitHub متصل کرده و نوت بوک را در GitHub منتشر می‌کنید.

  معرفی استودیو واتسون
"07:16  
  (اختیاری) ایجاد یک حساب کاربری در IBM Watson Studio
"03:59  
  نوت بوک‌های Jupyter در استودیو Watson - بخش اول
"05:35  
  نوت بوک‌های Jupyter در استودیو Watson - بخش دوم
"02:43  
  پیوند GitHub به واتسون استودیو
"03:03  

ویژگی‌های دوره

زیرنویس فارسی
زیرنویس فارسی

این دوره دارای زیرنویس اختصاصی است.

درباره دوره

علم داده، رشته‌ای پویا و رو به رشد است که به سرعت در حال تغییر و تحول است. دانشمندان داده با استفاده از ابزارهای مختلف، به حل مسائل پیچیده در دنیای واقعی می‌پردازند.

این دوره جامع، به شما در یادگیری ابزارهای ضروری برای تبدیل شدن به یک دانشمند داده ماهر کمک می‌کند.

با پایتون، Github، RStudio و Jupyter Notebooks آشنا خواهید شد که سنگ بناهای مورد استفاده توسط دانشمندان داده در سراسر جهان هستند.

در این دوره چه چیزهایی خواهید آموخت؟

  • برنامه نویسی پایتون: دستکاری داده‌ها، تجزیه و تحلیل آماری و ساخت مدل‌های یادگیری ماشین
  • Github: اشتراک‌گذاری کد، همکاری با دیگران و مدیریت پروژه‌های علم داده
  • RStudio: مدل‌سازی و تجسم آماری پیشرفته
  • Jupyter Notebooks: کاوش و ارائه داده‌های تعاملی

با گذراندن این دوره، درک جامعی از این ابزارهای کلیدی و کاربردهای آنها در پروژه‌های علم داده در دنیای واقعی خواهید داشت.

این دوره برای چه کسانی مناسب است؟

چه یک مبتدی مشتاق ورود به این رشته باشید یا یک حرفه‌ای با تجربه که به دنبال گسترش مهارت‌های خود هستید، این دوره پایه و اساس لازم را برای برتری در دنیای پویا علم داده فراهم می‌کند.

درباره استاد

maktabkhooneh-teacher Aije Egwaikhide

Aije Egwaikhide، دیتا ساینتیست در IBM است. او دارای مدرک کارشناسی در اقتصاد و آمار از دانشگاه منیتوبا و مدرک کارشناسی ارشد در تجزیه و تحلیل کسب‌وکار از کالج سنت لارنس، کینگستون است. او در حال حاضر مدرک کارشناسی ارشد در تجزیه و تحلیل مدیریت از دانشگاه کوئینز را دنبال می‌کند. ایجی در حال حاضر کارمند IBM است، جایی که در سال 2018 به عنوان یک دانشمند داده‌ی جوان در بخش خدمات بازرگانی جهانی (GBS) شروع به کار کرد. نقش اصلی او معنا بخشیدن به داده‌ها برای مشتریان نفت و گاز آن‌ها از طریق آمار پایه و الگوریتم‌های پیشرفته یادگیری ماشین بود. برجسته‌ترین فعالیت او در GBS ایجاد یک راه‌حل سفارشی یادگیری ماشین و آمار برای بهینه‌سازی عملیات در چاه‌های نفت و گاز بود. او بخشی از گروه شبکه مهارت‌های توسعه‌دهندگان IBM است، جایی که تجربیات دنیای واقعی خود را به دوره‌هایی که ایجاد می‌کند، می‌آورد.

مشاهده پروفایل و دوره‌‌های استاد
maktabkhooneh-teacher Romeo Kienzler

Romeo Kienzler، دارای مدرک کارشناسی ارشد (ETH) در رشته سیستم‌های اطلاعاتی، بیوانفورماتیک و آمار کاربردی (موسسه فناوری فدرال سوئیس) است. او نزدیک به دو دهه تجربه در زمینه مهندسی نرم‌افزار، مدیریت پایگاه داده و ادغام اطلاعات دارد. از سال 2012 او به عنوان یک دانشمند داده در IBM مشغول به کار شده است. او چندین اثر در این زمینه با ناشران بین‌المللی و در کنفرانس‌ها منتشر کرده است. تمرکز تحقیقاتی فعلی او بر روی معماری‌های پردازش داده‌های موازی عظیم است. رومئو همچنین به پروژه‌های متن‌باز مختلفی کمک می‌کند.

مشاهده پروفایل و دوره‌‌های استاد
maktabkhooneh-teacher Svetlana Levitan

دکتر Svetlana Levitan، حامی ارشد توسعه‌دهندگان در مرکز داده‌های باز و فناوری‌های هوش مصنوعی IBM، مدت زیادی طراح فنی و مهندس نرم‌افزار برای SPSS بوده است.او بر روی استانداردهای باز برای استقرار مدل‌های یادگیری ماشین PMML و ONNX کار می‌کند. سوتلانا دارای مدرک دکتری در ریاضیات کاربردی و کارشناسی ارشد در علوم کامپیوتر از دانشگاه مریلند، کالج پارک است. او عاشق یادگیری فناوری‌های جدید، به اشتراک گذاشتن تخصص خود و تشویق زنان در رشته‌های STEM است.

مشاهده پروفایل و دوره‌‌های استاد

نظرات کاربران

تا کنون نظری برای این دوره ثبت نشده است. برای ثبت نظر باید ابتدا در دوره ثبت نام کرده و دانشجوی دوره باشید.

سوالات پرتکرار

پس از سپری شدن زمان دوره، به محتوای دوره دسترسی خواهم داشت؟
بله؛ پس از سپری شدن مدت زمان دوره شما به محتوای دوره دسترسی خواهید داشت و می توانید از ویدئوها، تمارین، پروژه و دیگر محتوای دوره در صورت وجود استفاده کنید ولی امکان تصحیح تمارین توسط پشتیبان و دریافت گواهی نامه برای شما وجود نخواهد داشت.
poster
  
برگزار کننده:  Coursera
  
زمان مورد نیاز برای گذارندن دوره:  3 ساعت
مجموع محتوای آموزشی:  3 ساعت ویدئو
 (قابل دانلود می‌باشد)
course-feature   زیرنویس فارسی