×
ribbon

آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ

با پیشرفت در آمار و علوم کامپیوتر و همچنین مجموعه داده‌های بهتر و رشد شبکه‌های عصبی، یادگیری ماشین در سال‌های اخیر پیشرفت زیادی کرده است. امروزه یادگیری ماشین در همه‌جا وجود دارد، از جمله ترجمه ... ادامه

ارائه دهنده:  دانشگاه استنفورد  دانشگاه استنفورد
مدرس دوره:
سطح: پیشرفته
 پلاس
  
زمان مورد نیاز برای گذارندن دوره:  6 ساعت
مجموع محتوای آموزشی:  6 ساعت ویدئو
 (قابل دانلود می‌باشد)
course-feature   زیرنویس فارسی

آنچه در این دوره می‌آموزیم:

 یادگیری تکنیک‌های یادگیری بدون نظارت

 ساخت سیستم‌های توصیه‌گر با رویکرد فیلتر مشترک

 یادگیری عمیق مبتنی بر محتوا

 ساخت مدل‌های یادگیری تقویتی عمیق

پیش‌نیاز‌ها

این دوره سومین دوره از تخصص یادگیری ماشین بوده و پیش‌نیاز آن دوره‌های آموزش الگوریتم‌های نظارت‌شده در ماشین‌لرنینگ و آموزش الگوریتم‌های پیشرفته در ماشین‌لرنینگ است.

سرفصل‌های دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ

فصل اول: یادگیری نظارت نشده
  پیشگفتار
"03:31  
  خوشه‌بندی چیست؟
"04:22  
  درک K-means
"06:59  
  الگوریتم K-means
"09:59  
  بهینه‌سازی شی‌گرا
"11:22  
  مقداردهی K-means
"09:03  
  انتخاب تعداد خوشه‌ها
"08:07  
  پیداکردن اتفاقات غیرمعمول
"12:03  
  توزیع نرمال گوسین
"11:00  
  الگوریتم تشخیص ناهنجاری
"12:18  
  توسعه و ارزیابی یک سیستم تشخیص ناهنجاری
"11:48  
  تشخیص ناهنجاری یا یادگیری تحت نظارت؟
"08:18  
  انتخاب فیچرها
"15:07  
فصل دوم: سیستم‌های توصیه‌گر
  ساخت توصیه‌نامه
"05:42  
  استفاده از ویژگی‌های هر مورد
"11:32  
  الگوریتم فیلترینگ مشارکتی
"14:05  
  برچسب‌های باینری (موردعلاقه‌ها، لایکها، کلیک‌ها)
"08:37  
  معنای نرمالیزیشن
"08:55  
  پیاده‌سازی collaborative filtering با تنسورفلو
"11:48  
  پیداکردن آیتم‌های مرتبط
"06:43  
  collaborative filtering یا content based filtering؟
"09:55  
  یادگیری عمیق برای content based filtering
"09:52  
  توصیه از یک کاتالوگ بزرگ
"08:02  
  استفاده اخلاقی از سیستم‌های توصیه‌گر
"10:58  
  پیاده‌سازی content based filtering با تنسورفلو
"04:58  
فصل سوم: یادگیری تقویتی
  یادگیری تقویتی چیست؟
"08:58  
  مثال یک ماه‌نورد
"06:51  
  بازگشت در یادگیری تقویتی
"10:28  
  سیاست تصمیم‌گیری در یادگیری تقویتی
"02:47  
  مروری بر موضوعات کلیدی
"05:44  
  تعریف State-Action Value Function
"10:46  
  مثال State-Action Value Function
"05:32  
  معادله‌ی Bellman
"13:02  
  محیط Random Stochastic
"08:34  
  مثالی از کاربردهای فضای حالت پیوسته
"06:34  
  فرود روی ماه
"06:03  
  یادگیری state value function
"17:00  
  الگوریتم شبکه عصبی تقویتی با ساختار بهبودیافته
"03:11  
  الگوریتم تقویتی با سیاست حریصانه (greedy policy)
"09:09  
  الگوریتم تقویتی mini-batch و soft-updates
"11:53  
  استیت (حالت) یادگیری تقویتی
"03:04  
  سخن پایانی
"03:21  

ویژگی‌های دوره

زیرنویس فارسی
زیرنویس فارسی

این دوره دارای زیرنویس اختصاصی است.

درباره دوره

با پیشرفت در آمار و علوم کامپیوتر و همچنین مجموعه داده‌های بهتر و رشد شبکه‌های عصبی، یادگیری ماشین در سال‌های اخیر پیشرفت زیادی کرده است. امروزه یادگیری ماشین در همه‌جا وجود دارد، از جمله  ترجمه خودکار، تشخیص تصویر، فناوری جستجوی صوتی، خودروهای خودران و هر چیزی که فکرش را بکنید. دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ یکی از پیشرفته‌ترین دوره‌های موجود برای آموزش این سه مبحث در یادگیری ماشین و هوش مصنوعی به‌حساب می‌آید که توسط مکتب خونه تهیه شده است. در ادامه به معرفی دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ خواهیم پرداخت و در کنار آن در رابطه با این سه مبحث مهم به صحبت خواهیم کرد.

دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ 

این دوره، سومین دوره از مجموعه تخصص یادگیری ماشین با تدریس Andrew NG است. دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ یک دوره آنلاین اساسی به حساب می آید که با همکاری DeepLearning.AI و Stanford Online تهیه شده است. در دوره آموزشی یادگیری عمیق کاربران، اصول یادگیری ماشین و نحوه استفاده از این تکنیک‌ها برای ساخت اپلیکیشنهای هوش مصنوعی در دنیای واقعی را خواهند آموخت. دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ به زبان انگلیسی و با زیرنویس فارسی و روان هم‌اکنون در مکتب‌خونه در دسترس است. 

آنچه در دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ خواهید آموخت

با ثبت نام در این دوره آموزشی شما با مفاهیم زیر آشنا خواهید شد:

  • یادگیری تکنیک‌های یادگیری بدون نظارت: از جمله خوشه‌بندی و تشخیص ناهنجاری.
  • ساخت سیستم‌های توصیه‌گر با رویکرد فیلتر مشترک و روش یادگیری عمیق مبتنی بر محتوا.
  • ساخت مدل‌های یادگیری تقویتی عمیق.

این تخصص توسط اندرو انگ، یک آینده‌نگر هوش مصنوعی که تحقیقات انتقادی را در دانشگاه استنفورد و کارهای پیشگامانه در Google Brain ،Baidu و Landing.AI برای پیشرفت در زمینه هوش مصنوعی رهبری کرده است، آموزش داده می‌شود.

این دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی مقدمه گسترده‌ای برای یادگیری ماشین مدرن، از جمله یادگیری نظارت شده (رگرسیون خطی چندگانه، رگرسیون لجستیک، شبکه‌های عصبی و درختان تصمیم)، یادگیری بدون نظارت (خوشه‌بندی، کاهش ابعاد، سیستم‌های توصیه گر) است. 

دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ برای چه کسانی مناسب است؟

این دوره آموزشی برای تمامی افرادی که در زمینه هوش مصنوعی و یادگیری ماشین تحقیقات انجام می‌دهند مناسب است. همچنین این دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی برای دانشجویان کارشناسی، کارشناسی ارشد و دکتری رشته‌های مهندسی کامپیوتر بسیار دوره مناسبی به‌حساب می‌آید.

در پایان این تخصص، شما بر مفاهیم کلیدی تسلط خواهید داشت و دانش عملی برای به‌کارگیری سریع و قدرتمند یادگیری ماشین در مسائل چالش‌برانگیز دنیای واقعی را به دست خواهید آورد. اگر به دنبال ورود به دنیای هوش مصنوعی و یادگیری ماشین هستید، این دوره جدید یادگیری ماشین بهترین مکان برای شروع است.

درباره استاد

maktabkhooneh-teacher Andrew Ng

اندرو انگ استاد دانشکده علوم کامپیوتر دانشگاه استنفورد و سرپرست آزمایشگاه هوش مصنوعی استنفورد است. وی هم چنین بنیان‌گذار کورسرا (coursera.org) است و بر اساس گزارش تکنولوژی دانشگاه ام ای تی یکی از 35 مخترع برتر جوان دنیا است.
او دکتری خود را از دانشگاه کالیفرنیا برکلی گرفته و زمینه‌های پژوهش او هوش مصنوعی و علوم رباتیک است.

مشاهده پروفایل و دوره‌‌های استاد

نظرات کاربران

تا کنون نظری برای این دوره ثبت نشده است. برای ثبت نظر باید ابتدا در دوره ثبت نام کرده و دانشجوی دوره باشید.

دوره‌های پیشنهادی

سوالات پرتکرار

پس از سپری شدن زمان دوره، به محتوای دوره دسترسی خواهم داشت؟
بله؛ پس از سپری شدن مدت زمان دوره شما به محتوای دوره دسترسی خواهید داشت و می توانید از ویدئوها، تمارین، پروژه و دیگر محتوای دوره در صورت وجود استفاده کنید ولی امکان تصحیح تمارین توسط پشتیبان و دریافت گواهی نامه برای شما وجود نخواهد داشت.

یادگیری ماشین چیست؟

یادگیری ماشین (ML) شاخه‌ای از هوش مصنوعی (AI) است که کامپیوترها را قادر می‌سازد تا از داده‌های آموزشی «خود یاد بگیرند» و در طول زمان، بدون برنامه‌ریزی صریح، پیشرفت کنند. الگوریتم‌های یادگیری ماشین قادر به تشخیص الگوهای موجود در داده‌ها و یادگیری از آن‌ها هستند تا پیش‌بینی‌های خود را انجام دهند. به‌طور خلاصه، الگوریتم‌ها و مدل‌های یادگیری ماشین از طریق تجربه یاد می‌گیرند.

در برنامه‌نویسی سنتی، یک مهندس کامپیوتر یک سری دستورالعمل می‌نویسد که به کامپیوتر دستور می‌دهد چگونه داده‌های ورودی را به خروجی دلخواه تبدیل کند. دستورالعمل‌ها بیشتر بر اساس ساختار IF-THEN هستند: وقتی شرایط خاصی برآورده می‌شود، برنامه یک عمل خاص را اجرا می‌کند. از سوی دیگر، یادگیری ماشین یک فرآیند خودکار است که ماشین‌ها را قادر می‌سازد تا مشکلات را با کمک کم یا حتی بدون دخالت انسان حل کنند و اقداماتی را بر اساس مشاهدات گذشته انجام دهند.

درحالی‌که هوش مصنوعی و یادگیری ماشین اغلب به‌جای یکدیگر مورداستفاده قرار می‌گیرند، آن‌ها دو مفهوم متفاوت هستند و هوش مصنوعی مفهوم گسترده‌تری است و یادگیری ماشین زیرمجموعه‌ای از هوش مصنوعی به‌حساب می‌آید که سیستم‌های هوشمند را قادر می‌سازد تا به‌طور مستقل چیزهای جدید را از داده‌ها یاد بگیرند.

انواع یادگیری ماشین

برای درک نحوه عملکرد یادگیری ماشین، باید روش‌ها و الگوریتم‌های مختلف یادگیری ماشین را بررسی کنید، که اساساً مجموعه‌ای از قوانینی هستند که ماشین‌ها برای تصمیم‌گیری از آن‌ها استفاده می‌کنند. در زیر، پنج نوع رایج و پرکاربرد یادگیری ماشین شرح داده‌شده‌اند:

یادگیری تحت نظارت

الگوریتم‌های یادگیری نظارت شده یا یادگیری تحت نظارت (Supervised Learning) بر اساس داده‌های آموزشی برچسب‌گذاری شده پیش‌بینی می‌کنند. هر نمونه آموزشی شامل یک ورودی و یک خروجی دلخواه است. یک الگوریتم یادگیری نظارت شده این داده‌های نمونه را تجزیه‌وتحلیل می‌کند و استنباط می‌کند، اساساً، یک حدس آموزشی در هنگام تعیین برچسب برای داده‌های دیده نشده است.

Supervised Learning رایج‌ترین و محبوب‌ترین رویکرد برای یادگیری ماشین است. این روش یادگیری با نظارت نام دارد زیرا برای یادگیری از این مدل‌ها باید داده‌های نمونه برچسب‌گذاری شده دستی تغذیه شوند. داده‌ها برچسب‌گذاری می‌شوند تا به ماشین بفهمانند که باید به دنبال چه الگوهایی (کلمات و تصاویر مشابه، دسته‌بندی داده‌ها و غیره) باشد و ارتباط با آن‌ها را تشخیص دهد.

برای مثال، اگر می‌خواهید ایمیل‌های اسپم را به‌طور خودکار شناسایی کنید، باید نمونه‌هایی از ایمیل‌هایی را که می‌خواهید به‌عنوان هرزنامه یا اسپم طبقه‌بندی شوند و سایر موارد مهم که نباید هرزنامه تلقی شوند، به الگوریتم یادگیری ماشین بدهید. روش‌های مختلفی برای یادگیری با نظارت مانند طبقه‌بندی، رگرسیون، ماشین بردار پشتیبان و غیره وجود دارد.

یادگیری بدون نظارت

الگوریتم‌های یادگیری بدون نظارت (Unsupervised Learning) که تمرکز اصلی قسمت اول این  دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی است، بینش‌ها و روابط را در داده‌های بدون برچسب آشکار می‌کنند. در این مورد، مدل‌ها با داده‌های ورودی تغذیه می‌شوند، اما نتایج موردنظر ناشناخته هستند، بنابراین آن‌ها باید بر اساس شواهد غیرمستقیم، بدون هیچ راهنمایی یا آموزشی استنتاج کنند. در این روش مدل‌ها با «پاسخ درست» آموزش ندیده‌اند، بنابراین باید الگوهای خود را پیدا کنند.

یکی از رایج‌ترین انواع یادگیری بدون نظارت، خوشه‌بندی (clustering) به‌حساب می‌آید که شامل گروه‌بندی داده‌های مشابه است. این روش بیشتر برای تجزیه‌وتحلیل اکتشافی استفاده می‌شود و می‌تواند به شما در شناسایی الگوها یا روندهای پنهان کمک کند.

به‌عنوان‌مثال، تیم بازاریابی یک شرکت یا فروشگاه بزرگ اینترنتی می‌تواند از خوشه‌بندی برای بهبود بخش‌بندی مشتریان استفاده کند. با توجه به مجموعه‌ای از داده‌های درآمد و هزینه، یک مدل یادگیری ماشین می‌تواند گروه‌هایی از مشتریان را با رفتارهای مشابه شناسایی کند.

یادگیری نیمه نظارتی

در یادگیری نیمه نظارتی (Semi-Supervised Learning)، داده‌های آموزشی به دو قسمت تقسیم می‌شوند. مقدار کمی از داده‌های برچسب‌دار و مجموعه بزرگ‌تری از داده‌های بدون برچسب.

در این مورد، مدل از داده‌های برچسب‌گذاری‌ شده به‌عنوان ورودی برای استنتاج درباره داده‌های بدون برچسب استفاده می‌کند و نتایج دقیق‌تری نسبت به مدل‌های یادگیری نظارت‌شده معمولی ارائه می‌کند.

این رویکرد به‌ویژه برای کارهایی که مجموعه داده‌های بزرگی مانند طبقه‌بندی تصاویر را شامل می‌شود، محبوبیت بیشتری پیدا می‌کند. یادگیری نیمه نظارتی به تعداد زیادی داده برچسب‌گذاری شده نیاز ندارد، بنابراین راه‌اندازی آن سریع‌تر، مقرون‌به‌صرفه تر از روش‌های یادگیری نظارت‌شده به‌حساب می‌آید و برای کسب‌وکارهایی که مقادیر زیادی داده دارند ایده‌آل است.

یادگیری تقویتی

یادگیری تقویتی (Reinforcement Learning) به این می‌پردازد که چگونه یک عامل نرم‌افزاری (یا برنامه کامپیوتری) باید در موقعیتی برای به حداکثر رساندن پاداش عمل کند. به‌طور خلاصه، مدل‌های یادگیری ماشین تقویت‌شده سعی می‌کنند بهترین مسیر ممکن را که باید در یک موقعیت خاص طی کنند، تعیین کنند. آن‌ها این کار را از طریق آزمون‌وخطا انجام می‌دهند. ازآنجایی‌که هیچ داده آموزشی وجود ندارد، ماشین‌ها از اشتباهات خود درس می‌گیرند و اقداماتی را انتخاب می‌کنند که به بهترین راه‌حل یا حداکثر پاداش منجر شود.

این روش یادگیری ماشین بیشتر در رباتیک و بازی استفاده می‌شود. بازی‌های ویدیویی رابطه واضحی بین اقدامات و نتایج نشان می‌دهند و می‌توانند موفقیت را با حفظ امتیاز بسنجند. بنابراین، آن‌ها یک راه عالی برای بهبود الگوریتم‌های یادگیری تقویتی هستند. فصل سوم دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی با تمرکز بر این رویکرد ارائه شده است.

یادگیری عمیق (DL)

مدل‌های یادگیری عمیق (Deep Learning) می‌توانند تحت نظارت، نیمه نظارت یا بدون نظارت (یا ترکیبی از هر سه) باشند. آن‌ها الگوریتم‌های یادگیری ماشین پیشرفته‌ای هستند که توسط غول‌های فناوری مانند گوگل، مایکروسافت و آمازون برای اجرای کل سیستم‌ها و چیزهای قدرتمند مانند ماشین‌های خودران و دستیارهای هوشمند استفاده می‌شوند.

سیستم‌های توصیه‌گر

برنامه‌های زیادی وجود دارد که وب‌سایت‌ها داده‌های کاربران خود را جمع‌آوری می‌کنند و از آن داده‌ها برای پیش‌بینی میزان پسند بودن و ناپسندبودن کاربران خود استفاده می‌کنند. این به آن‌ها امکان می‌دهد محتوایی را که دوست دارند توصیه کنند. سیستم‌های توصیه‌گر (Recommender Systems) راهی برای پیشنهاد یا مشابه موارد و ایده‌ها به طرز فکر خاص کاربر هستند. بخش دوم دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ با رویکرد ساخت سیستم‌های توصیه گر ارائه شده‌است.

انواع سیستم‌های توصیه‌گر

سیستم توصیه‌کننده انواع مختلفی دارد:

  • فیلتر مشارکتی (Collaborative Filtering): فیلتر مشارکتی موارد را بر اساس معیارهای شباهت بین کاربران و یا موارد توصیه می‌کند. فرض اصلی پشت الگوریتم این است که کاربران با علایق مشابه ترجیحات مشترکی دارند.
  • توصیه مبتنی بر محتوا (Content-Based Recommendation): این روش نوعی یادگیری ماشین تحت نظارت است که برای القای یک طبقه‌بندی کننده برای تمایز بین موارد جالب و غیر جالب برای کاربر استفاده می‌شود.

سیستم توصیه‌های مبتنی بر محتوا

 سیستم‌های مبتنی بر محتوا مواردی را مشابه مواردی که قبلاً توسط مشتری رتبه‌بندی شده بود، به مشتری توصیه می‌کنند. از ویژگی‌ها و ویژگی‌های مورداستفاده می‌کند. از روی این ویژگی‌ها می‌تواند شباهت بین آیتم‌ها را محاسبه کند.

در یک سیستم توصیه مبتنی بر محتوا، ابتدا باید برای هر مورد یک پروفایل ایجاد کنیم که نمایانگر خصوصیات آن موارد باشد. از پروفایل‌های کاربر برای یک کاربر خاص استنباط می‌شود. ما از این پروفایل‌های کاربری برای توصیه موارد به کاربران از کاتالوگ استفاده می‌کنیم.

فیلتر مشارکتی

 فیلتر مشارکتی مبتنی بر این ایده است که افراد مشابه (بر اساس داده‌ها) معمولاً چیزهای مشابهی را دوست دارند. این پیش‌بینی می‌کند که کاربر کدام مورد را بر اساس ترجیحات مورد سایر کاربران مشابه دوست دارد.

فیلتر مشارکتی از یک ماتریس کاربر - مورد برای تولید توصیه‌ها استفاده می‌کند. این ماتریس حاوی مقادیری است که ترجیح کاربر را نسبت به یک آیتم مشخص می‌کند. این مقادیر می‌توانند بازخورد صریح یا بازخورد ضمنی را نشان دهند.

سخن پایانی

دوره آموزش نظارت‌نشده‌ها، توصیه‌گرها و یادگیری تقویتی در ماشین‌لرنینگ یک دوره حرفه‌ای و مناسب برای افرادی است که قصد دارند وارد این حوزه‌ها شوند. مفاهیمی که در این دوره آموزش داده می‌شود بسیار پیشرفته و جذاب هستند و مطمئناً برای کسانی که می‌خواهند در حوزه ماشین لرنیینگ دانش خود را بهبود ببخشند بسیار توصیه می‌شود.

poster
  
برگزار کننده:  دانشگاه استنفورد
  
زمان مورد نیاز برای گذارندن دوره:  6 ساعت
مجموع محتوای آموزشی:  6 ساعت ویدئو
 (قابل دانلود می‌باشد)
course-feature   زیرنویس فارسی