یادگیری تقویتی هوش مصنوعی با پایتون

آیا تا به حال فکر کرده‌اید که فناوری‌های هوش مصنوعی مانند OpenAI ChatGPT و GPT-4 واقعاً چگونه کار می‌کنند؟ در این دوره، شما پایه‌های این برنامه‌های تحول‌آفرین را خواهید آموخت. وقتی مردم درباره هوش مصنوعی ... بیشتر

0 دانشجو
مقدماتی
Udemy

آکادمی گرولی

+ 1 مدرس دیگر

به‌روزرسانی: ۱۴۰۴/۰۷/۰۵

محتوای دوره
درباره دوره
درباره استاد

آنچه در این دوره می‌آموزید

به‌کارگیری روش‌های یادگیری نظارت‌شده مبتنی بر گرادیان در یادگیری تقویت

درک یادگیری تقویتی از نظر فنی

فهم رابطه بین یادگیری تقویتی و روان‌شناسی

پیاده‌سازی 17 الگوریتم مختلف یادگیری تقویتی

محتوای دوره

14 فصل 111 جلسه 15 ساعت ویدیو
خوش‌آمد گویی
  طرح و نمایه کلی دوره
مشاهده
"07:55
  از کجا می توان کد را دریافت کرد؟
"04:35
  چگونه در این دوره موفق شویم؟
"03:03
  جمع بندی
"15:36
بازگشت مسئله Multi-Armed Bandit (چندبازویی)
مرور کلی سطح بالا بر یادگیری تقویتی
فرایندهای تصمیم‌گیری مارکوف
برنامه‌نویسی پویا
مونت کارلو
یادگیری تفاوت زمانی
روش‌های تخمین‌زنی
میان‌فصل: پرسش‌های متداول مبتدیان
پروژه معاملات سهام با الگوریتم‌های یادگیری تقویتی
راه‌اندازی محیط کاری (پرسش‌های متداول به درخواست دانشجویان)
راهنمای اضافی کدنویسی پایتون برای تازه‌کارها (FAQ بر اساس درخواست دانشجویان)
راهکارهای مؤثر یادگیری یادگیری ماشین (پرسش‌های متداول بر اساس درخواست دانشجویان)
پیوست: پرسش‌های متداول نهایی

درباره دوره

آیا تا به حال فکر کرده‌اید که فناوری‌های هوش مصنوعی مانند OpenAI ChatGPT و GPT-4 واقعاً چگونه کار می‌کنند؟ در این دوره، شما پایه‌های این برنامه‌های تحول‌آفرین را خواهید آموخت.

وقتی مردم درباره هوش مصنوعی صحبت می‌کنند، معمولاً منظورشان یادگیری نظارت‌شده و بدون نظارت نیست.

این وظایف در مقایسه با کاری که ما معمولاً از هوش مصنوعی انتظار داریم — مثل بازی شطرنج و گو، رانندگی خودروها و شکست دادن بازی‌های ویدیویی در سطحی فراتر از انسان — نسبتاً ساده هستند.

یادگیری تقویتی اخیراً برای انجام تمام این کارها و بیشتر از آن محبوب شده است.

دقیقا مانند یادگیری عمیق، بخش زیادی از نظریه آن در دهه‌های ۷۰ و ۸۰ کشف شده بود، اما تا همین اواخر امکان مشاهده نتایج شگفت‌انگیز آن وجود نداشت.

در سال ۲۰۱۶ شاهد بودیم که AlphaGo شرکت گوگل قهرمان جهان در بازی Go را شکست داد.

هوش‌های مصنوعی بازی‌هایی مثل Doom و Super Mario را انجام دادند.

خودروهای خودران شروع به رانندگی در جاده‌های واقعی با سایر رانندگان و حتی جابه‌جایی مسافران (مثل Uber) بدون کمک انسان کردند.

اگر این موارد برای شما شگفت‌انگیز است، برای آینده آماده باشید چون قانون بازگشت شتاب‌گیرنده می‌گوید این پیشرفت‌ها به صورت تصاعدی ادامه خواهد یافت.

یادگیری درباره یادگیری نظارت‌شده و بدون نظارت کار کوچکی نیست. تا به امروز من بیش از ۲۵ دوره فقط درباره این موضوعات داشته‌ام.

اما یادگیری تقویتی دنیای جدیدی را باز می‌کند. همان‌طور که در این دوره خواهید آموخت، یادگیری تقویتی بسیار متفاوت از یادگیری نظارت‌شده و بدون نظارت است.

این حوزه منجر به بینش‌های جدیدی در روان‌شناسی رفتاری و علوم اعصاب شده است. همان‌طور که خواهید دید، فرآیند آموزش یک عامل بسیار شبیه آموزش یک حیوان یا حتی انسان است. این نزدیک‌ترین چیزی است که تاکنون به هوش عمومی مصنوعی واقعی رسیده‌ایم.

 
آنچه در این دوره پوشش داده می‌شود:

مسئله Multi-Armed Bandit و معضل جستجو و بهره‌برداری
روش‌های محاسبه میانگین و میانگین متحرک و ارتباط آن‌ها با گرادیان کاهشی تصادفی
فرایندهای تصمیم‌گیری مارکوف (MDPs)
برنامه‌نویسی پویا
روش مونت کارلو
یادگیری تفاوت زمانی (Q-Learning و SARSA)
روش‌های تقریب (چگونه یک شبکه عصبی عمیق یا مدل قابل مشتق دیگر را در الگوریتم یادگیری تقویتی وارد کنیم)
نحوه استفاده از OpenAI Gym بدون تغییر کد
پروژه: ساخت یک ربات معامله‌گر بورس با استفاده از Q-Learning
اگر آماده یک چالش جدید و یادگیری تکنیک‌های هوش مصنوعی هستید که در یادگیری نظارت‌شده، بدون نظارت یا یادگیری عمیق ندیده‌اید، این دوره برای شماست.

 
منتظرتان در کلاس هستم!

"اگر نتوانی آن را پیاده‌سازی کنی، یعنی آن را نفهمیده‌ای."

همان‌طور که فیزیک‌دان بزرگ ریچارد فاینمن گفت:
"چیزی را که نتوانم بسازم، نمی‌توانم بفهمم."

دوره‌های من تنها دوره‌هایی هستند که در آن‌ها یاد می‌گیرید الگوریتم‌های یادگیری ماشین را از صفر پیاده‌سازی کنید.

دوره‌های دیگر فقط به شما یاد می‌دهند چطور داده‌ها را در کتابخانه‌ها وارد کنید، اما آیا واقعاً برای نوشتن ۳ خط کد به کمک نیاز دارید؟

بعد از انجام همین کار برای ۱۰ دیتاست، متوجه می‌شوید ۱۰ چیز یاد نگرفته‌اید؛ فقط یک چیز یاد گرفته‌اید و ۱۰ بار آن را تکرار کرده‌اید...

اطلاعات بیشتر

درباره استاد

آکادمی گرولی
70 دوره
14,421 دانشجو

آکادمی گرولی با هدف توانمندسازی و توسعه حرفه‌ای افراد در حوزه‌های مختلف شغلی  فعالیت می‌کند. دوره‌ها و وبینارهایی که گرولی ارائه می‌کند، به شما در جهت ارتقای مهارت‌های فنی و  نرم در حوزه‌های تخصصی مانند مدیریت محصول، بازاریابی دیجیتال، رشد (Growth) و توسعه کسب‌وکار  و دیگر حوزه‌های شغلی دسته‌بندی می‌شوند. آکادمی گرولی، اولین مجموعه در ایران است که دوره‌های حرفه‌ای شرکت بین‌المللی ریفورج  که شامل ۲۱ دوره با محتوای کاربردی در کلاس جهانی می‌باشد را با زیرنویس فارسی ارائه کرده است.

اطلاعات بیشتر

دیگر دوره‌های آکادمی گرولی

The Lazy Programmer
1 دوره
8 دانشجو

لیزی مدرس با بیش از ۱۰ سال تجربه در حوزه داده‌کاوی و یادگیری ماشین، با تدریس دوره‌های جامع و کاربردی، به یکی از پیشگامان آموزش آنلاین تبدیل شده است. او دارای دو مدرک کارشناسی ارشد در مهندسی کامپیوتر و آمار است و از اولین مدرسانی بود که دوره‌های یادگیری عمیق را به‌صورت آنلاین ارائه کرد. علاوه بر آموزش، تجربه عملی گسترده‌ای در مهندسی نرم‌افزار و تبلیغات دیجیتال دارد و با فناوری‌های متنوعی آشناست. علاقه‌مندی او به حوزه‌های مختلف علمی و تعهدش به ساده‌سازی مفاهیم پیچیده، باعث شده تا هزاران دانشجو و متخصص را در مسیر یادگیری هوش مصنوعی و داده‌کاوی همراهی و الهام‌بخش باشد.

اطلاعات بیشتر