با پیشرفت در آمار و علوم کامپیوتر و همچنین مجموعه دادههای بهتر و رشد شبکههای عصبی، یادگیری ماشین در سالهای اخیر پیشرفت زیادی کرده است. امروزه یادگیری ماشین در همهجا وجود دارد، از جمله ترجمه ...
یادگیری تکنیکهای یادگیری بدون نظارت
ساخت سیستمهای توصیهگر با رویکرد فیلتر مشترک
یادگیری عمیق مبتنی بر محتوا
ساخت مدلهای یادگیری تقویتی عمیق
این دوره سومین دوره از تخصص یادگیری ماشین بوده و پیشنیاز آن دورههای آموزش الگوریتمهای نظارتشده در ماشینلرنینگ و آموزش الگوریتمهای پیشرفته در ماشینلرنینگ است.
با پیشرفت در آمار و علوم کامپیوتر و همچنین مجموعه دادههای بهتر و رشد شبکههای عصبی، یادگیری ماشین در سالهای اخیر پیشرفت زیادی کرده است. امروزه یادگیری ماشین در همهجا وجود دارد، از جمله ترجمه خودکار، تشخیص تصویر، فناوری جستجوی صوتی، خودروهای خودران و هر چیزی که فکرش را بکنید. دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ یکی از پیشرفتهترین دورههای موجود برای آموزش این سه مبحث در یادگیری ماشین و هوش مصنوعی بهحساب میآید که توسط مکتب خونه تهیه شده است. در ادامه به معرفی دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ خواهیم پرداخت و در کنار آن در رابطه با این سه مبحث مهم به صحبت خواهیم کرد.
این دوره، سومین دوره از مجموعه تخصص یادگیری ماشین با تدریس Andrew NG است. دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ یک دوره آنلاین اساسی به حساب می آید که با همکاری DeepLearning.AI و Stanford Online تهیه شده است. در دوره آموزشی یادگیری عمیق کاربران، اصول یادگیری ماشین و نحوه استفاده از این تکنیکها برای ساخت اپلیکیشنهای هوش مصنوعی در دنیای واقعی را خواهند آموخت. دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ به زبان انگلیسی و با زیرنویس فارسی و روان هماکنون در مکتبخونه در دسترس است.
با ثبت نام در این دوره آموزشی شما با مفاهیم زیر آشنا خواهید شد:
این تخصص توسط اندرو انگ، یک آیندهنگر هوش مصنوعی که تحقیقات انتقادی را در دانشگاه استنفورد و کارهای پیشگامانه در Google Brain ،Baidu و Landing.AI برای پیشرفت در زمینه هوش مصنوعی رهبری کرده است، آموزش داده میشود.
این دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی مقدمه گستردهای برای یادگیری ماشین مدرن، از جمله یادگیری نظارت شده (رگرسیون خطی چندگانه، رگرسیون لجستیک، شبکههای عصبی و درختان تصمیم)، یادگیری بدون نظارت (خوشهبندی، کاهش ابعاد، سیستمهای توصیه گر) است.
این دوره آموزشی برای تمامی افرادی که در زمینه هوش مصنوعی و یادگیری ماشین تحقیقات انجام میدهند مناسب است. همچنین این دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی برای دانشجویان کارشناسی، کارشناسی ارشد و دکتری رشتههای مهندسی کامپیوتر بسیار دوره مناسبی بهحساب میآید.
در پایان این تخصص، شما بر مفاهیم کلیدی تسلط خواهید داشت و دانش عملی برای بهکارگیری سریع و قدرتمند یادگیری ماشین در مسائل چالشبرانگیز دنیای واقعی را به دست خواهید آورد. اگر به دنبال ورود به دنیای هوش مصنوعی و یادگیری ماشین هستید، این دوره جدید یادگیری ماشین بهترین مکان برای شروع است.
یادگیری ماشین (ML) شاخهای از هوش مصنوعی (AI) است که کامپیوترها را قادر میسازد تا از دادههای آموزشی «خود یاد بگیرند» و در طول زمان، بدون برنامهریزی صریح، پیشرفت کنند. الگوریتمهای یادگیری ماشین قادر به تشخیص الگوهای موجود در دادهها و یادگیری از آنها هستند تا پیشبینیهای خود را انجام دهند. بهطور خلاصه، الگوریتمها و مدلهای یادگیری ماشین از طریق تجربه یاد میگیرند.
در برنامهنویسی سنتی، یک مهندس کامپیوتر یک سری دستورالعمل مینویسد که به کامپیوتر دستور میدهد چگونه دادههای ورودی را به خروجی دلخواه تبدیل کند. دستورالعملها بیشتر بر اساس ساختار IF-THEN هستند: وقتی شرایط خاصی برآورده میشود، برنامه یک عمل خاص را اجرا میکند. از سوی دیگر، یادگیری ماشین یک فرآیند خودکار است که ماشینها را قادر میسازد تا مشکلات را با کمک کم یا حتی بدون دخالت انسان حل کنند و اقداماتی را بر اساس مشاهدات گذشته انجام دهند.
درحالیکه هوش مصنوعی و یادگیری ماشین اغلب بهجای یکدیگر مورداستفاده قرار میگیرند، آنها دو مفهوم متفاوت هستند و هوش مصنوعی مفهوم گستردهتری است و یادگیری ماشین زیرمجموعهای از هوش مصنوعی بهحساب میآید که سیستمهای هوشمند را قادر میسازد تا بهطور مستقل چیزهای جدید را از دادهها یاد بگیرند.
برای درک نحوه عملکرد یادگیری ماشین، باید روشها و الگوریتمهای مختلف یادگیری ماشین را بررسی کنید، که اساساً مجموعهای از قوانینی هستند که ماشینها برای تصمیمگیری از آنها استفاده میکنند. در زیر، پنج نوع رایج و پرکاربرد یادگیری ماشین شرح دادهشدهاند:
الگوریتمهای یادگیری نظارت شده یا یادگیری تحت نظارت (Supervised Learning) بر اساس دادههای آموزشی برچسبگذاری شده پیشبینی میکنند. هر نمونه آموزشی شامل یک ورودی و یک خروجی دلخواه است. یک الگوریتم یادگیری نظارت شده این دادههای نمونه را تجزیهوتحلیل میکند و استنباط میکند، اساساً، یک حدس آموزشی در هنگام تعیین برچسب برای دادههای دیده نشده است.
Supervised Learning رایجترین و محبوبترین رویکرد برای یادگیری ماشین است. این روش یادگیری با نظارت نام دارد زیرا برای یادگیری از این مدلها باید دادههای نمونه برچسبگذاری شده دستی تغذیه شوند. دادهها برچسبگذاری میشوند تا به ماشین بفهمانند که باید به دنبال چه الگوهایی (کلمات و تصاویر مشابه، دستهبندی دادهها و غیره) باشد و ارتباط با آنها را تشخیص دهد.
برای مثال، اگر میخواهید ایمیلهای اسپم را بهطور خودکار شناسایی کنید، باید نمونههایی از ایمیلهایی را که میخواهید بهعنوان هرزنامه یا اسپم طبقهبندی شوند و سایر موارد مهم که نباید هرزنامه تلقی شوند، به الگوریتم یادگیری ماشین بدهید. روشهای مختلفی برای یادگیری با نظارت مانند طبقهبندی، رگرسیون، ماشین بردار پشتیبان و غیره وجود دارد.
الگوریتمهای یادگیری بدون نظارت (Unsupervised Learning) که تمرکز اصلی قسمت اول این دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی است، بینشها و روابط را در دادههای بدون برچسب آشکار میکنند. در این مورد، مدلها با دادههای ورودی تغذیه میشوند، اما نتایج موردنظر ناشناخته هستند، بنابراین آنها باید بر اساس شواهد غیرمستقیم، بدون هیچ راهنمایی یا آموزشی استنتاج کنند. در این روش مدلها با «پاسخ درست» آموزش ندیدهاند، بنابراین باید الگوهای خود را پیدا کنند.
یکی از رایجترین انواع یادگیری بدون نظارت، خوشهبندی (clustering) بهحساب میآید که شامل گروهبندی دادههای مشابه است. این روش بیشتر برای تجزیهوتحلیل اکتشافی استفاده میشود و میتواند به شما در شناسایی الگوها یا روندهای پنهان کمک کند.
بهعنوانمثال، تیم بازاریابی یک شرکت یا فروشگاه بزرگ اینترنتی میتواند از خوشهبندی برای بهبود بخشبندی مشتریان استفاده کند. با توجه به مجموعهای از دادههای درآمد و هزینه، یک مدل یادگیری ماشین میتواند گروههایی از مشتریان را با رفتارهای مشابه شناسایی کند.
در یادگیری نیمه نظارتی (Semi-Supervised Learning)، دادههای آموزشی به دو قسمت تقسیم میشوند. مقدار کمی از دادههای برچسبدار و مجموعه بزرگتری از دادههای بدون برچسب.
در این مورد، مدل از دادههای برچسبگذاری شده بهعنوان ورودی برای استنتاج درباره دادههای بدون برچسب استفاده میکند و نتایج دقیقتری نسبت به مدلهای یادگیری نظارتشده معمولی ارائه میکند.
این رویکرد بهویژه برای کارهایی که مجموعه دادههای بزرگی مانند طبقهبندی تصاویر را شامل میشود، محبوبیت بیشتری پیدا میکند. یادگیری نیمه نظارتی به تعداد زیادی داده برچسبگذاری شده نیاز ندارد، بنابراین راهاندازی آن سریعتر، مقرونبهصرفه تر از روشهای یادگیری نظارتشده بهحساب میآید و برای کسبوکارهایی که مقادیر زیادی داده دارند ایدهآل است.
یادگیری تقویتی (Reinforcement Learning) به این میپردازد که چگونه یک عامل نرمافزاری (یا برنامه کامپیوتری) باید در موقعیتی برای به حداکثر رساندن پاداش عمل کند. بهطور خلاصه، مدلهای یادگیری ماشین تقویتشده سعی میکنند بهترین مسیر ممکن را که باید در یک موقعیت خاص طی کنند، تعیین کنند. آنها این کار را از طریق آزمونوخطا انجام میدهند. ازآنجاییکه هیچ داده آموزشی وجود ندارد، ماشینها از اشتباهات خود درس میگیرند و اقداماتی را انتخاب میکنند که به بهترین راهحل یا حداکثر پاداش منجر شود.
این روش یادگیری ماشین بیشتر در رباتیک و بازی استفاده میشود. بازیهای ویدیویی رابطه واضحی بین اقدامات و نتایج نشان میدهند و میتوانند موفقیت را با حفظ امتیاز بسنجند. بنابراین، آنها یک راه عالی برای بهبود الگوریتمهای یادگیری تقویتی هستند. فصل سوم دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی با تمرکز بر این رویکرد ارائه شده است.
مدلهای یادگیری عمیق (Deep Learning) میتوانند تحت نظارت، نیمه نظارت یا بدون نظارت (یا ترکیبی از هر سه) باشند. آنها الگوریتمهای یادگیری ماشین پیشرفتهای هستند که توسط غولهای فناوری مانند گوگل، مایکروسافت و آمازون برای اجرای کل سیستمها و چیزهای قدرتمند مانند ماشینهای خودران و دستیارهای هوشمند استفاده میشوند.
برنامههای زیادی وجود دارد که وبسایتها دادههای کاربران خود را جمعآوری میکنند و از آن دادهها برای پیشبینی میزان پسند بودن و ناپسندبودن کاربران خود استفاده میکنند. این به آنها امکان میدهد محتوایی را که دوست دارند توصیه کنند. سیستمهای توصیهگر (Recommender Systems) راهی برای پیشنهاد یا مشابه موارد و ایدهها به طرز فکر خاص کاربر هستند. بخش دوم دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ با رویکرد ساخت سیستمهای توصیه گر ارائه شدهاست.
انواع سیستمهای توصیهگر
سیستم توصیهکننده انواع مختلفی دارد:
سیستمهای مبتنی بر محتوا مواردی را مشابه مواردی که قبلاً توسط مشتری رتبهبندی شده بود، به مشتری توصیه میکنند. از ویژگیها و ویژگیهای مورداستفاده میکند. از روی این ویژگیها میتواند شباهت بین آیتمها را محاسبه کند.
در یک سیستم توصیه مبتنی بر محتوا، ابتدا باید برای هر مورد یک پروفایل ایجاد کنیم که نمایانگر خصوصیات آن موارد باشد. از پروفایلهای کاربر برای یک کاربر خاص استنباط میشود. ما از این پروفایلهای کاربری برای توصیه موارد به کاربران از کاتالوگ استفاده میکنیم.
فیلتر مشارکتی مبتنی بر این ایده است که افراد مشابه (بر اساس دادهها) معمولاً چیزهای مشابهی را دوست دارند. این پیشبینی میکند که کاربر کدام مورد را بر اساس ترجیحات مورد سایر کاربران مشابه دوست دارد.
فیلتر مشارکتی از یک ماتریس کاربر - مورد برای تولید توصیهها استفاده میکند. این ماتریس حاوی مقادیری است که ترجیح کاربر را نسبت به یک آیتم مشخص میکند. این مقادیر میتوانند بازخورد صریح یا بازخورد ضمنی را نشان دهند.
دوره آموزش نظارتنشدهها، توصیهگرها و یادگیری تقویتی در ماشینلرنینگ یک دوره حرفهای و مناسب برای افرادی است که قصد دارند وارد این حوزهها شوند. مفاهیمی که در این دوره آموزش داده میشود بسیار پیشرفته و جذاب هستند و مطمئناً برای کسانی که میخواهند در حوزه ماشین لرنیینگ دانش خود را بهبود ببخشند بسیار توصیه میشود.
اطلاعات بیشتر
اندرو انگ استاد دانشکده علوم کامپیوتر دانشگاه استنفورد و سرپرست آزمایشگاه هوش مصنوعی استنفورد است. وی هم چنین بنیانگذار کورسرا (coursera.org) است و بر اساس گزارش تکنولوژی دانشگاه ام ای تی یکی از 35 مخترع برتر جوان دنیا است.
او دکتری خود را از دانشگاه کالیفرنیا برکلی گرفته و زمینههای پژوهش او هوش مصنوعی و علوم رباتیک است.
اطلاعات بیشتر