مکتب خونه هوش مصنوعیهوش مصنوعی برای برنامه‌نویسیLLM

تا پایان تخفیف

آموزش مدل‌های زبانی-تصویری (VLM): از درک تصویر و ویدیو تا فاین‌تیون پیشرفته

Name: آموزش مدلهای زبانی-تصویری (VLM): از درک تصویر و ویدیو تا فاینتیون پیشرفته
Price: 1079400 IRR
Availability: OnlineOnly
Rating: 4.6 (10 reviews)

در دنیای امروز، هوش مصنوعی دیگر تنها به پردازش متن محدود نمی‌شود. تصور کنید سیستمی که بتواند همزمان یک تصویر را تحلیل کند، محتوای آن را توضیح دهد، ویدیوها را درک کند و حتی بر ... بیشتر

پرطرفدار

گواهی‌نامه

4.6 (10 امتیاز)

2,158دانشجو

متوسط

علیرضا اخوان‌پور

+ 1 مدرس دیگر

به‌روزرسانی: ۱۴۰۴/۰۶/۳۱

محتوای دوره

پیش‌نیاز‌ها

درباره دوره

نظرات کاربران

درباره استاد

آنچه در این دوره می‌آموزید

درک و پیاده‌سازی مدل‌های اتصال متن-تصویر

تحلیل پیشرفته تصاویر و ویدیوها با مدل‌های زبانی-بصری (VLM)

فاین‌تیونینگ و بهینه‌سازی مدل‌ها برای وظایف خاص

یادگیری سریع و کارآمد با ابزارهای مدرن و به‌روز

محتوای دوره

5 فصل22 جلسه6 ساعت ویدیو

آشنایی با مدل‌های مولتی‌مدال تصویر-متن از CLIP تا SigLIP

01:31 ساعت 10 جلسه

معرفی دوره

مشاهده

"02:40

پیش‌نیازها

مشاهده

"02:07

LLM vs VLM

مشاهده

"10:07

معماری CLIP (پیش‌آموزش زبان-تصویر)

"15:46

تابع ضرر (Loss Function) در CLIP

"12:07

آشنایی با امبدینگ‌های مولتی‌مدال CLIP

"15:19

یادگیری بدون نمونه (Zero Shot) با CLIP

"19:54

SigLIP، مدلی بهتر از CLIP

"13:12

کوئیز آشنایی با مدل‌های مولتی‌مدال تصویر-متن

"15:00

تمرین عملی: سیستم بازیابی تصاویر مشابه با CLIP/SigLIP (الزامی)

"300:00

مدل‌های VLM برای درک تصویر و ویدئو

01:40 ساعت 10 جلسه

فاین‌تیون کردن (Fine-tuning) و کاربردهای تخصصی مدل‌های مولتی‌مدال

01:44 ساعت 6 جلسه

روش‌های پیشرفته آموزش با ترجیحات: DPO، GRPO و MPO

00:47 ساعت 6 جلسه

پروژه نهایی VLM

0 ساعت 1 جلسه

پیش‌نیاز‌ها

دوره برای سطوح متوسط طراحی شده، اما تازه‌کارها هم می‌توانند دو فصل اول را بدون آشنایی قبلی با LLMها یا ترنسفورمرها استفاده کنند.

اگر دوره LLM قبلی مدرس این دوره، علیرضا اخوان‌پور، را گذرانده باشید، بهره بیشتری خواهید برد، خصوصاً فصل‌های ۳ و ۴ که مبحث فاین تیون کردن این مدل‌ها است.

آموزش هوش مصنوعی مولد با مدل‌های زبانی بزرگ (LLM)

مدرس:

علیرضا اخوان‌پور • کلاس ویژن

40٪

2,399,0001,439,400 تومانء

درباره دوره

در دنیای امروز، هوش مصنوعی دیگر تنها به پردازش متن محدود نمی‌شود. تصور کنید سیستمی که بتواند همزمان یک تصویر را تحلیل کند، محتوای آن را توضیح دهد، ویدیوها را درک کند و حتی بر اساس ترجیحات انسانی پاسخ‌های هوشمند ارائه دهد – این دقیقاً قدرت مدل‌های زبانی-تصویری (Vision-Language Models یا VLM) است!

اگر شما یک توسعه‌دهنده، پژوهشگر یا علاقه‌مند به هوش مصنوعی هستید و می‌خواهید در حوزه چندوجهی (multimodal AI) بدرخشید، این دوره دقیقاً برای شما طراحی شده است.

این دوره مبتنی بر آخرین پیشرفت‌های سال ۲۰۲۵، شامل تکنیک‌هایی مانند SigLIP و روش‌های بهینه‌سازی پیشرفته است. هدف دوره این است که شما نه تنها مفاهیم را یاد بگیرید، بلکه بتوانید بلافاصله آن‌ها را در پروژه‌های واقعی پیاده‌سازی کنید. دوره شامل ۱۵ نوت‌بوک عملی (Jupyter Notebook) آماده اجراست – بدون نیاز به نصب پیچیده است.

چرا VLM مهم است؟

مدل‌های زبانی-تصویری پلی بین جهان دیجیتال و واقعی می‌زنند. برخلاف مدل‌های سنتی متن‌محور مانند GPT، VLMها تصاویر و ویدیوها را با زبان طبیعی ترکیب می‌کنند. این یعنی آینده AI: از چت‌بات‌هایی که عکس‌ها را تحلیل می‌کنند تا سیستم‌های خودران که محیط را می‌فهمند.

کاربردهای عملی VLM

جستجو و توصیه‌گرها: مثل Google Lens یا Pinterest، که تصاویر را تحلیل کرده و محتوای مرتبط پیشنهاد می‌دهند. تصور کنید اپلیکیشنی که بر اساس عکس لباس، استایل‌های مشابه را پیدا کند!
پردازش پزشکی: تحلیل تصاویر MRI یا X-ray با تشخیص دقیق علائم، مثل شناسایی تومورها و تولید گزارش اتوماتیک.
تولید محتوا: ایجاد کپشن‌های هوشمند برای شبکه‌های اجتماعی یا ویرایش ویدیوها با دستورات متنی.
رباتیک و واقعیت افزوده: ربات‌هایی که اشیاء را شناسایی و دستورات صوتی را اجرا می‌کنند، مانند دستیارهای خانگی هوشمند.
آموزش و پژوهش: تحلیل داده‌های بصری برای تحقیقات علمی، مانند طبقه‌بندی تصاویر ماهواره‌ای برای تغییرات اقلیمی.

اطلاعات بیشتر

امتیاز و نظرات کاربران

4.6

از مجموع 10 امتیاز

2نظر

4 ماه پیش

به شدت عالی و کاربردی با تدریس بسیار جذاب

دانشجوی دوره

4 ماه پیش

واقعاً جذابه، چون وارد مباحث خیلی جدید و کاربردی مثل فاین‌تیون پیشرفته و یادگیری بر اساس پریفرنس‌ها میشه. فضای این دوره کاملاً تخصصی و هوشمنده و برای کسایی که دنبال درک عمیق از مدل‌های زبانی-تصویری هستن، فوق‌العاده‌ست.

ساناز بابایی

گواهی‌نامه

آموزش مدل‌های زبانی-تصویری (VLM): از درک تصویر و ویدیو تا فاین‌تیون پیشرفته

پس از گذراندن محتوای دوره به صورت آنلاین (بدون دانلود) در سایت مکتب‌خونه، در صورتی‌ که حد نصاب قبولی در دوره را کسب و تمرین ها و پروژه های الزامی را ارسال کنید، گواهی‌نامه رسمی پایان دوره توسط مکتب‌خونه به اسم شما صادر شده و در اختیار شما قرار می‌گیرد.

قابل اشتراک‌گذاری در

دوره‌های پیشنهادی مشابه

مینی دوره ساخت هوش مصنوعی شخصی در مرورگر

علیرضا اخوان‌پور

آموزش هوش مصنوعی مولد با مدل‌های زبانی بزرگ (LLM)

علیرضا اخوان‌پور • کلاس ویژن

2,399,0001,439,400 تومان

40٪

آموزش پایتون جامع

جادی میرمیرانی

1,599,000990,000 تومان

38٪

آموزش پردازش تصویر و بینایی ماشین با OpenCV

علیرضا اخوان‌پور • کلاس ویژن

2,999,0001,799,400 تومان

40٪

درباره استاد

علیرضا اخوان‌پور

12دوره

48,707دانشجو

علیرضا اخوان‌پور، متخصص برجسته در حوزه هوش مصنوعی و یادگیری عمیق، با بیش از ۱۰ سال سابقه تدریس و فعالیت حرفه‌ای، یکی از چهره‌های شناخته‌شده در این حوزه است. او علاوه بر سابقه ۷ سال مدیریت فنی در مجموعه دانش‌بنیان شناسا، در طراحی و پیاده‌سازی چندین پروژه عملی در زمینه پردازش تصویر، بینایی کامپیوتر و مدل‌های یادگیری عمیق نقش کلیدی داشته است.

از سال ۱۳۹۴ به عنوان مدرس در دانشگاه شهید رجایی فعالیت خود را آغاز کرد و از سال ۱۳۹۵ به طور تخصصی در حوزه هوش مصنوعی و یادگیری عمیق به تدریس مشغول است. در کنار تدریس، او چاپ مقالات بین‌المللی و داوری بیش از ۱۰ مقاله علمی را نیز در کارنامه دارد و تجربه عملی خود را با پیاده‌سازی پروژه‌های صنعتی و پژوهشی موفق ترکیب کرده است.

حضور او در محیط‌های آکادمیک با ارائه ورکشاپ در دانشگاه‌های امیرکبیر، شریف و تهران همراه بوده و دوره‌های تخصصی خود را در جهاد دانشگاهی شریف، دانشگاه تهران و سازمان‌های بزرگی مانند معاونت علمی و فناوری ریاست جمهوری، صندوق نوآوری و شکوفایی، همراه اول و دیجی‌کالا برگزار کرده است. همچنین در حوزه بانکی و تلکام، دوره‌های تخصصی برای کارکنان بانک‌های قوامین، سپه و صادرات و همراه اول و ایبیکام ارائه کرده و مدرس رویداد علم داده ایرانسل بوده است.

او در سایت مکتب‌خونه نیز دوره‌های پرمخاطبی در زمینه LLM، یادگیری عمیق، پردازش تصویر و OpenCV ضبط کرده که تجربه عملی گسترده او در پروژه‌های واقعی را نیز پوشش می‌دهند.

علیرضا اخوان‌پور به عنوان منتور و مشاور هوش مصنوعی با شتاب‌دهنده همتک و شرکت‌های معتبر مانند همراه اول و ایبیکام همکاری داشته و مدیریت سایت تخصصی Class.Vision را بر عهده دارد، که در زمینه هوش مصنوعی، یادگیری عمیق، بینایی کامپیوتر و یادگیری ماشین فعالیت می‌کند.

حضور موثر او در رویدادهای مهم مانند کنفرانس MVIP، فیس کاپ، داده ایرانسل و من برنامه‌نویسم و تولید محتوا در آکادمی همراه اول، مکتب‌خونه، کلاس ویژن و نماتک، به همراه تجربه عملی در چندین پروژه صنعتی و پژوهشی موفق، نقش برجسته او در گسترش دانش و کاربرد هوش مصنوعی در کشور را نشان می‌دهد.

اطلاعات بیشتر