تا پایان تخفیف

آموزش مدل‌های زبانی-تصویری (VLM): از درک تصویر و ویدیو تا فاین‌تیون پیشرفته

در دنیای امروز، هوش مصنوعی دیگر تنها به پردازش متن محدود نمی‌شود. تصور کنید سیستمی که بتواند همزمان یک تصویر را تحلیل کند، محتوای آن را توضیح دهد، ویدیوها را درک کند و حتی بر ... بیشتر

جدید
گواهی‌نامه
5 (1 امتیاز)
95 دانشجو
متوسط

علیرضا اخوان‌پور

+ 1 مدرس دیگر

به‌روزرسانی: ۱۴۰۴/۰۶/۳۱

محتوای دوره
پیش‌نیاز‌ها
درباره دوره
نظرات کاربران
درباره استاد

آنچه در این دوره می‌آموزید

درک و پیاده‌سازی مدل‌های اتصال متن-تصویر

تحلیل پیشرفته تصاویر و ویدیوها با مدل‌های زبانی-بصری (VLM)

فاین‌تیونینگ و بهینه‌سازی مدل‌ها برای وظایف خاص

یادگیری سریع و کارآمد با ابزارهای مدرن و به‌روز

محتوای دوره

5 فصل 22 جلسه 6 ساعت ویدیو
آشنایی با مدل‌های مولتی‌مدال تصویر-متن از CLIP تا SigLIP
  معرفی دوره
مشاهده
"02:40
  پیش‌نیازها
مشاهده
"02:07
  LLM vs VLM
مشاهده
"10:07
  معماری CLIP (پیش‌آموزش زبان-تصویر)
"12:07
  تابع ضرر (Loss Function) در CLIP
"15:46
  آشنایی با امبدینگ‌های مولتی‌مدال CLIP
"15:19
  یادگیری بدون نمونه (Zero Shot) با CLIP
"19:54
  SigLIP، مدلی بهتر از CLIP
"14:12
  کوئیز آشنایی با مدل‌های مولتی‌مدال تصویر-متن
"15:00
  تمرین عملی: سیستم بازیابی تصاویر مشابه با CLIP/SigLIP (الزامی)
"300:00
مدل‌های VLM برای درک تصویر و ویدئو
فاین‌تیون کردن (Fine-tuning) و کاربردهای تخصصی مدل‌های مولتی‌مدال
روش‌های پیشرفته آموزش با ترجیحات: DPO، GRPO و MPO
پروژه نهایی VLM

پیش‌نیاز‌ها

دوره برای سطوح متوسط طراحی شده، اما تازه‌کارها هم می‌توانند دو فصل اول را بدون آشنایی قبلی با LLMها یا ترنسفورمرها استفاده کنند.

اگر دوره LLM قبلی مدرس این دوره، علیرضا اخوان‌پور، را گذرانده باشید، بهره بیشتری خواهید برد، خصوصاً فصل‌های ۳ و ۴ که مبحث فاین تیون کردن این مدل‌ها است.

درباره دوره

در دنیای امروز، هوش مصنوعی دیگر تنها به پردازش متن محدود نمی‌شود. تصور کنید سیستمی که بتواند همزمان یک تصویر را تحلیل کند، محتوای آن را توضیح دهد، ویدیوها را درک کند و حتی بر اساس ترجیحات انسانی پاسخ‌های هوشمند ارائه دهد – این دقیقاً قدرت مدل‌های زبانی-تصویری (Vision-Language Models یا VLM) است!

اگر شما یک توسعه‌دهنده، پژوهشگر یا علاقه‌مند به هوش مصنوعی هستید و می‌خواهید در حوزه چندوجهی (multimodal AI) بدرخشید، این دوره دقیقاً برای شما طراحی شده است.

این دوره مبتنی بر آخرین پیشرفت‌های سال ۲۰۲۵، شامل تکنیک‌هایی مانند SigLIP و روش‌های بهینه‌سازی پیشرفته است. هدف دوره این است که شما نه تنها مفاهیم را یاد بگیرید، بلکه بتوانید بلافاصله آن‌ها را در پروژه‌های واقعی پیاده‌سازی کنید. دوره شامل ۱۵ نوت‌بوک عملی (Jupyter Notebook) آماده اجراست – بدون نیاز به نصب پیچیده است.

چرا VLM مهم است؟

مدل‌های زبانی-تصویری پلی بین جهان دیجیتال و واقعی می‌زنند. برخلاف مدل‌های سنتی متن‌محور مانند GPT، VLMها تصاویر و ویدیوها را با زبان طبیعی ترکیب می‌کنند. این یعنی آینده AI: از چت‌بات‌هایی که عکس‌ها را تحلیل می‌کنند تا سیستم‌های خودران که محیط را می‌فهمند.

 کاربردهای عملی VLM

  • جستجو و توصیه‌گرها: مثل Google Lens یا Pinterest، که تصاویر را تحلیل کرده و محتوای مرتبط پیشنهاد می‌دهند. تصور کنید اپلیکیشنی که بر اساس عکس لباس، استایل‌های مشابه را پیدا کند!
  • پردازش پزشکی: تحلیل تصاویر MRI یا X-ray با تشخیص دقیق علائم، مثل شناسایی تومورها و تولید گزارش اتوماتیک.
  • تولید محتوا: ایجاد کپشن‌های هوشمند برای شبکه‌های اجتماعی یا ویرایش ویدیوها با دستورات متنی.
  • رباتیک و واقعیت افزوده: ربات‌هایی که اشیاء را شناسایی و دستورات صوتی را اجرا می‌کنند، مانند دستیارهای خانگی هوشمند.
  • آموزش و پژوهش: تحلیل داده‌های بصری برای تحقیقات علمی، مانند طبقه‌بندی تصاویر ماهواره‌ای برای تغییرات اقلیمی.

اطلاعات بیشتر

گواهی‌نامه

آموزش مدل‌های زبانی-تصویری (VLM): از درک تصویر و ویدیو تا فاین‌تیون پیشرفته

پس از گذراندن محتوای دوره به صورت آنلاین (بدون دانلود) در سایت مکتب‌خونه، در صورتی‌ که حد نصاب قبولی در دوره را کسب و تمرین ها و پروژه های الزامی را ارسال کنید، گواهی‌نامه رسمی پایان دوره توسط مکتب‌خونه به اسم شما صادر شده و در اختیار شما قرار می‌گیرد.

قابل اشتراک‌گذاری در

linkdin

درباره استاد

علیرضا اخوان‌پور
11 دوره
34,894 دانشجو

علیرضا اخوان‌پور، متخصص برجسته در حوزه هوش مصنوعی و یادگیری عمیق، با بیش از ۱۰ سال سابقه تدریس و فعالیت حرفه‌ای، یکی از چهره‌های شناخته‌شده در این حوزه است. او علاوه بر سابقه ۷ سال مدیریت فنی در مجموعه دانش‌بنیان شناسا، در طراحی و پیاده‌سازی چندین پروژه عملی در زمینه پردازش تصویر، بینایی کامپیوتر و مدل‌های یادگیری عمیق نقش کلیدی داشته است.

از سال ۱۳۹۴ به عنوان مدرس در دانشگاه شهید رجایی فعالیت خود را آغاز کرد و از سال ۱۳۹۵ به طور تخصصی در حوزه هوش مصنوعی و یادگیری عمیق به تدریس مشغول است. در کنار تدریس، او چاپ مقالات بین‌المللی و داوری بیش از ۱۰ مقاله علمی را نیز در کارنامه دارد و تجربه عملی خود را با پیاده‌سازی پروژه‌های صنعتی و پژوهشی موفق ترکیب کرده است.

حضور او در محیط‌های آکادمیک با ارائه ورکشاپ در دانشگاه‌های امیرکبیر، شریف و تهران همراه بوده و دوره‌های تخصصی خود را در جهاد دانشگاهی شریف، دانشگاه تهران و سازمان‌های بزرگی مانند معاونت علمی و فناوری ریاست جمهوری، صندوق نوآوری و شکوفایی، همراه اول و دیجی‌کالا برگزار کرده است. همچنین در حوزه بانکی و تلکام، دوره‌های تخصصی برای کارکنان بانک‌های قوامین، سپه و صادرات و همراه اول و ایبیکام ارائه کرده و مدرس رویداد علم داده ایرانسل بوده است.

او در سایت مکتب‌خونه نیز دوره‌های پرمخاطبی در زمینه LLM، یادگیری عمیق، پردازش تصویر و OpenCV ضبط کرده که تجربه عملی گسترده او در پروژه‌های واقعی را نیز پوشش می‌دهند.

علیرضا اخوان‌پور به عنوان منتور و مشاور هوش مصنوعی با شتاب‌دهنده همتک و شرکت‌های معتبر مانند همراه اول و ایبیکام همکاری داشته و مدیریت سایت تخصصی Class.Vision را بر عهده دارد، که در زمینه هوش مصنوعی، یادگیری عمیق، بینایی کامپیوتر و یادگیری ماشین فعالیت می‌کند.

حضور موثر او در رویدادهای مهم مانند کنفرانس MVIP، فیس کاپ، داده ایرانسل و من برنامه‌نویسم و تولید محتوا در آکادمی همراه اول، مکتب‌خونه، کلاس ویژن و نماتک، به همراه تجربه عملی در چندین پروژه صنعتی و پژوهشی موفق، نقش برجسته او در گسترش دانش و کاربرد هوش مصنوعی در کشور را نشان می‌دهد.

اطلاعات بیشتر

دیگر دوره‌های علیرضا اخوان‌پور

کلاس ویژن
8 دوره
33,518 دانشجو

کلاس‌ویژن، یک سایت تخصصی برای دوره‌های هوش مصنوعی، دیپ لرنینگ، بینایی کامپیوتر و یادگیری ماشین است.

اطلاعات بیشتر

دیگر دوره‌های کلاس ویژن

سوالات پرتکرار

آیا در صورت خرید دوره، گواهی نامه آن به من تعلق می گیرد؟

خیر؛ شما با خرید دوره می توانید در آن دوره شرکت کنید و به محتوای آن دسترسی خواهید داشت. در صورتی که در زمان تعیین شده دوره را با نمره قبولی بگذرانید، گواهی نامه دوره به نام شما صادر خواهد شد.

حداقل و حداکثر زمانی که می توانم یک دوره را بگذرانم چقدر است؟

برای گذراندن دوره حداقل زمانی وجود ندارد و شما می توانید در هر زمانی که مایل هستید فعالیت های مربوطه را انجام دهید. برای هر دوره یک حداکثر زمان تعیین شده است که در صفحه معرفی دوره می توانید مشاهده کنید که از زمان خرید دوره توسط شما تنها در آن مدت شما از ویژگی های تصحیح پروژه ها توسط پشتیبان و دریافت گواهی نامه بهره مند خواهید بود.

در صورت قبولی در دوره، آیا امکان دریافت نسخه فیزیکی گواهی نامه دوره را دارم؟

خیر، به دلیل مسائل زیست محیطی و کاهش قطع درختان، فقط نسخه الکترونیکی گواهی‌نامه در اختیار شما قرار می‌گیرد

پس از سپری شدن زمان دوره، به محتوای دوره دسترسی خواهم داشت؟

بله؛ پس از سپری شدن مدت زمان دوره شما به محتوای دوره دسترسی خواهید داشت و می توانید از ویدئوها، تمارین، پروژه و دیگر محتوای دوره در صورت وجود استفاده کنید ولی امکان تصحیح تمارین توسط پشتیبان و دریافت گواهی نامه برای شما وجود نخواهد داشت.