تا پایان تخفیف
آموزش مدلهای زبانی-تصویری (VLM): از درک تصویر و ویدیو تا فاینتیون پیشرفته
در دنیای امروز، هوش مصنوعی دیگر تنها به پردازش متن محدود نمیشود. تصور کنید سیستمی که بتواند همزمان یک تصویر را تحلیل کند، محتوای آن را توضیح دهد، ویدیوها را درک کند و حتی بر ... بیشتر


علیرضا اخوانپور
+ 1 مدرس دیگر
بهروزرسانی: ۱۴۰۴/۰۶/۳۱
آنچه در این دوره میآموزید
درک و پیادهسازی مدلهای اتصال متن-تصویر
تحلیل پیشرفته تصاویر و ویدیوها با مدلهای زبانی-بصری (VLM)
فاینتیونینگ و بهینهسازی مدلها برای وظایف خاص
یادگیری سریع و کارآمد با ابزارهای مدرن و بهروز
محتوای دوره
پیشنیازها
دوره برای سطوح متوسط طراحی شده، اما تازهکارها هم میتوانند دو فصل اول را بدون آشنایی قبلی با LLMها یا ترنسفورمرها استفاده کنند.
اگر دوره LLM قبلی مدرس این دوره، علیرضا اخوانپور، را گذرانده باشید، بهره بیشتری خواهید برد، خصوصاً فصلهای ۳ و ۴ که مبحث فاین تیون کردن این مدلها است.
درباره دوره
در دنیای امروز، هوش مصنوعی دیگر تنها به پردازش متن محدود نمیشود. تصور کنید سیستمی که بتواند همزمان یک تصویر را تحلیل کند، محتوای آن را توضیح دهد، ویدیوها را درک کند و حتی بر اساس ترجیحات انسانی پاسخهای هوشمند ارائه دهد – این دقیقاً قدرت مدلهای زبانی-تصویری (Vision-Language Models یا VLM) است!
اگر شما یک توسعهدهنده، پژوهشگر یا علاقهمند به هوش مصنوعی هستید و میخواهید در حوزه چندوجهی (multimodal AI) بدرخشید، این دوره دقیقاً برای شما طراحی شده است.
این دوره مبتنی بر آخرین پیشرفتهای سال ۲۰۲۵، شامل تکنیکهایی مانند SigLIP و روشهای بهینهسازی پیشرفته است. هدف دوره این است که شما نه تنها مفاهیم را یاد بگیرید، بلکه بتوانید بلافاصله آنها را در پروژههای واقعی پیادهسازی کنید. دوره شامل ۱۵ نوتبوک عملی (Jupyter Notebook) آماده اجراست – بدون نیاز به نصب پیچیده است.
چرا VLM مهم است؟
مدلهای زبانی-تصویری پلی بین جهان دیجیتال و واقعی میزنند. برخلاف مدلهای سنتی متنمحور مانند GPT، VLMها تصاویر و ویدیوها را با زبان طبیعی ترکیب میکنند. این یعنی آینده AI: از چتباتهایی که عکسها را تحلیل میکنند تا سیستمهای خودران که محیط را میفهمند.
کاربردهای عملی VLM
- جستجو و توصیهگرها: مثل Google Lens یا Pinterest، که تصاویر را تحلیل کرده و محتوای مرتبط پیشنهاد میدهند. تصور کنید اپلیکیشنی که بر اساس عکس لباس، استایلهای مشابه را پیدا کند!
- پردازش پزشکی: تحلیل تصاویر MRI یا X-ray با تشخیص دقیق علائم، مثل شناسایی تومورها و تولید گزارش اتوماتیک.
- تولید محتوا: ایجاد کپشنهای هوشمند برای شبکههای اجتماعی یا ویرایش ویدیوها با دستورات متنی.
- رباتیک و واقعیت افزوده: رباتهایی که اشیاء را شناسایی و دستورات صوتی را اجرا میکنند، مانند دستیارهای خانگی هوشمند.
- آموزش و پژوهش: تحلیل دادههای بصری برای تحقیقات علمی، مانند طبقهبندی تصاویر ماهوارهای برای تغییرات اقلیمی.
اطلاعات بیشتر
گواهینامه

پس از گذراندن محتوای دوره به صورت آنلاین (بدون دانلود) در سایت مکتبخونه، در صورتی که حد نصاب قبولی در دوره را کسب و تمرین ها و پروژه های الزامی را ارسال کنید، گواهینامه رسمی پایان دوره توسط مکتبخونه به اسم شما صادر شده و در اختیار شما قرار میگیرد.
قابل اشتراکگذاری در

درباره استاد

علیرضا اخوانپور، متخصص برجسته در حوزه هوش مصنوعی و یادگیری عمیق، با بیش از ۱۰ سال سابقه تدریس و فعالیت حرفهای، یکی از چهرههای شناختهشده در این حوزه است. او علاوه بر سابقه ۷ سال مدیریت فنی در مجموعه دانشبنیان شناسا، در طراحی و پیادهسازی چندین پروژه عملی در زمینه پردازش تصویر، بینایی کامپیوتر و مدلهای یادگیری عمیق نقش کلیدی داشته است.
از سال ۱۳۹۴ به عنوان مدرس در دانشگاه شهید رجایی فعالیت خود را آغاز کرد و از سال ۱۳۹۵ به طور تخصصی در حوزه هوش مصنوعی و یادگیری عمیق به تدریس مشغول است. در کنار تدریس، او چاپ مقالات بینالمللی و داوری بیش از ۱۰ مقاله علمی را نیز در کارنامه دارد و تجربه عملی خود را با پیادهسازی پروژههای صنعتی و پژوهشی موفق ترکیب کرده است.
حضور او در محیطهای آکادمیک با ارائه ورکشاپ در دانشگاههای امیرکبیر، شریف و تهران همراه بوده و دورههای تخصصی خود را در جهاد دانشگاهی شریف، دانشگاه تهران و سازمانهای بزرگی مانند معاونت علمی و فناوری ریاست جمهوری، صندوق نوآوری و شکوفایی، همراه اول و دیجیکالا برگزار کرده است. همچنین در حوزه بانکی و تلکام، دورههای تخصصی برای کارکنان بانکهای قوامین، سپه و صادرات و همراه اول و ایبیکام ارائه کرده و مدرس رویداد علم داده ایرانسل بوده است.
او در سایت مکتبخونه نیز دورههای پرمخاطبی در زمینه LLM، یادگیری عمیق، پردازش تصویر و OpenCV ضبط کرده که تجربه عملی گسترده او در پروژههای واقعی را نیز پوشش میدهند.
علیرضا اخوانپور به عنوان منتور و مشاور هوش مصنوعی با شتابدهنده همتک و شرکتهای معتبر مانند همراه اول و ایبیکام همکاری داشته و مدیریت سایت تخصصی Class.Vision را بر عهده دارد، که در زمینه هوش مصنوعی، یادگیری عمیق، بینایی کامپیوتر و یادگیری ماشین فعالیت میکند.
حضور موثر او در رویدادهای مهم مانند کنفرانس MVIP، فیس کاپ، داده ایرانسل و من برنامهنویسم و تولید محتوا در آکادمی همراه اول، مکتبخونه، کلاس ویژن و نماتک، به همراه تجربه عملی در چندین پروژه صنعتی و پژوهشی موفق، نقش برجسته او در گسترش دانش و کاربرد هوش مصنوعی در کشور را نشان میدهد.
اطلاعات بیشتر
دیگر دورههای علیرضا اخوانپور

کلاسویژن، یک سایت تخصصی برای دورههای هوش مصنوعی، دیپ لرنینگ، بینایی کامپیوتر و یادگیری ماشین است.
اطلاعات بیشتر