پردازش تصویر یکی از دروس کاربردی هوش مصنوعی است. پردازش تصویر و بینایی کامپیوتر دارای کاربردهای صنعتی بسیار زیادی است و هر جایی که چشم انسان کارآیی دارد قابل استفاده است. در این درس ابتدا مقداری راجع به نحوه تشکیل تصویر و پارامترهای یک دوربین بحث میشود، سپس روشهایی برای بهبود کیفیت تصویر و کاهش نویز مطرح میشوند همچنین تبدیلهای تصویر از جمله تبدیل فوریه و تبدیل موجک (Wavelet) و کاربرد آنها در پردازش تصویر از جمله برای فشردهسازی تصویر (مانند jpeg) و بازیابی تصویر (فیلتر معکوس و فیلتر وینر) بررسی میشوند.
همچین در ادامه نحوه استخراج شکلهای سادهای مانند خط و دایره از تصویر بحث میشوند. سپس، روشهای متداول برای ناحیهبندی تصویر از جمله آستانهگذاری سراسری Otsu و آستانهگذاری وفقی و رشد ناحیه و همچنین پردازشهای موروفولوژی بررسی میشوند.
دستهبندی تصویر موضوع دیگری است که در این درس مورد بررسی قرار میگیرد. برای دستهبندی تصویر، ابتدا روشهای مهندسی ویژگی از جمله برخی از توصیفگرهای هندسی، توصیفگرهای رنگی و توصیفگرهای بافتی (مانند LBP) توضیح داده میشوند و بعد از آن وارد موضوع یادگیری ویژگی با استفاده از شبکههای کانولوشنی میشویم.
پس از معرفی مفاهیم پایه در حوزه شبکههای کانولوشنی، برخی از شبکههای کانولوشنی معروف از جمله VGG و ResNet را بررسی میکنیم، سپس برخی از شبکههای معروف برای ناحیهبندی معنایی از جمله UNet و چندین شبکه معروف برای تشخیص اشیاء از جمله RCNN، YOLO و RetinaNet را بحث میکنیم. در انتهای درس پردازش تصویر هم مقداری راجع به تولید تصویر با استفاده از شبکههای GAN صحبت میشود.
این دوره برای همه دانشجویان رشتههای مهندسی کامپیوتر و It و همه علاقهمندان به دانش هوش مصنوعی مناسب است.
این دوره طی 29 جلسه و در دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ضبط شده است و توسط تیم مکتبخونه در اختیار علاقهمندان قرار گرفته است.
دکتر محمدرضا محمدی از سال 1396 استادیار گروه هوش مصنوعی دانشگاه علم و صنعت است. ایشان دروس متنوعی از جمله مبانی بینایی کامپیوتر، پردازش تصویر (تصویرپردازی رقمی)، یادگیری ماشین، مبانی یادگیری عمیق و یادگیری عمیق را ارائه کرده است. همچنین، در اجرای پروژههای صنعتی متعددی در حوزهی بینایی کامپیوتر همکاری داشته است.