×
ribbon

آموزش بهینه‌سازی استنتاج مدل‌های هوش مصنوعی با NVIDIA TensorRT

در دنیای امروز که مدل‌های هوش مصنوعی روزبه‌روز بزرگ‌تر و پیچیده‌تر می‌شوند، چالش اصلی دیگر تنها آموزش مدل‌ها نیست، بلکه استقرار (Deployment) آن‌ها در محیط‌های واقعی با بالاترین سرعت، کمترین تأخیر (Latency) و بیشترین بازدهی ... بیشتر

جدید
گواهی‌نامه
212 دانشجو
پیشرفته

رضا محمودی

+ 1 مدرس دیگر

به‌روزرسانی: ۱۴۰۴/۰۷/۰۷

محتوای دوره
درباره دوره
درباره استاد

آنچه در این دوره می‌آموزید

آشنایی عمیق با معماری TensorRT و اجزای کلیدی آن شامل پارسرها، بهینه‌سازها و موتور اجرایی.

پیاده‌سازی تکنیک‌های پیشرفته بهینه‌سازی گراف مانند ادغام لایه‌ها (Layer Fusion) و مدیریت بهینه حافظه.

نحوه کار با لایه‌های سفارشی و توسعه پلاگین‌های اختصاصی برای عملیات پشتیبانی‌نشده در TensorRT.

معماری‌های مختلف استقرار از دیتاسنترهای ابری گرفته تا دستگاه‌های لبه (Edge) و سیستم‌های نهفته (Embedded).

پروفایلینگ و دیباگ کردن عملکرد با استفاده از ابزارهای حرفه‌ای مانند NVIDIA Nsight و trtexec برای شناسایی و رفع گلوگاه‌های پردازشی.

اتوماسیون فرآیندهای بهینه‌سازی و ادغام آن در پایپ‌لاین‌های CI/CD و پلتفرم‌های MLOps.

محتوای دوره

8 فصل 47 جلسه 8 ساعت ویدیو
اصول اولیه TensorRT و گردش‌های کاری (Workflows) Inference
  درک Inference یادگیری عمیق
مشاهده
"17:10
  بررسی اجمالی معماری TensorRT
مشاهده
"18:14
  فرمت مدل پشتیبانی‌شده و قابلیت همکاری فریم ورک ها
مشاهده
"16:54
  انواع دقت (Precision ) : FP32، FP16 و INT8
"11:12
  ورک فلو معمول TensorRT
"18:30
  ملاحظات پلتفرم سخت‌افزاری
"06:46
تبدیل مدل و پیش‌پردازش برای TensorRT
تکنیک‌های بهینه‌سازی موتور یا Engine
معماری‌های استقرار و تولید
پروفایلینگ، بنچمارک و اشکال‌زدایی عملکرد
مباحث پیشرفته بهینه‌سازی استنتاج
لایه‌های سفارشی، پلاگین ها وExtensions عملگر
اتوماسیون، CI/CD و یکپارچه‌سازی گردش کار

درباره دوره

در دنیای امروز که مدل‌های هوش مصنوعی روزبه‌روز بزرگ‌تر و پیچیده‌تر می‌شوند، چالش اصلی دیگر تنها آموزش مدل‌ها نیست، بلکه استقرار (Deployment) آن‌ها در محیط‌های واقعی با بالاترین سرعت، کمترین تأخیر (Latency) و بیشترین بازدهی (Throughput) است.

آیا تا به حال مدل یادگیری عمیقی ساخته‌اید که روی کاغذ دقت فوق‌العاده‌ای دارد، اما در عمل به دلیل سرعت پایین و تأخیر (Latency) بالا، قابل استفاده نیست؟ در دنیای هوش مصنوعی، سرعت و کارایی در هنگام استفاده از مدل‌های یادگیری عمیق (Inference) به اندازه‌ی دقت آن‌ها اهمیت دارد. یک مدل بزرگ و قدرتمند اگر نتواند در زمان واقعی و با کمترین هزینه به درخواست‌ها پاسخ دهد، در عمل کاربرد خود را از دست می‌دهد.

کتابخانه TensorRT انویدیا، قدرتمندترین ابزار برای بهینه‌سازی و شتاب‌دهی به فرآیند استنتاج (Inference) در شبکه‌های عصبی عمیق روی پردازنده‌های گرافیکی (GPU) است.

این دوره یک مسیر یادگیری جامع و کاربردی است که شما را از مبانی اولیه استنتاج تا پیشرفته‌ترین تکنیک‌های بهینه‌سازی و استقرار در محیط‌های صنعتی با استفاده از TensorRT همراهی می‌کند. با گذراندن این دوره، شما دانش و مهارت لازم برای تبدیل مدل‌های سنگین آموزشی به موتورهای استنتاج بهینه، سریع و آماده برای استفاده در مقیاس بزرگ را به دست خواهید آورد.

شایان ذکر است که این دوره با استفاده از هوش مصنوعی تولید و ضبط شده است.

هدف اصلی این دوره، توانمندسازی شما برای بهینه‌سازی و استقرار (Deploy) مدل‌های یادگیری عمیق با بالاترین سرعت و کمترین تأخیر (Latency) ممکن است. پس از پایان این دوره، شما قادر خواهید بود هر مدل آموزش‌دیده‌ای را دریافت کرده و با استفاده از TensorRT، یک موتور استنتاج (Inference Engine) بهینه، سریع و آماده‌ی استقرار در محیط‌های واقعی (Production) بسازید.

 

این دوره برای چه کسانی مناسب است؟
مهندسان هوش مصنوعی و یادگیری ماشین که مسئولیت استقرار مدل‌ها را بر عهده دارند.
متخصصان عملیات یادگیری ماشین (MLOps) که به دنبال ساخت پایپ‌لاین‌های خودکار و بهینه هستند.
توسعه‌دهندگان نرم‌افزار که مدل‌های هوش مصنوعی را در محصولات خود (مانند سیستم‌های خودروی خودران، پردازش ویدیو یا دستیارهای صوتی) ادغام می‌کنند.
پژوهشگران و دانشجویان علاقه‌مند به یادگیری عمیق که می‌خواهند با جنبه‌های عملی و کاربردی مدل‌ها آشنا شوند.

اطلاعات بیشتر

گواهی‌نامه

آموزش بهینه‌سازی استنتاج مدل‌های هوش مصنوعی با NVIDIA TensorRT

پس از گذراندن محتوای دوره به صورت آنلاین (بدون دانلود) در سایت مکتب‌خونه، در صورتی‌ که حد نصاب قبولی در دوره را کسب و تمرین ها و پروژه های الزامی را ارسال کنید، گواهی‌نامه رسمی پایان دوره توسط مکتب‌خونه به اسم شما صادر شده و در اختیار شما قرار می‌گیرد.

قابل اشتراک‌گذاری در

linkdin

دوره‌های پیشنهادی مشابه

درباره استاد

رضا محمودی
6 دوره
836 دانشجو

مهندس کامپیوتر ویژن با بیش از 5 سال تجربه در  صنعت نفت و گاز و راهنمایی و رانندگی کشور   مسلط به پایتون و C++، مهارت در فریم ورک های دیپ لرنینگ و ماشین لرنینگ 

 

اطلاعات بیشتر

دیگر دوره‌های رضا محمودی

زینب صادقی
6 دوره
836 دانشجو

زینب صادقی دانشمند ارشد داده و مهندس یادگیری ماشین، متخصص در هوش مصنوعی مولد .

اطلاعات بیشتر

دیگر دوره‌های زینب صادقی