آموزش بهینه‌سازی استنتاج مدل‌های هوش مصنوعی با NVIDIA TensorRT

در دنیای امروز که مدل‌های هوش مصنوعی روزبه‌روز بزرگ‌تر و پیچیده‌تر می‌شوند، چالش اصلی دیگر تنها آموزش مدل‌ها نیست، بلکه استقرار (Deployment) آن‌ها در محیط‌های واقعی با بالاترین سرعت، کمترین تأخیر (Latency) و بیشترین بازدهی ... بیشتر

جدید
16 دانشجو
پیشرفته

رضا محمودی

+ 1 مدرس دیگر

به‌روزرسانی: ۱۴۰۴/۰۷/۰۷

محتوای دوره
درباره دوره
درباره استاد

آنچه در این دوره می‌آموزید

آشنایی عمیق با معماری TensorRT و اجزای کلیدی آن شامل پارسرها، بهینه‌سازها و موتور اجرایی.

پیاده‌سازی تکنیک‌های پیشرفته بهینه‌سازی گراف مانند ادغام لایه‌ها (Layer Fusion) و مدیریت بهینه حافظه.

نحوه کار با لایه‌های سفارشی و توسعه پلاگین‌های اختصاصی برای عملیات پشتیبانی‌نشده در TensorRT.

معماری‌های مختلف استقرار از دیتاسنترهای ابری گرفته تا دستگاه‌های لبه (Edge) و سیستم‌های نهفته (Embedded).

پروفایلینگ و دیباگ کردن عملکرد با استفاده از ابزارهای حرفه‌ای مانند NVIDIA Nsight و trtexec برای شناسایی و رفع گلوگاه‌های پردازشی.

اتوماسیون فرآیندهای بهینه‌سازی و ادغام آن در پایپ‌لاین‌های CI/CD و پلتفرم‌های MLOps.

محتوای دوره

8 فصل 47 جلسه 8 ساعت ویدیو
اصول اولیه TensorRT و گردش‌های کاری (Workflows) Inference
  درک Inference یادگیری عمیق
مشاهده
"17:10
  بررسی اجمالی معماری TensorRT
مشاهده
"18:14
  فرمت مدل پشتیبانی‌شده و قابلیت همکاری فریم ورک ها
مشاهده
"16:54
  انواع دقت (Precision ) : FP32، FP16 و INT8
"11:12
  ورک فلو معمول TensorRT
"18:30
  ملاحظات پلتفرم سخت‌افزاری
"06:46
تبدیل مدل و پیش‌پردازش برای TensorRT
تکنیک‌های بهینه‌سازی موتور یا Engine
معماری‌های استقرار و تولید
پروفایلینگ، بنچمارک و اشکال‌زدایی عملکرد
مباحث پیشرفته بهینه‌سازی استنتاج
لایه‌های سفارشی، پلاگین ها وExtensions عملگر
اتوماسیون، CI/CD و یکپارچه‌سازی گردش کار

درباره دوره

در دنیای امروز که مدل‌های هوش مصنوعی روزبه‌روز بزرگ‌تر و پیچیده‌تر می‌شوند، چالش اصلی دیگر تنها آموزش مدل‌ها نیست، بلکه استقرار (Deployment) آن‌ها در محیط‌های واقعی با بالاترین سرعت، کمترین تأخیر (Latency) و بیشترین بازدهی (Throughput) است.

آیا تا به حال مدل یادگیری عمیقی ساخته‌اید که روی کاغذ دقت فوق‌العاده‌ای دارد، اما در عمل به دلیل سرعت پایین و تأخیر (Latency) بالا، قابل استفاده نیست؟ در دنیای هوش مصنوعی، سرعت و کارایی در هنگام استفاده از مدل‌های یادگیری عمیق (Inference) به اندازه‌ی دقت آن‌ها اهمیت دارد. یک مدل بزرگ و قدرتمند اگر نتواند در زمان واقعی و با کمترین هزینه به درخواست‌ها پاسخ دهد، در عمل کاربرد خود را از دست می‌دهد.

کتابخانه TensorRT انویدیا، قدرتمندترین ابزار برای بهینه‌سازی و شتاب‌دهی به فرآیند استنتاج (Inference) در شبکه‌های عصبی عمیق روی پردازنده‌های گرافیکی (GPU) است.

این دوره یک مسیر یادگیری جامع و کاربردی است که شما را از مبانی اولیه استنتاج تا پیشرفته‌ترین تکنیک‌های بهینه‌سازی و استقرار در محیط‌های صنعتی با استفاده از TensorRT همراهی می‌کند. با گذراندن این دوره، شما دانش و مهارت لازم برای تبدیل مدل‌های سنگین آموزشی به موتورهای استنتاج بهینه، سریع و آماده برای استفاده در مقیاس بزرگ را به دست خواهید آورد.

شایان ذکر است که این دوره با استفاده از هوش مصنوعی تولید و ضبط شده است.

هدف اصلی این دوره، توانمندسازی شما برای بهینه‌سازی و استقرار (Deploy) مدل‌های یادگیری عمیق با بالاترین سرعت و کمترین تأخیر (Latency) ممکن است. پس از پایان این دوره، شما قادر خواهید بود هر مدل آموزش‌دیده‌ای را دریافت کرده و با استفاده از TensorRT، یک موتور استنتاج (Inference Engine) بهینه، سریع و آماده‌ی استقرار در محیط‌های واقعی (Production) بسازید.

 

این دوره برای چه کسانی مناسب است؟
مهندسان هوش مصنوعی و یادگیری ماشین که مسئولیت استقرار مدل‌ها را بر عهده دارند.
متخصصان عملیات یادگیری ماشین (MLOps) که به دنبال ساخت پایپ‌لاین‌های خودکار و بهینه هستند.
توسعه‌دهندگان نرم‌افزار که مدل‌های هوش مصنوعی را در محصولات خود (مانند سیستم‌های خودروی خودران، پردازش ویدیو یا دستیارهای صوتی) ادغام می‌کنند.
پژوهشگران و دانشجویان علاقه‌مند به یادگیری عمیق که می‌خواهند با جنبه‌های عملی و کاربردی مدل‌ها آشنا شوند.

اطلاعات بیشتر

درباره استاد

رضا محمودی
6 دوره
529 دانشجو

مهندس کامپیوتر ویژن با بیش از 5 سال تجربه در  صنعت نفت و گاز و راهنمایی و رانندگی کشور   مسلط به پایتون و C++، مهارت در فریم ورک های دیپ لرنینگ و ماشین لرنینگ 

 

اطلاعات بیشتر

دیگر دوره‌های رضا محمودی

زینب صادقی
6 دوره
529 دانشجو

زینب صادقی دانشمند ارشد داده و مهندس یادگیری ماشین، متخصص در هوش مصنوعی مولد .

اطلاعات بیشتر

دیگر دوره‌های زینب صادقی