آموزش بهینهسازی استنتاج مدلهای هوش مصنوعی با NVIDIA TensorRT
در دنیای امروز که مدلهای هوش مصنوعی روزبهروز بزرگتر و پیچیدهتر میشوند، چالش اصلی دیگر تنها آموزش مدلها نیست، بلکه استقرار (Deployment) آنها در محیطهای واقعی با بالاترین سرعت، کمترین تأخیر (Latency) و بیشترین بازدهی ... بیشتر


رضا محمودی
+ 1 مدرس دیگر
بهروزرسانی: ۱۴۰۴/۰۷/۰۷
آنچه در این دوره میآموزید
آشنایی عمیق با معماری TensorRT و اجزای کلیدی آن شامل پارسرها، بهینهسازها و موتور اجرایی.
پیادهسازی تکنیکهای پیشرفته بهینهسازی گراف مانند ادغام لایهها (Layer Fusion) و مدیریت بهینه حافظه.
نحوه کار با لایههای سفارشی و توسعه پلاگینهای اختصاصی برای عملیات پشتیبانینشده در TensorRT.
معماریهای مختلف استقرار از دیتاسنترهای ابری گرفته تا دستگاههای لبه (Edge) و سیستمهای نهفته (Embedded).
پروفایلینگ و دیباگ کردن عملکرد با استفاده از ابزارهای حرفهای مانند NVIDIA Nsight و trtexec برای شناسایی و رفع گلوگاههای پردازشی.
اتوماسیون فرآیندهای بهینهسازی و ادغام آن در پایپلاینهای CI/CD و پلتفرمهای MLOps.
محتوای دوره
درباره دوره
در دنیای امروز که مدلهای هوش مصنوعی روزبهروز بزرگتر و پیچیدهتر میشوند، چالش اصلی دیگر تنها آموزش مدلها نیست، بلکه استقرار (Deployment) آنها در محیطهای واقعی با بالاترین سرعت، کمترین تأخیر (Latency) و بیشترین بازدهی (Throughput) است.
آیا تا به حال مدل یادگیری عمیقی ساختهاید که روی کاغذ دقت فوقالعادهای دارد، اما در عمل به دلیل سرعت پایین و تأخیر (Latency) بالا، قابل استفاده نیست؟ در دنیای هوش مصنوعی، سرعت و کارایی در هنگام استفاده از مدلهای یادگیری عمیق (Inference) به اندازهی دقت آنها اهمیت دارد. یک مدل بزرگ و قدرتمند اگر نتواند در زمان واقعی و با کمترین هزینه به درخواستها پاسخ دهد، در عمل کاربرد خود را از دست میدهد.
کتابخانه TensorRT انویدیا، قدرتمندترین ابزار برای بهینهسازی و شتابدهی به فرآیند استنتاج (Inference) در شبکههای عصبی عمیق روی پردازندههای گرافیکی (GPU) است.
این دوره یک مسیر یادگیری جامع و کاربردی است که شما را از مبانی اولیه استنتاج تا پیشرفتهترین تکنیکهای بهینهسازی و استقرار در محیطهای صنعتی با استفاده از TensorRT همراهی میکند. با گذراندن این دوره، شما دانش و مهارت لازم برای تبدیل مدلهای سنگین آموزشی به موتورهای استنتاج بهینه، سریع و آماده برای استفاده در مقیاس بزرگ را به دست خواهید آورد.
شایان ذکر است که این دوره با استفاده از هوش مصنوعی تولید و ضبط شده است.
هدف اصلی این دوره، توانمندسازی شما برای بهینهسازی و استقرار (Deploy) مدلهای یادگیری عمیق با بالاترین سرعت و کمترین تأخیر (Latency) ممکن است. پس از پایان این دوره، شما قادر خواهید بود هر مدل آموزشدیدهای را دریافت کرده و با استفاده از TensorRT، یک موتور استنتاج (Inference Engine) بهینه، سریع و آمادهی استقرار در محیطهای واقعی (Production) بسازید.
این دوره برای چه کسانی مناسب است؟
مهندسان هوش مصنوعی و یادگیری ماشین که مسئولیت استقرار مدلها را بر عهده دارند.
متخصصان عملیات یادگیری ماشین (MLOps) که به دنبال ساخت پایپلاینهای خودکار و بهینه هستند.
توسعهدهندگان نرمافزار که مدلهای هوش مصنوعی را در محصولات خود (مانند سیستمهای خودروی خودران، پردازش ویدیو یا دستیارهای صوتی) ادغام میکنند.
پژوهشگران و دانشجویان علاقهمند به یادگیری عمیق که میخواهند با جنبههای عملی و کاربردی مدلها آشنا شوند.
اطلاعات بیشتر
درباره استاد

مهندس کامپیوتر ویژن با بیش از 5 سال تجربه در صنعت نفت و گاز و راهنمایی و رانندگی کشور مسلط به پایتون و C++، مهارت در فریم ورک های دیپ لرنینگ و ماشین لرنینگ
اطلاعات بیشتر
دیگر دورههای رضا محمودی

زینب صادقی دانشمند ارشد داده و مهندس یادگیری ماشین، متخصص در هوش مصنوعی مولد .
اطلاعات بیشتر