آموزش وب اسکرپینگ با پایتون (web scraping)

اگر بخواهید در سریع‌ترین زمان ممکن حجم زیادی از اطلاعات را از یک وب‌سایت دریافت کنید، مانند مقادیر زیادی داده از یک وب‌سایت برای آموزش الگوریتم یادگیری ماشین روشی به نام وب اسکرپینگ وجود دارد ... ادامه

گواهی‌نامه
3.7 (87 امتیاز)
2,164 دانشجو
مقدماتی
محتوای دوره
پیش‌نیاز‌ها
درباره دوره
نظرات کاربران
درباره استاد

آنچه در این دوره می‌آموزید

داده‌های دلخواه خود را از هر وب‌سایتی استخراج نمایید

اده‌های خود در قالب‌های گوناگون و همچنین قالب‌های پایگاه‌داده‌ای، ذخیره نمایید

ربات‌هایی بسازید که همانند خزنده‌های گوگل رفتار کنند و لینک‌های صفحات وب را بخوانند

وارد وب‌سایت‌هایی شوید که نیاز به لاگین دارند

محدودیت‌های اعمال شده بر‌روی user- agent یا آی‌پی‌ها را دور بزنید

محتوای دوره

5 فصل 47 جلسه 9 ساعت ویدیو
فصل اول - آشنایی با مفاهیم پایه در داده‌های وب
فصل دوم - آشنایی با ابزارهای کاربردی در استخراج داده‌های وب
فصل سوم - استخراج داده برپایه‌ی پروتکل
فصل چهارم - مفاهیم پیشرفته
فصل پنجم - طراحی یک برنامه با رابط گرافیکی

پیش‌نیاز‌ها

درباره دوره

اگر بخواهید در سریع‌ترین زمان ممکن حجم زیادی از اطلاعات را از یک وب‌سایت دریافت کنید، مانند مقادیر زیادی داده از یک وب‌سایت برای آموزش الگوریتم یادگیری ماشین روشی به نام وب اسکرپینگ وجود دارد که با استفاده از آن می‌توان این کار را انجام داد. در دوره آموزش وب اسکرپینگ با پایتون، قرار است که عمل Web scraping انجام می‌شود. در اینجا در کنار معرفی دوره آموزش Web scraping با پایتون قرار است که کمی در رابطه با وب اسکرپینگ و جنبه‌های مختلف آن صحبت کنیم.

دوره آموزش وب اسکرپینگ با پایتون

دوره آموزش وب اسکرپینگ با پایتون ارائه شهد در مکتب خونه یکی از بهترین دوره‌های آموزشی پروژه محور وب اسکرپینگ است که در 5 فصل آموزشی ارائه‌شده است. کل محتوای این دوره آموزش در 10 ساعت محتوای ویدیویی تهیه و تدوین شده است.

دوره آموزش وب اسکرپینگ با پایتون یک دوره پروژه محور است که در فصل آخر با طراحی یک برنامه با رابط گرافیکی به کاربران ارائه خواهد شد.

پیش‌نیاز دوره آموزش وب اسکرپینگ با پایتون

برای اینکه وب اسکرپینگ را به‌راحتی انجام دهید، زبان برنامه‌نویسی پایتون در کنار وب اسکرپینگ می‌تواند کمک بسیار زیادی به شما بکند. به همین خاطر ما در دوره‌های آموزش برنامه‌نویسی مکتب خونه سعی کرده‌ایم که آموزش وب اسکرپینگ با پایتون را جای بدهیم. در همین راستا آشنایی با پایتون از پیش‌نیازهای این دوره آموزشی به‌حساب می‌آید.

حال باید بدانیم به چه دلیل باید از پایتون در کنار وب اسکرپینگ استفاده کنیم. زبان پایتون دارای ابزاری است که شمارا در استفاده از وب اسکرپینگ کمک می‌کند و ما قصد داریم چند نمونه از این ابزار را به شما معرفی کنیم:

  • Scrapy
  • Selenium
  • request
  • beautiful soup

برای مثال، کتابخانه Beautiful Soup یک بسته پایتون برای تجزیه اسنادهای HTML و XML است. این یک درخت تجزیه برای صفحات تجزیه شده ایجاد می‌کند که می‌تواند برای استخراج داده‌ها از HTML استفاده شود که برای وب اسکرپینگ بسیار مفید است.

برای اینکه در انجام پروژه‌های وب اسکرپینگ با پایتون تسلط پیدا کنید، نیاز به دو هفته زمان‌دارید که به حد متوسط برسید و برای اینکه در این حوزه حرفه‌ای‌تر فعالیت کنید، باید حتماً تمرین و انجام پروژه‌ی مداوم داشته باشید. با استفاده از دوره‌ی آموزش وب اسکرپینگ با پایتون مکتب ‌خونه، به‌راحتی می‌توانید در این حوزه‌ی برنامه‌نویسی به هدف خود نزدیک شوید.

 امروزه scraping در پایتون رایج‌ترین روش برای استخراج و بیرون کشیدن اطلاعات در وب است ولی با این حال از زبانه‌ای دیگری مانند جاوا، جاوا اسکریپت همراه با فریمورک نود جی اس و غیره نیز استفاده می‌شود.

با دوره آموزش وب اسکرپینگ با پایتون چه مهارت‌هایی کسب خواهیم کرد؟

شما با دوره آموزش وب اسکرپینگ با پایتون به توانایی‌هایی زیر خواهید رسید:

  • داده‌های دلخواه خود را از هر وب‌سایتی استخراج نمایید.
  • داده‌های خود در قالب‌های گوناگون و همچنین قالب‎‌های پایگاه‌داده‌ای، ذخیره نمایید.
  • ربات‌هایی بسازید که همانند خزنده‌های گوگل رفتار کنند و لینک‌های صفحات وب را بخوانند.
  • وارد وب‌سایت‌هایی شوید که نیاز به لاگین دارند.
  • محدودیت‌های اعمال شده بر‌روی user- agent یا آی‌پی‌ها را دور بزنید.

دوره آموزش وب اسکرپینگ با پایتون برای چه کسانی مناسب است؟

دوره آموزش وب اسکرپینگ با پایتون برای افراد زیر مناسب است:

  • دانشجویان رشته مهندسی کامپیوتر
  • پژوهشگران حوزه هوش مصنوعی و یادگیری ماشین
  • پژوهشگران وب و دیجیتال مارکترها
  • و هر فردی که به داده‌های وب در حجم کلان نیازمند است.

اگر قصد دارید در اسکرپینگ وب web scraping به تخصص خوبی دست‌یابید، هم‌اکنون با ثبت‌نام در دوره آموزش وب اسکرپینگ با پایتون مکتب خونه اولین و مهم‌ترین قدم را در این راه بردارید. آموزش web scraping ارائه شده در این دوره شما را به درک درستی از این مفهوم می‌رساند و حتی این توانایی را در خود خواهید دید که با آن وارد بازار کار شوید.

وب اسکرپینگ چیست؟

همان‌طور که در دوره آموزش وب اسکرپینگ با پایتون نیز این موضوع به‌خوبی پوشش و توضیح داده شده است، خراش دادن وب (Web scraping) همچنین که به‌عنوان وب اسکرپینگ یا تراشیدن وب نیز شناخته می‌شود، به فرآیند استخراج متن و سایر محتوا، کپی، ذخیره و استفاده مجدد از محتوای شخص ثالث در اینترنت اشاره دارد.

امروزه علاوه بر اعمال کارهای دستی که در آن محتوا با دست کپی یا استخراج می‌شود، تعدادی ابزار و ماژول های مختلف برای کپی خودکار و استخراج اطلاعات از وب‌سایت‌ها نیز ایجاد شده است. یک نمونه استفاده تائید شده از وب اسکرپینگ، ایندکس وب‌سایت‌ها توسط گوگل یا سایر موتورهای جستجو است. این ایندکس سازی بسیار اهمیت دارد، زیرا این تنها راهی است که کاربران می‌توانند صفحات وب‌سایت موردنظر خود را در اینترنت پیدا کنند. از سوی دیگر، وب اسکرپینگ مخرب صفحه با هدف سوءاستفاده غیرقانونی از مالکیت معنوی، قانون کپی‌رایت را نقض می‌کند و بنابراین غیرقانونی است.

کاربرد وب اسکرپینگ

اسکرپینگ web در بسیاری از زمینه‌های مختلف برای استخراج داده‌ها استفاده می‌شود که این موارد استفاده می‌تواند هم قانونی و هم غیرقانونی باشد. در دوره آموزش وب اسکرپینگ با پایتون با بسیاری از این کاربردها آشنا خواهیم شد و در زیر به برخی از این کاربردها اشاره خواهیم کرد.

خزنده‌های وب موتورهای جستجو

ایندکس وب‌سایت‌ها، اساس نحوه کار موتورهای جستجو مانند گوگل و بینگ است. فقط با استفاده از خزنده‌های وب که URL ها را تجزیه‌وتحلیل و ایندکس می‌کنند، می‌توان نتایج جستجو را مرتب کرد و ارائه داد. خزنده‌های وب ربات‌هایی هستند که برنامه‌های خودکاری هستند که وظایف تعریف‌شده و تکراری را انجام می‌دهند.

خدمات وب

اسکراپرهای صفحه را می‌توان به‌عنوان جایگزینی برای وب‌سرویس‌ها استفاده کرد. این مورد استفاده از وب اسکرپینگ برای شرکت‌هایی که می‌خواهند داده‌های تحلیلی خاصی را در یک وب‌سایت به مشتریان خود ارائه دهند، بسیار جالب است. با این حال، استفاده از یک وب‌سرویس برای این کار مستلزم هزینه‌های بالایی است. به همین دلیل، اسکراپرهای صفحه که داده‌ها را استخراج می‌کنند، گزینه مقرون‌به‌صرفه تری هستند.

ریمیکس داده

ریمیکس یا mashup محتوایی را از سرویس‌های مختلف وب ترکیب می‌کند. نتیجه یک سرویس جدید است. ریمیکس اغلب از طریق رابط‌ها انجام می‌شود، اما اگر چنین API‌هایی در دسترس نباشد، از تکنیک scraping صفحه نیز در اینجا استفاده می‌شود.

تحلیل احساسات در شبکه‌های اجتماعی

ماندگاری پست‌های رسانه‌های اجتماعی بسیار کم است، با این حال، وقتی به‌طور جمعی به آن‌ها نگاه کنیم، روندهای ارزشمندی را نشان می‌دهند. در حالی که اکثر پلتفرم‌های رسانه‌های اجتماعی دارای API-هایی هستند که به ابزارهای شخص ثالث اجازه دسترسی به داده‌هایشان را می‌دهند ولی این گزینه ممکن است همیشه کافی نباشد. در چنین مواردی، تحلیلگران با وب اسکرپینگ این وب‌سایت‌ها به اطلاعات بلادرنگ مانند احساسات، عبارات، موضوعات و غیره دسترسی پیدا می‌کنند.

قیمت‌گذاری و تحقیقات بازار

بسیاری از فروشندگان فعال در حوزه تجارت الکترونیک اغلب محصولات خود را در چندین بازار قرار می‌دهند. با وب اسکرپینگ، آن‌ها می‌توانند قیمت‌گذاری را در چندین پلت فرم نظارت کنند و در بازاری که سود بالاتر است، فروش انجام دهند.

تحقیقات بازار به شرکت‌ها کمک می‌کند تا بفهمند بازار چگونه حرکت می‌کند و چگونه می‌توانند از فرصت‌های ارائه‌شده استفاده کنند. با استفاده از وب اسکرپینگ، می‌توانید اطلاعاتی را جمع‌آوری کنید که به شما امکان می‌دهد اندازه، دامنه و ماهیت بازار خود و همچنین نحوه تغییر آن در طول زمان و با توجه به عوامل اقتصادی مختلف را درک کنید.

علاوه بر این، می‌توانید از وب اسکرپینگ برای انجام تحقیق و توسعه استفاده کنید، با استفاده از اطلاعاتی که جمع‌آوری می‌کنید تا محصولات و خدمات بهتری را طراحی کنید تا نیازهای بازار هدف شمارا به روش‌هایی که رقابت ممکن است با آن مواجه شود، برآورده کند.

یادگیری ماشین

مدل‌های یادگیری ماشینی برای تکامل و بهبود به داده‌های خام نیاز دارند. ابزارهای وب اسکرپینگ می‌توانند تعداد زیادی از نقاط داده، متن و تصویر را در مدت زمان نسبتاً کوتاهی خراش دهند. یادگیری ماشینی به شگفتی‌های تکنولوژیک امروزی مانند ماشین‌های بدون راننده، پرواز فضایی، تشخیص تصویر و گفتار می‌پردازد. با این حال، این مدل‌ها برای بهبود دقت و قابلیت اطمینان خود به داده‌ها نیاز دارند.

یک پروژه خوب وب اسکرپینگ از این شیوه‌ها پیروی می‌کند. این‌ها تضمین می‌کنند که داده‌هایی را که به دنبال آن هستید دریافت می‌کنید و در عین حال برای منابع داده مختل نمی‌شوند.

نظارت بر برند

همچنین می‌توان از وب اسکرپینگ برای اطمینان از اینکه نام تجاری شما توسط گزارش‌های نادرست و اخبار منفی لکه‌دار نمی‌شود استفاده کرد. اگر به دنبال محتوایی هستید که می‌تواند برای برند شما مضر باشد، می‌توانید کنترل را در دست بگیرید و محتوایی تولید کنید که با هرگونه تأثیر منفی احتمالی بر شهرت محصولات یا خدمات شما مبارزه کند.

اتوماسیون کسب‌وکار

کسب‌وکار شما احتمالاً داده‌های زیادی تولید می‌کند و جمع‌آوری همه آن‌ها در یک مکان مرکزی و با دسترسی آسان می‌تواند دشوار باشد. علاوه بر این، به دست آوردن داده‌هایی که ممکن است مربوط به یک ابتکار خاص باشد می‌تواند به همان اندازه چالش‌برانگیز باشد. با استفاده از آموزش وب اسکرپینگ با پایتون، می‌توانید داده‌های موردنیاز خود را جمع‌آوری کنید، حتی بر روی نقاط داده‌ای که برای پروژه‌های خاص اعمال می‌شوند یا می‌توانند برای رسیدگی به مسائل ضروری استفاده شوند، تمرکز کنید.

همچنین با استفاده از وب اسکرپینگ برای افزایش اتوماسیون کسب‌وکار خود، می‌توانید راه‌های جدیدی برای افزایش بهره‌وری یا حجم فروش کشف کنید. به‌عنوان‌مثال، می‌توانید از وب اسکرپینگ برای جمع‌آوری تمام اطلاعات فروش مربوط به سه ماهه خاصی استفاده کنید که در آن کسب‌وکار سود رکوردی داشته است. سپس می‌توانید همه‌چیز را در مورد این دوره تجزیه‌وتحلیل کنید، مانند تعداد فروش، میانگین مبلغ هر فروش و حتی اینکه چه کسی چه چیزی را فروخته است. اگر فروشندگان قوی شناسایی شده‌اند، می‌توانید با پرس‌وجو در مورد اینکه چه چیزی به موفقیت آن‌ها در آن دوره کمک کرده است، پیگیری کنید. سپس استراتژی‌های آن‌ها می‌تواند توسط دیگران تکرار شود و کل تیم را تقویت کند.

انواع Web Scrapers

انواع مختلفی از روش‌های وب اسکرپینگ وجود دارد و عملکردهای اساسی آن‌ها معمولاً می‌تواند برای موارد مختلفی استفاده شود. این‌ها عبارت‌اند از اسکراپرهای خودساخته، اسکراپرهای از پیش‌ساخته شده، افزونه‌های مرورگر، اسکراپرهای نرم‌افزار، رابط کاربری، اسکراپرهای ابر و اسکراپرهای محلی.

اسکراپرهای خودساخته

با دانش برنامه‌نویسی مناسب، تقریباً هرکسی می‌تواند وب اسکراپر خود را بسازد. امروزه از پایتون در ساخت وب اسکراپرهای خودساخته بسیار استفاده می‌شود و دوره آموزش وب اسکرپینگ با پایتون مکتب خونه نیز مبنی بر این رویکرد است. از طرف دیگر، می‌توانید اسکراپرهای وب از پیش‌ساخته شده را نیز تهیه کنید. شما به‌سادگی باید اسکراپر را دانلود کرده و اجرا کنید.

افزونه‌های مرورگر و نرم‌افزار

اسکراپرهای وب افزونه مرورگر به مرورگری مانند فایرفاکس یا کروم اضافه می‌شوند. اگرچه این نوع از وب اسکرپینگ ها مفید هستند، اما می‌توانند محدودکننده باشند زیرا عملکرد آن‌ها به مرورگر شما محدود می‌شود. ازآنجا که آن‌ها باید در مرورگر شما کار کنند، نمی‌توانید توابع پیچیده‌تری را پیاده‌سازی کنید. برعکس، نرم‌افزار وب اسکرپینگ را می‌توان بر روی کامپیوتری شخصی نصب کرد. آن‌ها انعطاف‌پذیری بیشتری نسبت به وب اسکرپینگ مرورگر دارند و ویژگی‌های پیشرفته‌ای را ارائه می‌دهند.

وب اسکرپینگ رابط کاربری

نوع وب اسکرپینگ رابط کاربری به‌طور قابل‌توجهی متفاوت است. برخی از اسکراپرها فقط دارای یک رابط کاربری هستند که به یک خط فرمان ساده مجهز شده‌اند و برخی رابط کاربری گرافیکی دارند.

سخن پایانی

وب اسکرپینگ یکی از ترندهای محبوب و مهم برنامه نویسی به‌حساب می‌آید که امروزه طرفداران بسیار زیادی پیدا کرده است و علاوه براین در شاخه‌های گوناگونی از آن استفاده میشود. اگر به فکر ورود به دنیای وب اسکرپینگ هستید هم اکنون با ثبت نام در دوره آموزش وب اسکرپینگ با پایتون، اولین و مهم‌ترین قدم در این مسیر را بردارید. همچنین در مکتب خونه انواع دوره آموزش پایتون و آموزش برنامه نویسی به عنوان مکمل و پیش نیاز این دوره نیز موجود است که در این مسیر شما را همراهی خواهد کرد.

اطلاعات بیشتر

امتیاز و نظرات کاربران

3.7

از مجموع 87 امتیاز

14 نظر

1 سال پیش

دوره بسیار عالی و کامل می باشد

داریوش احمدی

داریوش احمدی

2 سال پیش

خدایی اش دوره جذاب و خوبی هست با اینکه یه دوره ی دیگه ضعیف از این مدرس دیده بودم، ولی انصافا این دوره از هر لحاظ خوب هست. توضیحات مدرس کاملا کافی و کاربردی و اصولی هست. مثال ها همه کاربردی و اصولی هست و البته تمرین کم داره که خب قابل چشم پوشی هست. کیفیت صدا شاید یکم اذیت بکنه ولی در کل کیفیت ضبط و صدا قابل قبول هست.

سید احمد رضا ابطحی

سید احمد رضا ابطحی

3 سال پیش

برای من که اطلاعاتی در این زمینه نداشتم دوره ی بسیار مفیدی بود ممنون از تدریس خوبتون آقای سلیمی.

سپهر سهرابی

سپهر سهرابی

3 سال پیش

واقعا استادعالی بود و مخصوصا دست و پنجه نرم کردن با مشکلات دیدن استک اورفلو و ... از همه مهم تر پیگیر ترین استادی هست که من تو مکتبخونه دیدم تمامی سوالات بنده را جواب میده و کاملا به درس اشراف دارند و گه گاهی چون خیلی سریع کد میزنه بعضی اشتباهات کوچیک میکنه که شاید کلا 2 بار در کل درس اونم چیز خیلی کوچک و غیر مهم

سینا اروجلوی جدید

سینا اروجلوی جدید

4 سال پیش

دوره ی بسیار عالی و کاربردی و جذاب بود. باتشکر فراوان از استاد سلیمی و پشتیبان مکتبخونه

احمد اسدی امجد

احمد اسدی امجد

3 سال پیش

برای کسی که تازه میخواد وارد وب اسکرپینگ بشه عالیه . البته کیفیت صدا خیلی خوب نیست اما مطالب خوبن باید خودتون هم تمرین زیاد کنید . تمرینات دوره کمه

علی روستا

علی روستا

نظرات بیشتر

گواهی‌نامه

آموزش وب اسکرپینگ با پایتون (web scraping)

پس از گذراندن محتوای دوره به صورت آنلاین (بدون دانلود) در سایت مکتب‌خونه، در صورتی‌ که حد نصاب قبولی در دوره را کسب و تمرین ها و پروژه های الزامی را ارسال کنید، گواهی‌نامه رسمی پایان دوره توسط مکتب‌خونه به اسم شما صادر شده و در اختیار شما قرار می‌گیرد.

قابل اشتراک‌گذاری در

linkdin

دوره‌های پیشنهادی

درباره استاد

معین سلیمی
معین سلیمی
6 دوره
18,595 دانشجو

مهندس معین سلیمی برنامه‌نویسی را از سال 84 آغاز کرد و تا به امروز در پروژه‌های اجرایی و تحقیقاتی مختلفی به عنوان برنامه‌نویس یا ایده پرداز فعالیت داشته است. ایشان از سال 90 به صورت تخصصی به آموزش برنامه‌نویسی مشغول است و معتقد است آموزش دادن هر مهارتی نیازمند دو مورد است: ۱- داشتن علم در زمینه مذکور، ۲-داشتن صبر و حوصله بسیار و توانایی آموزش، که چه بسا مورد دوم مهمتر از مورد اول است. عاشق یادگیری است و این موضوع هم علت و هم معلول مهارت برنامه‌نویسی در او است. گذراندن کارشناسی ارشد مهندسی مکانیک با معدل برتر و نزدیک به دو دهه سابقه کار حرفه‌ای برنامه نویسی در بسیاری حوزه های مهندسی و IT، دید وسیع و یکپارچه‌ای در علوم مختلف برای او ایجاد کرده است. امروزه بیشتر وقت خود را به فعالیت در پروژه های مرتبط با علوم داده، هوش مصنوعی و دیجیتال مارکتینگ و همچنین آموزش و توسعه برنامه‌نویسی نزد نوآموزان، در معتبرترین دانشگاه‌های کشور اختصاص می‌دهد.

اطلاعات بیشتر

دیگر دوره‌های معین سلیمی

سوالات پرتکرار

آیا در صورت خرید دوره، گواهی نامه آن به من تعلق می گیرد؟

خیر؛ شما با خرید دوره می توانید در آن دوره شرکت کنید و به محتوای آن دسترسی خواهید داشت. در صورتی که در زمان تعیین شده دوره را با نمره قبولی بگذرانید، گواهی نامه دوره به نام شما صادر خواهد شد.

آیا گواهی‌نامه‌های دانشگاهی به صورت رسمی و توسط دانشگاه مربوطه صادر می‌شود؟

بله؛ گواهی نامه ها توسط دانشگاه مربوطه و با امضای رئیس دانشگاه یا مسئول مربوطه که حق امضای گواهی نامه ها را دارد صادر می شود و گواهی نامه معتبر دانشگاه است که به اسم هر فرد صادر می شود.

حداقل و حداکثر زمانی که می توانم یک دوره را بگذرانم چقدر است؟

برای گذراندن دوره حداقل زمانی وجود ندارد و شما می توانید در هر زمانی که مایل هستید فعالیت های مربوطه را انجام دهید. برای هر دوره یک حداکثر زمان تعیین شده است که در صفحه معرفی دوره می توانید مشاهده کنید که از زمان خرید دوره توسط شما تنها در آن مدت شما از ویژگی های تصحیح پروژه ها توسط پشتیبان و دریافت گواهی نامه بهره مند خواهید بود.

در صورت قبولی در دوره، آیا امکان دریافت نسخه فیزیکی گواهی نامه دوره را دارم؟

خیر، به دلیل مسائل زیست محیطی و کاهش قطع درختان، فقط نسخه الکترونیکی گواهی‌نامه در اختیار شما قرار می‌گیرد

پس از سپری شدن زمان دوره، به محتوای دوره دسترسی خواهم داشت؟

بله؛ پس از سپری شدن مدت زمان دوره شما به محتوای دوره دسترسی خواهید داشت و می توانید از ویدئوها، تمارین، پروژه و دیگر محتوای دوره در صورت وجود استفاده کنید ولی امکان تصحیح تمارین توسط پشتیبان و دریافت گواهی نامه برای شما وجود نخواهد داشت.