دادهکاوی یکی از علوم بسیار کاربردی در حل بسیاری از مسائل، امروزه کاربرد خود را در بازاریابی نیز نمایان کرده است. همین امر سبب شده این حوزه بیشازپیش محبوبیت کسب کند. از سویی دادهکاوی یکی از دروس اصلی و تخصصی در کارشناسی مهندسی کامپیوتر بوده که در انتخاب رشتههای آینده در مقطع ارشد و دکتری نیز بسیار طرفدار دارد. ما در مکتبخونه زمانی که این حجم از محبوبیت این حوزه آموزشی را درک کردیم تصمیم گرفته آموزشهایی را در این حوزه، بهصورت رایگان و غیر رایگان در اختیار شما همراهان گرامی قرار بدهیم. اما قبل از تهیه دورههای آموزشی ابتدا اطلاعات لازم در زمینه دادهکاوی، کاربرد و بازار کار آن کسب کنید.
Data mining یا دادهکاوی همانطور که از نامش پیداست به کنکاش و تحلیل معدنی از دادهها اشاره دارد. به بیان واضحتر زمانی که مجموعهای از دادهها در اختیار دارید، برای تحلیلها و تصمیمگیریهای آینده میتوانید این دادهها را کندوکاو کرده و بهترین انتخاب را داشته باشید.
البته بسیاری دادهکاوی را با یادگیری ماشین اشتباه میگیرند که برای جلوگیری از این امر باید بدانید یادگیری ماشین توسط مجموعهای از نتایج دادهکاوی انجام میشود. پس برای فراگیری دانش ماشین لرنینگ ابتدا بهتر است دادهکاوی را بدانید.
دادهکاوی در واقع اصلاح شده واژه آماردانان در اوایل دهه 1960 میلادی از عبارت صید داده (به انگلیسی data fishing یا data dredging) میباشد. البته زمانی دادهکاوی به اوج خود رسید که در دهه 1990 میلادی انبوهی از اطلاعات در پایگاه دادههای مختلف بلااستفاده مانده بود.
مراحل دادهکاوی را میتوان به سه مرحله عمده تقسیم کرد:
1. در ابتدا به پیداکردن و مطالعه دادههای مختلف میپردازد.
2. دادههای استخراج شده را تحلیل کرده تا اطلاعات جالبی از مجموعه دادهها به دست آید.
اطلاعات بهدستآمده کمک میکند یکروند توسعهیافته یا از مشکلات پیش رو جلوگیری شود. مثلاً اگر دادهکاوی روی آمار فروش محصولات یک کارخانه مواد غذایی انجام شود، نقاط ضعف و نقاط قوت کارخانه در فروش ماهانه مشخص میشود. این اطلاعات به مدیران کمک میکند تا راه چارهای برای نقاط ضعف پیدا کرده و با استراتژیهای مختلف نقاط قوت خود را حفظ و تقویت کنند.
دادهکاوی کاربردهای فراوانی دارد، از حوزه آیتی و نرمافزار گرفته تا حتی بازاریابی و مطالعه رفتار مشتریان. اما مهمترین این کاربردها عبارتاند از:
1. دادهکاوی در بازاریابی
اگر دقت کرده باشید در فروشگاههای زنجیرهای معمولاً قفسه ماکارونی به رب بسیار نزدیک است چراکه دادهکاوی روی رفتار مشتریان انجام شده نشان داده است، مشتری زمانی که یکی از این دو قلم جنس را برمیدارد، قطعاً به سراغ آن دیگری نیز میرود. با این کار نهتنها تجربه مشتری از خرید خوشایند افزایش مییابد بلکه چنانچه زمانی خرید یکی از این دو جنس را فراموش کرده باشد، شما بهراحتی به او یادآوری خواهید کرد!
2. دادهکاوی در پیشرفت تحصیلی
هیچ فکر کردهاید که بسیاری از کلاسهای کنکور با استفاده از ابزارهای دادهکاوی پیشرفت و پسرفت تحصیلی دانشآموزان خود را پیدا کرده و آنها را به سمت آیندهای بهتر سوق میدهند؟ اگر نمیدانستید باید بگوییم که دادهکاوی بیشتر از اینکه تصورش را بکنید، حتی در زندگی روزمره همه ما کاربرد دارد.
3. بازاریابی در بانکداری نوین
کاربرد دادهکاوی در بانکداری و مؤسسات مالی زمانی روشن میشود که معاملات میلیاردی جز ثابتی از این بیزینس باشد. در واقع دادهکاوی کمک میکند تحلیلهای بازاری، خطرها و ریسکهای احتمالی از قبل قابلپیشبینی باشد تا نهایت سود وارد معاملات شود.
البته دادهکاوی در موارد زیر نیز کاربردهای فراوانی دارد:
4. کتابخانهها
5. رشتههای مربوط به علوم رایانه
6. مهندسی صنایع
7. و...
ابزارهای دادهکاوی
متلب از مهمترین ابزارهای دادهکاوی در این روزها بهحساب میآید اما میتوان دادهکاوی را به کمک ابزارهای زیر نیز بهصورت کاملاً کاربردی انجام داد:
· پایتون
· آر
· ریپماینر
· Spss modeler
· وکا
انواع دادهکاوی میتواند نقش مهمی در کاربرد آن داشته باشد. ازاینرو ابتدا روشهای دادهکاوی را برایتان مطرح کرده و در پایان کاربرد هرکدام را بیان میکنیم. البته لازم است بدانید که از همه روشهای ذکر شده میتوان در همه کاربردهایی که در بخش قبل گفتیم، استفاده کرد اما بهینهترین روش انتخاب مناسبترینها است؛ ضمناً توجه داشته باشید روشهای ذکر شده همه روشهای موجود برای دادهکاوی نیستند!
1. روش دستهبندی یا classification دادهکاوی
در این تکنیک دادهکاوی دادهها را به دستههای مختلف هدف تقسیم کرده و از طریق الگوریتمهای مختلف دادهها را تجزیهوتحلیل میکنند. این روش شامل دو مرحله اصلی است که عبارتاند از:
1. مرحله یادگیری یا آموزش که با تجزیهوتحلیل دستهبندیها یافت میشود.
2. مرحله طبقهبندی که برای تخمین صحت دادهها استفاده میشود.
این روش بیشتر در پزشکی و سیستمهای بانکی رایج است.
2. روش خوشهبندی یا clustering دادهکاوی
این روش که نیز شباهت زیادی به روش قبل دارد خود شامل چندین تکنیک مختلف میباشد. این تکنیکها عبارتاند از:
روشهای جمعبندی سلسلهمراتبی
روشهای مبتنی بر شبکه
روشهای پارتیشنبندی
روشهای مبتنی بر مدل
روشهای مبتنی بر تراکم
این روش بیشتر در سیستم بانکداری مورداستفاده است.
3. روش ارتباطات یا association دادهکاوی
در این روش تلاش میشود دادههایی که در معدن اطلاعاتی ما به هیچ داده دیگری مرتبط نیستند کشف شده تا قاعده ارتباطی دقیقی بین دادههای مرتبط یافت شود. این روش از دو قانون زیر پیروی میکند:
1. قانون ارتباط تکبعدی: حاوی یک ویژگی تکرارشونده
2. قانون ارتباط چندبعدی: حاوی چند ویژگی تکرارشونده
این روش در آنالیز رفتار مشتریان مورداستفاده است.
4. روش پیشبینی یا prediction دادهکاوی
همانطور که از نامش پیداست، در این روش تصمیمگیریها و پیشبینی وقایع آینده باتوجهبه نتایجی که در گذشته حاصل شده انجام میشود. ازاینروش نیز در خردهفروشیها بسیار استفاده میشود.
5. روش درخت تصمیم یا decision tree دادهکاوی
درخت تصمیم درختی است که:
1. دارای گرههای است که هر گره داخلی نمایانگر آزمایشی بر روی ویژگی است.
2. دارای شاخه یا Branch است که نتیجه آزمون را نشان میدهد.
3. دارای گرههای ترمینال است که برچسب کلاس را نگه میدارند.
و البته بالاترین گره ریشه نام دارد که پاسخ سؤال را با دو یا چند جواب مختلف میدهد. ازاینروش برای تصمیمگیری در هر بیزینسی میتوان استفاده کرد.
6. روش شبکههای عصبی یا neural network دادهکاوی
سه رکن اساسی در این روش عبارتاند از:
مدل
الگوریتم یادگیری (نظارت شده یا بدون نظارت)
عملکرد فعالسازی
که مبتنی بر شبکه عصبی بیولوژیکی مدلسازی شده است. هر نورون بیولوژیکی حاوی اطلاعاتی است که ارتباط آن را با سایر نورونها نشان میدهد. ازاینروش دادهکاوی در طبقهبندی، تجزیهوتحلیل رگرسیون و پردازش دادهها استفاده میشود.
امروزه پلتفرمهای مختلفی اعم از منبع باز (رایگان) و غیر متنباز برای دادهکاوی وجود دارد که در نگاهی اجمالی میتوان به موارد زیر اشاره کرد:
1. Carrot2
2. Chemicalize
3. Gate
4. Elki
5. Oracle data miming
6. Microsoft analyze services
7. Clarabridge
8. و...
در اینکه دادهکاوی کاربردهای فراوانی دارد هیچ شکی نیست. اما مسئله اینجاست که تکنیکهای دادهکاوی میتواند مزایای بسیار خوبی برای هر نوع بیزینس و زمینه کاری داشته باشد. البته برخی معتقدند معایب دادهکاوی نیز اجتنابناپذیر است که در این مورد باید بگوییم مزایای دادهکاوی به معایب آن میچربد! ازاینرو فراگیری دادهکاوی از اهمیت بالایی برخوردار است. بد نیست در این مرحله نگاهی به مزایای آن نیز بی اندازیم:
1. شناخت مشتریان: زمانی که یک کسبوکار به دنبال جذب مشتری است، باید اطلاعات مفیدی از رفتار آنها داشته باشد. دادهکاوی این اطلاعات را در زمینه شناخت مشتری در اختیار شما میگذارد. البته که پیداکردن مشتریان وفادار و سودآور نیز به کمک دادهکاوی میسر میشود.
2. بهینهسازی محصولات: زمانی که شناخت کافی از مشتری پیدا کردید میتوانید محصولات کمفروش و پرفروش را بهصورت کاربردی و به کمک دادهکاوی دستهبندی کرده و سبد کالایی خود را بهینه کنید.
3. درک عمر مشتری: با اطلاعاتی که در نرمافزارهای دادهکاوی قرار میدهید میتوانید درک کنید که عمر میانگین مشتریان چقدر است؟ همچنین میتوانید علت ازدسترفتن برخی از مشتریان را نیز بیابید.
4. پیشبینی فروش: به کمک دادهکاوی میتوانید قبل از عرضه یک محصول یا خدمت جدید، میزان فروش آن را پیشبینی کنید.
5. کنترل کیفیت
6. تعیین طرحهای کنترل کیفی
7. شناسایی نوع خرابی
8. شناسایی مکانیزم خرابی قطعات مکانیکی
9. بهبود کیفیت
10. مهندسی کیفیت
11. پیشبینی احتمال خرابی
12. و...
شما میتوانید بهراحتی و بدون دغدغه شرکت در کلاسهای مختلف، به وبسایت ما یعنی مکتبخونه مراجعه کرده و همه آنچه درباره آموزش دادهکاوی نیاز دارید را کسب کنید. ما در این دورههای آموزشی سعی کردهایم بهینهترین روش آموزشی را همراه با نرمافزارهای دادهکاوی موردنیاز شما بهصورت کامل و اصولی جمعآوری کنیم تا قدمی مثبت در راستای رشد علم و دانش ایران و ایرانی باشیم.
خوشبختانه دادهکاوی یکی از مشاغلی است که امروزه طرفداران زیادی دارد. ازاینرو مسیر شغلی زمینههای کاری که مرتبط به دادهکاوی هستند برای تمامی کسانی که دانش آن را دارند، مسیری هموار و روبهرشد است. ازاینرو به شما اکیداً پیشنهاد میکنیم اگر به تجزیهوتحلیل دادهها علاقهمند هستید، از یادگیری دادهکاوی غافل نشوید که آیندهای درخشان در انتظارتان خواهد بود.
عنوان شغلی دانشمند داده یکی از مرتبطترین مشاغل به علوم دادهکاوی است که نهتنها درآمد بسیار بالایی در سراسر جهان دارد بلکه امروزه موقعیتهای شغلی بسیار زیادی مبتنی بر دانش دادهکاوی برای شما فراهم شده است. به طور میانگین یک دانشمند داده متوسط درآمد سالانه 120 هزار دلار در خارج از ایران را کسب خواهد کرد. البته این رقم در ایران 15 میلیون در ماه میرسد.
اگر دوست دارید برای پذیرش تحصیلی یا دریافت ویزای job offer (ویزای شغلی) به کشورهای مختلف که به لحاظ سطح زندگی بسیار با کیفیت هستند (مثل کانادا) مهاجرت کنید، توصیه میکنیم تا حد ممکن دانشهای جانبی خود را افزایش دهید. البته که دادهکاوی دانش جانبی بهحساب نیامده و خود میتواند مبحث اصلی بسیاری از شغلهای پردرآمد و رشتههای تحصیلی پرطرفدار باشد، اما اگر حتی حوزه کاری شما کمتر به دادهکاوی مربوط میشود، بازهم به شما پیشنهاد میکنیم از طریق دوره های آموزشی مکتبخونه، دانش خود را در این زمینه افزایش دهید. با این کار نهتنها رزومه قویتری برای دریافت پذیرش پیدا میکنید بلکه به لحاظ کاربردی نیز دانش فنی بالاتری خواهید داشت.
البته بد نیست بدانید که مشاغل مرتبط با دادهکاوی، مثل دانشمند داده که پیشتر اشاره کردیم، هماکنون تقاضاهای زیادی در سراسر جهان دارد پس دانش دادهکاوی مسیر مهاجرت شغلی شما را هموار میسازد. همچنین جالب است بدانید به دلیل محبوب بودن این رشته تحصیلی و کاربردهای گوناگونی که در مشاغل و کسبوکارهای مختلف دارد، دانشگاههای سراسر جهان به دنبال افراد مستعد در این زمینه میباشند. پس در هر دو صورت شانس اپلای و دریافت پذیرش تحصیلی یا شغلی با دانش دادهکاوی بسیار بالا میباشد.
امیدواریم به کمک دورههای آموزشی دادهکاوی در مکتبخونه بتوانید دانش کافی در این زمینه را فراگرفته و آیندهای مثال نزدنی برای خود رقم بزنید.