15
نتیجه برای "علم داده --- برنامه نویسی و IT" با فیلترهای مشخص شده در مکتبخونه موجود است.با ورود جهان به عصر کلاندادهها نیاز به ذخیرهسازی آنها هم افزایش یافت. این مسئله یکی از چالشهای و نگرانیهای اصلی صنایع سازمانی تا سال 2010 بود. از همین رو تمرکز اصلی آنها روی ایجاد چارچوب و راهحلهای ذخیره داده بود. با به وجود آمدن Hadoop و سایر چارچوبها مشکل ذخیرهسازی حل شده و تمرکزها روی پردازش این داده معطوف شد. دیتا ساینس علمی بود که بدین منظور ایجاد شد. علم داده آینده هوش مصنوعی است و تمام ایدههای فیلمهای علمی-تخیلی هالیوود با این دانش عظیم میتواند تحقق یابد. از این رو بسیار مهم است که بدانیم علم داده چیست و چگونه میتواند برای کسبوکارها ارزش افزوده ایجاد کند.
دیتا ساینس همچنان یکی از پرتقاضاترین مسیرهای شغلی است. متخصصان علم داده میدانند که برای موفقیت در این حوزه باید مهارتهای سنتی تجزیه و تحلیل حجم زیادی از دادهها، داده کاوی و مهارتهای برنامهنویسی را کسب کنند. متخصص علم داده برای کشف هوش سودمند برای سازمانهای خود باید به طور کامل بر چرخه حیات علم داده تسلط داشته باشد. همچنین او باید دارای انعطافپذیری و درک کافی برای به حداکثر رساندن بازده در هر مرحله از فرایند باشد. در ادامه بیشتر به بررسی چرخه حیات علم داده میپردازیم.
اصطلاح علم داده برای اولین بار در سال 2001 و توسط ویلیام کلیولند مطرح شد. او در مقاله خود تحت عنوان «علم داده: برنامهای برای گسترش جنبههای فنی در رشته آمار» علم داده را به عنوان یک رشته مستقل معرفی کرد. او معتقد بود این علم با علوم کامپیوتر و دادهکاوی در ارتباط است. البته جدید بودن این علم به معنای عدم استفاده از آن در سالهای دور نیست.
به عنوان مثال ناپلئون بناپارت برای تصمیمگیری در جنگ از مدلهای ریاضی استفاده میکرده است. مدلسازی در آن زمان برعهده ریاضیدانان بوده است.
کلیولند بر این باور بود که مهندسهای کامپیوتر شناخت اندکی از روشهای کار با داده دارند. از طرفی متخصصان آمار هم دانش محاسباتی بسیار خوبی ندارند؛ بنابراین تلفیق و ترکیب این دو گروه میتواند نوآوریهای زیادی را به وجود آورد. به گفته او دپارتمانهای علم داده باید متخصصانی داشته باشند که بتوانند دانش دادهها را با دانش محاسباتی ترکیب کنند. به همین ترتیب علمی پدید آمد که آن را علم داده نامیدند.
دانشکده مدیریت دانشگاه تهران اولین پژوهش را در زمینه متخصصین علم داده در ایران انجام داد. اما اولین دانشگاهی که به آموزش دیتا ساینس در مقطع کارشناسی ارشد پرداخت، دانشگاه شهید بهشتی بود. امروزه مرکز پژوهشی علوم و مدیریت داده دانشگاه تهران هم به صورت تخصصی علم داده را دنبال میکند.
از جمله رشتههای دانشگاهی مرتبط با این علم بهروز در ایران عبارتند از: علوم اطلاعات و دانششناسی، علوم کامپیوتر، رشته آمار، ریاضی کاربردی، آمار پزشکی، علوم تصمیم و مهندسی دانش، انفورماتیک، بیوانفورماتیک، ژئوانفورماتیک، تحلیل یادگیری، انفورماتیک پزشکی، علوم اعصاب محاسباتی، شیمیانفورماتیک و فیزیک محاسباتی.
چرخه حیات علم داده شامل پنج مرحله است:
ابتدا تیم پروژه باید با حوزه کسبوکار، سوابق کاری و تجربههای گذشته آن آشنا شود. سپس برای حمایت از پروژهها در حوزههای مختلف مانند افراد، زمان، فناوری و داده، منابع در دسترس را شناسایی کند. از مهمترین کارهایی که میتوان در مرحله اول انجام داد، تقسیم مسئله به اجزای کوچکتر است. تقسیم کار باید به گونهای باشد که علاوهبر حفظ انسجام و یکپارچگی، فرد بتواند با دنبال کردن مجموعهای از مراحل متوالی به نتسجه نهایی برسد.
تیم پروژه در مرحله دوم به یک محیط شبیهساز نیاز دارند تا بتوانند روی دادهها کار کرده و در زمان مناسب آنها را تجزیه و تحلیل کنند. فرایندهایی که در این مرحله انجام میشود، عبارتند از: استخراج، بارگذاری، تبدیل (ELT)، تبدیل و بارگذاری (ETL) یا همان عملیات انتقال درون محیط شبیهساز. به مجموع دو فرایند آخر یعنی ELT و ETL به اختصار ETLT میگویند. انتقال داده به کمک ETLT به تیم پروژه کمک میکند تا با ابعاد مختلف داده به خوبی آشنا شوند.
در این مرحله تیم پروژه تکنیکها، متدها و جریانهای کاری مورد نیاز را مشخص میکنند. آنها همچنین روابط بین متغیرها را بررسی کرده و از این طریق آن دسته از متغیرهای کلیدی که بیشترین تناسب را با مدل دارند، انتخاب میکنند.
در این مرحله مجموعههای داده برای تست، آموزش و اهداف تولیدی ایجاد میشود. به علاوه، مدلهای برنامهریزیشده در مرحله قبل ایجاد و اجرا میشوند. تیم پروژه در این مرحله باید محیط و ابزارهای لازم برای اجرای مدل و جریانهای کاری بررسی کند.
در این مرحله تیم پروژه با ذینفعان اصلی ارتباط برقرار کرده و میزان موفقیت و شکست نتایج را بررسی میکند. در ادامه تیم پروژه باید یافتههای جدید را شناسایی کرده و ارزش تولیدی برای کسبوکار را ارزیابی کند. سپس آنها را در قالب مستندات شفاف در اختیار ذینفعان قرار دهد.
آخرین مرحله شامل ارائه گزارشهای نهایی، کد و مستندات فنی است. بعضی از تیمها در این مرحله یک پروژه پایلوت را در محیط تولیدی سازماندهی و اجرا میکنند.
دیتاساینس تصمیمگیریها را تسهیل بخشیده و بهرهوری و توانمندی یک مجموعه را افزایش میدهد. سازمانهایی که از این علم بهره میبرند، میتوانند در شرایط مختلف بهترین تصمیمات را براساس دادههای موجود اتخاذ کنند. بدین ترتیب این سازمانها شاهد رونق اقتصادی خود خواهند بود.
در علم داده میتوان با توجه به دادهها یک الگوی خاص را شناسایی کرد و بر اساس آن، یک قاعده خاص برای روند کسبوکار برگزید. در چنین حالتی سازمان با نتایج مثبت بیشتری روبهرو خواهد شد. برای مثال میتوانیم به یک سازمان که با ارباب رجوع در ارتباط است، اشاره کنیم. قطعا علم داده در این سازمان به جذب مخاطبان کمک کرده و حتی میتواند در استخدام نیروی موثر و مفید بسیار کارآمد باشد.
به طور کلی مزایای علم داده را میتوان در موارد زیر خلاصه کرد:
از مهمترین مزیتهای علم داده میتوان به افزایش قدرت تصمیمگیری در رابطه با مسائل مهم و اساسی مربوط به یک شرکت اشاره کرد. سازمانها یا شرکتهایی که روی علم داده سرمایهگذاری میکنند، در آیندهای بسیار نزدیک بهرهوری بالایی را مشاهده خواهند کرد. همچنین آنها میتوانند در بسیاری از موارد مثل کاهش هزینهها، پیشرفت و جذب نیروی خوب پیشرفت زیادی داشته باشند. در واقع برای موفقیت در یک کسبوکار استفاده از علم داده اهمیت زیادی دارد و در دنیای امروز نمیتوان آن را نادیده گرفت.
امروزه علم داده در بخشهای وسیعی از کسبوکارها استفاده میشود. گستردگی این علم به قدری است که حتی دانشگاههای معتبر دنیا هرکدام به نحوی به آموزش علم داده میپردازند. زمینههای درسی متفاوتی برای این علم به کار گرفته میشود و در رابطه با محتوای دورهها یا سرفصلهای مرتبط با آن، هیچ اتفاق نظری وجود ندارد. درواقع هر موسسه و دانشگاه به سبک دلخواه خود، دوره دیتاساینس را ارائه کرده و سعی میکند مفیدترین اطلاعات را به جویندگان این علم انتقال دهد.
از همین رو میتوان فهمید که از علم داده میتوان در زمینههای بسیاری استفاده کرد. کاربردهای دیتاساینس آنقدر وسیع است که گاهی صاحبان کسبوکارها هم از اثرگذاری و سودآوری آن در کسبوکارشان باخبر نیستند. با این وجود، کاربرد علم داده در شاخههای زیر کاملا احساس میشود:
بسیاری از صاحبان و مالکان کسبوکار هیچ سررشتهای در علم داده ندارند. از این رو یکی از وظایف متخصص علم داده ارائه راهحلهای واضح و قانع کردن آنان برای استفاده از کابردهای دیتاساینس است. در شاخه فروش علم داده میتواند به تحلیل احساس مشتری، کنترل بهینه موجودی یا انبار، بهینهسازی قیمت و غیره کمک کند.
بسیاری از هزینههای کسبوکارها به علت انتخاب اشتباه مکان کسبوکار است. دیتاساینس با مطالعه دادههای مشتریان، اطلاعات سرشماری، ساعات حضور افراد، شغل آنها و غیره مشخص میکند که کدام منطقه میتواند سود بیشتری برای کسبوکار مورد نظر به ارمغان بیاورد.
از کاربردهای دیتاساینس در بخش رسانه میتوان به نگهداری مشتری، تبلیغات هدفمند و مخاطبمحور، تحلیل محتوای مورد استفاده در رسانه، تحلیل در لحظه یا یادگیری جریانی و غیره اشاره کرد.
از علم داده حتی میتوان در مسائل نظامی هم استفاده کرد. بهینه کردن محل برخورد موشک و تشخیص حملات سایبری مهمترین کاربرد علم داده در شاخه نظامی است.
علم داده نه تنها در موارد بالا بلکه در تولید محتوا، بررسی وقایع اجتماعی، راهاندازی کمپین انتخاباتی و تبلیغاتی، قانونگذاری خرد و کلان و همچنین پیشبینی تاثیر قوانین وضعشده در حوزههای مالی، اجتماعی و غیره کاربرد دارد. با شرکت در دوره آموزشی علم داده میتوانید در هرکدام از شاخههای مورد علاقه خود فعالیت کنید.
یکی از زبانهای برنامه نویسی مناسب برای مدیریت دادهها در علم داده زبان پایتون است. با استفاده از برنامهنویسی پایتون میتوان به راحتی و بدون صرف زمان زی،اد کدهای دستوری مفید را اجرا و اهداف دلخواه را دنبال کرد.
اگر قصد یادگیری علم داده با نرمافزار پایتون را دارید، باید بدانید که بسیاری از کشورهای پیشرفته مثل کانادا، استرالیا، آمریکا و برخی از کشورهای اروپایی، افراد توانمند در این زمینه را جذب میکنند. در صورتی که مهارتهای لازم را داشته باشید، میتوانید مهاجرتی آسان و هدفمند را تجربه کنید.
متخصصین داده یا دانشمندان داده در چنین کشورهای پیشرفتهای، ارزش شغلی بالایی داشته و افراد توانمند قطعا آینده موفقی خواهند شد. حتی در کشور خودمان هم آینده شغلی متخصصین علم داده بسیار پر رونق است. با کمک دوره علم داده میتوانید مهارتهای خود را ارتقا دهید.
دادهها در همه جا و به صورت گسترده موجودند. اصطلاحات متنوعی در ارتباط با استخراج، تمیز کردن، تجزیه و تحلیل و تفسیر دادهها وجود دارد که اغلب به جای هم استفاده میشوند. اما هرکدام از آنها مجموعهای مهارتهای مختلف را شامل میشوند. استخدام متخصص علم داده در یکی از سه حالت زیر انجام میشود:
دیتا ساینتیستها بررسی میکنند که چه سوالاتی نیاز به پاسخ دارند و از کجا میتوان دادههای مربوط به آنها را پیدا کرد. آنها هوش تجاری دارند و از مهارتهای تجزیه و تحلیل مانند توانایی استخراج، پاکسازی و ارائه اطلاعات برخوردارند. کسبوکارها از دانشمندان داده برای تهیه، مدیریت و تجزیه و تحلیل حجم زیادی از دادههای ساختارنیافته استفاده میکنند. سپس نتایج را جهت انجام تصمیمگیریهای استراتژیک در سازمان به ذینفعان ارسال میکنند.
مهارتهای مورد نیاز در این حوزه عبارتند از: مهارتهای برنامهنویسی شامل پایتون، R و SAS، مهارتهای آماری و ریاضی، داستانسرایی و تجسم دادهها، Hadoop، SQL و یادگیری ماشین.
تحلیلگران داده شکاف بین دانشمندان داده و تحلیلگران کسبوکار را پر میکنند. به تحلیلگران داده سوالاتی داده میشود که باید جواب آنها را از سوی یک سازمان پیدا کرده و تجزیه و تحلیل کنند. سپس نتایج را بیابند که با استراتژیها سطح بالای کسبوکار همسو باشد. تحلیلگران داده مسئولیت ترجمه تجزیه و تحلیل فنی به موارد اقدام کیفی و انتقال موثر یافتههای خود به ذینفعان را برعهده دارند.
مهارتهای مورد نیاز برای تحلیلگران داده عبارتند از: مهارتهای برنامهنویسی شامل پایتون، R و SAS، مهارتهای آماری و ریاضی و تجسم دادهها.
مهندسهای داده مقادیر نمایی دادههایی که به سرعت در حال تغییر هستند را مدیریت میکنند. آنها بر توسعه، استقرار، مدیریت و بهینهسازی پایپلاینها و زیرساختهای داده به منظور تبدیل و انتقال دادهها به دانشمندان داده برای پرسوجو تمرکز دارند.
مهارتهای مورد نیاز برای مهندسهای داده عبارتند از: زبانهای برنامهنویسی جاوا و Scala، پایگاههای داده (NoSQL MonogoDB CassandraDB)، فریمورکها (Apache Hadoop).
با فراگیری آموزش data science میتوانید مهارتهای فنی خود را در هر یک از سه حوزه بالا ارتقا دهید. متخصصان علوم داده که از مهارت بالایی برخوردار باشند در شرکتهای بزرگ و کوچک در سراسر جهان مخصوصا کشورهای پیشرفته میتوانند فرصتهای شغلی مناسب با حقوق رقابتی از آن خود کنند.
Glassdoor سه سال متوالی (2016، 2017، 2018) دانشمند داده را به عنوان برترین شغل در آمریکا (the #1 Best Job in America) اعلام کرد. نیاز شرکتهای بزرگ و کوچک به دانشمندان داده همینطور در حال افزایش است و روند صعودی دارد. به عنوان مثال در سال 2020 نیاز به این شغل 28 درصد افزایش داشته است.
میانگین حقوق پایه برای هر موقعیت در زیر آورده شده است:
علم داده و شغلهای مرتبط با آن به شدت در حال رشد است و روز به روز بر نیاز شرکتها و سازمانها برای علم داده افزوده میشود. از این رو یکی از آیندهدارترین شغلهای جهان را میتوان متخصص علم داده دانست. اگر به این زمینه علاقهمندید، دوره علم داده مکتب خونه را از دست ندهید.