آموزش پردازش زبان طبیعی با پایتون
ما در این دوره به آموزش عملی و تئوری NLP میپردازیم. این دوره با مفاهیم پایه پردازش زبان طبیعی شروع میشود، سپس به پیشپردازش متن به کمک کتابخانه هایی نظیر NLTK ، SpaCy و Hazm میپردازد. در ادامه استفاده از الگوریتمهای یادگیری ماشین برای Text Classification در مدل های Spam Detection و Sentiment Analysis مورد بررسی قرار ميگیرد و در قسمت آخر با توضیح و ایجاد مدل های Topic Modeling به پایان میرسد.
پیشفرض این دوره این است که مخاطب هیچ اطلاعاتی در مورد پردازش زبان طبیعی ندارد، بنابراین تمام مباحث لازم مربوط به پردازش زبان طبیعی مرتبط با یادگیری ماشین از ابتدا و به صورت کامل پوشش داده شود.
پردازش زبان طبیعی چیست ؟
پردازش زبان طبیعی (Natural Language Processing) یک شاخه از هوش مصنوعی است که به رایانهها کمک میکند تا زبان انسان را درک و پردازش کنند. این امر به رایانهها امکان میدهد تا با انسانها به طور طبیعی ارتباط برقرار کنند و وظایفی مانند ترجمه، خلاصهنویسی، تشخیص گفتار، و پاسخ به سوالات را که به درک زبان نیاز دارند،انجام دهند.
این دوره مناسب چه کسانی است؟
اگر تمایل دارید وارد حوزه پردازش زبان طبیعی شوید، فرآیندها و کدنویسی آن را فرا بگیرید و بتوانید مدل هایی ایجاد کنید که بتواند تسک های یادگیری ماشین را بر روی متن انجام دهد، این دوره مخصوص شماست!
سرفصل های این دوره :
۱- مبانی پردازش زبان طبیعی:
آشنایی با تعاریف و مفاهیم اولیه همچنین مفاهیم بنیادی NLP مانند Tokenization stemming، lemmatization، stop words
۲ - بررسی کتابخانه های پردازش متن :
استفاده از کتابخانه NLTK ، کتابخانه پیشرفته Spacy و همچنین Hazm برای , Tokenization و lemmatization
برچسبگذاری Part-of-Speech برای تشخیص نقش کلمات را در متن مانند اسم، فعل و صفت
برچسب گذاری Named-Entity برای شناسایی مفاهیمی مانند پول، زمان، شرکتها ،مکان ها و موارد دیگر رسم نمودار های روابط زبانی در با استفاده از کتابخانه SpaCy
۳ - ساخت مدل یادگیری ماشین با Scikit-Learn برای انجام طبقهبندی متن
ساخت خودکار سیستمهای یادگیری ماشینی که میتوانند متن های مثبت و منفی نظرات یا ایمیلهای هرزنامه را تشخیص دهد
۴ - Topic Modelingروشهای یادگیری بدون ناظر پیچیدهتر برای پردازش زبان طبیعی، مانند LDA و NMF، که در آن مدلهای یادگیری ماشین ما موضوعات و مفاهیم اصلی را از فایلهای متنی خام تشخیص میدهند.