- ベンチャ`悶Y垢型4
- C亠僥とディ`プラ`ニングによる徭隼冱ZI尖システム
- テキストマイニング、TFIDF、NLTK、C亠僥、ディ`プラ`ニングの光返隈、Word Embeddingの返隈などを僥ぶ。その瘁、この峰を旋喘して、猟蛍(ウェブ猟、Twitterなどソ`シャルメディアのデ`タ)システムのBと來嬬個措のプロジェクトをg仏する。シラバス
2021定5埖
5埖10晩
娩I坪否TFIDFを喘いて猟嫗蛍に駅勣な蒙翮燭鬩@誼する。Cosine貌業により猟嫗揖平の貌業を麻する。Web貧のテキストをЪし、TFIDFを喘いて貌業麻をする。
5埖17晩
娩I坪否彩纈Y垢型では噸粁の娩Iでは悶Yできないような坪否なので麿の娩Iに曳べて中易いです。まだ娩IはC亠僥やディ`プラ`ニングの乾り殻業ですが、これから僥ぶことはSしみです。
5埖24晩
娩I坪否gHにwebスクレイピングして、それらのテキストを嘖~?侘否~?兆~に蛍け、それぞれの猟のコサインシミラリティを箔めたりしました。それによって、それらの猟のベクトル圭鬚霊貌來が岑れたりして、とても中易いです。
2021定6埖
6埖14晩
試咤砂颪泙廃Г鵑世海箸鯤垢い弔帖徭蛍で深えながらプログラムのg廾を佩なっています。g廾を宥して、Web スクレイピング、テキストI尖、C亠僥についての尖盾を侮めることができます。
6埖21晩
湖襭宰修蓮▲妊`プラ`ニングにd龍があり、書指の娩Iに歌紗しました。暴は書瘁冩梢として、ディ`プラ`ニングを聞っていきたいと深えているので、それに鬚韻討了A議な尖式びg廾圭隈を尖盾することができました。
6埖28晩
湖襭宰修徭隼冱ZI尖やC亠僥にd龍を隔っていたので、この娩Iに歌紗しました。娩I坪では易枠伏によるvxをくだけではなく、gHに返を咾し處するので、僥んだことが附につきやすいと湖じました。また、プログラミング冱Zを Java または Python からxべるので、徭蛍のよりTれた圭を聞って、處をスム `ズにMめることが竃栖ました。
2021定10埖
10埖4晩
娩I坪否Course introduction : Introduction to data mining and text mining.
2021定11埖
11埖1晩
娩I坪否Fundamentals of text mining 1 and introduction to the Term frequency-inverse document frequency (TF-IDF). This meant to provide the student the ability to understand the basics of documents representation with vectors.
11埖8晩
娩I坪否Fundamentals of text mining 2 and introduction to cosine similarity. Class activity on contents of TFIDF. This aims to introduce a use of document vectorization step.
11埖15晩
娩I坪否Class activity: Calculation of TFIDF and cosine similarity. This exercise involves text retrieval, mining, and processing before applying any calculation algorithms.
11埖22晩
娩I坪否Tagging of natural language sentences using natural language toolkit NLTK. This library has comprehensive tools for text mining and provides high end skills to be used in the future.
11埖25晩
娩I坪否Stanford natural language library POS tagging in Java.This exercise provides experience on natural language processing using libraries in Java
11埖29晩
娩I坪否SVM example from Sklearn library
Document classification using SVM and SVM light. This neural network model is a good introduction for students who want to apply machine learning on an NLP task such as classification.
2021定12埖
12埖6晩
娩I坪否Evaluation and classification: This session aims to give to the student an intuitive understanding of how machine learning models performance is evaluated through a basic example of calculating Precision and Recall metrics
12埖13晩
娩I坪否Start of the First Term project
12埖20晩
娩I坪否Continue with the term project II: TFIDF calculation with filtering by Stanford NLP library in Java
2022定1埖
1埖4晩
娩I坪否Third Term project:Data crowling and processing,Word embedding using TFIDF
1埖17晩
娩I坪否Fourth Term Project:Document classification using SVM algorithm
1埖24晩
娩I坪否5th Term project:Data augmention to improve the classification model accuracy
1埖31晩
娩I坪否Final Evaluation:Filtering entities like nouns, adjectives and apply TFIDF