
在線民宿 UGC 數(shù)據(jù)挖掘培訓(xùn)
1 Pandas 數(shù)據(jù)聚合
2 TensorFlow 模型搭建
3 NLP 文本處理
4 Word2Vec 詞向量訓(xùn)練
5 Gensim 下的 LDA 主題自動(dòng)聚類
6 Stacking 集成情感分析
7 深度 GRU 情感分析
8 Flask API 搭建情感分析接口
9 百度 LBS 地理位置信息采集
10 Scikit-learn 模型搭建
11 Pyecharts 可視化
12 KMeans 下的詞向量自動(dòng)聚類
13 LDAvis 主題可視化
14 深度 CNN 情感分析
15 低代碼下的 LitNlp 深度情感分析
16 Python 使用 POST 和 GET 進(jìn)行接口請(qǐng)求
1
快速實(shí)現(xiàn)民宿整體的意見(jiàn)挖掘
1.Pandas數(shù)據(jù)聚合
2.數(shù)據(jù)EDA
3.貝葉斯情感分析建模
4.模型評(píng)測(cè)
5.情感極性可視化
2
利用 pyecharts 進(jìn)行可視化分析
1.數(shù)據(jù)清洗
2.數(shù)據(jù)特征處理
3.數(shù)據(jù)聚合
4.pyecharts可視化
3
民宿地理位置可視化分析
1.Requests接口請(qǐng)求
2.基于百度LBS接口解析地理位置信息
3.地理數(shù)據(jù)聚合
4.pyecharts地理信息可視化
4
基于字典的評(píng)論主題挖掘
1.詞性標(biāo)注
2.主題句切分
3.TFIDF關(guān)鍵詞挖掘
4.主題分布可視化
5
基于詞向量的主題聚類挖掘
1.名詞抽取
2.Word2Vec詞向量訓(xùn)練
3.佳聚類個(gè)數(shù)選取
4.KMeans主題聚類
6
基于 LDA 模型的評(píng)論主題挖掘
1.評(píng)價(jià)數(shù)據(jù)清洗
2.LDA主題建模
3.佳主題數(shù)選取
4.LDAvis主題分布可視化
7
文本自動(dòng)化標(biāo)注和數(shù)據(jù)采樣
1.特征工程
2.數(shù)據(jù)自動(dòng)化標(biāo)注
3.數(shù)據(jù)采樣
4.采樣結(jié)果評(píng)測(cè)
8
集成模型在情感分析中的應(yīng)用
1.特征工程
2.情感建模
3.Stacking集成建模
4.主題情感可視化
9
深度模型在情感分析中的應(yīng)用
1.數(shù)據(jù)預(yù)處理
2.詞級(jí)和字符級(jí)的文本分詞
3.深度情感分類模型
4.深度學(xué)習(xí)模型測(cè)試
10
部署深度情感推理模型
1.litNlp使用
2.FlaskAPI開(kāi)發(fā)
3.模型部署
4.情感極性批量預(yù)測(cè)
基于 Pandas 和 pyecharts 的數(shù)據(jù)聚合和可視化分析。
主題建模實(shí)戰(zhàn),包括:詞頻排序模型下的主題詞云分析、基于 Word2Vec 詞向量下的 KMeans 名詞聚類、LDA 主題建模。
針對(duì)數(shù)據(jù)集標(biāo)簽失衡問(wèn)題,實(shí)驗(yàn)分析了不用數(shù)據(jù)采樣方式對(duì)情感分析模型性能的影響。
介紹了基于 Stacking 的集成模型和深度情感分析模型在用戶評(píng)論情感建模上的性能差異,
然后針對(duì)深度模型分別使用字符級(jí)和詞語(yǔ)級(jí)進(jìn)行建模來(lái)比較差異,深度模型具體有 TextCNN 和 GRU。
主要實(shí)現(xiàn)模型的部署,使用 Flask 框架對(duì) litNlp 深度情感分析模型進(jìn)行 RESTful API 部署,實(shí)現(xiàn)情感極性預(yù)測(cè)通過(guò)網(wǎng)絡(luò)接口進(jìn)行服務(wù)。
