資源簡介
本報告包括詳盡完整的文本分類處理過程,包括語料庫的處理、jieba分詞、停用詞無關詞處理、詞袋模型的構建(CHI值檢驗用于特征篩選、tfidf作為特征向量值)。并用自編樸素貝葉斯以及sklearn包中的SVM進行了文本效果的檢測,通過混淆矩陣和roc曲線展現了實現效果。實驗報告寫的很詳細,不懂的地方可以看報告以及看博客中的部分細節講解。
代碼片段和文件信息
- 上一篇:S-57電子海圖文件
- 下一篇:電機統一理論英 阿德金斯PDF
評論
共有 條評論