資源簡介
1、資源中有語料,本語料庫由復(fù)旦大學(xué)李榮陸提供。test_corpus為測試語料,共9833篇文檔;train_corpus為訓(xùn)練語料,共9804篇文檔,兩個預(yù)料各分為20個相同類別。訓(xùn)練語料和測試語料基本按照1:1的比例來劃分。使用時盡量注明來源(復(fù)旦大學(xué)計算機信息與技術(shù)系國際數(shù)據(jù)庫中心自然語言處理小組)。
2、資源中還附有一份停用詞。
2、資源中還附有一份停用詞。
代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件??106752845??2019-11-29?20:44??語料(附停用詞)\data.rar
?????文件??????21539??2019-11-29?16:02??語料(附停用詞)\stopword.txt
?????目錄??????????0??2019-12-01?21:36??語料(附停用詞)
-----------?---------??----------?-----??----
????????????106774384????????????????????3
-----------?---------??----------?-----??----
?????文件??106752845??2019-11-29?20:44??語料(附停用詞)\data.rar
?????文件??????21539??2019-11-29?16:02??語料(附停用詞)\stopword.txt
?????目錄??????????0??2019-12-01?21:36??語料(附停用詞)
-----------?---------??----------?-----??----
????????????106774384????????????????????3
評論
共有 條評論