資源簡介
這個鏈接是訓練集,測試集請見我的資源
本語料庫由復旦大學李榮陸提供。test_corpus.rar為測試語料,共9833篇文檔;train_corpus.rar為訓練語料,共9804篇文檔,兩個預料各分為20個相同類別。訓練語料和測試語料基本按照1:1的比例來劃分。使用時盡量注明來源(復旦大學計算機信息與技術系國際數據庫中心自然語言處理小組)。文件較大(訓練測試各50多兆),下載時請耐心等待。
代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???52827271??2013-05-15?21:07??617249.rar
?????文件????????531??2011-09-01?09:08??README-datatang.txt
?????文件????????132??2013-05-23?17:27??url.txt
-----------?---------??----------?-----??----
?????????????52827934????????????????????3
-----------?---------??----------?-----??----
?????文件???52827271??2013-05-15?21:07??617249.rar
?????文件????????531??2011-09-01?09:08??README-datatang.txt
?????文件????????132??2013-05-23?17:27??url.txt
-----------?---------??----------?-----??----
?????????????52827934????????????????????3
評論
共有 條評論