資源簡介
為了彌補國內在中文情感挖掘方面的語料的匱乏,譚松波收集整理了一個較大規模的酒店評論語料。語料規模為10000篇。語料從攜程網上自動采集,并經過整理而成。為了方便起見,語料被整理成4個子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡語料,正負類各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡語料,正負類各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡語料,正負類各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡語料,正類為7000篇。

代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件????????132??2011-10-28?09:33??url.txt
?????文件????3995323??2011-10-28?09:21??中文情感挖掘酒店評論語料.rar
?????文件????????531??2011-09-01?09:08??README-datatang.txt
-----------?---------??----------?-----??----
??????????????3995986????????????????????3
-----------?---------??----------?-----??----
?????文件????????132??2011-10-28?09:33??url.txt
?????文件????3995323??2011-10-28?09:21??中文情感挖掘酒店評論語料.rar
?????文件????????531??2011-09-01?09:08??README-datatang.txt
-----------?---------??----------?-----??----
??????????????3995986????????????????????3
評論
共有 條評論