資源簡介
說明:譚松波收集整理了一個較大規(guī)模的酒店評論語料。語料規(guī)模為10000篇。語料從攜程網(wǎng)上自動采集,并經(jīng)過整理而成。為了方便起見,語料被整理成4個子集:
1. ChnSentiCorp-Htl-ba-2000: 平衡語料,正負類各1000篇。
2. ChnSentiCorp-Htl-ba-4000: 平衡語料,正負類各2000篇。
3. ChnSentiCorp-Htl-ba-6000: 平衡語料,正負類各3000篇。
4. ChnSentiCorp-Htl-unba-10000: 非平衡語料,正類為7000篇。
代碼片段和文件信息
評論
共有 條評論