-
大小: 330.33MB文件類型: .csv金幣: 1下載: 0 次發(fā)布日期: 2023-07-20
- 語(yǔ)言: C#
- 標(biāo)簽: NLP??微博??疫情??數(shù)據(jù)集??
資源簡(jiǎn)介
數(shù)據(jù)集為依據(jù)與“新冠肺炎”相關(guān)的230個(gè)主題關(guān)鍵詞進(jìn)行隨機(jī)數(shù)據(jù)采集的2020年1月1日—2020年2月20日期間共計(jì)100萬(wàn)條微博數(shù)據(jù),公開(kāi)數(shù)據(jù)集:
其中每列的含義:
- id: 微博序號(hào),主鍵
- weibo_id: 微博id
- daytime: 微博發(fā)布時(shí)間, 從0000-2359
- name:發(fā)布人賬號(hào)
- content:微博中文內(nèi)容
- day:日期
- month:月份
- sentiments:使用snowNLP分析得出的情感數(shù)值,范圍為-0.5 ~ 0.5,大于0為正面情感,小于0為負(fù)面情感;
- keyword0-4:使用jieba分詞提取的主題關(guān)鍵詞,取前四位;
使用該數(shù)據(jù)集進(jìn)行的可視化分析實(shí)現(xiàn):http://flask.yunwei123.tech/
github地址:https://github.com/yunwei37/COVID-19-NLP-vis
代碼片段和文件信息
評(píng)論
共有 條評(píng)論