資源簡(jiǎn)介
中文維基百科語(yǔ)料庫(kù),將其轉(zhuǎn)換為文本文件后,進(jìn)行繁體字轉(zhuǎn)換為簡(jiǎn)體字,字符集轉(zhuǎn)換,分詞,然后訓(xùn)練得到模型以及向量。由于文件上傳的大小限制是60MB,而訓(xùn)練后的所有文件大小有1G以上,所以這里只提供了下載鏈接,地址在網(wǎng)盤中。使用python中的gensim包進(jìn)行訓(xùn)練得到的,運(yùn)行時(shí)間較長(zhǎng),純粹的維基百科中文語(yǔ)料訓(xùn)練后的結(jié)果,拿去可以直接使用。

代碼片段和文件信息
?屬性????????????大小?????日期????時(shí)間???名稱
-----------?---------??----------?-----??----
?????文件??????????52??2017-02-23?10:35??wiki.zh.text.vector_url
-----------?---------??----------?-----??----
?????文件??????????52??2017-02-23?10:35??wiki.zh.text.vector_url
評(píng)論
共有 條評(píng)論