-
大小: 4KB文件類型: .py金幣: 1下載: 0 次發(fā)布日期: 2021-01-03
- 語言: Python
- 標(biāo)簽:
資源簡介
最新的詞語相似度計(jì)算方法;基于詞林和知網(wǎng)的詞語相似度計(jì)算;版權(quán)歸原作者所有,僅供學(xué)習(xí)交流使用;
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
‘‘‘
@author:?yaleimeng@sina.com
@license:?(C)?Copyright?2017
@desc:?混合采用詞林和知網(wǎng)的相似度計(jì)算方法。得到更加符合人們感覺的相似度數(shù)值。
@DateTime:?Created?on?2018/1/25?at?上午?08:59?by?PyCharm?‘‘‘
from?hownet.howNet?import?How_Similarity
from?cilin.ciLin?import?CilinSimilarity
class?HybridSim():
????‘‘‘
????混合相似度計(jì)算策略。使用了詞林與知網(wǎng)詞匯量的并集。擴(kuò)大了詞匯覆蓋范圍。
????‘‘‘
????ci_lin?=?CilinSimilarity()??#?實(shí)例化詞林相似度計(jì)算對象
????how_net?=?How_Similarity()??#?實(shí)例化知網(wǎng)相似度計(jì)算對象
????Common?=?ci_lin.vocab?&?how_net.vocab
????A?=?how_net.vocab?-?ci_lin.vocab
????B?=?ci_lin.vocab?-?how_net.vocab
????@classmethod
????def?get_Final_sim(cls?w1?w2):
????????lin?=?cls.ci_lin.sim2016(w1?w2)?if?w1?in?cls.ci_lin.vocab?and?w2?in?cls.ci_lin.vocab?else?0
????????how?=?cls.how_net.calc(w1?w2)?if?w1?in?cls.how_net.voca
評論
共有 條評論