資源簡(jiǎn)介
在使用TF-IDF算法進(jìn)行自然語(yǔ)言處理時(shí),大家在處理文本時(shí)會(huì)首先進(jìn)行切割,生成包含所有詞的詞典,但此時(shí)往往會(huì)有許多重復(fù)的詞,這些詞可能是經(jīng)常使用的詞,比如”的“,這樣的詞語(yǔ)太多會(huì)影響處理效果,因此需要去掉這些停用詞在進(jìn)行處理,在此提供停用詞表!
代碼片段和文件信息
評(píng)論
共有 條評(píng)論