91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 15KB
    文件類型: .py
    金幣: 1
    下載: 0 次
    發(fā)布日期: 2021-01-06
  • 語言: Python
  • 標簽: chi??ig??mi??python??

資源簡介

使用python,計算兩類文檔的chi、ig、mi值。其中文檔類型比例為1:1,可以自己調(diào)整。

資源截圖

代碼片段和文件信息

import?numpy?as?np
import?jieba
import?csv
import?os
import?sys
import?re

#用于獲得年報的內(nèi)容和分類。其中wordlist為[[年報一分詞][年報二分詞]...],classlist為[[年報一類別][年報二類別]...]
def?get_content_annual_1_1():
????wordList=[]
????classList=[]
????with?open(“ST信息預處理.csv“encoding=‘utf-8-sig‘)?as?csvfile:
????????readCSV?=?csv.reader(csvfile)
????????for?row?in?readCSV:
????????????stName=row[0][:-3]+‘-‘+row[1]
????????????nomalName_1?=?‘‘
????????????ifExist?=?True
????????????i=2
????????????while?ifExist:
????????????????if?os.path.exists(‘F:/作業(yè)/srp/chenyiyun/詞語分析/年報/‘
??????????????????????????????????+row[i][:-3]+‘-‘+row[1]+‘.txt‘):
????????????????????nomalName_1=row[i][:-3]+‘-‘+row[1]
????????????????????ifExist?=?False
????????????????else:
????????????????????print(row[0])
????????????

評論

共有 條評論