資源簡介
樸素貝葉斯文本分類的Python實現代碼
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
from?numpy?import?*
from?os?import?listdirmkdirpath
import?re
from?nltk.corpus?import?stopwords
import?nltk
import?operator
##############################################################
##?1.?創建新文件夾,存放預處理后的文本數據
##############################################################
def?createFiles():
????srcFilesList?=?listdir(‘originSample‘)
????for?i?in?range(len(srcFilesList)):
????????if?i==0:?continue
????????dataFilesDir?=?‘originSample/‘?+?srcFilesList[i]?#?20個文件夾每個的路徑
????????dataFilesList?=?listdir(dataFilesDir)
????????targetDir?=?‘processedSample_includeNotSpecial/‘?+?srcFilesList[i]?#?20個新文件夾每個的路徑
????????if?path.exists(targetDir)==False:
????????????mkdir(targetDir)
????????else:
????????????print?‘%s?exists‘?%?targetDir
????????for?j?in?
評論
共有 條評論