資源簡介
1、掌握選擇term的方法;
2、權(quán)重計算(TermWeighting):即計算每篇文 權(quán)重計算(Term Weighting):即計算每篇文 檔中每個term的權(quán)重,計算TF、IDF;
3、查詢和文檔的相似度計算(Siili ? 查詢和文檔的相似度計算(Similarity Computation)。

代碼片段和文件信息
//?stdafx.cpp?:?只包括標(biāo)準(zhǔn)包含文件的源文件
//?VSM.pch?將作為預(yù)編譯頭
//?stdafx.obj?將包含預(yù)編譯類型信息
#include?“stdafx.h“
//?TODO:?在?STDAFX.H?中引用任何所需的附加頭文件,
//而不是在此文件中引用
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件????2883584??2017-05-22?19:44??VSM-YYC\ipch\vsm-ecba59c9\vsm-6b86ff20.ipch
?????文件???????2777??2016-05-14?21:56??VSM-YYC\VSM\Chinese-StopWords.txt
?????文件?????144527??2017-05-09?15:22??VSM-YYC\VSM\input.txt
?????文件???????1414??2017-05-16?15:07??VSM-YYC\VSM\kmeans.txt
?????文件???????1482??2017-05-09?14:43??VSM-YYC\VSM\ReadMe.txt
?????文件????????207??2017-05-09?14:43??VSM-YYC\VSM\stdafx.cpp
?????文件????????234??2017-05-09?14:43??VSM-YYC\VSM\stdafx.h
?????文件????????240??2017-05-09?14:43??VSM-YYC\VSM\targetver.h
?????文件???????5092??2017-05-16?15:06??VSM-YYC\VSM\VSM.cpp
?????文件???????8053??2017-05-16?11:20??VSM-YYC\VSM\VSM.vcxproj
?????文件???????1310??2017-05-09?14:43??VSM-YYC\VSM\VSM.vcxproj.filters
?????文件?????343024??2017-05-16?15:07??VSM-YYC\VSM\所有文本之間的相似度.txt
?????文件????????504??2017-05-16?15:07??VSM-YYC\VSM\相似度大于定值的文本.txt
?????文件????8519680??2017-05-22?19:44??VSM-YYC\VSM.sdf
?????文件???????1291??2017-05-09?14:43??VSM-YYC\VSM.sln
????..A..H.?????13824??2017-05-22?19:44??VSM-YYC\VSM.v12.suo
?????目錄??????????0??2017-05-22?19:44??VSM-YYC\ipch\vsm-ecba59c9
?????目錄??????????0??2017-05-22?19:44??VSM-YYC\ipch
?????目錄??????????0??2017-05-18?21:15??VSM-YYC\VSM
?????目錄??????????0??2017-05-22?19:44??VSM-YYC
-----------?---------??----------?-----??----
?????????????11927243????????????????????20
評論
共有 條評論