91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 155KB
    文件類型: .rar
    金幣: 2
    下載: 0 次
    發布日期: 2021-06-07
  • 語言: Java
  • 標簽: java??查重??gui??

資源簡介

電子文檔doc查重,可一次導入n份。采用余弦算法查重,可自定義重復率生成結果。重復結果excle導出。采用java,gui形式。

資源截圖

代碼片段和文件信息

package?chaCongSystem;
import?java.io.UnsupportedEncodingException;
import?java.util.HashMap;
import?java.util.Iterator;
import?java.util.Map;
public?class?CosineSimilarAlgorithm?{
????public?static?double?getSimilarity(String?doc1?String?doc2)?{
????????if?(doc1?!=?null?&&?doc1.trim().length()?>?0?&&?doc2?!=?null
????????????????&&?doc2.trim().length()?>?0)?{
????????????Map?AlgorithmMap?=?new?HashMap();
????????????//將兩個字符串中的中文字符以及出現的總數封裝到,AlgorithmMap中
????????????for?(int?i?=?0;?i?????????????????char?d1?=?doc1.charAt(i);
????????????????if(isHanZi(d1)){
????????????????????int?charIndex?=?getGB2312Id(d1);
????????????????????if(charIndex?!=?-1){
????????????????????????int[]?fq?=?AlgorithmMap.get(charIndex);
????????????????????????if(fq?!=?null?&&?fq.length?==?2){
????????????????????????????fq[0]++;
????????????????????????}else?{
????????????????????????????fq?=?new?int[2];
????????????????????????????fq[0]?=?1;
????????????????????????????fq[1]?=?0;
????????????????????????????AlgorithmMap.put(charIndex?fq);
????????????????????????}
????????????????????}
????????????????}
????????????}
????????????for?(int?i?=?0;?i?????????????????char?d2?=?doc2.charAt(i);
????????????????if(isHanZi(d2)){
????????????????????int?charIndex?=?getGB2312Id(d2);
????????????????????if(charIndex?!=?-1){
????????????????????????int[]?fq?=?AlgorithmMap.get(charIndex);
????????????????????????if(fq?!=?null?&&?fq.length?==?2){
????????????????????????????fq[1]++;
????????????????????????}else?{
????????????????????????????fq?=?new?int[2];
????????????????????????????fq[0]?=?0;
????????????????????????????fq[1]?=?1;
????????????????????????????AlgorithmMap.put(charIndex?fq);
????????????????????????}
????????????????????}
????????????????}
????????????}
????????????Iterator?iterator?=?AlgorithmMap.keySet().iterator();
????????????double?sqdoc1?=?0;
????????????double?sqdoc2?=?0;
????????????double?denominator?=?0;
????????????while(iterator.hasNext()){
????????????????int[]?c?=?AlgorithmMap.get(iterator.next());
????????????????denominator?+=?c[0]*c[1];
????????????????sqdoc1?+=?c[0]*c[0];
????????????????sqdoc2?+=?c[1]*c[1];
????????????}
????????????return?denominator?/?Math.sqrt(sqdoc1*sqdoc2);
????????}?else?{
????????????throw?new?NullPointerException(
????????????????????“?the?Document?is?null?or?have?not?cahrs!!“);
????????}
????}
????public?static?boolean?isHanZi(char?ch)?{
????????//?判斷是否漢字
????????return?(ch?>=?0x4E00?&&?ch?<=?0x9FA5);
????}
????/**
?????*?根據輸入的Unicode字符,獲取它的GB2312編碼或者ascii編碼,
?????*
?????*?@param?ch
?????*????????????輸入的GB2312中文字符或者ASCII字符(128個)
?????*?@return?ch在GB2312中的位置,-1表示該字符不認識
?????*/
????public?static?short?getGB2312Id(char?ch)?{
????????try?{
????????????byte[]?buffer?=?Character.toString(ch).getBytes(“GB2312“);
????????????if?(buffer.length?!=?2)?{
????????????

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----

?????文件????????772??2017-06-05?19:16??chaCongSystem\.classpath

?????文件????????389??2017-06-02?20:37??chaCongSystem\.project

?????文件??????26155??2017-06-02?20:36??chaCongSystem\.settings\org.eclipse.jdt.core.prefs

?????文件???????2794??2017-06-02?20:36??chaCongSystem\.settings\org.eclipse.jdt.ui.prefs

?????文件???????2905??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\CosineSimilarAlgorithm.class

?????文件????????493??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\Main.class

?????文件???????1233??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\ProgressMonitorExample$Update.class

?????文件???????1359??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\ProgressMonitorExample.class

?????文件???????3795??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\WenDangAction.class

?????文件???????4986??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\WenDangChaCong.class

?????文件???????1057??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\Window$1.class

?????文件???????3478??2017-06-05?19:16??chaCongSystem\bin\chaCongSystem\Window.class

????.......??????2905??2017-04-23?13:57??chaCongSystem\CosineSimilarAlgorithm.class

????.......???????493??2017-04-23?13:57??chaCongSystem\Main.class

????.......??????1233??2017-04-28?22:20??chaCongSystem\ProgressMonitorExample$Update.class

????.......??????1359??2017-04-28?22:20??chaCongSystem\ProgressMonitorExample.class

?????文件???????3598??2017-05-05?19:18??chaCongSystem\src\chaCongSystem\CosineSimilarAlgorithm.java

?????文件????????177??2017-04-09?19:04??chaCongSystem\src\chaCongSystem\Main.java

?????文件???????1036??2017-05-05?19:18??chaCongSystem\src\chaCongSystem\ProgressMonitorExample.java

?????文件???????3399??2017-05-23?14:55??chaCongSystem\src\chaCongSystem\WenDangAction.java

?????文件???????5072??2017-06-03?16:17??chaCongSystem\src\chaCongSystem\WenDangChaCong.java

?????文件???????4423??2017-05-23?10:44??chaCongSystem\src\chaCongSystem\Window.java

????.......??????3745??2017-04-29?11:19??chaCongSystem\WenDangAction.class

????.......??????4491??2017-04-29?11:15??chaCongSystem\WenDangChaCong.class

????.......??????1056??2017-04-29?11:43??chaCongSystem\Window$1.class

????.......??????2889??2017-04-29?11:43??chaCongSystem\Window.class

?????文件??????35840??2017-05-27?12:29??測試數據\100000000000?李四?實驗1.doc

?????文件??????29696??2017-05-06?17:37??測試數據\120000000999?王五放?實驗1.doc

?????文件??????30720??2017-05-06?17:36??測試數據\130000022200?張三?實驗2.doc

?????文件??????32768??2017-04-23?10:50??測試數據\140000222000?小紅?實驗4.doc

............此處省略20個文件信息

評論

共有 條評論