91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡介

在最新版的中科分詞系統(tǒng)基礎(chǔ)上,進行了改進,加入用戶詞典和停用詞,并進行文件無亂碼讀寫,輸出分詞結(jié)果,效果不錯,是情感分析的良好基礎(chǔ)。這一部分,我用來寫作為碩士論文的數(shù)據(jù)處理基礎(chǔ)。在此分享給各位,歡迎指教

資源截圖

代碼片段和文件信息

package?com.lingjoin.nlpir.test;

import?java.io.*;
import?java.util.ArrayList;
import?java.util.List;
import?com.lingjoin.nlpir.NLPIR;

public?class?NLPIRTest?{

????private?List?files?=?new?ArrayList<>();?//創(chuàng)建數(shù)組files

????//getAllFiles函數(shù)來獲得文件的絕對路徑
????private?void?getAllFiles(File?filePath)?{
????????File[]?fsFiles?=?filePath.listFiles();//獲得filepath的絕對路徑
????????assert?fsFiles?!=?null;
????????for?(File?f?:?fsFiles)?{
????????????if?(f.isFile()?&&?!f.getName().equals(“.DS_Store“))?files.add(f.getPath());//獲得文件的路徑
????????????if?(f.isDirectory())?this.getAllFiles(f);//遞歸調(diào)用,將文件的絕對路徑存入數(shù)組files中
????????}
????}

????// private?String?getContent(File?file)throws?Exception{
// RandomAccessFile?f=new?RandomAccessFile(file?“r“);
// byte[]?b=new?byte[(int)?file.length()];
// f.read(b);
// f.close();
// //String?c=new?String(b“GBK“).replaceAll(“\\s“?““);
// return?(new?String(b+“\n“));
// }
????private?List?segLines(File?file)?throws?Exception?{
????????BufferedReader?bf?=?new?BufferedReader(new?InputStreamReader(new?FileInputStream(file)?“GBK“));
????????List?temp?=?new?ArrayList<>();
????????String?str;
????????while?((str?=?bf.readLine())?!=?null)?{
????????????//String?str2?=?str?+?“\r\n“;
????????????temp.add(str);
????????}
????????bf.close();
????????return?temp;
????}
????private?void?excludeStopWord(File?file)?throws?Exception?{
????????BufferedWriter?bw?=?new?BufferedWriter(new?FileWriter(“excludeStopWord.txt“));
????????//BufferedWriter?bw?=?new?BufferedWriter(new?OutputStreamWriter(new?FileOutputStream(“excludeSto

評論

共有 條評論