資源簡介
這個主要是應用在搜索引擎,搜索的時候一般略過停用詞,這個程序實現(xiàn)的就是根據停用詞表濾除文檔中的停用詞
代碼片段和文件信息
#include?
void?main()
{FILE?*fp;
int?ijkn;
char?c[5000][500]a[10000]ch*p1*p2*p;
if((fp=fopen(“C:\\Users\\dd\\Desktop\\安全警示.txt““r“))==NULL)
{printf(“can?not?open?file?安全警示!\n“);
getchar();
}
for(i=0;(ch=fgetc(fp))!=EOF;i++)
a[i]=ch;
fclose(fp);
a[i]=‘\0‘;
if((fp=fopen(“C:\\Users\\dd\\Desktop\\中文停用詞詞表.txt““r“))==NULL)
{printf(“can?not?open?file?中文停用詞詞表!\n“);
getchar();
}
j=0;
k=0;
ch=fgetc(fp);
while(ch!=EOF)
{if(ch!=‘\n‘)
{c[j][k]=ch;
k++;
}
else
{c[j][k]=‘\0‘;
j++;
k=0;
}
ch=fgetc(fp);
}
fclose(fp);
n=j;?
for(j=0;j<=n;j++)
{
- 上一篇:使用雙向鏈表實現(xiàn)快速排序,C語言
- 下一篇:Johnson算法
評論
共有 條評論