91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡介

本程序是北京師范大學學生根據一個中文字庫對所給的文章進行分詞。有詳細說明文檔和exe文件,采用C語言編寫,具體在文檔中完全說明。采用的算法是正向最大匹配算法和反向最大匹配算法。主要實現屏幕分詞和文件分詞兩項功能。因為對畢業設計有所幫助,所以我要分高一點哈~勿怪偶~

資源截圖

代碼片段和文件信息


/*-----------------------------中文分詞程序------------------------------
------------------------計算機系03級?03281047?劉川----------------------*/

//?stdafx.cpp?:?source?file?that?includes?just?the?standard?includes
// wordppl.pch?will?be?the?pre-compiled?header
// stdafx.obj?will?contain?the?pre-compiled?type?information

#include?“stdafx.h“
#include?

//?TODO:?reference?any?additional?headers?you?need?in?STDAFX.H
//?and?not?in?this?file

extern?char?tt[][40];

char *?source*?result; //文件暫存數組
int sum; //字典長度
FILE *fp1*fp2; //定義兩個文件指針
long filelen; //輸入文件的長度
char scrbuf[MD]; //屏幕文件緩沖區
char scrres[SD]; //屏幕文件結果區

/*------------------------------------分詞實現部分-----------------------------------------*/
//比較函數
int?compare(const?void*?aconst?void*?b){
return?strcmp((char*)a(char*)b);
}

//折半查找算法
int?binsearch(int?Lenchar?*aidkey)
{ int?lowhighmid;
low=0;high=Len-1;
while(low<=high)
{
mid=(low+high)/2;
if(strcmp(aidkeytt[mid])==0)
return?mid; //查找成功
else?if(strcmp(tt[mid]aidkey)>0)
high=mid-1; //修改查找區間上界
else
low=mid+1; //修改查找區間下界
}
return?-1; //查找失敗
}

//初始化函數
int?initialize()
{

sum=53335;
qsort(ttsum40*sizeof(char)compare); //對字典進行排序
return?1;
}

//屏幕分詞函數,采用正向最大匹配算法
void?scrposcutword()
{
int?ijk; //普通變量
int?end; //為1標示已經掃描完待分析文件,反之為0
int?mask=0; //遇到不能識別字符則標記為1,否則為0
int?bpsbrp; //bp為字符串已識別指針,sb為臨時用指針sp為結果數組指針
char?ch[2]buffer[37];

filelen=strlen(scrbuf);
strcpy(scrres““);
//分詞主程序部分,采用正向最大匹配算法
bp=0;rp=0;
while(1)
{ buffer[0]=0;
sb=bp;
for(i=0;i<36;i++) //從源數組中讀入36個字符
{
if(sb==filelen&&i==0)?{?end=1;?break;?} //讀到的第一個字符為文件尾,于是退出
if(sb==filelen) //遇到文件尾,跳出循環
break;
ch[1]=0;
ch[0]=scrbuf[sb];
strcat(bufferch);
sb++;
}
if(end==1)break;


for(i=i-1;i>=0;i--)
{
k=strlen(buffer);
j=-1;
if( strcmp(buffer“0“)==0||strcmp(buffer“1“)==0||strcmp(buffer“2“)==0||strcmp(buffer“3“)==0||strcmp(buffer“4“)==0||
strcmp(buffer“5“)==0||strcmp(buffer“6“)==0||strcmp(buffer“8“)==0||strcmp(buffer“7“)==0||strcmp(buffer“9“)==0)
goto?A;
j=binsearch(sumbuffer);
if(j!=-1) //如果查找到,則輸出查找到的內容,并將bp指針往前移相應位置
{ if(mask==1)?{?mask=0;?scrres[rp]=‘|‘;?rp++;?scrres[rp]=0;?}
strcat(scrresbuffer);?rp+=k;
scrres[rp]=‘|‘;?rp++;?scrres[rp]=0;
bp=bp+k;
break;
}
else //如果查不到
{
A: if(i==1) //若還剩2個字節,則判斷第一個字節,若大于0,說明不是漢字,輸出一個字節
{ buffer[2]=0; //若小于0,說明該漢字不在此庫中,輸出該字。并將bp指針往前移相應位置
if(buffer[0]<0)
{?strcat(scrresbuffer);?rp+=2;?scrres[rp]=0;?bp=bp+2;?mask=1;?break;}
else
{ buffer[1]=0;
strcat(scrresbuffer);?rp+=1;?scrres[rp]=0;?bp=bp+1;?mask=1;?break;?
}?
}
if(i==0) //若還剩1個字節,說明肯定是不能識別字符,則直接輸出這個字節,并將bp指針往前移1個字節
{ buffer[1]=0;?
strcat(scrresbuffer);?rp++;?scrres[rp]=0;?bp=bp+1;?mask=1;?break;?
}
buffer[i]=0; //將buffer最后一位去掉,再進

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----

?????文件???????2075??2005-11-26?22:59??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\ReadMe.txt

?????文件???????1925??2005-11-30?15:57??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\resource.h

?????文件????????318??2005-11-28?15:58??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\small.ico

?????文件??????11167??2005-12-06?13:55??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\StdAfx.cpp

?????文件???????1185??2005-11-30?19:45??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\StdAfx.h

?????文件?????520061??2005-11-30?15:13??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordlist.cpp

?????文件???????8324??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.aps

?????文件??????14031??2005-11-30?19:51??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.cpp

?????文件???????4513??2005-11-29?11:13??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.dsp

?????文件????????537??2005-11-26?22:59??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.dsw

?????文件???????1078??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.ICO

?????文件??????99328??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.ncb

?????文件??????54784??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.opt

?????文件???????1981??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.plg

?????文件???????5468??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl\wordppl.rc

?????文件????3076205??2005-12-08?18:50??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl.exe

?????文件??????46080??2005-12-06?13:58??采用正向逆向最大匹配才實現漢字分詞wordppl\中文分詞程序說明文檔.doc

?????文件????????157??2009-09-03?16:44??采用正向逆向最大匹配才實現漢字分詞wordppl\哈哈.txt

?????文件??????????0??2009-09-03?16:47??采用正向逆向最大匹配才實現漢字分詞wordppl\嘿嘿.txt

?????文件????????626??2005-12-01?18:54??采用正向逆向最大匹配才實現漢字分詞wordppl\測試文本一.txt

?????文件????????841??2005-12-06?13:56??采用正向逆向最大匹配才實現漢字分詞wordppl\測試文本一_neg.txt

?????文件????????842??2005-12-01?21:14??采用正向逆向最大匹配才實現漢字分詞wordppl\測試文本一_pos.txt

?????文件??????26373??2005-11-26?22:53??采用正向逆向最大匹配才實現漢字分詞wordppl\測試文本二.txt

?????文件??????35001??2005-12-01?21:16??采用正向逆向最大匹配才實現漢字分詞wordppl\測試文本二_neg.txt

?????文件??????35000??2005-12-01?21:14??采用正向逆向最大匹配才實現漢字分詞wordppl\測試文本二_pos.txt

?????目錄??????????0??2009-09-09?09:36??采用正向逆向最大匹配才實現漢字分詞wordppl\wordppl

?????目錄??????????0??2009-09-03?16:47??采用正向逆向最大匹配才實現漢字分詞wordppl

-----------?---------??----------?-----??----

??????????????3947900????????????????????27



............此處省略0個文件信息

評論

共有 條評論