資源簡介
資源包主要內容:
(1)各個步驟需要的實驗源碼
(2)各個步驟生成的text、xml以及csv文件
(3)實驗過程的大致說明,幫助更好的理解實驗
包含整個實驗過程的所有資源,代碼完整,附帶實驗說明,易于理解。
原reviews.xml有點不合適,用資源包里的替換掉就好。
最后,祝大家能早日做完實驗,早回家。
代碼片段和文件信息
#-*-coding:utf-8?-*-
from?lxml?import?etree
import?pandas?as?pd
import?sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)
id?=0
a=[]
b=[]
parser?=?etree.xmlParser(recover=True)
while?id?<100:
????tree?=?etree.parse(“F:/Pythonwork/NLP/review_parser/review_parsed“+‘%05d‘%id+“.xml“?parser)
????root?=?tree.getroot()
????for?element?in?root.iter():
????????depps?=?element.findall(“dep“)
????????for?depp?in?depps:
????????????if?depp.get(‘type‘)?==?“amod“:
????????????????print?depp.find(“governor“).text
????????????????print?depp.find(“dependent“).text
????????????????a.append(depp.find(“governor“).text)
????????????????b.append(depp.find(“dependent“).text)
????id+=1
dataframe?=?pd.Dataframe({‘名詞‘:?a?‘修飾詞‘:?b})
dataframe.to_csv(“test.csv“?index=False?sep=‘‘)
#print?root[0].tag
#print?root[0].attrib
#找標簽名為dependencies的屬性
print?root[0].find(“dependencies“).attrib.keys()[0]
#for?element?in?root.iter():
?#???if?element.find(‘review_text‘)?is?None:?pass
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????21088??2016-09-27?20:57??實驗三-NLP\hw2.ipynb
?????目錄???????????0??2018-01-24?17:44??實驗三-NLP\
?????目錄???????????0??2018-01-24?17:44??實驗三-NLP\.idea\
?????文件?????????459??2018-01-23?23:38??實驗三-NLP\.idea\NLP.iml
?????文件?????????222??2018-01-23?23:38??實驗三-NLP\.idea\misc.xm
?????文件?????????258??2018-01-23?23:38??實驗三-NLP\.idea\modules.xm
?????文件???????15441??2018-01-24?17:27??實驗三-NLP\.idea\workspace.xm
?????文件????????1030??2018-01-24?16:37??實驗三-NLP\Matched.py
?????文件?????????667??2018-01-24?00:13??實驗三-NLP\RewiewText.py
?????目錄???????????0??2018-01-24?17:44??實驗三-NLP\review_parser\
?????文件???????21909??2018-01-24?00:38??實驗三-NLP\review_parser\review_parsed00000.xm
?????文件???????21909??2018-01-24?00:38??實驗三-NLP\review_parser\review_parsed00001.xm
?????文件????????4287??2018-01-24?00:38??實驗三-NLP\review_parser\review_parsed00002.xm
?????文件????????6782??2018-01-24?00:38??實驗三-NLP\review_parser\review_parsed00003.xm
?????文件????????3431??2018-01-24?00:38??實驗三-NLP\review_parser\review_parsed00004.xm
?????文件???????28960??2018-01-24?00:39??實驗三-NLP\review_parser\review_parsed00005.xm
?????文件????????5201??2018-01-24?00:39??實驗三-NLP\review_parser\review_parsed00006.xm
?????文件???????40059??2018-01-24?00:39??實驗三-NLP\review_parser\review_parsed00007.xm
?????文件???????12403??2018-01-24?00:39??實驗三-NLP\review_parser\review_parsed00008.xm
?????文件???????40059??2018-01-24?00:39??實驗三-NLP\review_parser\review_parsed00009.xm
?????文件???????92543??2018-01-24?00:40??實驗三-NLP\review_parser\review_parsed00010.xm
?????文件????????3124??2018-01-24?00:40??實驗三-NLP\review_parser\review_parsed00011.xm
?????文件????????5657??2018-01-24?00:40??實驗三-NLP\review_parser\review_parsed00012.xm
?????文件????????9935??2018-01-24?00:40??實驗三-NLP\review_parser\review_parsed00013.xm
?????文件???????61297??2018-01-24?00:40??實驗三-NLP\review_parser\review_parsed00014.xm
?????文件???????24131??2018-01-24?00:41??實驗三-NLP\review_parser\review_parsed00015.xm
?????文件???????11241??2018-01-24?00:41??實驗三-NLP\review_parser\review_parsed00016.xm
?????文件???????27667??2018-01-24?00:41??實驗三-NLP\review_parser\review_parsed00017.xm
?????文件????????8566??2018-01-24?00:41??實驗三-NLP\review_parser\review_parsed00018.xm
?????文件????????2117??2018-01-24?00:41??實驗三-NLP\review_parser\review_parsed00019.xm
?????文件????????5186??2018-01-24?00:41??實驗三-NLP\review_parser\review_parsed00020.xm
............此處省略234個文件信息
- 上一篇:FERET_ 人臉數據庫
- 下一篇:深入Linux內核架構中文版--原版pdf
評論
共有 條評論