資源簡介
SRILM源代碼閱讀筆記。
主要針對(duì)SRILM的ngram的訓(xùn)練,即ngram-count。
7個(gè)文件:
1.類圖.jpg:與ngram-count相關(guān)的主要類的靜態(tài)圖(使用了starUML的逆向工程工具);
2.ngram-count.jpg:從語料訓(xùn)練出模型的主要流程;
3.lmstats.countfile.jpg:ngram-count的子流程,用于構(gòu)建詞匯表和統(tǒng)計(jì)ngram的頻度;
4.ngram.estimate.jpg:ngram-count的子流程,在詞匯表和ngram頻度的基礎(chǔ)上計(jì)算ngram條件概率
以及backoff權(quán)值的過程;
5.ngram.read.jpg:與訓(xùn)練無關(guān),讀取ARPA格式的語言模型的過程;
6.SRILM.uml:以上5個(gè)文件的原始圖,以StarUML繪制(利用StarUML可直接編輯)
7.SRILM.vsd:ngram-count相關(guān)的主要數(shù)據(jù)結(jié)構(gòu)的內(nèi)存布局 + ngram條件概率計(jì)算公式的參數(shù)說明,
以visio繪制(利用visio可直接編輯)

代碼片段和文件信息
?屬性????????????大小?????日期????時(shí)間???名稱
-----------?---------??----------?-----??----
?????文件?????951218??2012-09-04?11:19??SRILM_note\lmstats.countfile.jpg
?????文件????1097149??2012-09-04?11:19??SRILM_note\ngram-count.jpg
?????文件????1623615??2012-09-04?11:20??SRILM_note\ngram.estimate.jpg
?????文件?????824177??2012-09-04?11:20??SRILM_note\ngram.read.jpg
?????文件???????3671??2012-09-04?11:17??SRILM_note\readme.txt
?????文件????3760821??2012-09-04?10:22??SRILM_note\SRILM.uml
?????文件?????128512??2012-08-31?09:41??SRILM_note\SRILM.vsd
?????文件????1752955??2012-09-04?11:18??SRILM_note\類圖.jpg
?????目錄??????????0??2012-09-04?11:22??SRILM_note
-----------?---------??----------?-----??----
?????????????10142118????????????????????9
-----------?---------??----------?-----??----
?????文件?????951218??2012-09-04?11:19??SRILM_note\lmstats.countfile.jpg
?????文件????1097149??2012-09-04?11:19??SRILM_note\ngram-count.jpg
?????文件????1623615??2012-09-04?11:20??SRILM_note\ngram.estimate.jpg
?????文件?????824177??2012-09-04?11:20??SRILM_note\ngram.read.jpg
?????文件???????3671??2012-09-04?11:17??SRILM_note\readme.txt
?????文件????3760821??2012-09-04?10:22??SRILM_note\SRILM.uml
?????文件?????128512??2012-08-31?09:41??SRILM_note\SRILM.vsd
?????文件????1752955??2012-09-04?11:18??SRILM_note\類圖.jpg
?????目錄??????????0??2012-09-04?11:22??SRILM_note
-----------?---------??----------?-----??----
?????????????10142118????????????????????9
評(píng)論
共有 條評(píng)論