資源簡介
Words-240測試集包含240對中文詞匯和人工對這些詞對之間的語義相關度的評測值(和英文的WordSimilarity-353測試集類似),此測試集可以用于測試或者訓練中文語義相關度算法。我們以組為單位安排人員進行測試,共分為12組,每組包含20對詞。每一組詞匯都有20人分別對其相關性進行量化評測,
共有240余人參與了測試。詞匯之間相關性的度量值介于0到10之間(0表示這兩個詞之間毫不相關,10表示這兩個詞是同義詞),我
們將這20個人對某詞對的評測結果的平均值作為最終結果。每個人的評價結果請參見“測試集統計結果.xls”。如果您有什么問題或者評論,請您發郵件和我們聯系,郵件地址是:
代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????4961??2011-07-22?17:18??words-240發布\Words-240.txt
?????文件?????102400??2011-07-22?16:15??words-240發布\測試集統計結果.xls
?????文件???????3329??2011-07-22?17:19??words-240發布\說明Instruction.txt
?????目錄??????????0??2011-07-22?17:18??words-240發布
-----------?---------??----------?-----??----
???????????????110690????????????????????4
-----------?---------??----------?-----??----
?????文件???????4961??2011-07-22?17:18??words-240發布\Words-240.txt
?????文件?????102400??2011-07-22?16:15??words-240發布\測試集統計結果.xls
?????文件???????3329??2011-07-22?17:19??words-240發布\說明Instruction.txt
?????目錄??????????0??2011-07-22?17:18??words-240發布
-----------?---------??----------?-----??----
???????????????110690????????????????????4
- 上一篇:用CSocket類實現的聊天室程序
- 下一篇:兩款黑蘋果電池驅動kext
評論
共有 條評論