資源簡介
最新的ansj分詞工具jar包,用于在ecplise中使用ansj分詞。ansj是由孫健開發的一個基于n-Gram+CRF+HMM的中文分詞的java實現。分詞速度達到每秒鐘大約200萬字左右(mac air下測試),準確率能達到96%以上。目前實現了:中文分詞、中文姓名識別、用戶自定義詞典、關鍵字提取、自動摘要、關鍵字標記等功能??梢詰玫阶匀徽Z言處理等方面,適用于對分詞效果要求高的各種項目。作者在最新的分詞方式里增加了基于深度學習的分詞方式。
代碼片段和文件信息
評論
共有 條評論