Lucene中文分词“庖丁解牛” Paoding Analysis

Paoding's Knives中文分词具有极高效率和高扩展性。引入隐喻,采用完全的面向对象设计,构思先进。高效率:在PIII 1G内存个人机器上,1秒可准确分词100万汉字。采用基于不限制个数的词典文件对文章进行有效切分,使能够将对词汇分类定义。能够对未知的词汇进行合理解析。

该项目主页:http://code.google.com/p/paoding/

本页【搜索引擎】其它开源项目



 


MSN:jforeverg@hotmail.com 闽ICP备05011699号 友情链接