Java分布式中文分词组件word分词v1.2发布

word 分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等...
xg48 9年前    27874   

热门问答

热门文档