http协议中文分词 http-scws 更新

jopen 12年前
     <p><a href="/misc/goto?guid=4958320147857897380" target="_blank">http-scws</a>(基于scws的http协议中文分词),软件基于scws 1.1.7版本二次开发,基于libevent进行http封装,请求更简单</p>    <p><strong>功能:</strong></p>    <p>1.词库为文本文件方式,增加、删除更方便<br /> 2.支持gbk与utf-8(基于scws功能)<br /> 3.运行中可修改词库,不停服务只需一个命令即可使新词库生效<br /> 4.最大150K文本提交<br /> 5.可分词、提取高频词<br /> 6.支持GET与POST方式<br /> 7.支持短词、二元、主要单字、全部单字(基于scws功能)<br /> 8.支持标点过滤(基于scws功能)</p>    <p>简单测试结果:</p>    <p>AMD 64位台式机四核CPU,程序加载词库后占用21M内存,使用10进程不间断请求请求,内存无增加,CPU使用率在30%多</p>    <p>此项目开源,压缩包里有源代码及编译后的程序,有特殊需要的可自行修改源程序,编译后程序的编译环境为:amd 64位 4核CPU,centos 5.5 64位系统,内核为:2.6.18-194.el5。<br /> </p>