OpenPipeline是一套用于抓取、解析、分析和分发文档的开源软件。OpenPipeline提供了一个公共的架构实现数据源的连接,文件过滤,文本分析和文档在网络上分发。它包括一个job scheduler和一个完整的UI界面。OpenPipeline已经自带功能完整的组件,但还能够集成第三方模块。OpenPipeline已经提供的插件包括:用于抓取内容的管理系统,解析特殊文件格式和文本分析。 <DIV class=date>收录时间:2011-05-30 09:16:32</DIV>