I, Librarian 是一个 PDF 管理器和组织程序,可用来管理一系列的 PDF 文档。提供智能浏览和快速检索的功能。I, Librarian采用PHP开发并将所有的PDF注释说明存储在SQLite数据库文件中。
我想大多数人听说过 Node.js,但是你听说过 NodeOS 吗?没错,NodeOS,一个用 Node.js 写的操作系统。好吧,实话说,NodeOS 用 Linux 内核来处理各种底层任务,比如硬件通讯什么的,但是除此之外,使用的都是
Webmin 是一个基于Web的界面用于Unix系统管理。可以使用任何支持表格和表单的的浏览器,您可以设置用户帐户,互联网服务,DNS,文件共享等等。 在线示例: http://demo.webmin
SBuild 是一个非常快,强大和灵活的构建工具。它可用于构建任何基于Java VM的项目。SBuild的主要脚本语言是 Scala 。SBuild是一个依赖驱动的工具。 特性: 平独立的构建工具 多项目支持
BigMangoo 大芒果电子商务系统 基于OFBiz的开源电子商务系统 OFBiz国内的相关开源几乎找不到,BigMangoo通过提供一个基础的B2C平台,希望能帮助国内的OFBiz开发者更好
P9 基于ArcGIS的地理信息系统地名分系统建设 厦门精图信息技术有限公司 【摘要】厦门市地理信息系统地名分系统建设包括地名空间信息数据库和地名管理信息系统建设。其中,地名空间数据库建设,就是要采集整理
P46 人力资源绩效考核系统开发与设计 英文题目 Design and Development of humres performance assessment 学生姓名: 学 号: 专 业: 信息管理与信息系统 院 系:
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展
libtld 是一个用来从 URI 中抽取 TLD(顶级域名) 信息的 C 库。你可以提取域名、子域名等信息 项目主页: http://www.open-open.com/lib/vi
从文档(office,pdf,hwp)抽取文本的Java类库:JSearch。 Download & Installation JSearch.jar Just import JSearch.jar
bboss 大数据抽取工具 4.0.9 发布 相较上一版本(v4.0.8),v4.0.9增加了以下特性: 按照按日期字段切分任务,抽取db数据到hdfs,可以在第一次切分任务的基础上,将日期范围任务块进一步切分为更小的任务块
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展
抽取文章中的email地址并打印出来的Java代码
Tika 1.12 发布,Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tik
Xidel是一个命令行工具用来下载网页,并从它们中提取数据。它可以通过HTTP/ S连接下载文件,重定向,链接,或提取值,处理本地文件。可以使用XPath 2.0和XQuery1.0表达式,CSS3选择器和自定义模式匹配的处理页面,提取数据。提取的值可以被导出为纯文本/ XML / JSON,或分配给其他提取表达式使用。也有一个在线的CGI服务进行测试。
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展
bboss大数据抽取工具4.0.8发布 bboss大数据抽取工具功能特点如下: 实现 db 到hadoop hdfs 数据导入功能,提供高效的分布式并行处理能力,可以采用数据库分区、按字段分区、分页方式并行批处理抽取