P

Hadoop 中文版文档 文档

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。这个项目的地址是http://hadoop.apache.org/core/。

bmml123 2012-03-21   10514   0

PDF文档操作Java类库,Apache PDFBox 1.7.0 发布 资讯

PDFBox 是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成

jopen 2012-05-29   14726   1
PDFBox  

Apache PDFBox v2.0.2 发布,一个PDF文档生成的工具库 资讯

Apache PDFbox是一个开源的、基于Java的、支持PDF文档生成的工具库,它可以用于创建新的PDF文档,修改现有的PDF文档,还可以从PDF文档中提取所需的内容。Apache PDFBox还包含了数个命令行工具。

jopen 2016-06-09   16100   0

PDF文档操作Java类库,Apache PDFBox 1.7.1 发布 资讯

PDFBox 是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成

jopen 2012-07-25   14934   0
PDFBox  
P

Apache Solr 4.2.0 文档 文档

Apache Solr 是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。Solr是一个开源的企业级搜索服务器,底层使用易于扩展和修改的Java来实现。服务器通信使用标准的HTTP和XML,所以如果使用Solr了解Java技术会有用却不是必须的要求。 Solr主要特性有:强大的全文检索功能,高亮显示检索结果,动态集群,数据库接口和电子文档(Word,PDF等)的处理。而且Solr具有高度的可扩展,支持分布搜索和索引的复制。

songhappy 2014-12-17   891   0
P

Apache POI API 文档 文档

Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。   Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案(适用于Excel97-2008)。

riverlover 2012-11-03   20859   0
P5

  使用xpdf来处理中文PDF文档 文档

使用xpdf来处理中文PDF文档 PDFBox看起来非常的方便,它的API功能强大。甚至能和Lucene进行无缝的结合。但是它有一个致命的弱点,就是它不支持中文。要提取中文的文本,可以采用另一个非常出色的工具xpdf。

shiwenliang 2013-04-20   3275   0

HTML到PDF文档转换 wkhtmltopdf 经验

WebKit 网页渲染引擎开发的用来将 HTML 文档转成 PDF 文档的工具,可以跟多种脚本语言进行集成来转换文档。 使用webkit将Web页面转成PDF文档 添头部和底部 生成TOC 支持批量转换 (Linux)

fmms 2012-01-17   48468   0

PDF 文档字体处理 FontBox 经验

FontBox是一个开源的Java类库用于解析字体文件,提供了一个访问字体信息的底层数据结构。

fmms 2012-01-17   12614   0
P10

  java生成word、excel、pdf文档 文档

1、一个jacob操作Word的例子,其他操作excel,pdf的sample里都有   import java.io.File;   import com.jacob.com.*;   import

yemei198611522 2012-08-08   564   0

RTF文档PDF的工具 vPDF 经验

这是一个文本编辑器,它能够将编写的内容存成PDF文档。它还可以读取现有的.rtf文档,并将其在编辑器中展示。vPDF拥有一个将RTF转PDF格式的转换器。 项目主页: http://www

fmms 2012-01-17   29927   0

PDF文档管理器 I, Librarian 经验

I, Librarian 是一个 PDF 管理器和组织程序,可用来管理一系列的 PDF 文档。提供智能浏览和快速检索的功能。 项目主页: http://www.open-open

fmms 2012-01-18   18677   0

PDF文档转成HTML的工具 PdfMasher 经验

PdfMasher 是一个用来将 PDF 文档转成适合阅读的 HTML 格式。 PdfMasher is a tool to convert PDF articles (newspaper, academic)

fmms 2012-01-18   20082   0

PDF与CHM文档生成工具 TaDoc 经验

是一个帮助人们将Docbook文档生成pdf,chm文件的工具。本工具简化了配置的过程,并提供自动生成代码的脚本。 本工具使用了以下程序 docbook xsl xsltproc apache fop

fmms 2012-04-27   21694   0
PDF   Java开发  

iOS提取PDF文档目录:PDFContents 经验

PDFContents 可以从 PDF 文件中提取章节目录,以列表形式展示。支持多级目录。 项目主页: http://www.open-open.com/lib/view/home/1389769921711

jopen 2014-01-15   14013   0
P18

  Java利用iText生成PDF文档 文档

itextpdf.text.pdf.BaseFont; import com.itextpdf.text.pdf.PdfPCell; import com.itextpdf.text.pdf.PdfPTable;

koreamy24k 2013-12-04   580   0

PDF文档编辑软件 PDFMod 经验

PDF Mod 是一个简单的 PDF 文档编辑器软件。能够对页面进行重新排序、旋转和删除操作,能够对文档的标题、作者等元素进行编辑,也能够将图片导出或者导入到 PDF 文档里。 这款软件可以实现:

fmms 2012-01-18   20452   0

生成 PDF 文档的 C# 组件 SharpPDF 经验

SharpPDF是一个C#类库,实现了各种不同的对象来创建PDF文档。使用非常简单,只要几个步骤。它能够创建100%兼容PDF文档。 项目主页: http://www.open-open

fmms 2012-01-18   21132   0

PDF文档阅读工具 GPdf 经验

GPdf 是 GNOME 桌面环境下的一个PDF文档阅读工具,基于Xpdf。 项目主页: http://www.open-open.com/lib/view/home/1326854631780

fmms 2012-01-18   23025   0

使用pdfbox解析pdf文档 经验

首先介绍一下pdfbox, 1、使用PDFBox处理PDF文档 PDF全称Portable Document Format,是Adobe公司开发的电子文件格式。这种文件格式与操作系统平台无关,可以在Windows、Unix或Mac

jopen 2014-12-14   143167   0
1 2 3 4 5 6 7 8 9 10