System, Quartz, Win32, image buffers, PostScript, PDF, 和 SVG 文件导出。后端包括: OpenGL , XCB, BeOS, OS/2, 和 DirectFB
.NET下的文本数据抽取库,能够支持许多常用文件格式,如 docx, xlsx, xls, pdf, csv, txt, vcf, html等,是数据挖掘领域不可多得利器。 项目主页: http://www
Java 类库,基于 XML 的模板提供了灵活的报表和打印的功能,支持各种数据源和显示设备,包括打印机、PDF、Excel、HTML、XHTML、PlainText、XML和CSV文件等。 项目主页:
是一个轻量级的采用 Java 语言开发的报表解决方案,可以指定定时生成报表,并输出到不同的格式如 PDF、EXCEL、HTML、RTF 等,支持图表的生成。 项目主页: http://www.open-open
KBibTeX 是一个KDE下的 BibTeX 编辑器,用来使用 LaTeX 编辑书目。可导出 PDF, PostScript, RTF, 和 XML/HTML. 项目主页: http://www
是一个Web协助编辑平台,允许作者、翻译以及设计师同时远程的创建支持多语言的内容,并发布为不同的格式,如 PDF 和 HTML 等,基于 XML 技术存储和转换。 项目主页: http://www.open-open
元数据管理 全文搜索 标签管理 BPM document template features 生成PDF Flash查看器 项目主页: http://www.open-open.com/lib/vi
OpenReports 是一个基于web的报表解决方案,可为用户提供通过浏览器查看动态创建的PDF、HTML或XLS格式报表的能力。OpenReports 使用Java开发的,并使用JasperReports作为报表生成引擎。
jPdfCalendar是一个用来制作供打印的日历(PDF文档)的工具,你可以用你喜欢的照片来自制一个漂亮的日历,如下图所示: 项目主页: http://www.open-open.com
HTMLWorker 的重写,主要目的是创建一个 XML 解析器可用来根据 XHTML 内容来生成 PDF 文档。 项目主页: http://www.open-open.com/lib/view/home/1326857520155
是一个报表设计工具,可用来设计报表、创建报表菜单和配置,支持图形、分组、下钻、表达式处理和数据转换,可导出 HTML、PDF 和 CSV 格式,可通过 CSS 修改报表外观。 项目主页: http://www.open-open
是一个基于Web的办公套件,其功能包括用户管理、模块管理、邮件客户端、文件管理器、日程、项目管理以及客户关系管理等等。可方便与PDF和Outlook进行数据同步。 项目主页: http://www.open-open.
的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF
是一个批量的图片转换和缩略图生成工具,支持超过100种图像格式,包括:DPX, EXR, GIF, JPEG, JPEG-2000, PDF, PhotoCD, PNG, Postscript, SVG, and TIFF。 功能 多张图片同时转换
Relax NG, Batch XML validation), XSL 转换 (HTML, XML, PDF, SVG), schema/DTD 生成 , XML/DTD/HTML/XSL 代码完成 , 代码格式化
Apache Forrest是一个把来自各种不同的输入数据源转换成用一种或多种输出格式(比如HTML,PDF等)来统一显示的发布系统。它基于Apache Cocoon并分离了内容与内容结构,不仅可以生成静态的文档也可以当作一个动态的服务器。
NCrawler是一个简单并且非常高效的多线程网络爬虫。采用C#开发,基于管道的处理器。它包含HTML, Text, PDF, 和 IFilter 文档的处理器并语言检测(Google)。能够很方便添加管道步骤来抽取、使用和修改信息。
TeX/LaTeX 公式编辑器,它提供直观易用的界面,支持语法加亮及代码补全,能够导出 TEX、PNG、PDF 等多种格式。对于需要使用 LaTeX 来进行文档排版的同学来说,应当是很不错的得力助手。
文档持续更新中 提供两个文档版本 markdown html 自行下载 html可以转为PDF,同学自己动下手哈可以放在iPad或者Kindle中 项目主页: http://www
.html via beautifulsoup4 .pptx via python-pptx .pdf via pdftotext (default) or pdfminer .txt via python