YaHP是一个能够把html文档转换成pdf文档的Java开源包。 项目主页: http://www.open-open.com/lib/view/home/1326792140921
Herold 是一个用来将 HTML 文档转成 DocBook 文件的工具,它尝试检测 HTML 的结构并分析其中的 header 元素,支持 HTML 表格的处理。 项目主页: http://www
Markdown2HTML 是一个极其简单的Markdown转HTML文档的工具,基于 MarkdownJ 实现。拥有命令行和GUI两种模式。 项目主页: http://www.open-open
html2text 是一个 Python 脚本能够将 HTML 转成干净,易于阅读的 Markdown 格式。 示例代码: import html2text h = html2text.HTML2Text()
html-to-markdown 是 Clojure 用来将 HTML 文档转成 Markdown 格式的库。 项目主页: http://www.open-open.com/lib/vie
Painty 提供了将 HTML 代码转成图片的 PHP 解决方案,支持以下的 HTML 标签: H1 STRONG, B IMG tags HR BR, P 项目地址: http://www.rabuser
采用JavaScript开发的HTML to Markdown转换器。 The API is as follows: toMarkdown(stringOfHTML, options); Installation
to-markdown 是一个用 JavaScript 编写的将 HTML 文档转成 Markdown 格式的库。 示例代码: var toMarkdown = require('to-markdown')
Markdownify 是一个为 PHP 编写的 HTML 到 Markdown 的转换器。 使用方法:
lxml是Python语言中功能最丰富,最容易使用的XML和HTML文档处理库。它处理速度非常快,同时对内存十分友好,据统计已有超过两百万次的下载量。 项目主页: http://www
毫无疑问,HTML、HTTP 和 XML 是支撑 Web 技术的三种最重要的技术。对于 PHP 开发人员而言,使用这些技术可能比较麻烦。但是,新的 QueryPath 库,即 jQuery JavaScript
SGML、HTML與XML之比較 Comparison of SGML, HTML and XML 陳嵩榮 Sung-Jung Chen 輔仁大學圖書資訊學系碩士班學生 Graduate student
ReportLab / HTML5lib / pyPdf 等项目来将 HTML/XHTML/XHML 转换成 PDF 文档。支持 HTML 5 和 CSS 2.1 以及部分 CSS 3。 支持的功能特性: 转HTML和CSS输出成PDF文件
Parm 能够将Markdown文件编译成HTML文件。它支持目录索引文件,扩展Markdown语法(例如,GitHub的扩展语法),以及自定义模板和CSS。 发布说明: 添加支持排除文件配置
PdfMasher 是一个用来将 PDF 文档转成适合阅读的 HTML 格式。PdfMasher 0.6.0 发布了, 该版本增加了自动根据标题元素进行分页的功能,自动为标题元素生成 TOC ,提升了文字排版的检测以及修复了一些bug。
能够将Markdown文件编译成HTML文件。它支持目录索引文件,扩展Markdown语法(例如,GitHub的扩展语法),以及自定义模板和CSS。 版本说明:该版本修正了layout.html中的链接错误。
downmark_it 是一个基于Hpricot用于将 HTML 转成 Markdown 格式的 Ruby 开发包。 这个开发包支持variable header tags, horizontal
支持将一个HTML表单序列化成JavaScript对象,支持嵌套属性和数组。 Usage Example HTML form (input, textarea and select tags supported):
首先要感谢pdf2htmlEX的作者Lu Wang,该软件是一个pdf转html的开源软件,效果非常理想。下面两张图片是html和pdf视图下的截图: windows下载地址 pdf2htmlEX-v1
确保字体名称正确,不使用中文,大小写正确。 确保html标签都正确,简单的方法是所有内容都去掉,随便写几个中文看看能否正常生成,如果可以,在认真检查html标签,否则再次检查上述几条。 3)加密