YaHP是一个能够把html文档转换成pdf文档的Java开源包。 项目主页: http://www.open-open.com/lib/view/home/1326792140921
Herold 是一个用来将 HTML 文档转成 DocBook 文件的工具,它尝试检测 HTML 的结构并分析其中的 header 元素,支持 HTML 表格的处理。 项目主页: http://www
Markdown2HTML 是一个极其简单的Markdown转HTML文档的工具,基于 MarkdownJ 实现。拥有命令行和GUI两种模式。 项目主页: http://www.open-open
html2text 是一个 Python 脚本能够将 HTML 转成干净,易于阅读的 Markdown 格式。 示例代码: import html2text h = html2text.HTML2Text()
html-to-markdown 是 Clojure 用来将 HTML 文档转成 Markdown 格式的库。 项目主页: http://www.open-open.com/lib/vie
采用JavaScript开发的HTML to Markdown转换器。 The API is as follows: toMarkdown(stringOfHTML, options); Installation
to-markdown 是一个用 JavaScript 编写的将 HTML 文档转成 Markdown 格式的库。 示例代码: var toMarkdown = require('to-markdown')
Markdownify 是一个为 PHP 编写的 HTML 到 Markdown 的转换器。 使用方法:
lxml是Python语言中功能最丰富,最容易使用的XML和HTML文档处理库。它处理速度非常快,同时对内存十分友好,据统计已有超过两百万次的下载量。 项目主页: http://www
毫无疑问,HTML、HTTP 和 XML 是支撑 Web 技术的三种最重要的技术。对于 PHP 开发人员而言,使用这些技术可能比较麻烦。但是,新的 QueryPath 库,即 jQuery JavaScript
ReportLab / HTML5lib / pyPdf 等项目来将 HTML/XHTML/XHML 转换成 PDF 文档。支持 HTML 5 和 CSS 2.1 以及部分 CSS 3。 支持的功能特性: 转HTML和CSS输出成PDF文件
downmark_it 是一个基于Hpricot用于将 HTML 转成 Markdown 格式的 Ruby 开发包。 这个开发包支持variable header tags, horizontal
支持将一个HTML表单序列化成JavaScript对象,支持嵌套属性和数组。 Usage Example HTML form (input, textarea and select tags supported):
首先要感谢pdf2htmlEX的作者Lu Wang,该软件是一个pdf转html的开源软件,效果非常理想。下面两张图片是html和pdf视图下的截图: windows下载地址 pdf2htmlEX-v1
确保字体名称正确,不使用中文,大小写正确。 确保html标签都正确,简单的方法是所有内容都去掉,随便写几个中文看看能否正常生成,如果可以,在认真检查html标签,否则再次检查上述几条。 3)加密
cpp2html 是一个用来将 C/C++ 的源码文件转成直接在 HTML 上具有语法着色效果的 HTML 文档。 项目主页: http://www.open-open.com/lib/v
HTML2PDF能够把一个HTML文本转换成一个打印机友好的PDF文件。这个PHP脚本构建在FPDFPHP脚本之上。 项目主页: http://www.open-open.com/lib/
node-htmlparser 是一个 JavaScript 的 HTML/XML/RSS 解析器。 A forgiving HTML/XML/RSS parser written in JS for
Oga是一个采用Ruby编写的XML/HTML解析器。它提供了一个易于使用的API来解析,修改和查询文档(使用XPath表达式)。Oga不需要系统库如libxml,使得它能够更简便和更快的安装在各种平
一 、xml.dom 解析XML的API描述 minidom.parse(filename) 加载读取XML文件 doc.documentElement 获取XML文档对象 node.getA