PDF转HTML不丢格式的软件:pdf2htmlEX

jopen 10年前

pdf2htmlEX 是一个将PDF文件转成HTML的工具,用到了一些流行的Web技术。旨在提供一个准确的渲染,同时专为Web显示而优化。

它针对 Mozilla Firefox & Google Chrome等浏览器进行优化。

特性:

  • 单HTML文件输出
  • 精确的渲染
  • 文本抽取
  • 针对web进行优化(包括减少文件大小,文字行合并,(为HTML文字选择)字体重编码等等)

还不支持:

  • Type 3 字体
  • 非文本对象 (不过不要担心,不支持的对象将直接转成图片)

项目主页:http://www.open-open.com/lib/view/home/1346900228178