NekoHTML

NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。这个解析器能投扫描HTML文件并“修正”许多作者(人或机器)在编写HTML文档过程中常犯的错误。NekoHTML能增补缺失的父元素、自动用结束标签关闭相应的元素,以及不匹配的内嵌元素标签。NekoHTML的开发使用了Xerces Native Interface (XNI),后者是Xerces2的实现基础。

该项目主页:http://www.apache.org/~andyc/neko/doc/html/

本页【Html解析类库】其它开源项目



 


Email:pe_mail2006 AT 163.com 闽ICP备05011699号 友情链接