lkjson (JSON delphi library) 是 Delphi 实现的 JSON 数据格式和对象结构,主要特点是轻量级以及快速。
HtmlCleaner是一个开源的Java语言的Html文档解析器。HtmlCleaner能够重新整理HTML文档的每个元素并生成结构良好 (Well-Formed)的 HTML 文档。默认它遵循的规
HTML。此外,JTidy提供了对整个HTML的DOM分析器。程序员可以将JTidy当作一个处理HTML文件的DOM解析器来使用。 项目主页: http://www.open-open.com/lib/vi
Html Agility Pack 是CodePlex 上的一个开源项目。它提供了标准的DOM API 和XPath 导航--即使 HTML 不是适当的格式!
MozillaParser 是一个 Java 的HTML 解析类库,基于 mozilla 的html 解析器,提供了Java类到 Mozilla类的一个桥接,输入一个HTML文本,输出一个 Java 的
JoyHTML的目的是解析HTML文本当中的链接和正文,利用超链接密度法为主要判断依据的标记窗算法,采用DOM树解析模式。 项目主页: http://www.open-open.com
PyYAML是一个Python的YAML解析器。 YAML ="YAML Ain't Markup Language"(缩写为YAML)。这是一种数据序列化(serialization )语言,是一种
XmlPull和Sax类似,是基于流(stream)操作文件,然后根据节点事件回调开发者编写的处理程序。因为是基于流的处理,因此Xmlpull和 Sax都比较节约内存资源,不会象Dom那样要把所有节点以对橡树的形式展现在内存中。 但Xmlpull比Sax更简明,而且不需要扫描完整个流。
常量,当一个字符串由多个字符串常量连接而成时,它自己肯定也是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中” kvill”的一个引用。所以我们得出s0==s1==s2;用new
一 、xml.dom 解析XML的API描述 minidom.parse(filename) 加载读取XML文件 doc.documentElement 获取XML文档对象 node.getA
MD5的典型应用是对一段Message(字节串)产生fingerprint(指纹),以防止被“篡改”。举个例子,你将一段话写在一个叫 readme.txt文件中,并对这个readme.txt产生一个MD5的值并记录在案,然后你可以传播这个文件给别人,别人如果修改了文件中的任何内容,你对这个文件重新计算MD5时就会发现。如果再有一个第三方的认证机构,用MD5还可以防止文件作者的“抵赖”,这就是所谓的数字签名应用。
性能测试及集群监控工具 Kafka提供了非常多有用的工具,如 Kafka设计解析(三)- Kafka High Availability (下) 中提到的运维类工具——Partition Reassign
在上篇文章,我们介绍了Standard Bloom Filter(SBF)和Counting Bloom Filter(CBF)。简单回顾下,我们大概思路和历程是:为了解决允许false positive下的membership问题,我们设计了哈希表算法,由于它所需空间巨大,我们引入bitmap方法;因为它false positive possibility太大,我们引入了SBF,它使用多个独立的、均匀分布的哈希函数。而SBF的一个缺点是不支持删除操作,为了能够删除,我们引入了CBF,然而,CBF存在一个问题。 什么问题呢?那就是空间利用率不高。
121679 jsoup 简介 jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似
机机是个好动又好学的孩子,平日里就喜欢拿着手机地图点点按按来查询一些好玩的东西。某一天机机到北海公园游玩,肚肚饿了,于是乎打开手机地图,搜索北海公园附近的餐馆,并选了其中一家用餐。
因为最近工作上有需要使用解析 JavaScript 的代码,大部分情况使用正则表达式匹配就可以处理,但是一旦依赖于代码上下文的内容时,正则或者简单的字符解析就很力不从心了,这个时候需要一个语言解析器来获取整一个
SPJson 是一个简单的面向数据流的 JSON 解析器,支持 pull 模式和 DOM 模式的XML解析。 项目主页: http://www.open-open.com/lib/view/home/1324197844952
json不必多说了,在手机开发中,客户端和服务器端开发经常使用的数据交互模式。Iphone中利用json传递的数据,可以非常容易的展示到各个容器中。下面是一个最简单的例子。
DocumentBurster 从报表文件中获取元数据,并将这些数据通过邮件或者FTP发送,支持报表格式有:PDFCreator , Crystal Reports , JasperReports , Pentaho , OpenReports , JFreeReport , JXLS and Eclipse BIRT。
这是一套Google开发的DOM方式XML解析类库,支持读取和修改XML文档,支持XPath方式查询。 GDataXML 是 iOS 下的一款轻量级 XML 解析器,只包含两个文件 GDataXMLNode