C++高效解析JSON字符串

jopen 10年前

1. 什么是JSON字符串说明?

定义:

JSON(Javascript Object Notation)是一种轻量级的数据交换格式,易于阅读和编写,也易于机器解析和生成。

结构:

a. 名称/值 的集合,Json对象是键值对构成,类似于map。其键为普通字符串,值可以为任意类型,如数字、逻辑值、文本、数组对象、Json对象、null等。

b. 数组,Json对象也可以为一个数组,有一个或者多个数值构成,其中数值可以为任意类型,如数字、逻辑值、文本、数组对象、Json对象、null等。

c. 语法

数据在名称/值对中

数据由逗号分隔

花括号保存对象

方括号保存数组

举例:

a. 简单例子:{"firstname": "peisheng"}

b. 多个数据:{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"}

c. 数组例子:

{ "zubie": "cad",

"members": [

{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"},

{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"},

{"firstname": "peisheng", "lastname": "h", "email": "buzhidao"}

]

}

2. 为什么选择Json作为数据传输?而不是XML

可读性:JsonXML相比可谓不相上下,一边是简单的语法,一边是规范的标签形式,很难分出胜负。

可扩展性:XML天生有很好的可扩展性,Json也有。

编码难度:XML有丰富的编码工具,Json也有提供,但是XML要输入很多结构字符。

解码难度:凡是可扩展的数据结构,解析起来都很困难。

数据量: Json具有轻小的特点,降低了数据传输量。

3. JSONCPP库介绍

目前市场上有很多Json解析的开源库,http://www.json.org/,这个网站中有对Json的介绍,以及列出了各种语言实现的Json解析库。JSONCPP是一个C++实现的面向对象的跨平台开源库,具有易用、易读的特点。

JSONCPP中重要的类:

a. Json::Value 可以表示所有的类型,比如intstringobjectarray等。

b. Json::Reader 可以从Json字符串中解析出Json::Value对象。

c. Json::Writer 可以把Json::Value对象写入到字符串流或者文件中。

但是JsonCPP解析性能低,使用了std标准库的东西,在CAD的环境下很容易崩溃,最后放弃。

4. 如何读取Json字符串?

解码时,把Json字符串看成是一个map对象(object),对象(object)的键为字符串,值为任意类型,可以为intstringboolarrayobject等。解析Json字符串时,首先对当前层map解析解析,解析出key/val对。

解析过程:

a. 在键值对出现时,记录键的起始位置,kvoff1_key, kvoff1_val

b. 在键值对结束时,记录值的结束位置,kvoff2_key, kvoff2_val

c. 设置*kvoff2_key = 0, *kvoff2_val = 2

d. Json对象中,用map记录键值的起始位置

e. 重复a~d四个步骤

举例说明:

{"k1":"x1","k2":[1,2,3],"k3":{"k31":"v1"}}

按照上面的步骤进行解析

a. kvoff1_key=2, kvoff1_val=7

b. kvoff2_key=4, kv0ff2_val=9

c. *kvoff2_key=0, *kvoff2_val=0

d. Map.insert(kvoff1_key, kvoff1_val)

e. 重复a~d

5. 如何编辑Json字符串?

由于Json对象在内部维护了一份Json字符串内存RawBuf,插入时,在RawBuf后面添加一份键值对,并在所属的Json对象中记录一下键值对的起始位置,设置键和值的末尾值为0

如果追加的字符串的大小,比RawBuf剩余空间大时,添加List<TCHAR*> RawBufs字段,提供多缓冲支持,最后一个Buffer为当前正在使用的Buffer

RawBuf是使用步骤:

a. 初始化Json对象时,初始化一个 RAWBUFLEN=65535的TCHAR数组,并将该数组的指针添加到RawBufs中。

b. 插入一个键值对时,如果Buffer的剩余空间不足,生成一个大小为max(RAWBUFLEN, len(key) + len(val) + 2) 大小的TCHAR数组,并将数组的指针添加到RawBufs中,在将新值复制到刚才申请的空间里。