使用 Swift 进行 JSON 解析

Teri3992 9年前
   <p>使用 Swift 解析 JSON 是件很痛苦的事。你必须考虑多个方面：可选类性、类型转换、基本类型（primitive types）、构造类型（constructed types）（其构造器返回结果也是可选类型）、字符串类型的键（key）以及其他一大堆问题。</p>    <p>对于强类型（well-typed）的 Swift 来说，其实更适合使用一种强类型的有线格式(wire format)。在我的下一个项目中，我将会选择使用 Google 的 <a href="/misc/goto?guid=4958864722501471793" rel="nofollow,noindex">protocol buffers</a> （ <a href="/misc/goto?guid=4958838453360160405" rel="nofollow,noindex">这篇文章</a> 说明了它的好处）。我希望在得到更多经验后，写篇文章说说它和 Swift 配合起来有多么好用。但目前这篇文章主要是关于如何解析 JSON 数据 —— 一种被最广泛使用的有线格式。</p>    <p>对于 JSON 的解析，已经有了许多优秀的解决方案。第一个方案，使用如 <a href="/misc/goto?guid=4958971668141769239" rel="nofollow,noindex">Argo</a> 这样的库，采用函数式操作符来柯里化一个初始化构造器：</p>    <pre>  <code class="language-swift">extension User: Decodable {    static func decode(j: JSON) -> Decoded<User> {      return curry(User.init)        <^> j <| "id"        <*> j <| "name"        <*> j <|? "email" // Use ? for parsing optional values        <*> j <| "role" // Custom types that also conform to Decodable just work        <*> j <| ["company", "name"] // Parse nested objects    }  }  </code></pre>    <p>Argo 是一个非常好的解决方案。它简洁，灵活，表达力强，但柯里化以及奇怪的操作符都是些不太好理解的东西。(Thoughtbot 的人已经写了一篇 <a href="/misc/goto?guid=4959645856913584236" rel="nofollow,noindex">不错的文章</a> 来对这些加以解释)</p>    <p>另外一个常见的解决方案是，手动使用 guard let 进行处理以得到非可选值。这个方案需要手动做的事儿会多一些，对于每个属性的处理都需要两行代码：一行用来在 guard 语句中生成非可选的局部变量，另一行设置属性。若要得到上例中同样的结果，代码可能长这样：</p>    <pre>  <code class="language-swift">class User {    init?(dictionary: [String: AnyObject]?) {      guard        let dictionary = dictionary,        let id = dictionary["id"] as? String,        let name = dictionary["name"] as? String,        let roleDict = dictionary["role"] as? [String: AnyObject],        let role = Role(dictionary: roleDict)        let company = dictionary["company"] as? [String: AnyObject],        let companyName = company["name"] as? String,          else {            return nil      }            self.id = id      self.name = name      self.role = role      self.email = dictionary["email"] as? String      self.companyName = companyName    }  }  </code></pre>    <p>这份代码的好处在于它是纯 Swift 的，不过看起来比较乱，可读性不佳，变量间的依赖链并不明显。举个例子，由于 roleDict 被用在 role 的定义中，所以它必须在 role 被定义前定义，但由于代码如此繁杂，很难清晰地找出这种依赖关系。</p>    <p>（我甚至都不想提在 Swift 1 中解析 JSON 时，大量 if let 嵌套而成的鞭尸金字塔（pyramid-of-doom），那可真是糟透了，很高兴现在我们有了多行的 if let 和 guard let 结构。）</p>    <p>在 <a href="/misc/goto?guid=4959714368600416667" rel="nofollow,noindex">Swift 的错误处理</a> 发布的时候，我觉得这东西糟透了。似乎不管从哪一个方面都不及 <a href="/misc/goto?guid=4958872158576390994" rel="nofollow,noindex"> Result </a> ：</p>    <ul>     <li>你无法直接访问到错误：Swift 的错误处理机制在 Result 类型之上，添加了一些必须使用的语法（是的，事实如此），这让人们无法直接访问到错误。</li>     <li>你不能像使用 Result 一样进行链式处理。 Result 是个 <a href="/misc/goto?guid=4959714368718583111" rel="nofollow,noindex">monad</a> ，可以用 flatMap 链接起来进行有效的处理。</li>     <li>Swift 错误模型无法异步使用（除非你进行一些 hack，比如说 <a href="/misc/goto?guid=4959714368800993729" rel="nofollow,noindex">提供一个内部函数来抛出</a> 结果)， 但 Result 可以。</li>    </ul>    <p>尽管 Swift 的错误处理模型有着这些看起来相当明显的缺点，但 <a href="/misc/goto?guid=4959714368887871507" rel="nofollow,noindex">有篇文章</a> 讲述了一个使用 Swift 错误模型的例子，在该例子中 Swift 的错误模型明显比 Objective-C 的版本更加简洁，也比 Result 可读性更强。这是怎么回事呢？</p>    <p>这里的秘密在于，当你的代码中有许多 try 调用的时候，利用带有 do / catch 结构的 Swift 错误模型进行处理，效果会非常好。在 Swift 中对代码进行错误处理时需要写一些模板代码。在声明函数时，你需要加入 throws ， 或使用 do / catch 结构显式地处理所有错误。对于单个 try 语句来说，做这些事让人觉得很麻烦。然而，就多个 try 语句而言，这些前期工作就变得物有所值了。</p>    <p>我曾试图寻找一种方法，能够在 JSON 缺失某个键时打印出某种警告。如果在访问缺失的键时，能够得到一个报错，那么这个问题就解决了。由于在键缺失的时候，原生的 Dictionary 类型并不会抛出错误，所以需要有个对象对字典进行封装。我想实现的代码大概长这样：</p>    <pre>  <code class="language-swift">struct MyModel {      let aString: String      let anInt: Int            init?(dictionary: [String: AnyObject]?) {          let parser = Parser(dictionary: dictionary)          do {              self.aString = try parser.fetch("a_string")              self.anInt = try parser.fetch("an_int")          } catch let error {              print(error)              return nil           }      }  }  </code></pre>    <p>理想的说来，由于类型推断的存在，在解析过程中我甚至不需要明确地写出类型。现在让我们丝分缕解，看看怎么实现这份代码。首先从 ParserError 开始：</p>    <pre>  <code class="language-swift">struct ParserError: ErrorType {      let message: String  }  </code></pre>    <p>接下来，我们开始搞定 Parser 。它可以是一个 struct 或是一个 class 。（由于它不会被用在别的地方，所以他的引用语义并不重要。）</p>    <pre>  <code class="language-swift">struct Parser {      let dictionary: [String: AnyObject]?            init(dictionary: [String: AnyObject]?) {          self.dictionary = dictionary      }  }  </code></pre>    <p>我们的 parser 将会获取一个字典并持有它。</p>    <p>fetch 函数开始显得有点复杂了。我们来一行一行地进行解释。类中的每个方法都可以类型参数化，以充分利用类型推断带来的便利。此外，这个函数会抛出错误，以使我们能够获得处理失败的数据：</p>    <pre>  <code class="language-swift">func fetch<T>(key: String) throws -> T {  </code></pre>    <p>下一步是获取键对应的对象，并保证它不是空的，否则抛出一个错误。</p>    <pre>  <code class="language-swift">let fetchedOptional = dictionary?[key]  guard let fetched = fetchedOptional else {      throw ParserError(message: "The key \"\(key)\" was not found.")  }  </code></pre>    <p>最后一步是，给获得的值加上类型信息。</p>    <pre>  <code class="language-swift">guard let typed = fetched as? T else {      throw ParserError(message: "The key \"\(key)\" was not the correct type. It had value \"\(fetched).\"")  }  </code></pre>    <p>最终，返回带类型的非空值。</p>    <pre>  <code class="language-swift">    return typed  }  </code></pre>    <p>（我将会在文末附上包含所有代码的 gist 和 playground）</p>    <p>这份代码是可用的！类型参数化及类型推断为我们处理了一切。上面写的 “理想” 代码完美地工作了：</p>    <pre>  <code class="language-swift">self.aString = try parser.fetch("a_string")  </code></pre>    <p>我还想添加一些东西。首先，添加一种方法来解析出那些确实可选的值（译者注：也就是我们允许这些值为空）。由于在这种情况下我们并不需要抛出错误，所以我们可以实现一个简单许多的方法。但很不幸，这个方法无法和上面的方法同名，否则编译器就无法知道应该使用哪个方法了，所以，我们把它命名为 fetchOptional 。这个方法相当的简单。</p>    <pre>  <code class="language-swift">func fetchOptional<T>(key: String) -> T? {      return dictionary?[key] as? T  }  </code></pre>    <p>（如果键存在，但是并非你所期望的类型，则可以抛出一个错误。为了简略起见，我就不写了）</p>    <p>另外一件事就是，在字典中取出一个对象后，有时需要对它进行一些额外的转换。我们可能得到一个枚举的 rawValue ，需要构建出对应的枚举，或者是一个嵌套的字典，需要处理它包含的对象。我们可以在 fetch 函数中接收一个闭包作为参数，作进一步地类型转换，并在转换失败的情况下抛出错误。泛型中 U 参数类型能够帮助我们明确 transformation 闭包转换得到的结果值类型和 fetch 方法得到的值类型一致。</p>    <pre>  <code class="language-swift">func fetch<T, U>(key: String, transformation: (T) -> (U?)) throws -> U {      let fetched: T = try fetch(key)      guard let transformed = transformation(fetched) else {          throw ParserError(message: "The value \"\(fetched)\" at key \"\(key)\" could not be transformed.")      }      return transformed  }  </code></pre>    <p>最后，我们希望 fetchOptional 也能接受一个转换闭包作为参数。</p>    <pre>  <code class="language-swift">func fetchOptional<T, U>(key: String, transformation: (T) -> (U?)) -> U? {      return (dictionary?[key] as? T).flatMap(transformation)  }  </code></pre>    <p>看啊！ flatMap 的力量！注意，转换闭包 transformation 和 flatMap 接收的闭包有着一样的形式： T -> U?</p>    <p>现在我们可以解析带有嵌套项或者枚举的对象了。</p>    <pre>  <code class="language-swift">class OuterType {      let inner: InnerType            init?(dictionary: [String: AnyObject]?) {          let parser = Parser(dictionary: dictionary)          do {              self.inner = try parser.fetch("inner") { InnerType(dictionary: $0) }          } catch let error {              print(error)              return nil           }      }  }  </code></pre>    <p>再一次注意到，Swift 的类型推断魔法般地为我们处理了一切，而我们根本不需要写下任何 as? 逻辑！</p>    <p>用类似的方法，我们也可以处理数组。对于基本数据类型的数组， fetch 方法已经能很好地工作了：</p>    <pre>  <code class="language-swift">let stringArray: [String]    //...  do {      self.stringArray = try parser.fetch("string_array")  //...  </code></pre>    <p>对于我们想要构建的特定类型（Domain Types）的数组， Swift 的类型推断似乎无法那么深入地推断类型，所以我们必须加入另外的类型注解：</p>    <pre>  <code class="language-swift">self.enums = try parser.fetch("enums") { (array: [String]) in array.flatMap(SomeEnum(rawValue: $0)) }  </code></pre>    <p>由于这行显得有些粗糙，让我们在 Parser 中创建一个新的方法来专门处理数组：</p>    <pre>  <code class="language-swift">func fetchArray<T, U>(key: String, transformation: T -> U?) throws -> [U] {      let fetched: [T] = try fetch(key)      return fetched.flatMap(transformation)  }  </code></pre>    <p>这里使用 flatMap 来帮助我们移除空值，减少了代码量:</p>    <pre>  <code class="language-swift">self.enums = try parser.fetchArray("enums") { SomeEnum(rawValue: $0) }  </code></pre>    <p>末尾的这个闭包应该被作用于 <em>每个</em> 元素，而不是整个数组（你也可以修改 fetchArray 方法，以在任意值无法被构建时抛出错误。）</p>    <p>我很喜欢泛型模式。它很简单，可读性强，而且也没有复杂的依赖（这只是个 50 行的 Parser 类型）。它使用了 Swift 风格的结构， 还会给你非常特定的错误提示，告诉你 <em>为何</em> 解析失败了，当你在从服务器返回的 JSON 沼泽中摸爬滚打时，这显得非常有用。最后，用这种方法解析的另外一个好处是，它在结构体和类上都能很好地工作，这使得从引用类型切换到值类型，或者反之，都变得很简单。</p>    <p><a href="/misc/goto?guid=4959714368965856355" rel="nofollow,noindex">这里</a> 是包含所有代码的一个 gist，而 <a href="/misc/goto?guid=4959714369054758640" rel="nofollow,noindex">这里</a> 是一个作为补充的 Playground.</p>    <p> </p>    <p>来自：http://swift.gg/2016/09/06/decoding-json/</p>    <p> </p>
使用 Swift 进行 JSON 解析

相关经验

目录