纽约消防局是怎样利用数据挖掘的？

jopen 10年前

纽约消防局是怎样利用数据挖掘的？

纽约大概有一百万栋建筑，每年其中 3 千栋会起大火。官员们能够预测哪些楼会着火么？

纽约市消防局认为他们可以利用数据挖掘来做到这点。消防局的分析员称某些建筑和一些更容易起火的因素有关联。

贫穷就是其一。

“低收入社区和火灾有相关性，” 消防局的分析主管 Jeff Chen 在拉斯维加斯上的一个工业会议上这样说道。

其他一些和致命火灾相关的因素有：建筑物的年龄，它有没有电路问题，洒水器的数量和位置，及有无电梯。Chen 说那些空置的或者没有安保的建筑着火概率是其他建筑的两倍。

这些听起来都显而易见，但一下子要消化全部的相关因素也不容易。

纽约的官员们采用了大约 60 个不同的因素做了一个算法，该算法给城里的 33 万可审查的建筑物都算了一个危险系数（消防局不检查独栋或者双拼别墅）。

当消防员进行每周的例行审查时，电脑会生成一份按危险系数排序的建筑清单，他们应当先去检查这些建筑。

这个数据挖掘程序在七月被正式启用，在接下来的几个月里会被扩展到 2400 个类别里。Chen 说在用这个程序之前他们进行的检查都是很随机的。

像学校和图书馆这种拥有高安全优先级的地方理应更经常审查。然而从前纽约市并没有根据危险系数来针对某些特定建筑。

在前纽约市长 Michael Bloomberg 的带领下纽约正变得更以数据为驱使，这是诸多市政当局在尝试使用已有的常规数据来改善服务的一个例子。

波士顿在他们的“问题建筑”项目中采用了大数据。它利用了不同的城市资源信息，比如投诉电话、安全记录、犯罪和征税信息来认定警察应该去查访哪些建筑。

尽管应该给大数据系统投资看起来像是常识，市政当局还是很难衡量系统的成功性。官员也许能够引用一些比如火灾或者犯罪数量减小了之类的统计数据，但是却很难论证大数据工具就是其根本原因。因为它需要证明的是一个负数：因为他们的努力，某些事情没发生。

消防管理部门的助理官员 Jeff Roth 说：“最终，火灾的数量会减少，火灾也应不像以前那么严重。”