Skip to content

Latest commit

 

History

History
88 lines (51 loc) · 3.84 KB

what-big-data-brought.md

File metadata and controls

88 lines (51 loc) · 3.84 KB

大数据给公司带来了什么

一个公司如果开始要做大数据,成本是需要考虑的:

  1. 机器。会比传统的业务更消耗服务器,单机配置一般也比较高。
  2. 人员。BI,分析师,应用研发,架构,算法,每种类型的人价格都不便宜
  3. 数据为导向(或者慢慢转换为以数据为导向)会对原有的产品产生额外的负担。比如该产品需要产生大量的数据供大数据使用。

在实际的发展过程中,有很多老总敏锐的感觉到,手头有这么多有价值的数据,一定要利用起来,但是有几个问题确实是很多人不清楚的,大家也是边做边感受。有时候做到后面,心里也会犯嘀咕,花了这么多钱,这么多人手,做这件事情真的值得么?

我觉得真要做,至少要考虑下面几点:

  1. 需要多少成本?
  2. 需要多少时间?
  3. 产出是什么?
  4. 数据最后呈现的产品形态是什么?

如果能清楚的知道数据最后的产品呈现形态,想必产出也就自然而然知道了。毕竟产出需要特定产品去承载。

你知道了数据的最后的产品呈现形态,知道了产出,也就知道,数据究竟给公司带来了什么,也就回答了我们标题上的问题。

在罗列大数据都有哪些呈现形态的时候,我们不妨从一个非常高的角度看看大数据的组成包含哪些:

  1. 数据本身
  2. 流水线(支撑数据分析的数据处理平台)
  3. 挖掘加工(分析数据内部特征关联性规律,也就是机器学习)
  4. 产品(最终的呈现形态)

目前产品呈现形态,我所知的有:

  1. 推荐

    • 电商应用最广泛。有效增加用户体验,同时提升点击转化购买率
    • 有内容产出的站点。比如CSDN
    • 做内容聚合的,比如今日头条。据说今日头条的算法随着用户使用的积累,效果越来越好了。
  2. 广告(精准营销)

    • 专业的广告公司,比如广告联盟.
    • 特定产品本身承载的广告投放。比如微信那个高大上的朋友圈广告
    • 公司内部的EDM,电话,短信等营销
  3. 搜索(排序因子)

    • 机器学习产生的很多中间结果可以有效的提升搜索的排序
  4. 用户分析(这算的上是一个中间产品,也算的上是一个最终产品)

    • 了解你的客户是根本
    • 金融行业非常依赖于此。比如信征,反作弊,反欺诈等。未来放贷的变革估计也靠此了。
    • 这个可以作为一个直接的产品,也可以作为一个中间服务,直接支撑推荐,广告,搜索等产品
    • 基于此还可可以有非常多的产品,就等待人们去挖掘了。
  5. 实时计算(流量计费,反欺诈/作弊等等都需要依赖于此)

  6. BI报表

    • 基础流量,你网站的pv,uv等等
    • 质量监控,监控分析你的服务是否顺畅,比如视频播放卡顿比可以反馈出视频网站的服务质量。
    • 运营监控,譬如通过情感分析可以得到用户的直观反馈。典型如京东评论的情感分析。
    • 特定指标计算,这个是根据运营以及决策人员根据实际经验想看到的一些数据,我们把它量化,指标化,从而呈现出报表形态,方便运营以及决策人员做出相应的调整。
  7. 运维支持

    • 也可以划归到BI报表中的质量监控中去
    • 单独划归出来其实想说,大数据其实是可以对整个产品线的各个环节做support的。并不一定是我上面的列举。

上面说了七点,其实总结下,无非做了如下两件事情:

了解:

  1. 了解自己的产品
  2. 了解自己的用户

提升:

  1. 提升各种转化率
  2. 提升决策的准确率

当然,还有专门做数据的公司,只要他们能够为其他公司提供【了解】【提升】这两件事情,也就算达到自己的使命了。