QQ 大数据及其应用介绍


QQ大数据及其应用介绍 SNG 数据中心 QQ大数据 规模数据 QQ月活跃用户数超过 8.4亿 QQ最高同时在线超过 2.0亿 QQ空间月活跃用户数超过 6.5亿 QQ好友关系链对超过 900亿 活跃数据 一天QQ总发消息超过 100亿 一天发空间说说、个签超过 1亿 大数据应用一:好友/群推荐 数据:社交+标签+LBS 算法:识别并推荐适合的人与群 应用:在用户主动加好友/群时及时推荐 数据:SNS+标签+LBS 足球 数据挖掘 东北人 摄影 旅游 当前的活 动地点 过去的活 动地点 新加好友 旧有的社交圈子 即将加入的社交 圈子 基于社交行为 基于用户标签 基于活动地点 用户状态 社交需求 1 2 感知 用户 • 通过社交行为、用户标签以及活动地点感知用户状态以及社交需求。 算法:识别并推荐适合的人与群 • 从新的社交圈子中挑选与用户匹配的好友/群进行推荐,帮助其快速融入。 腾讯足球群 新同事 东北老乡 同好群体 应用:用户主动加好友/群时及时推荐 群组推荐 好友推荐 大数据应用二:广点通 广点通助力长尾广告 广点通的大数据解决方案 案例应用:红米手机促销 广点通助力长尾广告 优质资源 亿万活跃用户潜在投放量,提供多方 位广告展现平台 高效传播 智能广告竞价机制,高效提升广告效 益。实现通过实际带来推广效果付费 精准聚焦 细粒度挖掘用户属性,精选出适合广 告主推广的目标用户群 • 基于腾讯大社交平台独特基因,以海量用户为基础,以大数据洞察为核心, 以智能定向推广为导向,广点通提供一站式网络推广营销平台。 广点通的大数据解决方案 人 口 统 计 推 荐 内 容 推 荐 协 同 过 滤 增 强 CF 方 法 基础属性数据 人口属性 • 年龄/性别 • 地域/学历 • 职业/收入 • 上网场景 兴趣属性(400余种类目) • 女装 • 女包 •…… 行为属性数据 自定义标签(100万个) • 指环王 • 索尼 • 安踏 • 莫文蔚 •…… 生活状态 • 职业状态 • 婚恋状态 •…… 数据:海量 算法:精准 应用:实时 • 广点通应用大数据去了解每一位用户的喜好和需求,做到满足各个业务的个 性化精准推荐需求。 案例:红米手机促销 对QQ空间用户进行红 米手机促销 年轻上网用户,同时小米用户在 空间中的使用占比较高 小米希望通过与QQ空间的合作 促进红米手机首发销售,并扩大 红米手机在目标客户群中的品牌 影响力。 推广需求 广点通精准用户定位 • QQ空间活跃用户 • Android手机用户 • 18-35岁 执行方案 推广效果 • 10万 90秒红米全部售罄10W台; • 15万 首发第1秒超过15万用户抢购; • 745万 在空间预约创下史上最疯狂首发。 大数据应用三:用户行为研究 QQ用户行为的研究思路 案例:春节人口迁徙报告 QQ用户行为的研究思路 • 发挥QQ基数大、变量多的大数据优势,与社会热点话题结合,通过大数据计 算技术与呈展技术开展全网用户行为研究,传播QQ大数据的社会价值。 QQ号码 SNS行为数据 关系链数据 年龄/地域/性别等户口数据 LBS数据 网络/终端信息 • 社会关系连接 • 用户社交行为 • 用户迁徙行为 • 用户上网习惯 • 影响力传播 • 产品易用性 数据记录与收集 行为分析 案例:春节人口迁徙报告 • 地域属性 • 交通方式 • 城市风俗特征 • 景点分布 • 名校分布 • 迁徙人群特征 • 基于QQ用户位置变化轨迹,建立模型测算迁徙规模,分析人口迁徙方向及其影响因素。 该报告两次登录央视,并引来知乎日报、凤凰新闻等媒体主动扩散报导。 数据准备 建模分析 报告输出 • 全样本:8亿以上QQ使用记 录及LBS信息; • 唯一ID:QQ用户身份ID具有 用户跟踪能力; • 多样性:支持多维分析,包括 QQ聊天对象属性、位置属性、 行为时间等交叉分析。 迁徙规模测算模型 人口迁徙因素分析 大数据应用四:客户生命周期管理(CLM) 数据:多指标、多维度的海量数据采集 模型:在用户各生命周期进行预测与预警 应用:搭建CLM自动化系统 数据:多指标、多维度的海量数据采集 • 每周计算3.5亿的QQ用户,500多个指标,全面覆盖用户的腾讯平台数据 模型:在用户各生命周期进行预测与预警 • 建立预测、预警以及用户群特征分析模型,涵盖用户各个生命周期阶段 15% 4X 0.4% 22% 喜欢漂亮的东西 尤其是装扮类的 例如花藤;兴趣 广泛,比较博爱: 活跃于多种活动; 喜欢购买新颖和 有吸引力的东西。 年龄比较年轻, 朋友数量和大多 数用户相当 装扮爱好者 心理需求 细分规模 百分比 转化率是平 均数的倍数 (转化率) 价值 百分比 18% 2X 0.2% 15% 喜欢在说说日志 上表达观点,也 喜欢在自己和朋 友页面上分享、 发表,和在别人 的页面上评论; 时刻都要跟朋友 连在一起,手机 功能活跃;不太 关心相册。这个 人群有很多朋友 作家 5% 8X 0.8% 12% 非常活跃的用户, 而且变的越来越 活跃。几乎活跃 于所有基础功能; 也比较喜欢买红 钻,对绿钻,蓝 钻和黑钻等不感 兴趣。 这个客户 群比较年轻,有 很多QQ好友 QQ整体活跃 27% 3X 0.3% 28% 他们喜欢互动娱乐, 愿意为此花钱; 最近活跃次数是越 来越高的,但是不 大使用Qzone基础 功能,对他们而言, 有趣的游戏是关键。 他们往往比一般用 户年龄大,朋友较 少,男性居多 APP付费 26% 1X 0.1% 10% 总体活跃度低。 基础活跃最近8 周呈下行趋势; QQ账户里还有 余额。这部分人 年龄较大。 沉默用户 2% 7X 0.7% 5% 拥有3个钻以上; 喜欢在第三方游 戏或者应用上花 钱,但对活动有 特别偏好:仅在 装扮和音乐盒等 少数产品上活跃。 该人群男性比较 多 钻族收集群 7% 3X 0.3% 8% 非常喜爱相册, 尤其是上传照片; 对游戏/应用不感 兴趣,对装扮也 不感兴趣。他们 有时候自己写写 日志,他们喜欢 作为客户看别人 的Qzone。这群 人一般Q龄较长, 朋友较多,相对 年龄较大 相册狂热者 应用:搭建CLM自动化系统 • 实现用户信息采集、数学模型部署、活动精准投放、活动效果评估的全面自动 化,为用户提供及时准确的个性化服务,同时提高生产效率 用户信息采集 5500台服务器 总存储突破76PB 日均计算超过5PB 腾讯大数据计算平台 数学模型部署 潜在用户预测 流失用户预警 用户特征细分 多样化数学模型 活动精准投放 丰富的触达渠道 QQtips弹窗 QQ邮件 QQ空间广告位 活动效果监控 科学的试点和评估方案 模型、渠道、活动等, 多维度评估对比 自动化报表监控系统 大数据应用畅想 幸福指数与舆情监控 中国城镇化进程研究 个人征信 大数据应用畅想一:幸福指数 • 关注QQ用户幸福指数,做中国网民生活状态和社会运行状态的“睛雨表”。 分析用户发表文本内容 积极情绪/消极情绪 分析用户消费记录 经济水平与生活状态 分析用户关系连接 人际关系与社会形态 从互联网到现实世界 大数据应用畅想二:舆情监控 • 通过对用户行为数据系统性的收集与分析,可以全面了解民众对民生问题的 诉求,并能对突发事件进行及时监控与预警。 XX市车牌要 要摇号了 反对摇号 不支持摇号啊 社会 事件 数据 采集 买车都要排队了 QQ空间状态 腾讯微博发言 门户网站评论 观点 汇总 得出 结论 60%的人对购车限号持反 对意见,其中以18-25岁 的男性为主。 … … 大数据应用畅想三:中国城镇化进程研究 通过LBS计算人口常住地 例行统计各地的常住人口 建立模型推算城镇化进程 • 通过QQ用户LBS轨迹的变化跟踪计算,从人口迁移的角度看评估城镇化发展 的动力——包括乡村的推力和城市的拉力。 1 2 4 跟踪研究各时间切片变化3 2014年 2024年 大数据应用畅想四:个人征信 传统型个人征信数据 • 个人基础信息:身份, 婚姻,居住,职业 • 银行信息:各个银行 的所有贷款数据、信 用卡数据; • 公用事业费用数据: 社保、住房公积金、 环保、养路费; • 其他事业单位数据: 工商局,交通局等。 • 传统型个人征信基础数据 • 腾讯网上消费数据 • 腾讯社交网络数据 腾讯新型个人征信数据 • 在传统个人征信的基础数据上,增加结合腾讯大数据,包含社交数据,消费 数据,地理位置数据,社交评论数据等,形成个人征信综合评分系统。 传统个人 征信数据 腾讯消费 社交网络 用户ID映射 统计分析 社团挖掘及节 点影响力分析 个人社交信用及影响力 • 亲戚、同学、同事社团的信用 • 用户在社团的重要度 个人网上消费力 • 腾讯网上消费力 个人传统信用 • 户口/社保信息 • 外部银行数据 个 人 征 信 综 合 评 分 系 统 谢谢聆听,敬请指导 Thank youBy 腾讯社交网络事业群/数据中心
还剩22页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 8 金币 [ 分享pdf获得金币 ] 1 人已下载

下载pdf

pdf贡献者

ng42

贡献于2015-02-18

下载需要 8 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf