吴金龙_婚恋交友中的用户推荐系统


突破阻爱·为自己 突破阻爱·为自己 @InfoQ infoqchina 突破阻爱·为自己 婚恋交友中的 用户推荐系统 吴金龙 佳缘技术研发中心 2014年04月25日 突破阻爱·为自己 关于我 • 吴金龙 – 新浪微博:@breezedeus – 世纪佳缘技术研发中心 2005 2010 2011 2014 北京大学计算数学专业 博士研究方向:协同过滤推荐算法 世纪佳缘 研发中心:数据相关 阿里云计算 PC & Mobile输入法开发 突破阻爱·为自己 大纲 佳缘、研发中心 背景介绍 三大系统:运营、个性化、组合 推荐系统 五大特点、二项计划 总结 突破阻爱·为自己 背景简介 佳缘、研发中心 突破阻爱·为自己 佳缘的信件模式:灵活的按效果付费 7 • 国外婚恋交友网站:先付费 • 世纪佳缘:后付费 突破阻爱·为自己 佳缘的信件模式:灵活的按效果付费 8 突破阻爱·为自己 为什么佳缘不免费? 9 为什么 不 免费 垂直型网 站,用户 目的明确 用户的生 命周期短 用户获取 成本高 付费,让 交友环境 更加纯净 目前没有 其他更好 模式 突破阻爱·为自己 2万+ 2.4% 1万-2万 3.4% 5千-1万 8.8% 女30% 超一亿注册会员 性别 年龄 教育背景 月收入 男70% 18-23 41.7% 45+ 1.7% 36-45 7.6% 31-35 8.8% 高中及以下 32.4% 硕士及以上 3.2% <2000 13.6% 2千-5千 67.9% 24-30 39.2% 大学 64.5% 地区分布 会员多 会员少 会员属性 突破阻爱·为自己 研发中心的工作范畴:数据相关&新技术探索 11 数据接口 非个性化 推荐 个性化推 荐 魅力会员 人脸检索 数据产品 用户推荐 网警系统 人脸搜索 数据运营与监控 新产品调 研统计 产品效果 统计 产品改进 支持 分布式存储与计算系统 Hadoop /Hive Mysql/ MongoDB Memcached /Redis Storm 突破阻爱·为自己 三大用户推荐系统 运营、个性化、组合 突破阻爱·为自己 婚恋交友中的交互流程 13 为男用户展示 女性 男用户点击 查看异性资料 男用户发信 回信 付费查看此信 件具体内容 女收信用户上 线后查看邮箱 突破阻爱·为自己 用户推荐系统的一般流程 14 候选产生 模块 排序模块 所有用户 候选用户 最终结果 排序后用户 过滤模块 突破阻爱·为自己 系统一:运营推荐系统 15 按照择偶条件匹 配、资源分配等 原则抽取候选集 按照收益最大化 等原则排序候选 集 所有用户 候选用户 最终结果 排序后用户 过滤已联系过的、 黑名单等候选 • 目标:最大化公司的(短期和长期)收益 – 提高人均付费金额 – 提升付费人数 突破阻爱·为自己 运营推荐系统:候选产生模块 按照择偶条件匹 配、资源分配等 原则抽取候选集 带约束的动态资源分配问题 资 源 需 求 方 资 源 提 供 方 突破阻爱·为自己 运营推荐系统:排序模块 按照收益最大化 等原则排序候选 集 最大化用户的看信/收益效率 看信效率:单位 时间内的看信量 让愿意看信的用户 收到更多信 看的信越多, 收信就越多 缩短发信到看信 的时间周期 登录越频繁, 收信就越多 突破阻爱·为自己 系统二:个性化推荐系统 18 抽取用户可能感 兴趣的异性作为 候选集 依据用户的历史 数据对候选集重 排序 所有用户 候选用户 最终结果 排序后用户 • 提升用户满意度 过滤不满足择偶 条件、已联系过、 黑名单等候选 突破阻爱·为自己 个性化推荐系统的架构 19 线下系统 Log 监控系统 数据模型系统 前 端 展 示 数据流动方向 算法支持 线上系统 突破阻爱·为自己 个性化推荐系统:候选产生和排序模块 使用规则控制各类运营用户的收信情况 引入信件收益尝试最大化整体收益 抽取用户可能感 兴趣的异性作为 候选集 Offline/Online item-based kNN 依据用户的历史 数据对候选集重 排序 Logistic Regression / Latent Factor 问题 无法 融合运 营需求 突破阻爱·为自己 个性化推荐系统的评价指标演进 发/收信 看信 正向回信 收益 突破阻爱·为自己 系统三:组合推荐系统 22 以满足运营需求 为准则抽取候选 集 依据用户的历史 数据对候选集重 排序 所有用户 候选用户 最终结果 排序后用户 • 在满足运营需求的情况下,提升用户体验 过滤不满足择偶 条件、已联系过、 黑名单等候选 突破阻爱·为自己 组合推荐中分解成多个转化率预测问题 23 为男用户展示 女性 男用户点击 查看异性资料 男用户发信 回信 付费查看此信 件具体内容 女收信用户上 线后查看邮箱 퐂퐯퐑1 퐂퐯퐑4 퐂퐯퐑2 퐂퐯퐑3 突破阻爱·为自己 组合推荐系统 发信随意 发信认真 无回信 新用户 用户群组 看信->回信 发信->看信 点击->发信 展示->点击 • 针对不同的用户群,使用不同的组合策略 突破阻爱·为自己 总结 五大特点、二项计划 突破阻爱·为自己 特点一:地域性强 • 只找本地人:小地区内候选集合很小 – 如何扩展择偶条件 地区分布 会员多 会员少 突破阻爱·为自己 特点二:可逆性 • 两边都是人:需要考虑到双方感受 突破阻爱·为自己 特点三:资源不可复制 • 一夫一妻制:资源不可重复使用 突破阻爱·为自己 特点四:转化链很长 • 信只有被看了,才有价值 为男用户展示 女性 男用户点击 查看异性资料 男用户发信 回信 付费查看此信 件具体内容 女收信用户上 线后查看邮箱 突破阻爱·为自己 特点五:多指标博弈 • 公司利益 vs. 用户利益 • 短期利益 vs. 长期利益 突破阻爱·为自己 未来计划一:各产品之间交叉使用数据 产品 用户推荐 魅力会员 网警查杀 产品推荐 知识库 魅力会员 网警查杀 产品推荐 图片检索 31 • 多数据源融合 突破阻爱·为自己 未来计划二:探索新的推荐元素 • 推荐理由 – 为什么推荐她:因为你离异,她也离异? • 人脸检索技术 突破阻爱· 为自己 突破阻爱·为自己 特别感谢合作伙伴 突破阻爱·为自己 特别感谢媒体伙伴(部分)
还剩34页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 3 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

mmmu7

贡献于2014-05-29

下载需要 3 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf