美团网 推荐与个性化


如何做好 本地生活服务推荐 美团网 推荐与个性化 沈国阳 Outline •  美团的⼏个重要推荐产品 •  美团推荐产品的目标 •  美团推荐系统的整体框架 •  比较有特⾊的⼯作 – 基于地理位置的冷启动 – 排序的关键⼯作 – Interleaving v.s. abtest – Online Learning 美团的几个重要推荐产品 美团推荐 产品 的目标 •  快速找到所需 – 高品质低价格(下单 , 消费后能够给出好评 ) – 品类丰富 •  推荐的核心指标 – 下单 率 – 多样性 美团推荐系统框架 美团平台的特点 •  冷启动用户占比高 •  移动终端占比高 •  持券时间短 •  持券距离近 冷启动用户占比高 不同品类的持券时间分布 0.00% 10.00% 20.00% 30.00% 40.00% 50.00% 60.00% 0hr 3hr 6hr 9hr 12hr 15hr 18hr 21hr day:1 day:3-3.5 day:5-10 电影 酒店 美发/美容/美体 美食 摄影写真 生活服务 休闲娱乐 运动健身 不同城市持券距离 0 500 1000 1500 2000 2500 3000 3500 4000 4500 北 京 上 海 广 州 深 圳 天 津 西 安 福 州 重 庆 杭 州 宁 波 无 锡 南 京 合 肥 武 汉 成 都 美容美发 休闲娱乐 生活服务 运动健身 摄影写真 电影 酒店 美食 地理位置挖掘 •  地理位置特征 – 实时地理位置 – 周末 /平时常去地理位置 – 常去消费地 – 工作地 – 居住地 •  地理位置的粒度 – 商圈 基于地理位置的冷启动 •  本地人热单 地理位置+时间上下文 •  计算时段之间的相似度 – sim(h[i],h[j]) •  把相似时段的统计信息根据相似度加权统 计到该时段中 – newsum(h[i],item,loc) = sum(h[i],item,loc) +∑ sim(h[i],h[j]) * sum(h[j],item,loc) 美团排序的关键工作 •  模型及建模 – Additive Groves – 展示 , 点击 , 下单 •  样本采样及 label处理 – 点击 :下单=1:10 •  去除 position bias -位置 p的平均下单率 cvr_p -item i在 p位置的表现下单率 i_cvr_p -item i的实际下单率 -这个值用来做特征 (i_cvr_0+i_cvr_1+…)/(cvr_0+cvr_1+…) 美团排序的关键工作 •  特征工程 – 上下文特征 : 时间 , 地理位置 , 天气 , 温度等 – Item特征 : 价格 , 销量 , 评分 – 用户特征 : 年龄 , 性别 , 品类偏好 , 价格偏好 等 Interleaving v.s. abtest •  abtest – 效果对比稳定性较差 , 一般需要一周的数据来 验证效果 – 可以获得定量数据 •  Interleaving – 需要流量小 , 灵敏度高 – 只能获得定性结论 Interleaving v.s. abtest •  Interleaving的列表生成方式 Interleaving v.s. abtest •  Interleaving的评估方法 wins(A) = 40%, wins(B) = 30%, tie = 30% Result = 5% , A > B Online Learning •  互联网上的机器学习 vs 与针对静态物品的 机器学习 •  用户群体的行为是在不断变化的 – 季节 – 天气 , 空气质量 – 社会潮流 – 电视节目 – 对算法的认知和反馈
还剩17页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 5 金币 [ 分享pdf获得金币 ] 1 人已下载

下载pdf

pdf贡献者

wlpwlfs

贡献于2015-10-20

下载需要 5 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf