外卖商家排序的算法演进

2020-02-27 246浏览

  • 1.外卖商家排序的算法演进 温赟 美团外卖
  • 2.外卖商家排序的算法演进 温赟 wenyun@meituan.com
  • 3.内容概览 • 外卖行业发展简介 • 外卖与团购的异同 • 外卖商家排序的技术演进 • 外卖商家排序的算法挑战与应对 • 小结
  • 4.外卖行业发展简介
  • 5.外卖⾏行业发展简介 2013.12 杭州・淘点 点 1993.8 常州・丽华 快餐 2016.1 2014.11.9 去年餐饮行 业收入突破 三万亿 美团外卖 北京・美团 外卖 单天百万单 2009.4 2014.5 2015.12.20 上海闵 行・饿了么 北京・百度 外卖 美团外卖 单天三百万 单
  • 6.外卖⾏行业发展简介 来源:艾瑞网 2015年中国外卖O2O行业发展报告
  • 7.外卖与团购的异同
  • 8.外卖与团购的异同 • 团购应用、网站 • 线上支付 • 低价活动 外卖 • 商家套餐 • 到店消费 引流 支付 就餐 • 外卖应用 • 低价活动 • 线上支付 • 自助点餐 • 等待配送 团购
  • 9.外卖与团购的异同 • 移动化 • 本地化 • 场景化 • 时间刚性 • 资源约束
  • 10.移动化 美团团购 移动端交易占比 美团外卖 移动端交易占比 100 100 90 90 80 80 70 70 60 60 50 50 40 40 30 30 20 20 10 10 0 0 2011 2012 2013 百分比 2014 2015 2013 2014 百分比 2015
  • 11.本地化 美团外卖各品类订单距离分布占比图 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 0 1km 1 2km 2 3km 3 4km 4 5km >5km
  • 12.场景化 美团外卖单天订单趋势图
  • 13.时间刚性
  • 14.资源约束 • 食材库存 • 厨房产能 • 配送运力 订餐 出餐 送餐
  • 15.外卖商家排序的技术演进
  • 16.产品形态
  • 17.技术框架 APP API H I Rank Service m A/B Testing Engine e kL1:a AL2:H - SL3:c i Sa P /
  • 18.在线服务 • A/B Testing • 做AA测试,坚持做 • 重视抽样误差 • 关注时间周期效应
  • 19.在线服务 • 插件化策略模块 • 模块分解可读性 v.s. 代码性能优化 • 重视接口约束合约 • 关注插件链的前后依赖
  • 20.在线服务 • 调试系统 • 结果的可解释性 • 业务、产品的协同
  • 21.离线流程 • 流量清洗 • 抓取流量 • 无效加载 最后点击/下单 skip above +2
  • 22.离线流程 • 特征矩阵 用户-商 家 • • • • • • • • P-基本信息 P-转化率 P-优惠活动 P-用户评价 P-热门信息 P-竞对信息 P-配送信息 P-服务质量 商家 • • • • • • 用户 UP-浏览行为 UP-点击行为 UP-成单行为 UP-加购行为 UP-评论行为 UP-收藏行为 • • • • • U-人口统计 U-品类偏好 U-购买力 U-优惠偏好 U-上下文信息
  • 23.离线流程 • GBDT——机器学习模型Startup • Decision Tree 简单贪婪 • Bagging 民主智慧 • Boosting 知错就改 • Shrinkage 小步快跑 • 非线性模型 & 特征选择功能
  • 24.效果⾥里程碑 • 时段特征交叉 • 特征工程 • 按照小时数hour划分 用户行为数据,取前后 n个小时数据进行衰减 后线性加权 • 按照星期数weekday 划分用户行为数据,按 照不同的相似度关系衰 减后线性加权 • 问题 • 商家扩展新的营业时段
  • 25.效果⾥里程碑 • 距离特征交叉 • 特征工程 • 按照距离区间分段确定转 化率基准,供平滑参考 • 按照GeoHash划分区域 网格,取上下前后左右共 计9个方格确认区域用户 行为热度数据 • 问题 • 计算和存储开销明显增大
  • 26.效果⾥里程碑 • CTR还是ROI • 基于用户-商家预测下单金额的重排序 成交额 DAU CTR CVR 平均下单次数 单均价
  • 27.外卖商家排序的算法挑战与应对
  • 28.排序稳定性 • 排序结果不稳定的成因 • 不同人——个性化策略 • 不同地点——LBS检索、商家配送范围 • 不同时间——时段、星期、场景 • 不同竞对营业情况——同行歇业 • 效果的稳定性 & 结果的可解释性
  • 29.特征实时化 • 商家实时库存 • 商家服务质量 • 商家活动情况 • 配送运力情况
  • 30.特征实时化
  • 31.跨端系统反馈 • 配送拥塞控制 • 配送实时负载指标 用户选择 高排名商 家下单 调整商家 排名 • 配送等待时间 • 配送预计送达时间 关联商家 订单配送 超时 商家接单、 配送派单 区域配送 运力紧张
  • 32.跨端系统反馈 • 商家库存售罄预测 • 单量预测 用户选择 高排名商 家下单 调整商家 排名 区域局部 单量短期 预测 商家接单、 配送派单 区域配送 实时负载
  • 33.Explore & Exploit • 外卖商家供给的演变
  • 34.Explore & Exploit • 外卖平台的基尼系数
  • 35.Explore & Exploit • 多来源数据融合解决冷启动 • 数据重合覆盖度 • 迁移学习的可信度 • 基于用户好奇心偏好的探索 • 专一 v.s. 尝鲜
  • 36.小结
  • 37.⼩小结 • 技术驱动的前提理解业务 • 做正确的事,不做容易的事 • 在正确的时间做正确的事 • 关注模型策略对数据分布的影响
  • 38.