阿里2B电商核心问题以及算法建模
2020-03-01 155浏览
- 1.阿里2B电商核心问题以及算法建模 【可发布】2019 QCon北京-深度学习在百度搜索中的工程实践-百度-曹皓.pdf 霍承富/晓惑 阿里巴巴-CBU技术部-新零售算法
- 2.阿里2B电商核心问题以及算法建模 【可发布】2019 QCon北京-深度学习在百度搜索中的工程实践-百度-曹皓.pdf 霍承富/晓惑 阿里巴巴-CBU技术部-新零售算法
- 3.电商核心问题 人 场 货 货 场 人 算法构建三位一体营销体系 问题定义: • 如何挖掘人的诉求? 如何表达场的心智? 如何圈选符合心智的商品? • 如何构建人货场的精准匹配机制?
- 4.算法建模 基础信息挖掘 市场牵引机制 • 人的表征 • 流量中控 • 货的画像 • 召回排序 • 场的图谱 • 组货推荐 实时数据服务平台
- 5.算法建模 —— 人的表征 表征:非明文标签,基于深度模型的Embedding Vector。 • DeepWalk • Node2Vector • I2I • U2I • U2U 问题:基于全局行为Item网络的Embedding Vector缺乏精细的个性化刻画能力。
- 6.算法建模 —— 人的表征 Opt1:上下文相关的Embedding Vector(个性化)。 n x FC n x FC Merge n x FC n x FC n x FC DSSM User + Query Online Input NN Model Training NN-Part Online Server NN-Part Offline Prediction U Vec Merge Q Vec I Vec SE Scoring
- 7.算法建模 —— 人的表征 Opt2:上下文相关+兴趣点演进的Embedding Vector。 Auxiliary Loss RNN n x FC Merge n x FC n x FC • • Attention • • DIN(Deep Interest Network) DIEN(Deep Interest Evolution Network) Feature Engineering Loss Function
- 8.算法建模 —— 货的画像 画像:产品、运营、商家可感知的明文标签,可理解、可运营、可执行。 新品 趋势品 时效 厂货 尖货 品牌 品质 低价段 价格 品类规划 爆品 尾货 高价段 • 价格机制:维护健康的价格区间,挖掘价格和转化的关系,建模价格竞争力。 • 销量预估:预估销量趋势,结合运营知识,定义生命周期。
- 9.算法建模 —— 货的画像 价格机制 价格合理性 单品历史比价 平台同款比价 下游同款比价 价格 雷达 折扣真实性 转化竞争力 可解释性:单调趋势 特 征 工 程 RELU
- 10.算法建模 —— 货的画像 GBDT/DNN销量预估 • 历史规则圈选召回/准确 57% • 算法预估圈选召回/准确 90%
- 11.算法建模 —— 场的图谱 图谱:关系链接,具备心智表达能力和推理能力。 Clustering 心智 选品 场 营销 文案 智能文案 场 场 场 场 场 场 场 Scene2Scene
- 12.算法建模 —— 场的图谱 心智选品:基于场景心智,构建差异性的Clustering选品算法体系 User • 搜索 Query • 行为特征 • 身份属性 知识图谱 • 场景抽象 • 实体关联 • 属性附庸 • 商品挂载 场景卡片 • 榜单:趋 势力 • 清单:价 格力 • 主题:身 份组货 • 锦囊:意 图挖掘
- 13.算法建模 —— 场的图谱 营销文案:满足不同业务场景对心智风格和文案长度的强诉求。(WWW 2019)
- 14.算法建模 —— 场的图谱 营销文案:Case展示 风格控制 • 输入端添加风格词的embedding和NER信息 • 风格词和输入词语共享embedding信息 长度控制 • 在输入端添加位置的embedding信息 场景:榜单Case展示
- 15.算法建模 基础信息挖掘 市场牵引机制 • 人的表征 • 流量中控 • 货的画像 • 召回排序 • 场的图谱 • 组货推荐 实时数据服务平台 15
- 16.算法建模 —— 流量中控 分时流量计划 与 分时流量调控 计划流量 10000 大促会场分流 实际 5000 个性化 0 会场效能 0 2 4 ↑ 搜索推荐机制 6 8 10 12 14 16 18 20 22 ↓ → 算法调控中枢 商家成长扶持 历史数据分析&建模 目标设置&预估检验 Organic & P4P 目标多场景分配 单场景目标调控 营销权益分发 消息 日志处理 红包优惠券 实时流式数据 历史批量数据 算法基础组件 相关性召回 转化率建模 个性化建模
- 17.算法建模 —— 流量中控 Organic & P4P:平衡广告营收和买家体验,最大化平台价值。
- 18.算法建模 —— 流量中控 权益分发:用户权益敏感度预估+权益金额决策分配 (不同的用户分发不同额度的权益,最大化业务目标) 分组背包MCKP 我的328领券 财神牛发券 红包雨下券 • M用户(M组) • N种额度权益(N物品) • P权益敏感概率 • W权益额度/权益预算
- 19.算法建模 —— 召回排序 Favorite DeepMatch I2I Cart SWING I2I Click C2I ABFS Basic Engine 2 U2C 1 Hot2I TPP Server User Feature iGraph 3 DIN Porsche PAI Offline Model Training WDL/DCN LR+GBDT RTP Ranking 4
- 20.算法建模 —— 召回排序 大促会场实时个性化:业务强诉求 • 会场商品实时圈选投放和下架 • 售罄商品实时下架 • 实时指标(销量/转化率/综合)排序 实时变更流 实时日志流 选品平台 投放位DB iGraph索引 C2I/S2I GBDT-ReRank 实时特征流 大促会场 +30% 实时个性化 • User * Item Hit统计特征 • Item统计特征 • 算法Join特征回传埋点 全量 U2X2I + Rank
- 21.算法建模 —— 组货推荐 业务场景 • 小B采购(e.g. 渔具商行) • 类C自购(e.g. 钓鱼套装) • 营销活动(e.g. 满减、搭配推荐促GMV) 运营方案 • 主营类目圈品 • 基于类目树组货 • 行业知识穷举 算法方案 • 用户行为网络图聚类 • 金额约束规划 • 行业知识约束规划
- 22.算法建模 —— 组货推荐 LPA:each node is initialized with unique label and at every iteration of the algorithm, each node adopts a label that a maximum number of its neighbors have. 图聚类(LPA) 主题类目约束 Note:抽象业务诉求,采用成熟的算法,并结合业务知识, 求解业务问题。
- 23.算法能力体系 • Tree-based Subgraph Convolutional Neural Networks for Top-N Recommender Systems, submitted, IJCAI 2019. • Automatic Generation of Pattern-controlled Product Description in E-commerce, accepted, WWW 2019. • User behavior sequence modeling to optimize ranking mechanism for E-commerce search, ICCIP 2017: 164-169.
- 24.算法能力体系 • Tree-based Subgraph Convolutional Neural Networks for Top-N Recommender Systems, submitted, IJCAI 2019. • Automatic Generation of Pattern-controlled Product Description in E-commerce, accepted, WWW 2019. • User behavior sequence modeling to optimize ranking mechanism for E-commerce search, ICCIP 2017: 164-169.
- 25.阿里2B电商核心问题以及算法建模