天云大数据 邢建伟 - 人工智能行业应用

2020-02-27 60浏览

  • 1.人工智能行业应用 —Fintech 天云大数据: 邢建伟
  • 2.FinTech 规则流程驱动到智能数据驱动 IT DT 机器的角色,从快速思维到智能思维 2017/10/22
  • 3.在过去的几十年里,计算机被广泛用于完成自动化任务,后 者往往是被清晰的规则和算法描述的。如今,机器学习技术 允许我们在难以精确描述规则的边界内完成同样的任务。 - 来源自亚马逊创始人杰夫·贝索斯(Jeff Bezos)2017年度致股东的公开信。
  • 4.350年前,科学巨人牛顿用三个简约表达式,揭示了自然规律,客观抽象了传统参照系中的世界。
  • 5.某互金理财产品的营销获客传播的复杂网络 某保险公司的代理人成功销售的获客网络
  • 6.人工智能依靠质朴的数学和超强的计算能力, 还原了世界的复杂性。 如何用RGB像素色差等信号 体系描述图片内容? 如何描述棋风,大局观? 如何制订动态防范的欺诈规则? 深度学习的特征建立过程,就是协助我们对复杂问题描述的精确量化。
  • 7.笛卡尔为之后的牛顿准备了一个坐标系,使F=ma的推演成为经典。
  • 8.         –žž™ bk Uw‰t –žž– 2oD=B] BE –ž™ …Œ2#0I+ –žžœ ¢Ÿ¥Mn;z¡¬··¼£¬¸¶¬·µ» –žž– œ•(ƒyH/4{Ž[½< 3U ¾ –ž˜ !€@caL¦¯°¬¸­µº¹aL‘ —••š xJ‚>w“B“mwjv}  —••š –” ^$U@cŽ, xJi \CiŠ –ž grF'jvaL —•–– ¢Ÿ¥«¬¹¸µ´F' :R½ „¾lV —•–• ›•BUŽ, h,T YŽh,u8Q"S-r  –žž– ˆ%sdaL —•–™ ¡µµ°¤¯¦¯¹*¢¤©ª¨ ~ b& _K5 —•–• –š•G`U)O–•••‹VbU pqA?6 –žž ZWeifaL —•–š xJ®¯¯¶³±´®N9K5~ b&_K5 —•–˜ š•X †7‡~N9U 1P.A?ˆ –žž— §“²¯¬·´±´°aL   
  • 9.数据湖—数据融合方案
  • 10.数据湖-元数据管理 l 我要的数据有哪些? l 我要的数据在哪里? 数据库/表/字段 存放目录/文件名 如果要把所有的数据的元数据定义 全部梳理出来,知道元数据的含义, 将会面临巨大的工作量。 面临数千甚至数万的元数据信息的治理 文件 文件 文件 数据表 数据表 数据表 数据表 数据表 数据表 文件 数据表 文件 数据表 数据表 数据表 文件 数据表 数据表 数据源 数据源 数据源 数据源 。。。
  • 11.n 为每一张表和每一个字段赋予标签含义,通过标签索引相关字段,未来通过标签检 索,敏捷定位到所需字段项以及字段数据。 票据融资 融资租赁 融资 贸易融资
  • 12.将数千张表字段构建关联起来,形成网 络关联图谱,探查元数据逻辑联系,实 现对数据结构的透彻了解和灵活掌控。
  • 13.申请进件的关联特征 通过分析银行信用卡的“通过信用卡”信息和“欺诈信用卡”信 息,找到注册信息中包含的关系,同时对关系信息统计分析,计 算相关指标,然后通过统计分析的结果构建社交网络,最终支撑 欺诈用户发现。 深度学习网络 基础金融属性 年龄 年收入 学历 职位 区域 职业 第三方信用卡 。。。 备注
  • 14.数据转换 社交特征抽取 随机森林 梯度提升 深度学习 串联模式 结合原有审批流程 相关特征 抽取 MaximAI 平台建模 结合业务 落地实施 客户数据 清洗处理 BDCN构 建社交网 络 建模结果 分析 客户基本申请信息 客户社交属性信息 抽取一阶度、 一阶欺诈比等特征 AUC/KS等 评估模型准确性
  • 15.原始 特征 网络 特征 • 年龄 • 年收入 • 学历(数值化) • 职位(数值化) • 手机号 • 单位电话 • 电子邮箱 • …… 建立复杂网络 • 一阶度,一阶欺诈 数,一阶欺诈比 • 二阶度,二阶欺诈 数,二阶欺诈比 • 最短路径(距离欺 诈节点) • …… 0.70 仅使用申请人 原始基础信息 的AUC值 0.93 加入网络特征 属性后的AUC 值
  • 16.
  • 17.
  • 18.逻辑回归 梯度提升 • 传统的行为评分模型主要使用逻辑回归模型 • 使用梯度提升模型能提升模型的性能
  • 19.数据转换 随机森林 梯度提升 深度学习 调额 风险监控 相关特征 抽取 MaximAI 平台建模 结合业务 落地实施 客户数据 清洗处理 MaximAI 特征选择 建模结果 分析 客户静态申请信息 客户动态行为信息 静态属性信息 动态属性信息 AUC/KS等 评估模型准确性
  • 20.原始无变换特征: Ø 客户基本属性 Ø 原始行为数据 Ø 变换行为数据 Ø 人行信息数据 模型: l 梯度提升 l 随机森林 l 深度学习 0.86 使用逻辑回归 模型的AUC值 0.91 使用梯度提升 模型的AUC值
  • 21.业务规则 营收 拨打 话术 策略 规则 策略 客户大数 据分析 风险评分 行为 习惯 分类: 优质、恶意客户 历史 消费 还款 信息 分类名单、 话术库、拨打 接触策略 拨打接触 友好 提醒 多轮 施压 分期 化解 后台 行方 业务系统 数据平台 大数据处理平台 IVR自动 催收模块 拨打结果 数据 催收外呼 接入平台 友好提醒保持客户 满意度,客户不同 情况下拨打策略 引导客户按键确 认,识别及办理。 结合客户反馈、 真实识别拨打实 况(未接、挂断、 客户按键)
  • 22.贷中 数据 催收 情况 账单 信息 进件 信息 核心系 统账户 数据 人行 信息 信 用 卡 审批 生 命 信息 周 期 管 理 各业务系统 风险一体化 实时、批量数据交互传输 数据统一 审批 催收 事件通知 开放系统 事件处理 事件记录、 跟踪、预警 客服系统 其他 批量 指令通知 指令通知 BDRT 决策系统 模型孵化 事件及处理策略 定义 策略 更新 MaximAI平台 事件 决策 BDCN平台 V+TRAID PRM 主机系统 决策 策略处理指令 处理策略 TRAID 策略 策略更新
  • 23.A B C 融合 lgorithm igdata loud MaximAI企业级人工智能平台产品 在线 数据 MaximAI分 布式人工智 能平台 计算 算法 能力 科学 融合计算能力: 从并行计算到分布式计算的创新 Scala分布式程序的算法代码重构,充分发挥 SPARC/Alluxia内存计算能力。 融合在线数据: 从流程驱动到数据驱动的创新 数据无需在生产系统和挖掘系统间抽取离线, 实时的全量数据建模 融合业务价值: 从零到一的创新 从业务问题定义到前沿算法模型反复迭代, 最终体现商业价值化的模型,可以在平台中 发布、分享和继承。业务创新可以规模化复 制。
  • 24.MaximAI企业级人工智能平台产品 (续) FreeCoding Subscripution 采用完全界面化的操作 用户无需任何编程背景, 也可轻松使用数据挖掘技术 通过REST接口整合、订阅算 法包和数据分析模版 面向高阶用户,自主编写 Spark Scala,R,Python代码 向导服务 订阅服务 轻AI的前沿算法民主化 精致产业
  • 25.移动互联网前夜 开放平台应用开发 通讯科技巨头专利科技
  • 26.