美图数据统计分析平台架构与实现
2020-02-27 59浏览
- 1.卢荣斌 2017.07.30
- 2.01 与技 02 美 平台架 03 未来规划 撞
- 3.0 1 统计业务与技术碰撞 业务发展与技术迭代的过程 «
- 4.以美拍为例,初期统计业务的特点 1 2 3 体量小 统计需求较少 快速响应 初期产品快速迭代,要求数据指 标响应跟上迭代速度
- 5.Rsync Crontab 通过rsync⽅式收集到⼀个节点 线上配置定时任务 初期实现简单快速 Shell & Php MySQL 采用快速简单的脚本语⾔实现统 计 数据简单存放到MySQL供展示 查询 «
- 6.用户量爆发 数据量日渐增⼤ 统计需求膨胀 存储容量 VS 计算 脚本维护
- 7.Hive Java & Cronta b HDFS MySQL • 实现采集系统 • 搭建Hadoop分布式存储与计算 • 搭建基于Hive数据仓库 • Java替换Shell等脚本语⾔ «
- 8.Query DBStore Aggregato r HiveQuery MySQLQuery MySQLDBStor e
- 9.q q • ⼀定程度减少了编码量,但还 是有⼀定的编码成本 • q q «
- 10.0 2 统计平台架构实现 构建平台,提供服务。 «
- 11.提供平台,解耦业务依赖 App
- 12.«
- 13.- JobManage r Scheduler JobExecutor
- 14.Web JobMeta Statistics Function data source Web JobManage r data store Task dependency aggregator Filter
- 15.«
- 16.流程、插件化 JobMeta JobExecutor Query Hive Filter Aggregator Data Store MySQL
- 17.Scheduler JobExecutor Job Meta JobManager Query HivePlugin HbasePlugin Aggregator Filter Data Store MySQLPlugin MongoPlugin FilePlugin HDFSPlugin
- 18.丰富功能,解决更多业务场景 HQL Hive MongoDB HDFS MySQL File Bitmap MySQL TopN UDF
- 19.API API Hbase MySQL Mongo «
- 20.对接内部服务统⼀认证授权中⼼ CA API Hbase MySQL access token Mongo acce ss to ken
- 21.- CA JobManager Scheduler JobExecuto r Plugins DB API
- 22.0 3 未来规划 «
- 23.分布式调度 OLAP 支持任务与资源的分布式调度 针对数据分析⼈员的即席查询 数据可视化 实时统计 统⼀可视化平台 能比较快速便捷地接⼊实时统计
- 24.Thanks Q&A