《大数据的发展脉络:见自己 见天地 见众生》 演讲人:吴甘沙 英特尔中国研究院

2020-03-01 209浏览

  • 1.大数据发展脉络 见自己,见天地,见众生 @吴甘沙 首席工程师,英特尔中国研究院 1
  • 2.科学技术革命的宏观规律 科技革命周期 第1次 机械化 经济波动周期 (康德拉季耶夫) 长波1 18世纪 第2次 电气化 长波2 19世纪 长波3 第3次 信息化„ 长波4 20世纪 大科技革命的下一波高潮呼之欲出 2 第3.5次? 第4次? 长波5 21世纪
  • 3.信息技术革命的小周期 智慧化 3 4 2 1 数字化 架构化 1950-1970 3 1970-1990 网络化 移动互联网 1990-2010+ 云计算 物联网 大数据 Something Big is Happening NOW
  • 4.大数据的应用模式 4
  • 5.见自己(个人) 1:1 Marketing Nanotargeting和Retargeting 5
  • 6.见天地 6
  • 7.见众生 Knowledge Graph Cancer Genomics 7
  • 8.截至2012年底,我国已有154个城 市提出建设智慧城市,41个地级以 上城市在“十二五”规划或政府工 作报告中正式提出建设智慧城市, 80%以上的二级城市明确提出建设 智慧城市的发展目标。可以说,智 慧城市已在中国遍地开花。 北京已全面启动 •将围绕城市智能运转、企业智能 运营、生活智能便捷、政府智能 服务等方面,全面启动“智慧城 市”建设工程。 黑龙江 吉林 辽宁 北京 内蒙古 河北 环渤海 20.3% 天津 山东 甘肃 江苏 陕西 湖北 安徽 重庆 四川 规模 星级 水平 区域IT投资占比 带动的IT投资(单位长度10亿元) 8 上海将建设国际型智慧城市 •将在2013年底达到“基础 设施能级跃升、示范带动效 应突出、重点应用效能明显、 关键技术取得突破、相关产 业国际可比、信息安全总体 可控”的目标。 浙江 长三角 26.1% 湖南 福建 图例 智慧城市投资规模分布图 上海 南京等重点铺开 •由政府指导、电信运营商 建设 •围绕物联网技术,打造江 苏智慧城市13个市分站。 广东 珠三角 17.1% 广州着力建设“智慧树” 南 •建设“树”型智慧城市框 海 架,囊括交通、信息服务、 电子政务、城市综合管理、 诸 医疗、社区、市民卡等各 岛 方面。 Courtesy of 张涛 CCID
  • 9.DRAGON时代的软件定义城市 D Data driven R Resilient A Automated G Gamified O Open N Networked 9
  • 10.通往DRAGON时代的必经之路 新的大数据思维方式和方法学 新的大数据生态系统和服务模式 新的大数据采集、存储、管理、计算和安全技术 10
  • 11.快 杂 大 大数据的新思维(一) 11
  • 12.大数据的新方法学(一) 数据极大丰富前提下的新分析思维和技术 采样数据全集数据 大数据+小算法 +上下文+知识积累 多数据源的整合 基于主观因果假设  机械穷举相关关系 12 描述性分析  预测性 和处方性分析 实时性 > 绝对的精确性
  • 13.智能交通:多数据源的集成 浮动车GPS:20M/day出租车运营数据: 1M/day 交通卡:19M/day 视频/图像数据 和元数据: 100s of TB/day 高速路收费数据: 0.5M/day 社交网络 情感分析 GIS数据 手机位置信息: 18M/day 供水系统 13 居民调查: 80000户 智能电网 睡眠质量 部分数据来源: Beijing TOCC
  • 14.大价 值 14 大数据的新思维(二)
  • 15.大数据的新方法学(二) 数据资产、数据产品和社会化分析服务的货币化 数据民主化和开放数据 数据市场和数据定价 社会化分析服务 15
  • 16.数据拥有者 大数据的 生态系统 数据 数据技术公司 数据产品 和服务 16 数据中介 服务 数据中介
  • 17.智慧城市公共数据和服务平台 城市应用商店 数据交易市场 城市操作系统 17
  • 18.大数据的技术栈 数据分析 数据处理和管理 计算、互联和存储 18 数据权利 可视化 编程和管理工具 应用和服务
  • 19.大数据系统的设计权衡 大体量 城市计算 惰性数据的即席查询 批量计算 基于采样的查询 增量计算 内存计算 精确性 Little data (个人计算) 19 实时性 流计算
  • 20.Intel参与和资助的大数据计算范式 Spa rkS tre am Spa rkG ra ph Apache Mesos 20
  • 21.谁拥有数据?谁能用数据?谁在用数据? 管理边界在哪里? 社交媒 体数据 道路 摄像头 行车记录仪 电子病历 道路状况数据库 21
  • 22.数据的拥有权、隐私和使用知情权 • 保障拥有权:法律与技术缺一不可 • 隐私与服务的辩证法 – 隐私数据的使用完全失控 • 数据拥有者对数据的使用可审计 – – – – – – 22 数据有几份拷贝 分别在哪里 谁在使用它 数据转换中“血统”的存续 产生了多少价值 利润分享模型(数据GPL)
  • 23.通往DRAGON时代的必经之路 新的大数据思维方式和方法学 新的大数据生态系统和服务模式 新的大数据采集、存储、管理、计算和安全技术 23
  • 24.敬谢聆听 24