人工智能中的连接主义 邓志东 清华大学

2020-03-01 288浏览

  • 1.2017 ArchSummit全球架构师峰会 人工智能中的连接主义 邓志东教授/博士生导师 2017.12.08 ž 北京 清华大学智能技术与系统国家重点实验室 清华信息科学与技术国家实验室(筹) 清华大学计算机科学与技术系 michael@tsinghua.edu.cn
  • 2.
  • 3.
  • 4.
  • 5.提纲 OUTLINES 1、AI的本质 2、连接主义的深度神经网络取得突破性进展 3、深度强化学习:连接主义与行为主义的结合 4、 与符号主义的重新融合代表了AI的未来
  • 6.提纲 OUTLINES 1、AI的本质 2、连接主义的深度神经网络取得突破性进展 3、深度强化学习:连接主义与行为主义的结合 4、 与符号主义的重新融合代表了AI的未来
  • 7.1、AI的本质 连接主义
  • 8.1、AI的本质 行为主义
  • 9.1、AI的本质 符号主义
  • 10.提纲 OUTLINES 1、AI的本质 2、连接主义的深度神经网络取得突破性进展 3、深度强化学习:连接主义与行为主义的结合 4、 与符号主义的重新融合代表了AI的未来
  • 11.2、连接主义的深度神经网络取得突破性进展 弱人工智能:深度卷积神经网络+深度强化学习
  • 12.人工智能自动驾驶 Google Waymo 将激光雷达的成本削减了90%以上,2017年10月已在 美国凤凰城Chandler 镇100平方英里范围内,对500辆克莱斯勒插电式 混合动力L4自动驾驶汽车进行社会公测,这是Waymo自动驾驶商业化 落地的前奏,首次实现了无驾驶员的公测无人驾驶出租车。 无安全驾驶员了!
  • 13.人工智能自动驾驶 特斯拉Autopilot 2.0: 目前特斯拉的量产车上均已安装Autopilot 1.0或2.0硬件系统,其 自动驾驶功能,可通过OTA(空中下载)进行从L2到L4+的软件 升级; 2017年年底之前以完全自动驾驶模式从洛杉矶开往纽约
  • 14.人工智能自动驾驶 大范围无人驾驶出租车试运行: Uber 2016年9月14日在美国匹兹堡市推出城区大范围无人驾驶 出租车免费载客服务并试运行;先期已测试近2年
  • 15.人工智能自动驾驶 2021年⎯无人驾驶汽车的产业元年: Google Waymo、沃尔沃、福特、宝马、百度、英特尔等全球近 20家企业均已宣称,4年后的2021年前后将会是无人驾驶汽车的 产业元年,部分SAE L4将实现量产。
  • 16.ILSVRC 人工智能视觉物体识别 AlexNet (Krizhevski et al., 2012) 15.3% top-5 error OverFeat (Sermanet et al., 2013) 13.8% VGG Net (Simonyan et al., 2014) 7.3% GoogLeNet (Szegedy et al., 2014) 6.6% Human (Russakovsky et al., 2014) 5.1% Feb 6, 2015, Microsoft 4.94% Feb 11, 2015, Google 4.82% Dec 11, 2015, Google 3.58% Dec 10, 2015, Microsoft 3.57% Feb 23, 2016, Google 3.08% Sep 26, 2016, Trimps-Soushen 2.99% April 2017, Qihoo 360 2.77% ImageNet ILSVRC 1,000 Deep CNN Very Deep Learning 极深度学习/1202层 15M Images 22k Categories
  • 17.人工智能人脸识别 LFW 2017年 1. 阅面科技 ReadSense 99.82%; 2. 平安PingAn AI Lab 99.80%; 3. 腾讯YouTu Lab 99.80%
  • 18.人工智能人脸识别 刷脸支付/刷脸闸机 1 6 3:2 “ ”
  • 19.人工智能相机 谷歌Clips AI相机 2017 10 5 Google Clips /
  • 20.人工智能无人零售店 阿里无人超市“淘咖啡”
  • 21.人工智能物体检测 DCNN (ICCV-2015) (CVPR-2016) R-CNN (CVPR-2014) Fast R-CNN Faster R-CNN (NIPS-2015) YOLO SSD (ECCV-2016) R-FCN (NIPS-2016)
  • 22.人工智能语义分割 FCN /
  • 23.人工智能风格抽取
  • 24.人工智能唇读 12 LipNet GRID DeepMind 95.2% 46.8% BBC 12.4% 71% 80% Y. M. Assael,etal.:LipNet:Eend-to-End Sentence-Level Lipreading,arXiv:1611.01599v216 Dec 2016.
  • 25.人工智能语音助理&聊天 目前的社交新媒体和互动平台中,AI虚拟 助手和AI聊天机器人,正在崛起,推动人 机自然交互商业落地 AI虚拟助手 Apple:SiriAmazon:Alexa Microsoft:Cortana Google:Google Now Viv Labs :Viv 百度:度秘 AI聊天机器人 Microsoft:小冰/TayFacebook:Messenger IBM&GIT:Jill Watson助教各 种Android聊天机器人
  • 26.人工智能音箱 亚马逊于2014年推 出的智能音箱Echo, 基于语音助手Alexa 亚马逊Echo 实现音乐播放、新 闻搜索、网购下单、 谷歌Home Uber叫车、外卖预 定等服务,成为行 苹果Homepod 业标杆 百度DuerOS
  • 27.人工智能语音合成 9 19 DeepMind WaveNet A. Oord, et al.,WaveNet:A Generative Model for Raw Audio,arXiv:1609.03499v2,19 Sep 2016.
  • 28.人工智能速记&语音输入 10 17 5.9% / WER / W. Xiong, et al., Achieving Human Parity in Conversational Speech Recognition,arXiv:1610.05256v1, 17 Oct 2016.
  • 29.人工智能翻译 9 27 Google - - GNMT 87% - 60% Y. Wu, et al., Google's Neural Machine TranslationSystem:Bridging the Gap between Human and Machine Translation,arXiv:1609.08144v2,8 Oct 2016. 58%
  • 30.人工智能翻译 2017 10 5 Google Google Pixel Buds 40 无线耳塞Pixel Buds Google Pixel 2 “AI+ + ”
  • 31.人工智能翻译 5 8 Facebook FAIR Google GNMT 9 J. Gehring, M. Auli, D. Grangier, D. Yarats, and Y. N. Dauphin, Convolutional Sequence to Sequence Learning,arXiv:1705.03122v2[cs.CL] 12 May 2017.
  • 32.人工智能对抗训练 GAN Goodfellow (2014) GAN 2016 Ian Goodfellow, NIPS 2016Tutorial:Generative Adversarial Networks,arXiv:1701.00160v3,9 Jan 2017 (57 pages).
  • 33.人工智能制造
  • 34.人工智能已成为自动驾驶汽车商业落地的关键; 视觉物体识别、人脸识别,唇语识别等在许多 国际公开评测中,达到或超过人类的水平; 速记等语音识别已可媲美人类; 包括神经机器翻译在内的自然语言处理,性能 也得到大幅度提升,并已开始产品商业落地
  • 35.提纲 OUTLINES 1、AI的本质 2、连接主义的深度神经网络取得突破性进展 3、深度强化学习:连接主义与行为主义的结合 4、 与符号主义的重新融合代表了AI的未来
  • 36.3、深度强化学习:连接主义与行为主义的结合
  • 37.3、深度强化学习:连接主义与行为主义的结合 学习算法: Œ监督学习/Supervised Learning 强化学习/Reinforcement Learning Ž无监督学习/Unsupervised Learning 强化学习也称再励学习,是一种模拟人类和动物 行为学习的延迟回报学习(基于奖励或惩罚);学 习效率介于监督学习与无监督学习之间。
  • 38.3、深度强化学习:连接主义与行为主义的结合 强化学习的基本原理
  • 39.3、深度强化学习:连接主义与行为主义的结合 Deep CNN + 强化学习: 应用于神经动态规划 ( Neuro-dynamic programming)决策问题 中,取得了以AlphaGo为 代表的里程碑式的胜利 深度强化学习与MDP 强化学习: 2017年全球十大突破性 技术之首! - MIT技术评论
  • 40.深度强化学习 “ ” AlphaGo 4 3:0 2017.5 5 5:0 4:1 2015.10 2016.3 9 60:0 2017.1
  • 41.AlphaGo Lee 3 9-15 AlphaGo Lee 4:1 深度强化学习
  • 42.AlphaGo Master 12 29 -2017 30 1 4 Master 60 0 1 AlphaGo
  • 43.★深度强化学习:探索认知智能的曙光 主要涉及如下三个关键技术: -策略网络: 输出每步落子获胜的条件概率分布 (局部),消减搜索的宽度 输出对任意棋局获胜的全局“棋 感”评分,消减搜索的深度 -价值网络: AlphaGo 搜索空间: 宽度250, 深度150 -蒙特卡洛树搜索: 输出下一步最优落子 19×19 用于获得围棋最优策略
  • 44.★深度强化学习:探索认知智能的曙光 网络结构: -深度策略网络: 13-layer DCNN /SL Policy Network, RL Policy Network -深度价值网络: 13-layer DCNN -蒙特卡洛树搜索: 传统方法 暴力法:搜索空 间巨大; 对棋局和落子的 获胜评估困难
  • 45.★深度强化学习:探索认知智能的曙光 如何进行学习? 大数据: 3,000万棋局(positions) (KGS围棋服务器6-9段) 利用其中的100万进行测试 深度监督学习+深度强化学习+大数据+TPU 深度监督学习: 人类职业围棋高手棋谱(监督策略网络, 价值网络)/人类专家棋谱,最高57%预测成功率 深度强化学习: 机器自弈(self-play)(强化策略网络,价 值网络)
  • 46.★深耕深度强化学习 AlphaGo Zero 无师自通的围棋AI Nature 550, pp.354–359 (19 October 2017)DOI:doi:10.1038/nature24270.
  • 47.★深耕深度强化学习 0天: AlphaGo Zero没有利用围棋的历史棋谱,仅输入了基 本的规则 3天: AlphaGo Zero超过了AlphaGo Lee 21天: AlphaGo Zero达到了AlphaGo Master 40天: AlphaGo Zero超过了所有的AlphaGo版本,完全依赖 自弈,没有人的干预,也未使用任何历史棋谱数据 ResNet80
  • 48.★深耕深度强化学习 AlphaZero 无师自通的通用棋类AI Stockfish:2016 年 Top Chess Engine 11万次训练,不到2小时,击败Elmo Championship(TCEC)世界冠军程序 30万次训练,4小时,击败Stockfish Elmo: 2017年Computer Shogi 16.5万次训练,8小时,击败AlphaGo Lee Association (CSA)世界冠军程序arXiv:1712.01815v1[cs.AI] 5 Dec 2017
  • 49.★深耕深度强化学习 5,000 个TPU1 :推演自弈的棋类 64 个 TPU2:训练神经网络 0天: AlphaZero没有 利用任何历史棋谱,仅 输入了基本的棋类规则 3天: AlphaZero打败 了超人类水平的国际象 棋程序(Stockfish)、 日本将棋程序(Elmo) 和围棋AI程序(AlphaGo Zero)
  • 50.★深耕深度强化学习 ?
  • 51.★开辟深度强化学习新战场 2017 1 DeepStack 人工智能扑克 M. Moravcik, et al.,DeepStack:Expert-Level Artificial Intelligence in No-Limit Poker,arXiv:1701.01724v2[cs.AI] 10 Jan 2017.
  • 52.★开辟深度强化学习新战场 AlphaGo DQN 人工智能游戏玩家 Nature, Feb. 26, 2015 深度Q-网络/DQN 49种Atari像素游戏 中,29种达到乃至 超过人类职业选手 的水平 Mnih, et al., “Human-level control through deep reinforcement learning”, Nature, vol. 518, pp. 529-533, 26 Feb. 2015.
  • 53.★开辟深度强化学习新战场 AlphaGo 人工智能游戏玩家 DeepMind “ 2”
  • 54.★开辟深度强化学习新战场 AlphaGo 人工智能自动驾驶
  • 55.★开辟深度强化学习新战场 AlphaGo 人工智能金融 AlphaGo投顾
  • 56.★开辟深度强化学习新战场 AlphaGo 人工智能医疗
  • 57.★开辟深度强化学习新战场 ?
  • 58.提纲 OUTLINES 1、AI的本质 2、连接主义的深度神经网络取得突破性进展 3、深度强化学习:连接主义与行为主义的结合 4、 与符号主义的重新融合代表了AI的未来
  • 59.4、与符号主义的重新融合代表了AI的未来 以大数据驱动的Deep CNN为代表的感知智 能的成功(“举三反一”),使机器在垂直细 分领域初步获得了媲美人类水平(human level)的“模式”识别能力,这必将成为 认知智能发展的基石。 在新的起点上,进行“举一反三”的认知智能前沿研究
  • 60.迈向认知智能和通用人工智能 ☆认知智能,即对人类深思熟虑行为 的模拟,包括记忆、常识、知识学习、 推理、规划、决策、意图、动机与思考 等高级智能行为 现状:追求看清、听清,有识别无理解 未来:要看懂、听懂、读懂!
  • 61.★具有认知推理的半监督/无监督学习 从特征学习到规则学习 获得举一反三能力 pre-training Hinton Knowledge distilling CNN Knowledge Transfer (2015) CNN Hinton, G., Vinyals, O., Dean,J.:Distilling the knowledge in a neural network.arXiv:1503.02531(2015).
  • 62.★具有认知推理的半监督/无监督学习 从特征学习到规则学习 获得举一反三能力 “特征提取+推理”的小样本学习 深度无监督学习是AI的“黑科技” -动物与人类习得的大部分知识都来自于无监督 学习(先有无监督,监督是语义水平的); -通过预测性的无监督学习来构建并 推断世界,获得“印象”; -进一步降低对大数据的依赖
  • 63.★迈向通用人工智能 从特征学习到规则学习 获得多任务学习能力 将深度学习获得的特征或概念抽象,想象或与知 识图谱结合,同时整合记忆、注意力、常识、推理 、规划与意图等,以获得多任务学习能力。 例如,LSTM (Hochreiter,1997);记忆神经网络MN(Weston et al.,2014) ;堆叠增强递归神经网络(Joulin et al.,2014);NTM (DeepMind,2014); 堆叠的What-Where自动编码器(Zhao et al., 2016),…
  • 64.★迈向通用人工智能 从特征学习到规则学习 获得多任务学习能力 概念抽象:以嵌入结构的方式表达世界 认知向量:概念向量通过时空递归学习,获得知 识或认知的表达 推理/规划:对上述递归过程的应用 例如,对自动问答系统等,就可将之视为想法/认知向量之间进行检索 比较(深度检索模型);而对推理、规划、机器翻译、语言与语境 理解、对话系统,就可考虑为想法/认知向量的生成、组合与变换 ( 深度生成模型)。
  • 65.4、与符号主义的重新融合代表了AI的未来 ?
  • 66.作为一种感知智能模型,连接主义的深度卷积神经网 络迄今最好地模拟了生物视觉通路,在完备大数据与超强 计算硬件的强力支撑下,通过多层特征的自动提取等,已在 计算机视觉、语音识别、自然语言处理、自动驾驶、大数据 处理等诸多方面,接近、达到甚至超过人类水平。 以AlphaZero为代表的深度强化学习,将连接主义与行 为主义结合,已具有超人类水平的博弈类决策能力,为决策 类认知智能的探索带来了新的曙光。 与符号主义结合的面向小数据具有“举一反三”推理能 力的认知智能与通用人工智能,仍有待探索与突破。
  • 67.谢谢!