AI辩论、清华论文……一文看懂卓越人工智能引领者大奖
7月9日,世界人工智能大会的最高奖项——卓越人工智能引领者(Super AI Leader,简称SAIL奖)在2020世界人工智能大会云端峰会的开幕式上举行了颁奖仪式。中国工程院院士、同济大学校长陈杰,商汤科技创始人、香港中文大学教授汤晓鸥为SAIL奖颁奖。
获得2020 SAIL奖的项目是:
“IBM Project Debater”
“联影智能uAI新冠肺炎医学影像智能化诊断全栈解决方案”
“百度文心(ERNIE)知识增强语义理解技术与平台”
“卡内基梅隆大学Tetrad因果关系自动发现智能平台”
清华大学论文《忆阻器卷积网络的全硬件实现》。
颁奖现场。
SAIL奖评审专家依托上海人工智能战略咨询专家委,集聚了全球人工智能领域最具影响力的科学家和企业家,由中国工程院院士、中国科学院院士、国内外知名高校和科研机构的学者、人工智能产业界的领军企业技术带头人组成。
以下为2020 SAIL奖的获奖项目介绍:
IBM Project Debater
IBM在AI领域深耕多年,作为全球IT产业中屹立逾百年的企业,如今IBM正迎来一个人工智能的能量大爆发的时期。
1997年,IBM研发的超级计算机深蓝(Deep Blue)国际象棋比赛中击败了世界冠军加里.卡斯帕罗夫(Gary Kasparov),而象棋一直被认为是一种人类社会的高智力博弈。
2011年,IBM人工智能系统Watson在益智游戏节目《危险边缘》(Jeopardy!)中更是击败了两位最优秀的人类冠军,由此吸引了全世界的目光。
2018年,IBM研究院则在美国旧金山的Watson West,首次展示了人类与智能机器之间的公开现场辩论赛。双方辩手分别是IBM耗时逾六年研发的,首个能与人类进行复杂辩论的AI系统Project Debater(以下简称Debater),以及曾在2016年获得以色列国家辩论冠军以色列大四女生Noa Ovadia和以色列国际辩论协会主席 Dan Zafrir。
2019年,在美国旧金山,AI"辩手"Project Debater再次亮相,与欧洲辩论冠军哈瑞在美国旧金山展开了酣畅淋漓的"人机辩论赛"。
第一部分:Project Debater的价值
决策
在这个充满复杂问题、海量信息和误导文化的世界,我们非常有必要通过对思想观点进行深入探索,建立以事实为依据、有说服力的论点。
超越当前技术
辩论和论证并不只是没有预设答案的活动,“回答问题”只是提供事实信息。搜索引擎只为你完成了一半的工作,在辩论中,没有标准答案评分功能。
对业务不可或缺
Project Debater 推动人工智能向更前沿的领域进军,促进智能辩论的发展,帮助建立更合理的论点,做出更明智的决策。
第二部分:支撑Project Debater 的三大能力
数据驱动的辩论文稿的生成和表达能力
给定一个有争议的主题的简短描述,通过阅读、理解大量的语料,它能够创作出结构良好的辩论文稿,并清晰且有针对性地表达出来,甚至还会适时地展现幽默感。
语理解能力
能够识别长篇大论的连续口语中的每一个句子里隐含表达的重要概念和观点;
模拟人类困境
通过独特的知识图谱来模拟人类的矛盾与困境,使系统能够根据需要提出有原则的论点。
第三部分:技术及学术成就
超过30份出版物
发布的数据集:数千次下载
领导并共同组织有关辩论技术的Dagstuhl 一周研讨会,会议期间创造了“计算辩论(Computational Argumentation)”这个术语
ACL 2016 年有关计算论证的NLP 教程
2015 年和2016 年共同组织论点挖掘研讨会
被选中在EMNLP 2018 中领导并组织关于论点挖掘的下一场研讨会
自然语言处理 (NLP)算法 NLP是指计算机自动理解、解读和处理人类语言(比如,话语和文本)。NLP 是人机互动的关键要素, IBM Project Debater 团队积极开展 NLP研究也在情理之中。
论点挖掘 观点和论据是论点的重要组成部分:确定并合理运用观点和论据对于在辩论中形成论点至关重要 。IBM Project Debater 团队投入了大量精力,开发机器学习方法,为观点和论据挖掘海量的语料库,并利用这些语料库生成与辩论主题相关的论点 。
立场分类和情绪分析 自动辩论系统必须能够确定论点能否支持或反驳给定的主题。这对人类来说十分简单,但对机器而言则相当困难,因为它需要能够敏锐地辨别自然语言丰富的微妙之处和细微差异。我们在这个非常有趣的研究领域已经取得重要进展。
深度神经网络 (DNN)和弱监督 DNN 具备提高自动语言理解能力的巨大潜力,但是众所周知,训练 DNN 需要大量人工标记的高质量数据。我们开发了多种工具和方法,以弱监督式训练DNN,以便缓解这个瓶颈问题。我们还利用DNN 开发 Project Debater的听说技能 。
文本转语音 (TTS)系统 与个人助手或导航器不同,辩论系统需要能够持续数分钟对事先未知的主题作出雄辩,同时与受众保持互动。我们开发了新的 TTS 算法和方法,用于为 Project Debater 提供清晰流利、有说服力的语言表达能力。
第四部分:Project Debater的未来
IBM Project Debater仅仅预示着一个开始,未来,Debater将有潜力在全球范围内协助人类制定日常的复杂决策,这些潜在用途包括:
金融顾问
通过训练Debater来找出金融事实,用以支持或反对金融分析师所思考的金融投资选择。
律师
通过Debater的汇总技术,律师可以借助Debater来寻找相关案件和主张,或借助Project Debater模拟法庭辩论来分析优势和劣势。
公共事务决策
通过Debater公正的优/缺点分析和对人类困境的模拟,可以就需要进行决策的问题,提供基于事实、没有人为偏见的观点。
学生助手
通过Debater帮助各个年龄段的学生改进他们的批判性思维和沟通技巧,或帮助他们找出更多信息以改进报告和论文。
企业决策者
通过Debater拓宽思路,在关键决策中纳入他们可能没有考虑到的新观点。
第五部分:关于人机辩论
重点不在于赢或输,而是为了展示人工智能掌握人类丰富语言的能力。
与游戏不同,语言可以告诉我们更多关于人类思维和表达的信息,这是IBM Research最感兴趣的。
我们相信,人工智能有潜力来理解我们。
人工智能的推理越透明和有理有据,我们就越能信任它,从而就越能利用它帮助我们做出正确的决定。
IBM研究院在增强和补充人类认知的构建技术方面拥有丰富的历史,从而可以提供更多信息和背景来帮助决策。
人工智能辩手也不例外——帮助人们推理,建立充分的论据,做出更好的决定。
第六部分:突破进入商业解决方案
更具有突破意义的是,在2020年3月,IBM首次推出:将源自Project Debater的一些关键技术集成至 IBM Watson商用产品中的首批成果,侧重于提高客户使用自然语言的能力,以支持企业开始挖掘和分析人类语言中某些最具挑战性的方面。其中包括:
1.分析—高级情绪分析(Advanced Sentiment Analysis)。IBM 增强了情绪分析能力,能够更好地识别和理解复杂的单词组合。
2.摘要提炼—总结(Summarization)。该技术可从各种来源中提取文本数据,为用户就与特定主题相关的口头和书面言论提炼一份摘要。
3.聚类—高级主题聚类(Advanced Topic Clustering)。基于从 Project Debater 获得的洞察,全新主题聚类技术将支持用户对输入的数据进行“聚类”,从而就相关信息创建有意义的“主题”,用户随后即可对这些主题进行分析。
这些新的人工智能能力,将在2020年被陆续集成到Watson Assistant、Watson Discovery、Watson Core Natural Language Understanding等产品中,从而让企业在收集数据、组织数据、分析数据和扩散人工智能到企业运营中等人工智能四阶梯中,达到全新的水平。
uAI新冠肺炎医学影像智能化诊断全栈解决方案
上海联影智能医疗科技有限公司
今年新冠肺炎疫情突然爆发,AI走到了疫情防控的前线。作为医疗同行者,联影智能积极响应、加速产品创新,迅速推出“uAI新冠肺炎医学影像智能化诊断全栈解决方案”,从成像、筛查、诊断到随访,以AI全栈助力抗“疫”。
AI自动定位,实现无接触扫描
在医院以往的扫描过程中,技师必须要反复进出扫描间,不可避免地会与患者进行接触。联影自主研发的“智能天眼”CT,能对病人的身高、体型、位置等信息进行自动化识别,技师无需进入扫描间,即可完成隔室扫描,大幅降低交叉感染风险。疫情期间,有500余台智能“天眼”CT驰援全国抗疫一线,包括武汉全市70%的定点医院发热门诊、传染病区及超过一半的方舱医院。
联影“智能天眼CT”
AI量化分析,助力筛查、诊断及随访联影智能为全国100多家医院提供了uAI新冠肺炎智能辅助分析系统,并驰援美国、马来西亚、意大利、北非等海外多国。该系统可基于患者CT图像,自动标记病灶,对新冠病毒感染病灶勾画重合率接近90%,全肺感染百分比量化误差小于1%,可将5至10分钟的CT阅片时间缩短至1分钟以内。同时,系统可全自动匹配治疗前后影像检查的肺炎病灶,实现多次影像的同步比对阅片,帮助医生精准评估新冠病情发展。
联影智能新冠肺炎智能辅助分析系统。
云端服务,缓解诊疗压力为解决某些临时场地难以开展影像诊断的难题,联影智能AI系统通过联影云将服务覆盖到包括武汉雷神山医院、方舱医院在内的全国 200 余家医疗机构,助力缓解新冠肺炎定点医院诊疗压力。
获得SAIL奖的背后,是联影智能推进医学影像AI落地的行动与决心,未来联影智能将继续致力于技术创新与应用,提供贯穿成像、筛查、随访、诊断、治疗、评估全流程,覆盖全病种的全栈全谱的智能解决方案,为医生、医疗设备赋能提效,与用户、合作伙伴携手共赢。
文心(ERNIE)知识增强语义理解技术与平台
北京百度网讯科技有限公司
自然语言处理(NLP)被称为人工智能皇冠上的一颗明珠,自然语言理解是其重要研究方向之一,在该领域的技术突破,对于机器认知智能发展至关重要。
百度获奖项目“文心(ERNIE)知识增强语义理解技术与平台”,是一个取得世界级突破的语义理解技术与平台,依托于百度的深度学习平台飞桨而打造,将机器理解语言的水平提升到一个新的高度,全面刷新了各项NLP任务的世界最好效果。2019年3月发布至今,已在多个公开权威语义评测中获得了近十项世界冠军。
文心(ERNIE)开创性地将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化,如同人类持续学习一样。文心(ERNIE)在16个中英文典型NLP任务上显著超越当时世界最好效果。2019年12月,文心(ERNIE)在国际权威的通用语言理解评估基准GLUE上,首次突破90分,超过人类水平3个百分点,刷新榜单得分并获得全球第一。2020年3月,在全球最大规模之一的语义评测SemEval 2020上,文心(ERNIE)取得了5项世界冠军。
此外,文心(ERNIE)在语言生成领域也取得突破,提出了业界首个基于多流机制生成完整语义片段的预训练语言生成技术ERNIE-GEN,该技术在各类语言生成任务上也显著超越国际最好效果。2020年7月,文心(ERNIE)在多模态语义理解领域取得突破,提出了业界首个基于场景图知识增强的多模态预训练模型ERNIE-ViL,在多项典型多模态任务上刷新世界最好效果,并登顶视觉常识推理权威榜单VCR。
文心(ERNIE)相关创新成果也被人工智能顶级学术会议AAAI 2020和IJCAI 2020收录。文心(ERNIE)技术突破被包括全球顶级科技商业杂志《麻省理工科技评论》、德国光谱杂志,以及韩国AITimes、日本AI-SCHOLAR等多国权威科技媒体官方报道,极大彰显中国在人工智能领域创新与突破的实力。
文心(ERNIE)的创新成果,不仅体现在权威数据集的理论评测上,也体现在面向用户的实际产品应用中。为了推动文心(ERNIE)在低内存、低功耗的业务场景中应用,百度发布了语义理解模型轻量化方案ERNIE Slim,大幅降低了文心(ERNIE)的模型落地成本,使得这一技术的广泛应用成为可能。
目前文心(ERNIE)已经全面应用在百度搜索引擎、信息流、智能音箱等几十个产品中,大幅提升了产品的智能化体验。同时,文心(ERNIE)也通过百度大脑AI开放平台面向开发者和企业进行开放赋能,目前已广泛应用于金融、通信、教育、互联网等各行各业,推动产业智能化发展。
卡内基梅隆大学
因果关系是科学和工程中的一个基本概念,也是实现通用人工智能过程中不可或缺的一环。对因果性的认识,不光能让我们更好地理解、组织已经学到的知识点,还能让我们具有创新型思维,在各个领域中,这种理解都给了我们恰当地控制和改变系统的能力。
有关因果关系的研究在过去三十多年已在统计学、计算机科学以及哲学界取得很多进展。很多研究工作的目的是做因果推断——假设已经知道了系统定性的因果性(比如知道了治疗方式是原因,而康复率是结果),通过分析观测到的数据,找到定量的因果影响程度,或者进行所谓“反事实推理”(如果当初给这个病人用了另外一种治疗方式,结果会不会更好?)。可是,在现实中,我们如何去探知因果关系呢?传统方式是进行人为干预实验,而这样的实验很昂贵,且很多时候不可行。
自1980年代,卡内基梅隆大学(CMU)的因果研究团队就开始致力于解决因果发现的问题——我们能不能从被动观测的数据中找出数据背后的因果关系?传统观点是这个问题基本不可解——混杂因素、选择偏差的存在都使得因果发现变得非常困难。项目团队的Clark Glymour 教授(美国艺术与科学院院士)和Peter Spirtes以及Richard Scheines两位教授早在1984年就开始思考这个问题,到1989年他们终于提出实用的因果发现算法——从非实验数据中找出因果关系。直到现在,这些算法还是因果发现领域最广为使用的,而这些发现也开创了因果发现这个领域。
为带来直接影响,项目团队和Joseph Ramsey教授一起,同时开发了Tetrad因果关系自动发现平台,并持续更新,目前平台已基本囊括各种已被证明有效的因果发现算法。2015年张坤教授加入项目团队,加深了因果模型和人工智能之间融合关系。团队开发的机器学习工具使得因果发现变得更可靠的同时,机器得以自动自主地从各场景和任务中学习、综合、表述和使用因果性质。项目团队希望机器可以像人一样探知和利用万事万物之间的联系,再辅以理性的规则。进而使得机器可以更全面、更人性化的服务人类,带给人更多的尊严、保障和便利。
在过去十几年间,辅以Tetrad平台以及项目团队在1993年出版的教科书《因果性、预测和搜索》,CMU因果研究团队的研究成果带动了美国、欧洲、中国和日本等地一大批研究组的工作,已在机器学习和人工智能领域催生了因果发现这个研究方向,获得广泛关注。目前已成功应用在卫生保健、生物信息学、语言理解及建模、机器人学、社会科学、经济、金融、生物、神经科学、地质学、病毒学等各个领域。仅在2019年5月到2020年5月间,Tetrad平台就有35325名非重复用户。
微软研究院合伙人Chris Meek说:“Tetrad的思想和软件平台已经根本上改变了研究者们分析和解释我们观察到的数据的范式。”
亚马逊的首席机器学习科学家、德国马克思普朗克智能系统研究所所长Bernhard Sch?lkopf教授说:“在人工智能领域,越来越多的人认为因果性能把人工智能领域带上了一个新台阶,而CMU的因果研究团队处在该领域发展的中心位置——不光他们的思想和算法,还有他们的Tetrad软件平台都有深远影响。”
清华大学 姚鹏(第一作者)
人工智能算法复杂度和参数规模的增长对智能芯片的算力和能效提出了更高要求,受限于芯片集成程度和底层架构瓶颈,传统智能芯片发展遇到了重大挑战。基于忆阻器的存算一体技术有望带来智能硬件革命,被华为和阿里巴巴达摩院等评为未来科技趋势,阿里达摩院在2020年1月发布了《2020十大科技趋势》报告,其中第二大趋势即为“计算存储一体化突破AI算力瓶颈”。
基于忆阻器的存算一体智能系统在基本器件、计算原理、体系架构等多层次突破传统计算体系:器件上,采用新型忆阻器,突破传统CMOS器件;原理上,基于欧姆定律等物理规律,突破布尔逻辑理论;架构上,基于存算一体技术,突破“冯诺依曼架构”瓶颈。该智能系统有望呈数量级的提升硬件算力和能效。
当下存算一体发展,主要集中于器件研究和全连接结构实现,完整存算一体系统实现面临以下挑战:器件方面,制备高一致、可靠的多值忆阻器阵列仍是挑战;系统方面,器件固有的非理想特性、阵列误差和电路噪声都会降低系统精度;架构方面,存算一体实现卷积功能需要连续采样、计算,无法匹配全连接结构的计算效率,成为性能瓶颈。
面向存算一体系统的混合训练方法是指在硬件处理过程中,将片外训练好的权重编程到各忆阻器阵列中,通片上学习、更新局部硬件权重来自适应的弥补多种非理想特性的影响,解决误差累积问题;空间并行策略是指将相同卷积核编程到多组忆阻器阵列中,配合混合训练的方法,可以并行、准确的处理卷积计算,提高系统并行度和计算速度。通过器件、电路、架构和算法的联合优化,采用硬件实验结合系统仿真的方法,验证了这些技术的通用性,能够适用于多种网络模型,广泛的消除存算一体设计中的速度瓶颈,展现了存算一体架构的光明前景,推进下一代高算力、高能效的智能系统发展。
新闻推荐
从1948年12月1日,中国人民银行成立并发行第一套人民币开始,5元面额纸币保留至今,从图案、防伪技术等方面都有过多次调整或提...