月度归档:2018年01月

“芯片漏洞门”事件再升级,苹果在美遭遇首起集体诉讼

雷锋网按:自2018年1月开始曝光的芯片级安全漏洞以来,英特尔、ARM、AMD、苹果、微软、Google等一众巨头均已牵涉其中,无一幸免。继英特尔、AMD市值相继“大缩水”之后,苹果也因此事在美国遭遇了第一起集体诉讼。

雷锋网此前报道,这起漏洞的主角为 Meltdown(熔断)和 Spectre(幽灵)两组CPU漏洞,其能利用CPU中的 Speculative Execution(推测执行)机制,使得黑客通过用户层面应用从 CPU 内存中读取核心数据。所有现代的英特尔、ARM、AMD 和英伟达处理器都会受到影响,而苹果在自家的智能手机、苹果电脑以及PC中也使用了英特尔或自主研发的A系列处理器,因而也受此波及。

虽然截至目前已有多家公司包括苹果发布了补丁包。然而,苹果还是因为此事及其他原因在美国遭遇了首起集体诉讼。

据了解,这起诉讼的原告为 Anthony Bartling 和 Jacqueline Olson,二人于上周在美国圣何塞地区法院,代表所有购买采用 ARM 架构处理器的苹果设备的消费者向该公司发起集体诉讼,而这些消费者使用的苹果设备包括采用A4到A11芯片的 iPhone、iPad、iPod Touch 和Apple TV。

该诉讼指控苹果公司至少从2017年6月即已经知道这一芯片漏洞的缺陷,但却未向公众及时披露细节。原告还称,苹果不太可能在不降低处理器性能的情况下提供全面的Meltdown和Spectre解决方案。

据了解,该起集体诉讼预计将有超100名苹果用户参与,补偿和赔偿总额预计将超500万美元。

如雷锋网报道,在这次芯片漏洞被曝光以后,苹果公司在上周就已发布了应对措施,针对 Meltdown,苹果在 iOS 11.2 & macOS 10.13.2 & tvOS 11.2 中加入了保护措施,Apple Watch 不受影响。而针对 Specture,苹果则在 macOS 10.13.2补充了更新,并在 iOS 11.2.2 中缓解了该漏洞的影响。同时,该公司还建议用户从包括 APP Store 这样的可信渠道下载应用。目前,这些漏洞已在早先的 macOS 和 OS X 中得到了解决。

此前曾有消息表示,苹果的 Spectre 补丁导致一位开发者的 iPhone 6 性能大幅降低,但该公司表示,测试显示,这项缓解措施并未对 Speedometer 和 SRES-6 跑分结果产生明显影响,在 JetStream 跑分中产生的影响也不到 2.5%。

而根据美国科技新闻网站 PatentlyApple 近日报道,一些以色列用户也向海法地区法院提交了集体诉讼申请,计划就这两组CPU漏洞起诉苹果、英特尔和ARM。这些原告属于处理器芯片的使用者,他们以“处理器漏洞损害自身隐私安全”为由,将这些公司告上了法庭。

然而,在这起发生在处理器行业的安全漏洞事件中,苹果作为一家处理器的使用客户,受此波及遭遇诉讼,难免也有点冤。

*注:图片来源于网络

雷锋网

拿下 1.12 亿美元 A 轮融资,Pony.ai 的无人驾驶车队将落地广州

去年 9 月到 11 月,是自动驾驶创业公司 Pony.ai (中文名“小马智行”)的密集发声期,无论是无人驾驶汽车路测视频曝光,还是图灵奖得主姚期智出任其首席顾问,抑或是去年 10 月宣布在广州南沙设立无人驾驶研发中心和总部基地,这一切都表明 Pony.ai 的发展节奏在不断加快。

在 Pony.ai 成立一年之际,这家公司又往前推进了一大步。雷锋网新智驾消息,硅谷当地时间 1 月 15 日,Pony.ai 宣布完成 1.12 亿美元 A 轮融资,领投方是晨兴资本和君联资本,种子轮领投方红杉中国以及 IDG 资本继续跟进此轮融资,新增的投资方还包括弘泰资本、联想之星、普华资本、启宸资本、DCM 资本、Comcast 资本以及硅谷未来资本等。

有了这笔大额资金的注入,Pony.ai 将有更多弹药投入到自动驾驶技术的研发之上。Pony.ai 方面透露,2018 年第一季度,他们将在广州投放无人驾驶车队,并且进行运营测试。同时,有了这笔钱的加持,Pony.ai 将继续在美国和中国发展合作伙伴,探索无人驾驶商业化落地,广招人才。

除了广州,目前 Pony.ai 在美国加州的弗雷蒙特(Fremont)也有一个总部,同时在北京还建有研发中心。Pony.ai CEO 彭军(James Peng)在接受媒体采访时表示,现阶段公司在中美两地一共有 70 人的团队,技术研发占绝大多数。彭军的目标是在 3 年后搭建起一个拥有 400 人的团队。

值得一提的是,去年 6 月,Pony.ai 获得了美国加州自动驾驶汽车路测的许可。如今,你很容易就能在美国湾区的道路上目睹 Pony.ai 的自动驾驶测试车辆,正尝试各种各样复杂的道路环境,这家公司专注于 Level 4 级别自动驾驶技术的研发,选择的是一步到位,而非循序渐进。

之所以吸引如此多资本的青睐,Pony.ai 两位创始人的华丽背景必然是最大的加分项。

据雷锋网新智驾了解,2016 年 12 月,被前百度首席科学家吴恩达称为“世界上最好的编程者之一”的楼天城以及时任百度无人车首席架构师的彭军(James Peng)双双离职,联手创业,拉来 8、9 人的核心团队,共同创办了自动驾驶公司 Pony.ai。尽管当时极其低调,但作为百度 T10 和 T11 级别的工程师,他俩的公司吸引了诸多眼球。

楼天城是清华大学计算机博士,图灵奖得主姚期智的得意门生,“楼教主”曾连续两年夺得谷歌全球编程挑战赛冠军。实力超群的他在 2016 年被王劲招入百度美国研究中心自动驾驶团队。此外,楼天城还在谷歌无人车项目中工作过。

彭军则是百度美国研究中心引入的第一位工程师,也是后来百度硅谷自动驾驶团队的早期成员。他曾在谷歌工作七年,2012 年进入百度,担任过主任架构师,在广告、大数据、 云计算多个领域负责架构设计。2015 年,百度自动驾驶事业部成立,彭军出任首席架构师。

正如晨兴资本合伙人张斐所言,“我们非常欣赏 James 和天城领导的顶级技术工程团队,无人驾驶是个很长又很难的雪坡,我们希望和团队一起长期合作,携手开拓未知的新世界。”

而在君联资本董事总经理靳文戟看来,“Pony.ai 是国内最有机会一步到位实现 Level 4 级别自动驾驶商业化的公司之一。”

那么 Pony.ai 会为我们开拓怎样一个新世界,拭目以待。

雷锋网新智驾推荐阅读:《专访彭军:直奔L4无人驾驶,这有一份Pony.ai创立半年来的体会》

雷锋网

余轮教授:基于眼底影像和人工智能,怎样实现大疾病预警和个性化健康服务?

雷锋网AI掘金志《未来医疗大讲堂——医学影像专题》第五期总结文:一个只给医疗AI从业者、影像科医生、名校师生、CFDA工作人员看的系列课程。

注:90分钟的视频信息量巨大,文字仅为冰山一角,强烈建议观看完整版视频,请点击链接:

http://www.mooc.ai/open/course/420

课程提纲:

1、糖尿病视网膜病变(DR)的远程筛查和眼底图像判读

  • 应用背景

  • 重大疾病预警

  • 要解决的关键问题

2、AI在眼底图像分析和DR筛查中的应用

  • DR筛查的防治指南和分级诊断标准

  • 视网膜对慢性病诊断和预后判断的作用

  • 巨头入围,创业企业的机会在哪里

3、基于深度学习医学影像分析中的标注问题

  • AlphaGO DNN的一个缺点

  • DR血管瘤和出血点的随机分布

  • 随机性和人眼灰度判别的局限性

  • 如何评价某些DR的AI分析系统成果

4、人工智能在眼底医疗影像中的目标和评价体系

  • 医学的评价体系

  • 计算机工程界常用的评价指标

  • DR自动分析与眼底血管改变

  • 基于知识计算模型的重大疾病风险预警和健康评估引擎

5、医疗影像分析走向人工智能化的关键要素

  • 人工智能应用的各个领域

  • 人工智能方向的人才培养

6、经典医学图像处理方法与深度学习的结合

  • 图像预处理与深度学习

  • 眼底血管分割方法

  • 眼底硬性渗出检测方法

7、基于眼底影像和人工智能的健康服务系统

  • 总体思路

  • 系统产品介绍

  • 应用创新和技术优势

  • 应用领域和刚需分析

嘉宾介绍

余轮,二级教授,博士生导师,国务院政府特殊津贴获得者

学术背景:

余轮教授现为福州大学生物医学与健康工程首席科学家、研究院长,是德国汉堡大学医学院高访学者,曾长期担任中国图象图形学会副理事长、中国生物医学工程学会信息与控制分会委员以及福建省生物医学工程学会副理事长、互联网协会常务理事等职务,为国务院政府特殊津贴获得者。

余教授曾先后主持国家基金重点项目“免散瞳眼底自动照相机及其远程会诊系统”以及“远程糖尿病性视网膜病变筛查及图象分析系统”、“远程病理学会诊及图象分析系统”、“冠心病早期诊断新技术及心脏医学图象自动分析系统”、“远程病理学会诊系统”、“远程心电中央监护及自动分析系统”等国家基金、卫生部联合基金、国家火炬项目等16个项目的研究,均取得应用或推广。

余教授近年来专注于人工智能、医学影像、远程医疗和健康医疗大数据的研究,建立了一种基于眼底影像的重大疾病预警和移动医疗健康服务系统,从事糖尿病视网膜病变筛查及其远程会诊系统15年,在人工智能和DR筛查、一种“可更新、低成本、可分析”的健康医学大数据系统的建立和大数据服务中取得重要的突破和10多项专利等知识产权成果,发表紧密相关论文100多篇。

以下内容节选自余轮教授课程

据雷锋网了解,余教授从十多年前就开始在糖尿病视网膜病变的远程筛查和图像判读方面进行研究,他认为,远程医疗是开展DR筛查的有效办法,因为DR筛查可以使失明风险降低94.4%,但是我国的筛查率还不到10%,其中的主要就在于我国专业眼底阅图医生数量不足,而且忙于已发眼病的诊治,根本没有时间去进行大量糖尿病患者的筛查。

此外,根据2015年发布的中国糖尿病患者ASCCVD分级预防指南:糖尿病管理首先应该解决脑卒中等动脉粥样硬化性疾病的预防,而不仅仅以控制血糖为中心。但迄今缺乏风险预测的高效手段。

2001年,余教授在美国访问期间参观了著名的威尔玛眼科中心以及该中心的新型糖尿病视网膜病变的远程自动照相系统,基于DR的社会需求和自己的亲身经历,余教授从十几年前开始便投身该领域的研究。

AI在眼底影像分析和DR筛查中的应用

去年四月到六月,在国内掀起一股AI和DR筛查的热潮。在远程DR筛查的研究之外,余轮教授也非常关注人工智能技术在医学领域的应用。

他认为,医学影像与人工智能的结合,是数字医疗领域较新的分支,而且是今天数字医疗产业的热点。此外,医学影像包含了海量的数据,即使有经验的医生有时也显得无所适从。所以,人工智能在医学影像的解读方面的应用需要长时间专业经验的积累医学影像与人工智能的结合。

在余教授看来,仅仅依靠AI-自动筛查系统运用于临床前,仍然有许多问题需要去解决。部分学者担心这种自动筛查机器会增加筛查本身的成本;还有学者认为它还不具备可以判断DR严重程度或分级的能力,这将导致一些需要及时处理的严重DR患者不能得到及时有效的治疗。余教授表示,“DR读片必须结合自动分级和人工分级进行。

去年11月,腾讯觅影进入首批国家新一代人工智能开放创新平台名单,负责建设医疗影像国家新一代人工智能开放创新平台。余教授认为,腾讯研发并推广觅影系统,目前还主要希望它能作为整个“互联网+智慧医疗”生态系统的一个版块。包括智慧产业、智慧政府和智慧民生,其中医疗是智慧民生的重中之重。

现阶段腾讯的医疗AI技术和产品视乎并没有绝对的领先优势,有的甚至刚刚开始,但以腾讯觅影、微信支付和新一代人工智能开放创新平台为依托的智慧城市和智慧医院,却是各地政府和医院难以拒绝的。

巨头入围,那是否其它创业企业就没有希望呢?余教授认为是有机会的,医疗AI创业企业可以搭建平台,与医疗大数据、互联网医疗、医疗信息化等领域的企业形成协同效应,将产品整合打包或落地。

DR筛查与自动分级

余教授表示,医学领域对一个系统的评价指标主要有两个:敏感性和特异性。企业在开发人工智能系统时都在追求高敏感性和高特异性。但是在余教授看来,“明察秋毫”和“枉杀千人”需要找到一个平衡点。临床要追求整体的运行效率,牺牲敏感性追求特异性会造成漏诊率提高,致使筛查或检查不达目的;牺牲特异性追求敏感性可能又会对医生“越帮越忙”,造成医疗资源的浪费。

余教授表示,很多企业都声称其开发系统的敏感性和特异性可以接近于100%,但是这个结果还需要结合具体的实践场景,是来自于数据库中的数据还是临床数据。目前,DR分期分类的方法已经有了ETDRS(Early Treatment Diabetic Retinopathy Study)标注,该标准需要采集7个视野,单幅45度图像DR筛查敏感性不高于70%,所以,对外宣称准确率可以达到95%以上的结果还是存在疑问的。

基于上述的思考,余教授团队提出了一种Betago-C引擎,可以在提高特异性的同时,不降低敏感度。“AI不只是深度学习,经典的图像处理方法集合深度学习来提取特征,应该是一个很高的方向。”

此外,在精准医学的背景下,除了Betago-C引擎之外,他们团队还建立了一个基于知识计算模型的重大疾病风险预警和健康评估引擎:实现眼底视网膜病变的“人工智能-自动分级”,眼底血管改变的检测以及问诊资料的获得与分析模型的建立。

在随后的演讲中,余教授结合图像预处理与深度学习结合的案例,分享了眼底血管的两种分割方法以及眼底硬性渗出检测方法(粗分割和精分割)。

基于眼底影像和人工智能的健康服务系统

余教授表示,医疗卫生改革很重要的一点就是将医院内的CT、MR等技术独立出来向社会开放,因此第三方检测平台也成为了资本追逐的对象。那么,眼底影像与第三方检测平台结合可以有哪些发展方向?

余教授介绍了自己团队的“基于眼底影像和人工智能的健康服务系统”。他认为这类系统的总体发展思路可以分为三点:

  • 建立远程眼底中心,提供远程眼底图像判读筛查和转诊服务

  • 从眼底看全身健康,助力慢病分级诊疗与个性化的健康服务

  • 建设影响监检测平台,助力医疗保险控费和健康管理体检机构

以余教授团队的系统方案为例,这套系统的云健康服务系统由“远程判读会诊中心”和“大数据和健康管理”两部分组成。受检者眼底图像拍摄后,传输到云平台进行判读和处理,在此前提及的“疾病风险预警评估引擎”的支持下工作。

学员部分问题

雷锋网AI掘金志线上直播结束后,学员从不同维度提出了20个问题,余轮教授对多数问题进行了耐心解答。

问题:

1.详细讲讲您设计的贝塔方法

2.您怎么评价和看待谷歌现在炒地很热的AI糖网筛查项目?

3.您预计CFDA什么时候可以大规模审批通过糖网AI产品?

4.谈谈近一年您认为比较前沿且实用,但很多人没注意到学术研究方向

5.控糖控压的干预措施怎么跟踪控制?能详细介绍下么?

6.眼底图像糖网各个分期之间特征很近似,有没有针对性的算法提升分类精度

7.聚类算法比如dbscan能不能分割出眼底图像中血管?在这方面现在效果做的怎么样?

……

详细内容和精彩问答,欢迎点击链接:http://www.mooc.ai/open/course/420

雷锋网

美国iPhone用户集体状告苹果:A系列处理器存漏洞

雷锋网消息,近日,全球处理器行业爆发了“熔断”和“幽灵”两大漏洞,波及了所有的处理器制造商。据外媒最新消息,美国iPhone手机用户也向苹果发起了集体诉讼,指控其设计的A系列处理器存在安全漏洞。

据美国科技新闻网站AppleInsider报道,这一消费者集体诉讼的发起人为律师事务所Wolf Haldenstein Adler Freeman Herz,原告消费者包括加州的苹果手机用户Jacqueline Olson和Anthony Bartling。

据悉,诉状已经在1月8日提交给了美国加州圣何塞的联邦地方法庭,诉讼列为集体诉讼,意味着其他购买苹果手机的消费者可以加入原告队伍,提出索赔。

据雷锋网了解,苹果在手机和平板电脑中采用了自行设计制造的A系列处理器,这一处理器的技术专利和设计方案来自于英国芯片设计巨头ARM公司,苹果进行了定制修改,并且委托三星电子、台积电等代工厂制造。

此前,ARM被证实受到幽灵漏洞的影响,这意味着使用该公司方案的其他手机处理器公司也将受到影响,其中除了苹果之外,也包括三星电子、高通等公司。

原告指出,苹果的处理器存在设计缺陷,能够导致黑客或者恶意程序获取保存在苹果产品中的个人信息。目前针对苹果处理器中的幽灵漏洞,还没有完整的固件或是软件补丁修补方法,另外漏洞修补是否导致苹果电子设备出现永久性的降速,还没有明确说法。

原告还表示,苹果实际上在2017年6月就知道了处理器的安全漏洞,因此苹果应该更早时间对消费者披露处理器的设计缺陷。

据称,目前至少已经有100多名消费者加入了集体诉讼中,表示自己的手机受到了处理器漏洞的影响,如果法庭作出有利于消费者的判决,苹果的赔偿金额可能超过500万美元。

在此次产品事故中,消费者更担心的是漏洞修补之后对处理器以及电脑、手机等性能的永久性下降。漏洞修补之后,苹果A系列处理器出现多大程度的性能下降,苹果尚未披露这一敏感信息。

雷锋网了解到,2017年末,苹果爆发了降速门丑闻,在全世界多个国家遭到了将近30宗消费者集体诉讼,要求苹果停止降速行为,赔偿消费者。

雷锋网

【Fintech晚报】迅雷CEO陈磊回应:惊讶互金协会指控 将入会接受监督;“以太猫”完成 7000 万美金 A 轮融资

今天,Fintech行业又有哪些不可错过的大事发生?雷锋网AI金融评论栏目“Fintech”晚报将为你搜罗业界最新资讯!

多部门联合打击网络黑色产业链 已发现代币、虚拟币类传销平台超3000多家

据央视财经报道,公安部、最高人民检察院、最高人民法院、 工信部、中国人民银行等部门和相关企业14日举行的2018年守护者计划大会上,表示将采取联合治理模式,携手更多的政府部门和企业,打击网络黑色产业链力度,共同构建“网络安全共同体”。

腾讯安全反诈骗实验室负责人李旭阳表示,最近利用所谓的区块链概念搞的代币、虚拟币这一块,就发现非常活跃的这种代币有两千多种,发现这种传销平台已经超过3000多家,这类的犯罪因为涉案金额非常大,而且危害是非常大的。

迅雷CEO陈磊回应:惊讶互金协会指控 将入会接受监督

近日,互金协会刊文指出,以发行迅雷“链克”(原名“玩客币”)为代表,一种名为“以矿机为核心发行虚拟数字资产”(IMO)的模式值得警惕,存在风险隐患。

对此,迅雷CEO陈磊接受新浪科技采访时做出回应:

“任何一个创新业务,在发展初期都会受到一定争议,因为很多人对它还不够了解。互金协会发的提示用户风险,我认为是对社会和用户负责任的举措。不过无论是互金协会还是迅雷,我认为在保护用户、打击炒作方面,目的都是一致的。而企业的利益,用户的利益和国家的政策也都是完全一致的。了解迅雷和玩客云项目的媒体和用户,都了解我们打击炒作,保护用户是我们一贯的态度,不是做样子的,而是一个企业安身立命的根基,是我们对用户的责任和承诺。”

同时他也惊讶于互金协会的“通过招商大会频繁推销、发布交易教程助推炒作”的指控,表示玩客云只开过一次线下招商会,且迅雷从未发布过交易教程。

另外关于迅雷并未加入互金协会一事,陈磊称迅雷不是一家金融企业,所以之前没有入会。但从事区块链业务之后,他们会积极拥抱加入协会,让更多的前辈帮助、监督业务。

腾讯云与长江商业银行战略合作,用云计算连接智慧小微金融服务

1月15日,腾讯云与江苏长江商业银行股份有限公司签署战略合作协议。双方宣布将在金融专有云、大数据平台、移动互联网技术、数据中心标准化建设以及金融创新场景化解决方案等方面展开深度合作,探索将云计算、大数据、人工智能等技术与金融服务相连接,助力长江商业银行更广泛地为广大小微用户提供差异化、专业化、特色化的金融服务

“以太猫”完成 7000 万美金 A 轮融资,将探索区块链+AR游戏

据金色财经消息,Etheeum CyptoKitties(以太猫实验室)已完成7000万美金A轮融资。本轮由索罗斯量子基金领投,其它投资方包括ConsenSys资本、DouleRock基金、谷歌旗下基金公司。

同时,CryptoKitties宣布发行区块链资产ETHCK,并将于1月16号联合华尔街区块链联盟举办数字资产投资论坛。据悉,这是今年美国第一个重要的区块链会议。

雷锋网AI金融评论曾报道,CryptoKitties是一个基于以太坊网络开发的虚拟养猫游戏应用,玩家可在上面买卖并繁殖不同品种的电子宠物小猫。

 

美图回应区块链传闻:正在寻找合适的方式进入,但绝对不会涉及ICO

1月15日,美图在独家回应36氪时表示:公司对区块链技术关注研究已久,目前正在寻找合适的方式进入区块链领域,但可以确定不会涉及ICO。受此影响公司股价曾一度单日上涨超过11%。

36氪在报道中称,在区块链技术的布局上,美图的董事长个人和公司似乎有所分工。当前区块链技术仍处于早期的发展阶段,未来具有很大的不确定性和风险,蔡文胜更多地是以个人的身份做早期投资。

雷锋网

智行者科技 CTO 王肖:自动驾驶大脑的设计思路探析 | 未来汽车大讲堂

自动驾驶大脑被认为是自动驾驶汽车的灵魂,也是多数公司正在努力的核心环节。但是,作为自动驾驶的最重要组成部分,自动驾驶大脑究竟是如何构成和工作的,很多人对此却仍然一知半解。最近,北京智行者科技 CTO 王肖在雷锋网 · AI 慕课学院的“未来汽车大讲堂”,对这一问题做出了将近两个小时的详细讲解。

王肖博士毕业于清华大学汽车工程系,曾作为核心人员参与 2012、2014 及 2015 年中国智能车未来挑战赛,并获得团队冠军,还曾参与起草中国智能网联车辆技术路线图,获汽车工业科学技术进步一等奖、军队科技进步奖等多项奖励。

智行者科技设定的自动驾驶路线分为两方面,一是限制场景下的园区低速车,2017 年 9 月,其研发的自动驾驶扫地车已经在北京奥林匹克森林公园进行了试运营;另外,开放场景下的自动驾驶乘用车也是其聚焦方向之一,鉴于近期北京市路测政策的出台,公司在这一领域的步伐也在不断加快。

基于智行者在技术升级和落地两方面的突出表现,关于自动驾驶大脑的构成与运行,王肖博士应该是行业最具发言权的人士之一。

(2018 年 1 月 16 日,雷锋网 · 新智驾将在美国硅谷举办 GAIR 硅谷智能驾驶峰会,届时,将有国内外多位自动驾驶行业专家到场,带来丰富的行业干货分享。详情请点击 https://gair.leiphone.com/gair/gairsv2018

整个课程共分为三部分:自动驾驶大脑的研究背景、自动驾驶大脑的设计思路探析以及 AVOS 关键技术的设计与应用。

研究背景

首先,王肖博士对自动驾驶大脑的研究背景进行了讲解,这其中包括自动驾驶大脑与人类驾驶员各自的行为逻辑分析,自动驾驶大脑的组成,以及 Google 等先进自动驾驶公司在此所做的实践。

2016 年 11 月 8 日,谷歌公布自动驾驶视频在业内引起巨大轰动,很多人一度认为自动驾驶将马上走入普通人生活。但第二天,拉斯维加斯的一辆自动驾驶低速摆渡车便与一辆卡车发生了车祸。事故的原因并非自动驾驶车辆本身出现了问题,而是卡车在倒车过程中不小心撞上了停在一边的摆渡车。

这一事故便集中反映了目前自动驾驶大脑的局限性及其与人类驾驶员的区别:在遭遇外界的某种“入侵”时,人类驾驶员可以采取积极行动,进行躲避,而停止的自动驾驶汽车则多半只能“坐以待毙”。

由此也引出两个重要问题:

一、眼下的自动驾驶系统是否具备真正的智能?

王肖博士认为,围绕事件判断中“what”、“which”、“who”、“when”、“where”等核心问题,现有的人工智能技术还远不能给出完整准确的回答。

比如,利用眼下的技术,用户可以搜索出美国总统是谁,在什么时间当选总统,但关于其为什么可以当选、通过什么手段当选这样的问题,Google 上能搜索出来的仅仅是引用的相关专家回答,搜索引擎自己并不能生成智能分析。

因此,可以说,在分析“为什么”或者“怎么样”的问题时,现有的人工智能仍然非常“傻”。关于“在哪儿”、“要去哪儿”、“周围车辆状态如何”这样的问题,现有的自动驾驶系统可以很容易做出高精度感知和定位,但如果面对堵车、如何换道这样的问题,自动驾驶系统多数只能基于规则来工作。

在此,王肖博士举出了一个具体案例。最早,Google 的豆荚车看见小朋友穿着奇形怪状衣服,可以做到停车避让,这是所有新司机都可以达到的水平。但是,如果是一个老司机,则会想,小朋友穿着奇怪的衣服是否是因为前方学校正在举行活动,学校举行活动是否会引发堵车,如此是不是需要避开这条路,重新规划一条路线。但现在即使是 Google 在内的所有自动驾驶公司的产品都做不到这一点,即无法产生一个正常司机能够产生的联想。

所以,王肖博士得出的结论是,现有的自动驾驶系统并不具备真正的智能,我们所说的智能车,某种程度上,还处于非常“弱智”的阶段。

二、人类的常规驾驶是否需要如自动驾驶一般的高精度输入与输出?

现在世界上最好的摄像头、激光雷达、高精度定位都宣称自己能做到厘米级,王肖博士表示,在与很多汽车行业的朋友交流时,经常被问到“人为什么不需要高精度地图”之类的问题。

王肖认为,这之中非常重要的一个问题是,大部分人类驾驶员做不到高精度识别或高精度控制。人识别不了厘米级误差,而且,人类开车只需要确定一个大概的方向,基本靠局部定位,在驾驶过程中凭感觉完成判断。高精度控制也是同理。人开车时只要不打瞌睡,基本上都能比世界上最好的自动驾驶系统完成更好的驾驶。

行业常说希望自动驾驶汽车达到人类驾驶水平,但是自动驾驶研究的思路和实现方案与人类则完全不一样。现在的自动驾驶汽车依赖高精度感知定位,某种程度上就是因为自动驾驶大脑本身太弱。

……

自动驾驶大脑设计思路探析

自动驾驶大脑的分析设计是此次课程的核心环节,关于自动驾驶大脑的认知、规划,情境的输入与输出,王肖博士花费了大量篇幅从各个细节进行了讲解,并从智行者的产品出发,做出了多种情境的实例解析。

自动驾驶包括感知、认知、规划三个部分,自动驾驶大脑则主要包括认知和规划模块。认知的输入就是感知的输入,输出后便直接到达了规划。

在这里,王肖博士引入了几个重要的行业术语,比如感知的输出为场景,场景便是传感器识别到的人或车,是孤立的事物,其相互连接并不紧密。情境则是眼前的画面映射到大脑中产生的关联分析,这种分析又包括多维场景的融合分析,对象显著性分析,注意力聚焦分析,情境形式化分析。关于这四个模块,王肖博士都做出了非常详尽的解释。

……

AVOS 关键技术

在第三部分,王肖博士则介绍了智行者自动驾驶操作系统(AVOS)的设计思路与应用,以及其涉及的关键技术,并分享了团队的测试视频。

……

课程最后,王肖对学员的在线提问也做出了耐心解答,这些问题涵盖了自动驾驶大脑的研究设计到整个自动驾驶行业发展的多个方面。

比如,自动驾驶运动规划的方法有哪些?

王肖博士的回答是,运动规划大致有两种,一种是常规的路径加速度的分解,一种是模型的方法,后者最典型的代表是戴姆勒,其主要思路是,综合考虑障碍物位置、道路属性等多种因素后,得出车的轨迹。对两种方法的好处与缺陷,王肖博士也进行了分析。

比如,最近有消息称,博世与国内三大图商合作完成了高精度地图众包采集与数据标注的可行性验证,那么,高精地图的制作未来会不会被主流图商或大型供应商垄断,创业公司自己做采集、标注平台的意义还大吗?

王肖博士认为,未来,高精度地图肯定会由图商来做,包括智行者在内的大多数科技公司并不想做,也没有能力去做大范围的高精度地图。

而高精度地图为什么是各家自动驾驶公司商业化的必备条件,王肖分析了几点原因,包括高精度地图是导航的基本依据;高精度地图是弥补感知缺失的重要手段;高精度地图是量产产品行为一致性的可靠保证。

……

点击课程链接 http://www.mooc.ai/open/course/412,即可获取王肖完整课程视频

“未来汽车大讲堂”由雷锋网 · 新智驾、雷锋网 · AI 慕课学院联合主办,从 2017 年 11 月 30 日晚 8 点开始,通过在线直播(直播平台:AI 慕课学院、雷锋网 App)形式分享课程。之后,还将有多位学界、产业界专家陆续送出更多精彩课程,学员通过以下方式,即可参与:

1、微信添加助教“小慕”(moocmm),并备注:低速+姓名+职位,通过审核后将邀请你入群(专业群审核严格,请认真填写,感谢理解);

2、关注微信公众号“新智驾”(ID:AI-Drive),进入后直接回复关键词“特定场景自动驾驶”,可预约课程;或点击课程直达链接查看:http://www.mooc.ai/open/course/338

3、直播平台:AI 慕课学院、雷锋网 App(注:直播免费,录像回看需支付 29.9 元)。

雷锋网

直播答题应用轮番吸金,百万英雄广告狂人专场告诉我们什么?

2018年的第一个月,直播答题已然成为风口。然而在不少人看来,这就是一场“撒币”盛宴,如何赚钱、如何保持用户粘性成为严峻的问题。

就在今天晚8点,今日头条旗下西瓜视频的直播答题节目《百万英雄》举办了”广告狂人专场“,单场奖金500万,30分钟直播内联动近30家品牌主共同参与、近100家广告代理商。

在雷锋网编辑看来,这一场“广告人专场”可以说有两方面的作用:其一是探索直播答题的广告变现,一口气展示给品牌主其品牌植入方式;二是开启“专场答题”。在这一场广告专场结束后,紧跟着就是诗词专场。

在节目开始之前,雷锋网编辑拿到了一份广告狂人专场的广告节目单。从节目单上我们可以看到有在四个环节:预热、开场、正式开始答题和终极一问,都有不同的广告植入方式。每一个环节中,都有相应的品牌露出、主持人都要配合完成口播广告、题目中也会有相应的植入。

预热时的广告植入方式:开场前15分钟预告【5支品牌广告轮播】、主持人自我介绍【人名条植入品牌名】、主持人着装【品牌LOGU徽章】、活动规则【规则条植入品牌产品名】、主持人动作【品牌周边道具植入】。

开场时的广告植入方式:开场动作【品牌产品道具植入】、开场口播【所有品牌名】、本场奖金+金币雨、【品牌LOGO植入+主持人口播】。

正式开始答题时的广告植入方式:品牌名植入题干、品牌名植入选项、品牌名及核心卖点植入题后解读、中插广告片、产品浮层,花式包装、主持人产品道具互动、品牌名植入复活码口播、品牌明星中插出境,站外粉丝团互动预热。

终极一问中的广告植入方式:品牌植入包装盒、品牌卖点植入题目。

这么多广告,还有人愿意看吗?不知道是出于因为500万奖金的诱惑,还是因为主持人陈铭口播广告技巧了得,最讨厌广告的观众们竟然在最后一题时还有450万在线。也就是说这一场有450-500万人同时收听了30多分钟,来自30个品牌的广告。500万人瓜分500万奖金,最后有26万人留下,每人分得12元奖金,和普通场的奖金不相上下。

在这一场专场之前,雷锋网编辑就认为,对直播答题如何赚钱的担心或许有点多余。有流量就会有变现的方式,而最直接了当的当数广告。直播答题平台提供内容让用户免费消费,广告主花钱为直播平台的内容买单,那么,广告主实际上买走了用户的时间和注意力。直播答题只要有流量,就不用担心没钱撒。

在1月9日,《芝士超人》宣布拿到趣店旗下大白汽车1亿元广告订单,将会分期支付。在当晚的答题直播中,主持人怀抱大白汽车玩偶并且预告次日晚间第七题的答案,在大白汽车分期APP中。想要知道答案,玩家就会去下载App,广告的植入直接变成引流。

此后,《百万赢家》先后开设了京东、美团专场,专场中主持人口播广告还有品牌的答题植入。《冲顶大会》在1月15日整天的几场比赛中设置了百度专场,同样采用了口播加上答题植入。《百万英雄》之前还没有广告,今天的这一场直接来了30位品牌商,大玩广告手法。

现在看来,短短两周,直播答题的商业变现已经逐渐清晰。那么,如何保持用户粘性或许会是下一个问题。目前,答题模式相对单一,各个竞争产品差异很小,那么用户自然会选择奖金高的App。谁出钱多,谁能让广告主出钱多,或许会定这些直播答题App的生死。


雷锋网

没有赛车手的赛车,比拼的是什么?

*Roborace项目专注于自动驾驶赛车。

雷锋网新智驾按:本文作者Dean Takahashi,来自VentureBeat(以下简称VB)。雷锋网编译整理。

Roborace是一项电动无人驾驶汽车竞赛,所有参赛车辆都采用相同设计,完全比拼软件设计能力。

作为科幻电影《创:战纪》里面酷炫吊炸概念车的缔造者,Daniel Simon把第一款无人驾驶的电动赛车设计成了绿色汽车。该车重达2204磅(约999.7千克),长约15.7英尺(约4.7米),携带四个电机和一个大电池,时速超过200英里(约321公里)。它还拥有一个英伟达 Drive PX2的自动驾驶平台,每秒可执行24万亿次的AI运算,并将很快升级采用新型AI芯片Xavier(含有90亿个晶体管)。

Roborace的创始人希望这款车可以成为无人驾驶汽车软件开发者相互竞技的基础平台。虽然它并不总是最好最快的汽车,但首席创意官Rod Chong在CES采访时表示,这款车在相对复杂的赛道上可以安全避开行人和其他障碍物。

每个参赛团队的汽车硬件配置都一样,他们将在软件中一决胜负。曾经参与过汽车游戏项目的Rod Chong说:“就像早期的赛车导致盘式制动器的发明一样,这种竞赛可以催生更好的AI技术。”

*Roborace CTO Bryn Balcombe和首席创意官Rod Chong

以下是VB采访Roborace的首席创意官Rod Chong和 CTO Bryn Balcombe的内容,雷锋网新智驾编译如下。 

VB: 当前你们正在做什么事情?

Rod Chong: Roborace项目是在两年前开始的,当时我们的创始人正是考虑赛车运动的发展方向,而一个明显的趋势就是电动车竞赛。很多制造商正在涉足该领域,但我们也需要寻找其他赛车的方式来推动技术的发展。

其实,传统赛车一直推动着汽车的发展,汽车技术的许多重大里程碑都来自赛车。例如,五十年代后期,捷豹在赛车上推出了碟刹,当然还有很多其他例子。智能驾驶和自动驾驶汽车正在发生大规模的变革,我们的目标是开发一个集娱乐与媒体的平台,通过竞争和挑战来推动相关技术的发展。

我们的愿景是,这些汽车将以一种新颖的形式出现在竞赛中。我正在调研赛车的各个方面,不会采用大多传统形式。一般的比赛,就是让汽车在循环赛道中行驶,达到一定距离后,第一个通过终点线的获取胜利。不过,我们会在比赛途中设置一些障碍车辆来考验汽车的避障功能,这要求参与公司必须开发这项重要技术。

VB:轨道上可能要有行人作为障碍。

Chong:我们有模仿这种情况的自动障碍物,汽车将通过这个来挑战彼此,但增强现实的技术元素也需要。我们正在设计一个看起来像电子游戏的东西,作为竞赛的一部分。汽车可以看到AR障碍物或AR车辆,并做出响应反馈。

除了这辆车以外,我们还有一辆带有驾驶舱的无人驾驶车Robocar,可以携带一个司机,通过互动让AI驾驶系统向司机学习。未来可能会有几支队伍,首先在一辆车中配备驾驶舱和专业司机,然后,让更多的Robocars向司机学习。在设计时这些元素我们都会考虑在内。

VB:是电动的吗?

Chong:是电动的。我们的最终目标是拯救生命,通过推动技术,改善城市的生活条件。

VB:有点像DARPA挑战。

Chong:是的,那里的车真的很快。

VB:目前进展多大?

Chong:目前在做最后的工程,就是显示模型。我们必须开发它,保证它的可靠性,且适应高速行驶。现在对车身做冷却处理,预计到五月底或六月初会完成。至于比赛日程,暂时还没有谈论。

VB:这辆车已经投入多少工作量?

Chong:大概一年半。

VB:其他公司要建造他们自己的汽车吗?

Chong:现在的前提条件是我们提供硬件平台,好支持不同参赛团队提供的驱动智能平台。硬件是公平的,竞争主要是软件方面,是软件工程师之间的较量。

VB:所以像初创公司AImotive也可以参与竞争?

Chong:是的,他们可以。

VB:有什么有趣的事情让你换掉工作吗?

Chong:对我来说,目前的工作充满了正能量,很难拒绝。你只是从傍观者的角度看车,而我却要和车一起工作生活。我更多地把它看作是一个机器人,而不是一辆汽车。

VB:在这可以从电子游戏中吸取经验教训吗?

Chong:是的。在我整个游戏工作史中,我将把所有这些应用于竞赛形式。

VB:用AR技术,几乎可以创建一个虚拟轨道。

Chong:创建一个虚拟轨道有很多方法,例如在人工智能系统和自动驾驶系统之间建立多人联盟,一起进行多人模拟游戏。

VB:这里的风险更小,人们可以用硬件实现疯狂赛车。

Chong:以往各种不同的著名赛事中,人们试图减慢车速,增加障碍,来保证赛车手的安全。但是无人驾驶赛车不需要考虑司机的安全,我们可以让它疯狂的快,或者做一些疯狂的事情。我们需要考虑的是两辆车在轨道上运行的方式。

VB:设置障碍,就是学习如何导航,而不是跑的最快。

Chong:这将是令人兴奋的。如果你有10辆无人驾驶汽车在一条赛道上爬行,然后这些赛车手从他们身边闪过,这将是非常令人兴奋的观察。

英伟达新的Xavier芯片系统。

VB:这些公司标志是实际的赞助商吗? 

Chong:这些只是我们迄今为止有过讨论和合作的企业。目前我们主要的合作者是英伟达,运用他们的硬件和技术,驱动Drive PX2自动驾驶平台。我们已经宣布,将在今年夏季与英伟达一起研发Xavier芯片系统(2016年9月,Nvidia 公司针对自动驾驶技术和汽车产品发布了一款 Xavier芯片),使其应用在自动驾驶赛车上,这为我们开辟了全新的竞争格局,不久的将来就会看到一个更加智能化的平台。

VB:电源效率更高吗?

Chong:我们并不担心电量消耗,只是想知道需要多少计算能力来驱动智能软件,这才是至关重要的。

VB:目前,对于设计有什么想说的吗?

Bryn Balcombe:首先是要设计无人的驾驶舱,这意味着汽车在没有人辅助的情况下会自主行驶,对于目前市场而言有较大的挑战。然后要重新运用空气动力学来设计操纵系统,因为没有了驾驶员的空间,散热器管道等可以重新布局。

雷锋网

AAAI 2018预讲会在哈工大成功举办,25篇顶会文章讲了什么(下)

雷锋网 AI 科技评论按:1 月 6
日,由中国中文信息学会青年工作委员会(简称「青工委」)主办,哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)承办的『AAAI
2018 预讲会』在哈尔滨工业大学成功举办。本次会议由华为和云孚科技提供赞助,雷锋网作为独家合作媒体,提供了在线直播,并对本次预讲会做全程报道。

来张讲者合照镇楼!其中有教授、博士、研究生、本科生,覆盖了学术研究的各个年龄层。

照片由哈工大李家琦提供

本次 AAAI 2018 预讲会邀请了来自全国各地 15 所高校和研究单位的老师和同学分享他们在 AAAI 2018 中接收的 25
篇论文,内容覆盖有聊天机器人、语义依存图、文本摘要、机器翻译、信息抽取、表示学习等多个领域的最新研究成果。会议吸引了 200
多名老师和学生来此参会并进行交流。

我们在《AAAI 2018预讲会在哈工大成功举办,25篇顶会文章讲了什么(上)》中已经详细介绍了其中的12篇文章,分别为:

Session 1

[1] Adversarial Learning for Chinese NER from Crowd Annotations

作者:杨耀晟,张梅山,陈文亮,张伟,王昊奋,张民

单位:苏州大学人类语言技术研究所

[2] Adaptive Co-attention Network for Named Entity Recognition in Tweets

作者:张奇,傅金兰,刘晓雨,黄萱菁

单位:复旦大学

[3] Large Scaled Relation Extraction with Reinforcement Learning

作者:曾祥荣,何世柱,刘康,赵军

单位:中科院自动化所

[4] Event Detection via Gated Multilingual Attention Mechanism

作者:刘健,陈玉博,刘康,赵军

单位:中国科学院自动化研究所

[5] Neural Networks Incorporating Dictionaries for Chinese Word Segmentation

作者:张奇,刘晓雨,傅金兰

单位:复旦大学

[6] Learning Multimodal Word Representation via Dynamic Fusion Methods

作者:王少楠, 张家俊, 宗成庆

单位:自动化所

Session 2

[7] Inferring Emotion from Conversational Voice Data: A Semi-supervisedMulti-path Generative Neural Network Approach

作者:周素平,贾珈,王琦,董宇飞,尹宇峰,雷克华

单位:清华大学

[8] Long Text Generation via Adversarial Training with Leaked Information

作者:郭家贤,卢思迪,蔡涵,张伟楠,汪军,俞勇

单位:上海交通大学

[9] Style Transfer in Text: Exploration and Evaluation

作者:付振新,谭晓烨,彭楠赟,赵东岩,严睿

单位:北京大学计算机科学技术研究所

[10] Meta Multi-Task Learning for Sequence Modeling

作者:陈俊坤,邱锡鹏,刘鹏飞,黄萱菁

单位:复旦大学

[11] RUBER: An Unsupervised Method for Automatic Evaluation of Open-DomainDialog Systems

作者:陶重阳,牟力立,赵东岩,严睿

单位:北京大学计算机科学技术研究所

[12] Exploring Implicit Feedback for Open Domain Conversation Generation

作者:张伟男,李凌志,曹东岩,刘挺

单位:哈尔滨工业大学

我们接下来将详细介绍另外13场报告的内容。分别为:

Session 3

[13] Neural Character Dependency Parsing for Chinese

作者:李浩楠,张智松,琚毓琪,赵海

单位:上海交通大学

[14] A Neural Transition-Based Approach for Semantic Dependency Graph Parsing

作者:王宇轩,车万翔,郭江,刘挺

单位:哈尔滨工业大学

[15] Asynchronous Bidirectional Decoding for Neural Machine Translation

作者:张祥文,苏劲松,秦悦,刘洋,纪荣嵘,王鸿吉

单位:厦门大学

[16] Knowledge Graph Embedding with Iterative Guidance from Soft Rules

作者:郭舒,王泉,王丽宏,王斌,郭莉

单位:中国科学院信息工程研究所

[17] Embedding of Hierarchically Typed Knowledge Bases

作者:张日崇,孔繁爽,王晨玥,茆永轶

单位:北京航空航天大学

[18] Faithful to the Original: Fact Aware Neural Abstractive Summarization

作者:曹自强,韦福如,李文婕,李素建

单位:香港理工大学

[19] Twitter Summarization based on Social Network and Sparse Reconstruction

作者:贺瑞芳,段兴义

单位:天津大学

Session 4

[20] Improving Review Representations with User Attention and ProductAttention for Sentiment Classification

作者:吴震 ,戴新宇,尹存燕,黄书剑,陈家骏

单位:南京大学

[21] Chinese LIWC Lexicon Expansion via Hierarchical Classification of WordEmbeddings with Sememe Attention

作者:曾祥楷,杨成,涂存超,刘知远,孙茂松

单位:清华大学

[22] Learning Structured Representation for Text Classification withReinforcement Learning

作者:张天扬,黄民烈,赵立

单位:清华大学

[23] Assertion-based QA with Question-Aware Open Information Extraction

作者:闫昭,唐都钰,段楠,刘树杰,王文迪,姜大昕,周明,李舟军

单位:微软亚洲研究院

[24] End-to-End Quantum-like Language Models with Application to QuestionAnswering

作者:张鹏,牛嘉斌,苏展,王本友,马力群,宋大为

单位:天津大学

[25] EMD Metric Learning

作者:张子昭,张宇博,赵曦滨,高跃

单位:清华大学

Session 3(7场报告)

主持人:杨亮副教授,大连理工大学

[13] Neural Character Dependency Parsing for Chinese

作者:李浩楠,张智松,琚毓琪,赵海

单位:上海交通大学

经过一个半小时的午间休息和讨论后,Session 3 由来自上海交通大学的赵海教授开启。

2009 年,赵海教授针对中文分词过程中会受到词义模糊影响的问题,提出了字符级依存分析的方案。这种方案有两个好处:1)使用字符级树避免了中文分词不存在通用标准的问题;2)单词内部的深层次结构为更深层次的处理提供了额外的信息,能够更好地理解整个句子。

在此基础上,这篇文章利用神经模型来探索字符依存分析,提出了一个开放的字符级依存树库 SCDT(首次提供了丰富的字符级 POS 标签和依存类别标签)以及首个字符级别的神经中文依存分析器。

实验显示字符级 POS 标签和依存标签对解析性能起着重要的作用。另外在主分析指标方面,神经字符依存分析要比无神经网络的分析器更有效。

(感谢赵海教授指正)

[14] A Neural Transition-Based Approach for Semantic Dependency Graph Parsing

作者:王宇轩,车万翔,郭江,刘挺

单位:哈尔滨工业大学

随后由来自哈工大 SCIR 的王宇轩博士分享了他们在语义依存图上的研究工作。

语义依存图是近年来提出的对树结构句法或语义表示的扩展,它与树结构的主要区别是允许一些词拥有多个父节点,从而使其成为有向无环图 (directed acyclic graph,DAG)。因此要获得句子的语义依存图,就需要对这种 DAG 进行分析。目前大多数工作集中于研究浅层依存树结构,少有人研究如何对 DAG 进行分析。

这篇文章提出一种基于转移的分析器,使用 list-based arc-eager 算法的变体对依存图进行分析。

[15] Asynchronous Bidirectional Decoding for Neural Machine Translation

作者:张祥文,苏劲松,秦悦,刘洋,纪荣嵘,王鸿吉

单位:厦门大学

来自厦门大学的张祥文介绍了他们在机器翻译中一项有趣的工作。

传统的机器翻译中都是按照单向顺序编码。这种方法的一个缺点就是,一旦中间出现翻译错误,随后的内容就会出现很大的差错。本文作者提出了一种双向编码的新思路。

15-1,双向编码

实验结果相较之前的方法有显著提升。但是这种效果的提升是以消耗计算量为代价的。Poster 环节中,张祥文也表示他们也曾考虑过跳序编码的方法。

[16] Knowledge Graph Embedding with Iterative Guidance from Soft Rules

作者:郭舒,王泉,王丽宏,王斌,郭莉

单位:中国科学院信息工程研究所

随后由来自中科院信息工程研究所的王泉副研究员报告了他们在知识图谱表示学习方面的研究。

学习知识图谱在低维向量空间中的分布式表示是当前研究的热点。最近,将分布式知识表示与传统符号逻辑相结合引起了越来越多的关注。但是,以往的大多数尝试采用一次性注入逻辑规则的方式,忽略了分布式知识表示学习和逻辑推理之间的交互性。此外,以往的方法只专注于处理硬规则,即那些总是成立、不能被违反的规则。这类规则通常需要耗费大量的人力来编写或验证。

本文作者提出了一种新的知识图谱分布式表示学习方法——规则引导嵌入(rule-guided embedding,简记为 RUGE),借助软规则的迭代引导完成知识图谱表示学习。所谓软规则,就是那些不总是成立、带置信度的规则。这类规则可以经由算法从知识图谱中自动抽取。

16-1,框架概述

具体来说,RUGE 同时利用标注三元组、未标注三元组、自动抽取出的软规则这三种资源以迭代的方式进行知识图谱表示学习。每一轮迭代在软标签预测和表示修正这两个步骤间交替进行。前者利用当前学到的表示和软规则为未标注三元组预测软标签;后者进一步利用标注三元组(硬标签)和未标注三元组(软标签)对当前表示进行修正。通过这个迭代过程,RUGE 可以成功建模分布式知识表示学习和逻辑推理二者间的交互性,逻辑规则中蕴含的丰富知识也能被更好地传递到所学习的分布式表示中。

(感谢王泉副研究员指正!)

[17] Embedding of Hierarchically Typed Knowledge Bases(孔繁爽,北航)

作者:张日崇,孔繁爽,王晨玥,茆永轶

单位:北京航空航天大学

孔繁爽是来自北京航空航天大学的硕士生。她在报告中介绍了他们在 embedding 过程中考虑实体类型的研究工作。

Embedding 已经成为基于知识库和各种嵌入模型的预测、推理、数据挖掘和信息检索的重要手段。但是大多数模型都是「无类型的」,也即将知识库仅仅视为一个实例集合,而不考虑实体的类型。

17-1 ,embedding过程中考虑实体类型

在这篇文章中,作者研究了实体类型信息在知识库 embedding 中的应用。他们提出了一个框架,将一个通用的「无类型」嵌入模型添加到一个「有类型」嵌入模型中。这个框架将实体类型解释为对所有实体集合的一个约束,并使这些类型约束在嵌入空间中同构地引入一组子集。然后引入额外的 cost 函数来模拟这些约束与实体和关系的嵌入之间的适应性。

(感谢孔繁爽指正!)

[18] Faithful to the Original: Fact-Aware Neural Abstractive Summarization

作者:曹自强,韦福如,李文婕,李素建

单位:香港理工大学

来自香港理工大学的曹自强博士在随后的报告中提出,生成摘要不仅要保持信息充分,更重要的是信息的忠实性。

与抽取摘要不同,生成式摘要在融合原文本的过程中往往会创造出虚假的事实。曹自强在报告中介绍,目前有近 30% 的最先进的神经系统都会受到这种问题的困扰。以前生成式摘要主要着眼于信息性的提高,但作者认为忠实性(也即「信」)是生成摘要的前提,非常重要。

18-1,模型框架

为了避免在生成摘要中产生虚假事实,作者使用了开放的信息抽取和依存分析技术从源文本中提取实际的事实描述,然后提出 dual-attention sequence-to-sequence 框架来强制以原文本和提取的事实描述为条件的生成。实验表明,他们的方法可以减少 80% 的虚假事实。

(感谢曹自强博士指正!)

[19] Twitter Summarization based on Social Network and Sparse Reconstruction

作者:贺瑞芳,段兴义

单位:天津大学

来自天津大学的贺瑞芳副教授介绍了她们基于社交网络和稀疏重构的 Twitter 摘要研究工作。

随着 Twitter 等微博服务的快速增长,数百万用户产生了大量短小而嘈杂的信息,使得人们很难快速掌握自己感兴趣话题的概要信息。作者通过 Twitter summarization 来尝试这个问题的解决,即从大量 Twitter 文本中提取摘要信息。

传统摘要方法一般只考虑文本信息,现有推特摘要方法考虑了社会媒体的用户级静态特性,但却忽视了推文之间的社交关系。受社会学理论的启发(在社会网络中有表达一致性和表达传染性),作者提出了一种新的称之为 Twitter Summarization based on Social Network and Sparse Reconstruction(SNSR)的微博摘要方法,这种方法能够用于社交媒体情景中大规模、短小和嘈杂的文本上,采用稀疏重构进行推理。

作者在文章中将推文之间的关系建模为社会正则,将其整合到组稀疏优化的微博摘要框架之中,并设计了多样性正则来消除社交网络带来的强冗余信息。

由于缺乏公共语料库,作者构建了 12 个不同话题的标准 Twitter 摘要数据集。在这个数据集上的实验结果表明,这个框架在处理社交媒体中大规模、短小及嘈杂消息的有效性。

(感谢贺瑞芳副教授指正!)


Session 4(6场报告)

主持人:丁效副教授,哈尔滨工业大学

[20] Improving Review Representations with User Attention and Product Attention for Sentiment Classification

作者:吴震 ,戴新宇,尹存燕,黄书剑,陈家骏

单位:南京大学

来自南京大学的吴震在 Session 4 环节介绍了他们在文档级别情感分类方面的研究工作。

在网络平台上有大量由用户写的文档类型的评价,其中有些是表达用户情感的,有些则是对产品本身的评价。如何根据这些评价信息推断出用户的情感表达是一个非常有意思的工作。

在这方面,唐都钰等人(2015)在 CNN 网络的基础上添加了用户和产品的偏置矩阵和表示矩阵来表示这些信息;陈慧敏等人(2016)在层次网络中融入用户和产品的这些信息。这两个研究都获得了很好的提升。

20-1,UPNN

20-2,USC+UPA

作者注意到,评论文本中有些词表现出很强的用户喜好,而有些词则倾向于评价产品特点。其中观点(理性评价)与产品更相关,而情绪(感性评价)则与用户喜好关系更紧密。在此基础上,作者提出了一个对称的网络模型:

20-3

在这个网络中,左边用来抽取用户喜好的感性评价,右边用来抽取产品评价的理性评价。此外为了综合两种视角,作者补充了一个组合策略。整体来看,损失函数表示为

其中三个参数可以调整以观看不同的效果。其实验表明,这种模型要比目前 state-of-art 的一些模型有更好的效果。

[21] Chinese LIWC Lexicon Expansion via Hierarchical Classification of Word Embeddings with Sememe Attention

作者:曾祥楷,杨成,涂存超,刘知远,孙茂松

单位:清华大学

来自清华大学孙茂松组的杨成博士报告了他们在中文语言查询和字数统计(LIWC)词义扩展的研究工作。

LIWC 是一个字数统计软件工具,已被用于许多领域的定量文本分析之中。由于其成功和普及,核心词典已被翻译成中文和许多其他语言。然而,其中的词典只包含数千个单词,与汉语常用单词的数量相比是远远不足的。目前的方法通常需要手动扩展词典,但是这往往需要太多时间,并且需要语言专家来扩展词典。

为了解决这个问题,作者提出了自动扩展 LIWC 词典的方法。具体而言,作者认为这个问题是一个层次分类的问题,并利用 seq2seq 模型来给词典中的单词分类。另外,作者还使用关注机制的义元信息来捕捉一个词的确切含义,以便可以扩展一个更精确、更全面的词典。

(感谢杨成博士指正!)

[22] Learning Structured Representation for Text Classification via Reinforcement Learning

作者:张天扬,黄民烈,赵立

单位:清华大学

随后杨成博士代表黄民烈副教授介绍了他们在学习文本分类的结构表示方面的研究内容。

表征学习是自然语言处理中的一个基本问题。这篇文章研究如何学习文本分类的结构化表示。

与大多数既不使用结构也不依赖于预定义结构的现有表示模型不同,作者提出了一种强化学习(RL)方法,通过自动地优化结构来学习句子表示。

作者在文章中提出两种结构表示模型:Information Distilled LSTM (ID-LSTM) 和 Hierarchically Structured LSTM (HS-LSTM)。其中 ID-LSTM 只选择重要的任务相关的单词,HS-LSTM 则去发现句子中的短语结构。两种表示模型中的结构发现被表述为一个顺序决策问题,结构发现的当前决策影响随后的决策,这可以通过策略梯度 RL 来解决。

结果表明,这种方法可以通过识别重要的词或任务相关的结构而无需明确的结构注释来学习任务友好的表示,从而获得有竞争力的表现。

[23] Assertion-based QA with Question-Aware Open Information Extraction

作者:闫昭,唐都钰,段楠,刘树杰,王文迪,姜大昕,周明,李舟军

单位:微软亚洲研究院

接下来由哈工大的冯骁骋博士代替微软亚洲研究院的唐都钰博士,介绍了他们在自动问答方面的研究工作。

在这项工作中,作者提出了一个基于断言的问答任务(Assertion-based QA),这是一个开放的领域问题问答任务。在搜索引擎中,用户提出问题后,引擎会反馈回一个相关的段落作为响应。但是这并不利于用户快速得到想要的信息。为了简化引擎反馈信息,作者提出将问题和段落作为输入,输出包含主、谓、宾三元组表示的断言的 ABQA 问题。

为了解决这个问题,作者构建了一个名为 WebAssertions 的数据集,其中包括 55960 个(question,passage)和 358427 个(question,passage,assertion)。

随后为了从段落中提取出断言,作者开发了提取式和生成式两种方法。实验结果表明,这两种方法都能够较好地直接从段落中给出问题的具体答案,并包含部分支撑信息。(文中断言泛指三元组)

(感谢冯晓骋博士指正!)

[24] End-to-End quantum language models with Application to Question
 Answering

作者:张鹏,牛嘉斌,苏展,王本友,马力群,宋大为

单位:天津大学

来自天津大学的苏展做了一场极为有意思的报告,他们的工作是通过借鉴量子统计物理中的方法来表示语言模型,并用于语问答任务。

语言建模(LM)是自然语言处理领域的基础研究课题。最近(Sordoni,Nie 和 Bengio 2013)利用量子统计物理中的数学形式,提出了量子语言模型(Quantum Language Model,QLM)。具体来说就是,QLM 借鉴了量子力学中密度矩阵的概念,将 single term 和 term dependency 的概率不确定性 encoding 到密度矩阵中,且与传统 n-gram 模型相比,量子语言模型在表示 n 阶 dependency 时不会增加参数规模。

这种方法在理论上是非常重要的,因为它是首次用量子理论的公式来推广 LM。但是其也有一些限制:1)QLM 中每个词的表示是一个 one-hot 向量,它只能编码 local 事件,而不能考虑全局语义信息;2)QLM 通过密度矩阵表示文本(例如 query, document),它通过迭代求解而非解析求解,因此在端到端的设计中很难更新和优化密度矩阵;3)QLM 中密度矩阵的表示、训练和匹配,这三个步骤无法共同优化,限制了 QLM 的适用性。

针对这些问题,这篇文章首次将词向量作为单个词的状态向量,单个词表示一个纯态系统,整个句子就可以对应于由密度矩阵表示的混合态系统。这样就可以在没有迭代估计的情况下导出密度矩阵,密度矩阵表示也可以被集成到神经网络结构中并通过反向传播算法自动更新。

24-1,单句表示,Question 和 Answer 分别用密度矩阵表示

基于这种思想,作者提出了一种端到端的模型(即基于神经网络的类量子语言模型(NNQLM)),并设计了两种不同的体系结构。

24-2,框架一 由于密度矩阵是一个半正定的矩阵,其联合表示的迹内积可以反映密度矩阵相似度,为了将其应用于 End-to-End 模型,将联合表示矩阵的对角线元素和迹作为全连接层的输入。

迹内积 (Trace Inner Product) 可表示两个量子系统的相似度。在问答任务中,Question (Q) 和 Answer (A) 所对应的两个密度矩阵的乘积可作为 Q 和 A 的联合表示,其联合表示的迹(即迹内积)可计算 Q 和 A 的相似度,每个对角线元素表示各个潜在语义子空间的相似度。

24-3,框架二 对密度矩阵的联合表示进行卷积操作,实验结果表明卷积可以更加充分地挖掘联合表示中潜在语义子空间的相似性信息

作者将这个模型用在经典的 QA 任务中,即答案选择(从预选的候选答案中找出正确的答案)。实验结果表明,NNQLM 在 WIKI 数据集上显著提升了 QLM 的效果,并在 TREC-QA 数据集接近了 state-of-art 的结果。

目前,量子力学和神经网络的交叉领域已经衍生出量子机器学习和量子人工智能等新兴研究方向,已有相关重要论文发表在 Science 等高水平期刊。该论文以语言模型为切入点,对量子力学和神经网络这一交叉领域进行研究,并在自然语言处理领域的问答任务中实现了端到端训练的类量子语言模型,扩展了量子语言模型的理论和应用。

(感谢苏展指正!)

[25] EMD Metric Learning(张子昭,清华)

作者:张子昭,张宇博,赵曦滨,高跃

单位:清华大学

最后来自清华的本科生张子昭做了本次预讲会的最后一个报告,报告内容为对 EMD 度量的一个优化工作。

Earth Mover's Distance (EMD) 是 2000 年 IJCV 期刊文章《The Earth Mover's Distance as a Metric for Image Retrieval》提出的一种多维分布相似度量方法,被广泛应用于计算机视觉等任务当中。所谓 EMD,是传统运输问题的最优解问题,简单来说就是给定两个 signature(P 和 Q),把一个变成另一个所需要的最小工作量。EMD 越小,实体之间就越相似。

 

25-1,EMD。其中 f_ei 是 P_i(Q_i)的中心的特征,w_i 是 P_i(Q_i)的相应的权重。d_ij 是从 P_i 到 Q_j 运送一个供给单位的成本,f_ij 是相应的流量

EMD 求解公式为

目前大多数设计 EMD 的工作都集中在 EMD 的加速和应用上,很少有工作对 EMD 进行优化。为了解决这样的问题,这篇文章提出了一个 EMD 度量学习的算法。

从上面的公式可以看出 ground distance matrix D 对 EMD 有很大影响。所以要想优化 EMD,那么就去优化 D。从另一方面 D 又由相应的度量 A 来决定,因此可以通过优化 Ground Distance Metric A 来优化 EMD。

 

25-3,EMD 度量学习框架

其方法是从训练数据中选择出一个子集,对这些数据进行采样,得到一些三元组来减少整个方法的计算量;随后构建一个目标函数,通过交替优化模型,最后得到一个稳定的度量 A。

在实验部分,作者将这种方法应用于多视角对象分类和文档分类当中。实验结果表明,与传统的 EMD 方法和最新的方法相比,他们提出的 EMD 度量学习方法具有更好的性能。此外,这种 EMD 度量学习方法也可以应用于其他领域。

(感谢张子昭指正!)


!!!NOTE!!!

预讲会已经结束,顶会将要开始。届时雷锋网 AI 科技评论也将到现场进行一线报道。如果你也有论文被 AAAI 录用 ,欢迎在后台留下你的联系方式,我们将与您联系,并进行更多交流!

雷锋网

清华Aminer团队发布「AI 与自动驾驶汽车研究报告」,阐述 AI 研究现状

雷锋网 AI科技评论按:近期,清华大学的Aminer团队利用Aminer数据分析功能推出了一份「AI与自动驾驶汽车研究报告」。截止发稿时间,该报告放出了66页(据负责人唐杰所说共有100页左右)。

据雷锋网了解,报告共有三大块内容,分别为「AI篇」、「汽车篇」和「AI+汽车篇」。其中「AI篇」包括:AI定义、起源、发展;全球AI学者分布、AI流派、AI发展趋势及中国AI研究现状等。「汽车篇」包括全球汽车领域的研究创新趋势、全球学者分布、中国学者分布、流派以及趋势分析。在最后的「AI+汽车篇」中,报告给出了AI和汽车研究的交叉创新笛卡尔分析图,并依据分析图做了过去十年的热点分析和未来三年的趋势分析。本文仅介绍其中「AI篇」的内容,更多详细内容请查看报告原文

人工智能技术源头

「人工智能」的名字正式提出是在1956年举行的为时两个月的达特茅斯会议,这次会议代表了人工智能正式诞生和兴起。

人工智能技术源头,趋势图中每条带子的宽度代表所处年代研究的热度,每个年代中由上到下是当年研究热度的排名

全球人工智能学者分布

报告统计了Aminer中人工智能所有子领域的专家学者数量,全球人工智能专家共有18107人。

按照性别来看,其中男性17231人,而女性仅有876人,只占全部学者中的4.84%。

在全部AI专家中,华裔科学家占比26.69%,具有中国国籍的AI专家占比14.77%。其中后者中,大陆地区专家占比91.13%(全球占比13.46%),港澳地区占比8.87%(1.31%)。

报告中根据H index把所有AI专家分为三类。如上面所说,AI专家共有18107人;其中H Index>=30称为资深 AI 专家,全球范围内共有4918人;H index>=60的称为领军AI专家,共有742人。

由以上数据可以看出,在全球人工智能专家中,占比最多的前三名是美国(39.71%)、中国(14.77%)和英国(6.3%),这三个国家的人工智能专家数量对比其他国家和地区具有绝对优势。

然而在全球资深人工智能专家和领军人工智能专家数目上,美国(分别为54.13%和68%)占比多于全球其他所有地区专家数目的总和。而中国在这方面,虽然全球排名第二,但与第一名美国的差距仍然很大;而且是专家越资深,两国之间数目的差距就越大。

AI 研究流派

根据全球AI专家的关系图谱,可以看到人工智能的研究主要以

Ajith Abraham

Peter Norvig

Juan Carlos Augusto

Edward A. Feigenbaum

Bruce G. Buchanan

John Mccarthy

Carl Djerassi

Ben Goertzel

Nils Nilsson

Ryszard Tadeusiewicz

十人为首的流派研究构成。

这些学者在citation、G-index、H-index、diversity和sociability方面都有着不俗的表现,但是近两年参加的活动较少。例如这位:


全球人工智能发展趋势

从全局的热度来看,artificial intelligence、neural networking、soft computing、fuzzy logic、fuzzy sets、computer intelligence等是整体关注的热点。

但近期关注的重点则是集中在artificial intelligence、decision making、neural network、computational intelligence、social media等领域。

中国人工智能领域分类树

人工智能既是计算机科学的一个分支,优势计算机科学、控制论、信息论、语言学等多种学科相互渗透而发展起来的综合性学科。在此原则下,Aminer团队基于ACM计算分类系统CCS2012,并根据Aminer前期采样数据以及当前研究热度和领域,重构了中国人工智能的领域分类树,共有27个一级概念和44个二级概念,囊括了中国人工智能发展的各个领域。

中国AI学者现状

报告统计了中国四个权威机构的数据,包括中国电子学会(CIE)、中国中文信息学会(CIPSC)、中国自动化学会(CAA)和中国计算机学会(CCF)。

在四大学会的会员中,从事人工智能相关领域的学者共1073人,分别有1045名来自高校,89名来自科研机构,22名来自企业。可以看出目前中国有97.39%的人工智能学者都任职于高校,远远多于在科研机构或企业中认知的人工智能专家。在这些学者中,又大多分布在一些著名高校,例如清华有72名,北大有66名,中科院有51名。

同样报告中还统计了这些学者所在的领域。其中分布人数最多的为数据挖掘(230人),其次是机器学习(207人)和计算机视觉(193人);而在机器人、跨学科计算与机器学习应用等领域则人才稍显薄弱。

同时,报告基于统计结果还发现,人工智能领域呈现出跨学科的特点,大部分学者的专业都是计算机相关专业(如计算机、电子工程、数学等),也有少部分学者专业为与计算机不明显相关的专业(如经济学、生物、心理学等)。

中国 AI 论文现状

报告统计了近2年人工智能领域发表的国际顶会(CCF-A类和CCF-B类)的5573篇论文,其中有1554位中国学者。

在上面提到的AI领域分类树中,中国学者较为活跃的领域有机器学习(796人,51.22%)、计算机视觉(334人,21.49%)、自然语言处理(204人,13.13%)、社交网络(84人,5.41%)等。这些领域也是人工智能在国际上比较活跃的子领域。

报告还分析了论文作者所在机构的分布情况,结果显示中科院位列第一(127人),清华其次(94人),随后是北大(51人)、微软(48人)、中科大(35人)、南京大学(34人)、哈工大(30人)、香港中文大学(25人)、卡内基梅隆大学(24人)、复旦(24人)以及上海交通大学(23人)。

上图中还表现了其中学生与老师的情况。借助Aminer系统中学者的数据,他们发现在论文作者中,国内大学老师的数量一般多于学生,如清华大学有64位老师,30位学生;北大有40位老师,11位学生。但是国外大学,如卡内基梅隆(4位老师,20位学生)则经常是学生多于老师。

报告随后选择了12个具有代表性的子领域,从Aminer系统中统计了从2015年至今在各个领域中发表论文的情况,其中发表论文按照人次统计。

从中可以看出计算机视觉发表论文数量远远超其他领域,其中中国学者在其中也扮演者极为重要的角色。其次就是机器学习(29.85)和自然语言处理(28.57)。而在推理等不活跃的领域,中国学者参与度也同时不是很高。

中国人工智能专利现状

报告基于国家专利局的相关数据,覆盖了AI研究的各个方向,其中在数据库(38038)、机器学习(13877)、人机交互(9969)、大物联网(8929)、大数据(5055)、语音技术(4835)、虚拟现实(3577)、数据挖掘(1422)、深度学习(786)、自然语言处理(819)、机器人学(1547)等领域尤为活跃。

另外在AI的实践应用中,无人机(9356)、人脸识别(3207)、社交网络(710)、自动驾驶(647)等AI具体应用方向专利数量可观。

以深度学习专利来看,在2012年暂无深度学习相关的专利,2013年有31个,2014年为80,2015年为237,到2016年则有465个。通过拟合可以看出,中国在深度学习方面的专利基本曾指数的趋势增长。

报告还统计了AI专利在各机构中的分布情况,统计结果显示其中61.62%的专利来自各类企业,31.97%的专利来自于各大院校,而只有5.12%的专利是由科研单位申请的,其余的来自机关单位。AI专利中申请最多的前三名分别为乐视(428)、中国电网(328)和百度(241);高校中AI专利申请较多的学校有浙江大学(103)、东南大学(93)、华南理工(92)、清华大学(88)等。

在AI专利的省市地域分布上,专利申请数量最多的三个城市分别为北京(20.41%)、深圳(8.98%)和上海(7.30%)。这一点,似乎没有人会感觉到意外。

(某雷锋网AI微信公众号的粉丝地域分布)

更多内容及详细信息,请查看报告原文。

雷锋网