标签归档:2017

NIPS 2017竞赛全回顾:“NIPS史上最长Workshop”有何魅力? | NIPS 2017

雷锋网消息,虽然为期三天的NIPS 2017正会已经结束,但聚集在长滩的机器学习研究者们仍然热情不减。从12月8日起,大会将进入为期两天的Workshop阶段,来自世界各地的机器学习爱好者们将分为53个Workshop进行各自领域最新研究的研讨。

本次的NIPS大会新增了五个官方竞赛,大会方也专门设置了一个专门的Competition Workshop环节进行相关的总结研讨。整个Workshop按五个竞赛分为五部分,内容设置上大致相同,即在1小时45分钟内,首先由竞赛主办方讲解竞赛事宜、解读本次比赛的意义和比赛中的一些趣事、宣布结果;然后由1-3支优胜队伍讲解他们的竞赛思路及做法,最后是相关的演讲及讨论。整个Workshop议程安排非常紧凑,从早上8:15分开始,到晚上7:30才结束,难怪组织方在最后散场时向坚持到最后的参会者致谢,并笑称这是“NIPS史上最长的Workshop”(The Longest Workshop In NIPS ever)。让我们来一起看看Workshop的进程吧:

(Competition Workshop议程)

早上8:15,Competition Workshop的组织者、巴塞罗那大学的Sergio Escalera教授及微软云信息与服务实验室(CISL)机器学习负责人Markus Weimer至开幕词,随后,IBM Watson公布了AI XPRIZE Milestone Award,这是由IBM Watson设置的、总奖金为5百万美元的竞赛,用于奖励在全球范围内利用人工智能技术应对未来世界巨大挑战的团队。来自蒙特利尔的Aifred Health和来自米兰的Amiko AI获得前两名并获得该奖项。

(AI XPRIZE Milestone Award Top 10优胜队伍)

接下来进入正式的各项竞赛相关内容。首先登台的是由“GANS之父”Ian Goodfellow与Google Brain团队共同举办的Adversarial Attacks and Defences(对抗攻击防御比赛)。关于该项比赛雷锋网之前已有详细介绍,参见:《Ian Goodfellow牵头举办NIPS机器学习对抗赛,提升系统鲁棒性

(小插曲:在Ian Goodfellow讲话的时候投影仪出了些问题)

在Ian Goodfellow的介绍结束后,加州大学伯克利分校电子工程与计算机系教授、2010年度麦克阿瑟天才奖、2013年度MIT TR35获得者Dawn Song(宋晓东)做了题为《Adversarial Examples Are Prevalent in Deep Learning Systems》的演讲。该演讲内容雷锋网将在后续进行整理和分享。

(Dawn Song在演讲中)

该竞赛的冠军是来自清华大学的TSAIL团队,董胤鹏代表团队介绍了竞赛的经验。清华大学的庞天宇和约翰霍普金斯大学的谢慈航也作为另外两只优胜队伍代表介绍了各自的方法。

(清华大学TSAIL团队董胤鹏在演讲中)

随后进行介绍的第二个竞赛是“Learning to Run”。该项赛事由斯坦福神经肌肉生物力学实验室(MNBL)主办,要求参赛者开发一个控制器,使符合生理学的人体模型能够尽可能快地在复杂的障碍物中进行奔跑。比赛提供人体肌肉骨骼模型和基于物理的模拟环境,参赛者可以在其中合成物理和生理上精确的运动,最终根据在规定的时间内跑动的距离和韧带拉伸惩罚来计分。斯坦福神经肌肉生物力学实验室的Carmichael ong、CrowdAI创始人Sharada Mohanty、Deepsense.ai的Henryk Michalewski等竞赛相关人员进行了竞赛的讲解、命题和环境搭建等方面的分享。

(Wojciech Jaskowski演讲中)

雷锋网此前曾经对获得比赛第二名的北京大学信息科学技术学院大学二年级的黄哲威同学进行了采访(参见《大二少年的炼丹入门之路:专访NIPS 2017“Learning to Run” 比赛亚军黄哲威》)。由于竞赛方只为冠军提供NIPS门票及旅行资助,黄哲威同学没有来到现场。在现场,获得第一名的Wojciech Jaskowski(来自NNAISENSE)和第三名、第六名的两支团队介绍了自己的竞赛思路。

随后,加州大学伯克利分校副教授、2016年度MIT TR35获奖者Sergey Levine发表了题为《From Learning to Run to Learning to Think》的演讲。本演讲雷锋网将在后续进行整理和分享。

(NVIDIA代表为Wojciech Jaskowski颁发证书)

Wojciech Jaskowski获得NVIDIA 新一代超级计算机DGX Station,而第二、第三名将获得NVIDIA在NIPS 2017上刚刚发布的Titan V显卡。

在午饭后,首先进行介绍的是第三项竞赛“The Conversational Intelligence Challenge”。虽然本竞赛组织者中包括机器学习大神Yoshua Bengio,但Bengio本人并没有出现在现场,来自俄罗斯的Mikhail Burtsev主持了本环节。

“The Conversational Intelligence Challenge”的议程安排为:竞赛主席Mikhail Burtsev致辞、颁奖典礼、获奖队伍介绍、以及一个主题演讲和一个Panel。

颁奖环节。莫斯科物理技术学院(MIPT)和波兰弗罗茨瓦夫大学(University of Wroclaw)分获前两名,来自香港理工大学和复旦大学的 PolyU 团队在NIPS Round 中取得第五名。由于第一、第二名分数(在统计学意义上)相差不大,竞赛组织者决定这两支队伍将分享10000美元奖金(你们这是在和稀泥吧)。

第四项竞赛为Personalized Medicine: Redefining Cancer Treatment。该项比赛由 Sloan-Kettering 癌症中心 (MSKCC) 发起,在Kaggle上举办,有1386支队伍参加了第一阶段的比赛,357支队伍参加了第二阶段的比赛。在比赛中,参赛选手需要开发基于临床证据 (文本) 的基因突变分类算法,基因突变可以划分为 9 类。即使对专家来说,解释临床证据也非常具有挑战性,因此想要成功对临床证据(文本)建模难度非常大。这类算法可以帮助人们解决癌症的复杂性,并且发现以前未知的基因突变,这些突变往往对癌细胞的生成起到重要作用。大会组织者、世界上历史最悠久、规模最大的私立癌症中心MemorialSloan-Kettering Cancer Center工程与机器学习总监Iker Huerga和首席科学家JJ Gao分别发表了演讲。美中不足的是,这两位演讲者的PPT中都把自家机构的名字打错了…

(Center打成Cancer,晚饭扣一个鸡腿)

华人选手在本次竞赛中表现出色。其中来自康奈尔大学的团队获得第一名,张希同学代表队伍进行了分享。该分享的PPT也会在随后在网上放出,雷锋网将持续关注。

最后一项竞赛是“Human-Computer Question Answering”。该项该项赛事由马里兰大学(University of Maryland)、斯坦福大学(Stanford University)等多家机构的研究人员发起,亚马逊 AWS 提供设备资助。比赛方式与我们所熟悉的Jeopardy人机智力竞赛有所不同,问答系统在接收问题时,每次收到一个单词,由系统自主决定什么时候回答。越往后问题提示就越多,难度也随之降低,而回答问题得到的得分也越少。

本次竞赛冠军为来自日本的一支工作室性质的创业团队Studio Ousia。该团队参赛的问答系统的正确率得分不仅远远超出了0.55的基准线,比第二名也高出了超过20个百分点。

在现场,该系统还与来自不同领域的六位人类顶尖智力问答选手过招。在60道题的回答中,机器的得分远远超过了人类联队,往往是主持人一道问题刚说了几秒钟,机器就已经说出了答案,以至于人类选手每答对一道题目,现场就会响起热烈的掌声。

本次“人机竞赛”的相关结果雷锋网将另行详细报道。

竞赛结束的时候已经是晚上7点多钟,但不少参会者仍然在现场兴致勃勃地讨论。这虽然是NIPS第一次举办竞赛,但这种形式不仅能吸引更多机器学习队伍参与,也可以以更直观的方式展示机器学习在网络安全、神经与肌肉模拟和手术应用、基因解析、问答系统等领域的最新应用,取得了非常不错的效果。相信在明年的NIPS上,我们也能看到更精彩的竞赛。

雷锋网

NIPS 2017 五大比赛全汇总,看看优胜的中国选手有哪些

雷锋网 AI 科技按,NIPS 2017 正在美国如火如荼召开,作为机器学习领域的顶级会议,今年的注册参会者超过 8000 人。

现场 Keynote、Oral 和 Sportlight 等优秀论文的宣讲一场接一场,雷锋网 AI 科技评论记者也在时刻关注。除了论文之外,今年有一个议程尤为瞩目,美国时间 12 月 8 日,大会现场将会有一个围绕 NIPS 2017 Competition Track(NIPS 2017 大赛)的 workshop。NIPS 2017 Competition Track 是今年新增的一项议程,主办方从 23 个比赛提案中选择了五个不同类型的数据驱动类比赛,覆盖领域广泛。

这场 workshop 将从早上八点持续到晚上七点半,比赛主办方和优胜选手会分别上台宣讲,其中有大家耳熟能详的 Ian Goodfellow、Yoshua Bengio 等人(作为比赛主办方)。

下面雷锋网 AI 科技评论将为大家带来关于这五个比赛的详细信息。

The Conversational Intelligence Challenge(智力对话比赛)

该比赛为莫斯科物理技术学院(MIPT)、麦吉尔大学(McGill University)、蒙特利尔大学(University of Montreal)等机构的多位学者共同主办,主办方为选手提供的奖金为 1 万美元,Facebook 是比赛的白金赞助商。

据主办方介绍,「人机交流对话系统(聊天机器人、个人助理和语音控制界面等)在我们的日常生活中越来越普遍,这场比赛的初衷是想创造一个可以与人类进行智能对话的聊天机器人,他们希望能为开发下一代智能会话系统贡献出开放的数据集。」

比赛分为四个阶段——Qualification round(认证阶段)、Human Evaluation Round(评估阶段)、Tuning Round(调整阶段)、NIPS Round(NIPS 阶段)。在 Human Evaluation Round,每队选手至少需要评估 150 条对话,而在 Tuning Round,大家需要对自己的方案进行调整,训练模型。NIPS Round 中,则会对提交的会话系统进行评估。

从目前公开的排行榜上可以看到,中国选手中,来自香港理工大学和复旦大学的 PolyU 团队在NIPS Round 中取得第五名。

Personalized Medicine: Redefining Cancer Treatment(个性化医疗:重新定义癌症治疗)

此次比赛的参赛队伍共有 1386 支,第一名的奖金是 10000 美元,第二名是 3000 美元,第三名是 2000 美元。

该项比赛由 Sloan-Kettering 癌症中心 (MSKCC) 发起,在Kaggle上举办,目前关于比赛的讨论也有很多,大家要是对这项比赛有兴趣,可以点击 https://www.kaggle.com/c/msk-redefining-cancer-treatment 查看详情。目前中国选手也取得了不错的成绩,可以看到 kaggle 账户为 Li-Der 的中国选手取得了 Public Leaderboard 第一名,kaggle 账户为 Yang 的中国选手取得了 Private Leaderboard 第三名。

在比赛中,参赛选手需要开发基于临床证据 (文本) 的基因突变分类算法,基因突变可以划分为 9 类。即使对专家来说,解释临床证据也非常具有挑战性,因此想要成功对临床证据(文本)建模难度非常大。这类算法可以帮助人们解决癌症的复杂性,并且发现以前未知的基因突变,这些突变往往对癌细胞的生成起到重要作用。

Adversarial Attacks and Defences(对抗攻击防御比赛)

比赛的全名为 Non-targeted Adversarial Attack,简介是「Imperceptibly transform images in ways that fool classification models」,也就是说,需要以欺骗分类模型的方式将图片巧妙地移花接木。该比赛为谷歌大脑团队(Ian Goodfellow 等人)牵头主办,具体而言,分为三个竞赛项目:

  • Non-targeted Adversarial Attack,竞赛者所提交的系统需要对给定的图片进行处理,使得某个通用机器学习分类器无法识别。

  • Targeted Adversarial Attack,竞赛者所提交的系统需要对给定的图片进行处理,让某个通用机器学习分类器能成功识别图像属于特定类别。

  • Defense Against Adversarial Attack,竞赛者需要构建一个机器学习分类器,拥有足够的鲁棒性使之能正确鉴别对抗性的图像。

本次比赛共有 91 支队伍参赛,排行榜显示,来自清华大学的 TSAIL 团队(Yinpeng Dong, Tianyu Pang, Fangzhou Liao)占领 Leaderboard 榜首。

目前大多数现有的机器学习系统的鲁棒性很差,容易受对抗样本的影响,样本经过轻微修改后,可能就会让机器学习发生错误,这一比赛主要是为了加快研究机器学习分类器的对抗样本,提升其鲁棒性。

相关文章:

Ian Goodfellow牵头举办NIPS机器学习对抗赛,提升系统鲁棒性

Learning to Run(学习跑步比赛)

本次比赛共有 595 支队伍报名,中国选手在其中表现不俗,来自中国科学技术大学 USTC-IMCL 团队在 Round 1 中排名第一,来自清华大学的黄哲威在 Round1 和 Round2 中均排名第二,比赛的前几名几乎全被中国选手包揽。值得一提的是,冠军选手可以获得 NVIDIA DGX Station,亚军和季军的奖品则是 NVIDIA Titan Xp。

该项赛事由斯坦福神经肌肉生物力学实验室(MNBL)主办,要求参赛者开发一个控制器,使符合生理学的人体模型能够尽可能快地在复杂的障碍物中进行奔跑。比赛提供人体肌肉骨骼模型和基于物理的模拟环境,参赛者可以在其中合成物理和生理上精确的运动,最终根据在规定的时间内跑动的距离和韧带拉伸惩罚来计分。

根据比赛要求,参赛者需要建立一个采用当前状态观察(41维向量)为输入的函数f,并以最大化奖励的方式输出肌肉的激励行为(18维向量)。其中,总回报是最后一次迭代后X轴上的骨盘位置(即跑动的距离)减去过度使用韧带力量带来的惩罚(韧带的作用是防止关节过度弯曲,如果跑动幅度过大会导致韧带受到伤害,而这是在比赛中需要避免的)。

相关文章:

大二少年的炼丹入门之路:专访NIPS 2017“Learning to Run” 比赛亚军黄哲威 | NIPS 2017

Human-Computer Question Answering(人机问答系统比赛)

众所周知,智能问答系统涉及的领域很广,比如说知识的抽取和表示,用户问句的语义理解和通过知识推理得到答案。这些领域都需要进行深入研究,才能得到更好的智能问答系统。今年,参赛选手需要提交类似 IBM Watson 一样的智力问答系统,这个问答系统在接收问题时,每次收到一个单词,由系统自主决定什么时候回答。

机器学习在语音、图像等领域都取得了不错的成绩,但对自然语言的处理仍是一个难点,这次的比赛也将极具挑战性。

该项赛事由马里兰大学(University of Maryland)、斯坦福大学(Stanford University)等多家机构的研究人员发起,亚马逊 AWS 提供设备资助。在明天的 workshop 上,美国时间下午 6 点,胜出的系统还会与人类顶尖智力问答选手过招,这也将会非常精彩。

关于 NIPS 2017 Competition Track 的介绍就此结束,雷锋网 AI 科技评论也会持续关注,为大家带来最新消息。

雷锋网

OWASP 发布 2017 Top 10 Web 应用安全威胁,Web 安全防护正当时

近日,开放式 Web 应用程序安全项目(OWASP)发布了最终版 2017 Top 10 榜单。在 2017 威胁榜单中,注入攻击漏洞仍然位居 Top 10 威胁之首,而 XSS 的威胁程度从 A3 降到了 A7。敏感信息泄露、安全配置错误、失效的访问控制等威胁均有提升,值得企业重视。

与此同时,榜单中还出现了一些新的安全威胁,包括 XXE 漏洞(A4:2017, XML External Entity attack)、针对 Java 平台的不安全反序列化漏洞(A8:2017, Insecure Deserialization)以及记录和监控不足风险(A10:2017, Insufficient Logging & Monitoring)等。

A1 注入攻击漏洞    

A2 失效的身份认证  

A3 敏感信息泄露   

A4  XXE 漏洞   

A5 失效的访问控制    

A6 安全配置错误

A7 跨站脚本 XSS

A8 不安全反序列化漏洞

A9 使用含有已知漏洞的组件

A10 不足的记录和监控

随着网贷、购物和社交等一系列新型互联网产品的诞生,企业信息化的过程中越来越多的应用都架设在 Web 平台上,接踵而至的就是 Web 安全威胁的凸显。大量黑客利用网站操作系统的漏洞和 Web 服务程序的 SQL 注入漏洞等得到 Web 服务器的控制权限,轻则篡改网页内容,重则窃取重要内部数据,更为严重的则是在网页中植入恶意代码,使得网站访问者受到侵害。

什么是 Web 应用安全风险?

如下图所示,攻击者可以通过应用程序中许多不同的路径和方法来危害您的业务或者企业组织。每种路径方法都代表了一种风险,有些路径方法很容易被发现并利用,有些则很难被发现。


文章重点分析排名前三的 Web 安全威胁以及应对方法:

注入攻击漏洞

注入攻击漏洞,例如 SQL、OS 以及 LDAP 注入。这些攻击发生在当不可信的数据作为命令或者查询语句的一部分,被发送给解释器的时候,攻击者发送的恶意数据可以欺骗编辑器,以执行计划外的命令或者在未被恰当授权时访问数据。

检查是否存在「注入漏洞」的方法

最好的办法就是确认所有解释器的使用都明确地将不可信数据从命令语句或查询语句中区分出来。对于 SQL 调用,在所有准备语句和存储过程中使用绑定变量,并避免使用动态查询语句。

检查应用程序是否安全使用解释器的最快最有效的办法是代码审查,代码分析工具能帮助安全分析者找到使用解释器的代码并追踪应用的数据流。

可以执行应用程序的动态扫描器能够提供信息,帮助确认一些可利用的注入漏洞是否存在。

典型案例

NextGEN Gallery 插件是众所周知的 WordPress 相册插件,这款插件功能强大,可以在博客中任意插入动态图片效果,提供了很完美的照片管理方法,在 WordPress 平台上拥有过百万的安装量。

今年 3 月 NextGEN Gallery 插件被曝存在严重的 SQL 注入漏洞,影响上百万用户,攻击者利用 SQL 注入漏洞获取了数据库中包括用户信息在内的敏感数据。

失效的身份认证

与身份认证和会话管理相关的应用程序功能常常被错误地实现,攻击者使用认证管理功能中的漏洞,采用破坏密码、密钥、会话令牌去冒充其他用户的身份。

检查是否存在「失效的身份认证」的方法

用户身份验证凭证是否使用哈希或加密保护;是否可以通过薄弱的账户管理功能(例如账户创建、密码修改、密码修复、弱会话 ID)重写。

会话 ID 暴露在 URL 里;会话 ID 没有超时限制,用户会话或身份验证令牌(特别是单点登录令牌)在用户注销时没有失效;密码、会话 ID 和其他认证凭据使用未加密链接传输等。

典型案例

机票预订应用程序支持 URL 重写,把当前用户的会话 ID 放在 URL 中:http://example.com/sale/saleitems;jsessionid=2P0OC2JDPXM0OQSNDLPSKHCJUN2JV?dest=Hawaii 

该网站一个经过认证的用户希望让他朋友知道这个机票打折信息。他将上面链接通过邮件发送给朋友们,并不知道已经泄露了自己会话 ID. 当他的朋友们使用上面的链接时,可以轻而易举地使用他的会话和信用卡。

敏感信息泄露

许多 Web 应用程序没有正确保护敏感数据,如信用卡、身份证 ID 和身份验证凭据等。攻击者可能会窃取或篡改这些弱保护的数据以进行信用卡诈骗、身份窃取或其他犯罪。

敏感数据需额外的保护,比如在存放或在传输过程中进行加密,以及在与浏览器交换时进行特殊的预防措施。

检查是否存在「敏感信息泄露」的方法

首选需要确认哪些数据时敏感数据而需要被加密。当这些数据被长期存储的时候,无论存储在哪里,是否被加密和备份?

无论内部数据还是外部数据,传输时是否是明文传输?是否还在使用旧的或者脆弱的加密算法?

加密密钥的生成是否缺少恰当的密钥管理或缺少密钥回转?当浏览器接收或发送敏感数据时,是否有浏览器安全指令?

典型案例

一个网站上所有需要身份验证的网页都没有使用 SSL 加密。攻击者只需要监控网络数据流(比如一个开放的无线网络或其社区的有限网络),并窃取一个已验证的受害者的会话 Cookie. 攻击者利用这个 Cookie 执行重放攻击并接管用户的会话,从而访问用户的隐私数据。

如何有效地防范 Web 应用安全风险?

安全防护要贯穿整个 Web 应用生命周期

在 Web 开发阶段需要对代码进行核查,在测试阶段需要对上线前的 Web 应用做完整的安全检查,在运营阶段,建议在事前、事中和事后进行分阶段、多层面的完整防护。

构建以漏洞、事件生命周期闭环管理体系

通过监测系统平台进行漏洞生命周期的管理,包含漏洞扫描、人工验证、漏洞状态的追踪工作以及漏洞修复后的复验工作等,使漏洞管理流程化。

提升安全管理人员工作能力

安全管理岗位人员需要建立起信息安全管理的概念,清楚 Web 威胁的危害,掌握识别安全漏洞及风险的专用技术,以及对安全问题进行加固处置的技能。

文章来源青云QingCloud(微信公众号:QingCloud-IaaS)下载完整版报告

雷锋网雷锋网雷锋网

雷锋网

DeepMind 16篇NIPS 2017论文,全部信息都在这里了 | NIPS 2017

雷锋网按:作为人工智能领域的“领头羊”,DeepMind的最新研究总是能引起大家的关注。那么在即将在加州长滩召开的机器学习领域顶级会议NIPS 2017上,DeepMind又会给我们带来什么样的先知卓见呢?雷锋网为你整理了DeepMind在NIPS 2017上的论文,便于大家按自己感兴趣的内容按图索骥。一起来看一下:

第1天 12月4日 2Poster

论文1:《Robust imitation of diverse behaviours

作者:Ziyu Wang,Josh Merel,Greg Wayne,Nando de Freitas,Scott Reed,Nicolas Heess

摘要:我们提出了一个建立在最先进的生成模型上的神经网络架构,该架构能够学习不同行为之间的关系,并模仿它所显示的具体行为。训练结束后,我们的系统可以编码一个单一的观察动作,并根据这个演示创建一个新的小动作。它也可以在不同类型的行为(如步行的不同风格)之间切换,尽管之前并没有看到过这种切换。

(上面的小人切换步行风格像不像在跳舞?)

展示时间/地点:Pacific Ballroom #143,Poster环节,6:30-22:30


论文2:《Sobolev training for neural networks

作者:Wojtek Czarnecki,Simon Osindero,Max Jaderberg,GrzegorzŚwirszcz,Razvan Pascanu

摘要:本文给出了一种将目标函数导数的知识纳入深度神经网络训练的简单方法。我们证明最近的基于ReLU的体系结构非常适合这样的任务,并评估它们在三个问题即低维回归,政策蒸馏和合成梯度训练上的有效性。我们观察到训练的效率尤其是在低数据情况下显著提高,并且以接近最新的准确度训练了第一个基于梯度的合成的ImageNet模型。

展示时间/地点:Pacific Ballroom #139,Poster环节,6:30-22:30


第2天 12月5日 4Poster

论文3:《Filtering variational objectives

作者:Chris J. Maddison,Dieterich Lawson,George Tucker,Nicolas Heess,Mohammad Norouzi,Andriy Mnih,Arnaud Doucet,Yee Whye Teh

摘要:我们考虑将变分的下界扩展到基于粒子滤波的边界似然估计器(雷锋网注:主要特指估算概率分布)定义的下界族群。这些过滤目标可以利用模型的顺序结构在深生成模型中形成更紧密的界限和更好的模型学习目标。在我们的实验中,我们发现用滤波目标进行训练比使用变分下限训练相同的模型体系结构有了实质性的改进。

展示时间/地点:Pacific Ballroom #114,Poster环节,6:30-22:30


论文4:《Visual interaction networks: Learning a physics simulator from video

作者:Nicholas Watters,Andrea Tacchetti,Theophane Weber,Razvan Pascanu,Peter Battaglia,Daniel Zoran

摘要:在这项研究中我们提出了一种基于神经网络的模型”视觉交互网络“(VIN),在没有先验知识的情况下学习物理动力学。 VIN能够从几帧视频中推断出多个物理对象的状态,然后用这些来预测对象位置。它还能够推断隐形物体的位置,并学习依赖于物体属性(如质量)的动力原理。

由VIN(右)预测的动力学与真实模拟(左)相比较

展示时间/地点:Pacific Ballroom #123,Poster环节,6:30-22:30


论文5:《Neural discrete representation learning

作者:Aäronvan den Oord,Oriol Vinyals,Koray Kavukcuoglu

摘要:在没有监督的情况下学习有用的陈述仍然是机器学习中的关键挑战。这项研究中,我们提出了一个简单而强大的生成模型,该模型被称为矢量量化变分自动换能器(VQ-VAE)以学习这种离散表征。当这些表征与先前的自回归配对时,该模型能够生成高质量的图像,视频和语音以及进行高质量的扬声器转换。

展示时间/地点:Pacific Ballroom #116,Poster环节,6:30-22:30


论文6:《Variational memory addressing in generative models

作者:JörgBornschein,Andriy Mnih,Daniel Zoran,Danilo Jimenez Rezende

摘要:基于注意力的记忆可用于增强神经网络,并被用于Few-shot learning、快速适应性、更普遍地支持非参数扩展等领域。不同于目前流行的可区分的软注意机制,我们使用随机的硬注意力来生成模型中的记忆内容,这使得我们可以将变分推理应用于内存寻址,使用目标信息获得更精确的内存查找,尤其是在内存缓冲区大且内存条目混杂的模型中。

展示时间/地点:Pacific Ballroom #117,Poster环节,6:30-22:30


第3天 12月6日 2 Oral/4 Spotlight/4Poster

论文7:《REBAR: Low-variance, unbiased gradient estimates for discrete latent variable models

作者:George Tucker, Andriy Mnih, Chris J Maddison, Dieterich Lawson, Jascha Sohl-Dickstein

摘要:由于具有高方差梯度估计量,对具有离散潜变量的模型进行学习具有挑战性。 之前的方法要么产生高方差/无偏梯度,或低方差/有偏差的梯度。 REBAR使用控制变量和重新参数化技巧来获得两者中最好的结果:低方差/无偏差的梯度,使得收敛更快,效果更好。

展示时间/地点:Hall A,10:35-10:50,Oral讲解;

Pacific Ballroom #178,Poster环节,6:30-22:30


论文8:《Imagination-augmented agents for deep reinforcement learning

作者:Sébastien Racanière, Théophane Weber, David P. Reichert, Lars Buesing, Arthur Guez, Danilo Rezende, Adria Puigdomènech Badia, Oriol Vinyals, Nicolas Heess, Yujia Li, Razvan Pascanu, Peter Battaglia, Demis Hassabis, David Silver, Daan Wierstra.

摘要:我们描述了一个基于想象力的规划方法的新族类,并介绍了为智能体学习和构建计划,从而最大化任务效率提供新方法的架构。 这些架构对于复杂和不完善的模型是有效的,稳健的,并且可以采取灵活的策略来扩展他们的想象力。 我们介绍的智能体受益于一个“想象编码器”,这是一个神经网络,它学习提取任何对未来决策有用的信息,但忽略那些不相关的信息。

图为智能体进行飞船任务游戏。该游戏必须激活一定次数的推进器以稳定飞行器。红色表示执行的轨迹,蓝色和绿色表示想象的轨迹。

展示时间/地点:Hall A,15:05-15:20,Oral讲解;

Pacific Ballroom #139,Poster环节,6:30-22:30


论文9:《A simple neural network module for relational reasoning

作者:Adam Santoro, David Raposo, David Barrett, Mateusz Malinowski, Razvan Pascanu, Peter Battaglia, Timothy Lillicrap

摘要:我们演示了使用简单的即插即用神经网络模块来解决需要复杂关系推理的任务。 这个称为“关系网络”的模块可以接收非结构化的输入,比如图像或故事,并隐含地推理其中包含的关系。

展示时间/地点:Hall A,15:25-15:30,Spotlight讲解;

Pacific Ballroom #139,Poster环节,6:30-22:30


论文10:《Simple and scalable predictive uncertainty estimation using deep ensembles

作者:Balaji Lakshminarayanan, Alexander Pritzel, Charles Blundell

摘要:量化神经网络(NN)中的预测不确定性是一个具有挑战性但尚未解决的问题。 大部分工作集中在贝叶斯解决方案上,但这些方案都是计算密集型的,需要对训练管道进行重大修改。我们提出了一种贝叶斯神经网络的替代方案,该方案易于实现和并行,只需要很少的超参数调整,并产生高质量的预测不确定性估计。 通过一系列关于分类和回归基准的实验,我们证明了我们的方法可产生良好校准的不确定性估计,其与近似贝叶斯神经网络一样好或更好。

展示时间/地点:Hall A,15:45-15:50,Spotlight讲解;

Pacific Ballroom #133,Poster环节,6:30-22:30


论文11:《Natural value approximators: learning when to trust past estimates

作者:Zhongwen Xu, Joseph Modayil, Hado van Hasselt, Andre Barreto, David Silver, Tom Schaul

摘要:基于随输入而平滑变化观察的典型近似值,我们重新回顾了RL的价值逼近器的结构,但是当到达奖励值时真值会突然发生变化。 我们提出的方法使用插值与预测值估计,用于适应这种不对称的不连续性。

展示时间/地点:Hall A,17:25-17:30,Spotlight讲解;

Pacific Ballroom #6,Poster环节,6:30-22:30


论文12: 《Successor features for transfer in reinforcement learning

作者:Andre Barreto, Will Dabney, Remi Munos, Jonathan Hunt, Tom Schaul, David Silver, Hado van Hasselt

摘要:我们提出了一个强化学习的转移框架。 我们的方法取决于两个关键的观点:1)“继承者特征”,这是一种价值函数表示,将环境的动态与回报分离开来;2)“广义的政策改进”,一种考虑了一整套策略的一般化的动态规划策略改进步骤。 综合起来,这两个想法导致了一种无缝集成在强化学习框架内的方法,并允许在任务之间不受任何限制地进行转移。

展示时间/地点:Hall A,17:40-17:45,Spotlight讲解;

Pacific Ballroom #9,Poster环节,6:30-22:30


论文13:《Deep reinforcement learning from human preferences

作者:Paul Christiano (Open AI), Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei (Open AI)

摘要:人工智能安全的一个核心问题是如何告诉一个算法我们希望它做什么。 OpenAI展示了一个全新的系统,允许没有技术经验的人员教AI如何执行一个复杂的任务,如操纵模拟机器人手臂。

通过900个人的反馈教会了这个算法后空翻。

展示时间/地点:Pacific Ballroom #1,Poster环节,6:30-22:30


论文14:《A multi-agent reinforcement learning model of common-pool resource appropriation

作者:Julien Perolat, Joel Z Leibo, Vinicius Zambaldi, Charles Beattie, Karl Tuyls, Thore Graepel

摘要:本文考察了共同资源占用问题的复杂性。 如渔业,放牧牧场或淡水的系统,许多人或行为者可以获得相同的资源。 社会科学的传统模式往往表明,获得资源的各方以自利的方式行事,最终导致不可持续的资源枯竭。 但我们在人类社会的实际经验知道可能会产生很多中可能的结果。 像渔业这样的资源,有时候会被过度开发,有时可以可持续地收获。 在这项研究中,我们提出了可用于研究的新建模技术,旨在解释我们在现实世界中观察到的与传统模型预测的差距。

展示时间/地点:Pacific Ballroom #86,Poster环节,6:30-22:30


论文15:《DisTraL: Robust multitask reinforcement learning

作者:Yee Whye Teh, Victor Bapst, Wojciech Czarnecki, John Quan, James Kirkpatrick, Raia Hadsell, Nicholas Heess, Razvan Pascanu

摘要:我们开发了一个强化多任务学习的方法。 我们的假设是,任务是彼此相关的(例如处于相同的环境或具有相同的物理特性),好的动作序列倾向于在任务中重复出现。 我们的方法通过将特定于任务的策略同时提炼为一个通用的默认策略,并通过将所有特定于任务的策略规则化为违约策略来跨这些任务转移这些常识。 我们的研究表明,这会导致更快、更强大的学习。

展示时间/地点:Pacific Ballroom #138,Poster环节,6:30-22:30


论文16:《A unified game-theoretic approach to multiagent reinforcement learning

作者:Marc Lanctot, Vinicius Zambaldi, Audrunas Gruslys, Angeliki Lazaridou, Karl Tuyls, Julien Perolat, David Silver, Thore Graepel

摘要:在这项研究中,我们首先观察到独立强化学习者产生可以共同关联但在执行过程中未能与其他主体进行良好的概括的策略。 我们通过提出一个称为联合策略关联的新度量来量化这种影响,然后我们提出了一个由博弈论基础所推动的算法,该算法概括了虚拟游戏,迭代最佳响应,独立RL和双重预言等几种方法。 我们的研究表明,我们的算法可以在第一人称协调游戏中显着降低联合策略的相关性,并在普通的扑克基准游戏中找到稳健的反策略。

展示时间/地点:Pacific Ballroom #203,Poster环节,6:30-22:30

雷锋网

大二少年的炼丹入门之路:专访NIPS 2017“Learning to Run” 比赛亚军黄哲威 | NIPS 2017

2017年11月13日,北京大学信息科学技术学院的黄哲威同学发布了这样一条朋友圈:

"结束了一个多月的杂交炼丹,业余RL选手最后两天被吊打,Juergen Schmidhuber抢我核弹,显卡拿好QAQ"

他所说的“核弹”,指的是来自于“核弹厂”NVIDIA的新一代超级计算机、售价6.9万美元起的DGX Station,是NIPS 2017“Learning to Run”竞赛的优胜奖品,而二三名的奖品是NVIDIA Titan Xp。比赛第一轮结束后,PKU-hzwer (黄哲威的参赛帐号)排名第二,第一名的 USTC-IMCL 来自中国科学技术大学,前几名几乎全是中国选手;第二轮最后两天却全被来自于NNAISENSE(“LSTM之父”Juergen Schmidhuber所创办的人工智能公司)的Wojciech Jaskowski反超。

“第一名隐藏了实力,我们一度认为胜利在望。”黄哲威无不遗憾地告诉雷锋网。最终他们屈居亚军。

“Learning to Run”是即将在长滩召开的机器学习顶级学术会议NIPS 2017的5个官方挑战赛之一,比赛共有595支队伍报名。挑战赛由斯坦福神经肌肉生物力学实验室(MNBL)主办,要求参赛者开发一个控制器,使符合生理学的人体模型能够尽可能快地在复杂的障碍物中进行奔跑。比赛提供人体肌肉骨骼模型和基于物理的模拟环境,参赛者可以在其中合成物理和生理上精确的运动,最终根据在规定的时间内跑动的距离和韧带拉伸惩罚来计分。

从比赛官网雷锋网了解到,本次比赛的目标是:

利用深度强化学习解决医学问题;

推动增强学习中的开源工具研究(物理模拟器,增强学习环境和竞赛平台等);

在具有随机性和高度维度的行动空间的复杂计算环境中推进增强学习的研究。

根据比赛要求,参赛者需要建立一个采用当前状态观察(41维向量)为输入的函数f,并以最大化奖励的方式输出肌肉的激励行为(18维向量)。其中,总回报是最后一次迭代后X轴上的骨盘位置(即跑动的距离)减去过度使用韧带力量带来的惩罚(韧带的作用是防止关节过度弯曲,如果跑动幅度过大会导致韧带受到伤害,而这是在比赛中需要避免的)。

赛后雷锋网也在第一时间联系了黄哲威,向他请教第一次参赛就取得好成绩的奥秘。

雷锋网(以下用Q代表):你是怎么注意到这个比赛的?

黄哲威(以下用A代表):我在旷视Face++的研究院实习,9月份的时候,我的Mentor向我推荐了这个比赛,正好入门一下各种炼丹工具。

Q:介绍一下你的Mentor的情况,以及他给了哪些有益的解决问题的思路?

A:我的Mentor(周舒畅)和另外一些研究员提供了许多思路,包括网络模型、激活函数,动作噪声等等,以及科学的实验管理方法。

Q:你认为这个比赛最大的难点在哪里?

A:最大的难点是官方提供的模拟器的计算速度很慢,每轮障碍跑在单核 cpu 上的模拟时间超过一个小时,获取训练数据代价很高;连续动作空间的决策本来就是强化学习的一个难题,在这个任务中,环境提供的输入信息是41维的0到1实数向量,包括下肢关节的位置,角度,速度,障碍信息等,根据这些信息我们需要输出18维的0到1实数向量,决策下肢肌肉的动作;环境具有随机性,障碍的大小和位置是不确定的,而且输入信息中只有模型前方最近的一个障碍。

Q:模拟慢的问题最后是怎么解决的?

A:一位中国选手(@qing-yongliangaka)为大家提供了模拟器并行的框架,这个框架让我们能够在多台服务器上并行模拟器然后训练,节约了大量的训练时间。这位选手也获得了比赛方颁发的特别奖。

Q:你们是如何搭建模型的?

A:1) 我参考了一些开源的代码,并尝试在OpenAI gym上训练了一些简单的任务,正确实现了 DDPG 之后,我们通过比较多的对比实验确定了各种参数和网络结构;

2) 发现训练出的模型瘸腿(拖着一条腿)和重心靠后的情况比较多,我们针对这两个问题设计了一些惩罚。

Q:在你看来,参与比赛的过程中有哪些比较重要的节点?

A:1) 由于我缺乏并行处理的知识,单个模拟器速度又极其缓慢,刚开始数天毫无进展,后来发现有参赛者开源了并行模拟器的框架,使得我们能在数百个 cpu 上开展训练;

2) 加入了比赛的讨论组之后,惊讶地得知一些选手从随机网络参数开始,不到一天就能训练出表现很不错的模型,而我对着一份网络参数折腾许多天也没什么进展,于是开始了提高训练速度的探索;

3) 通过以及降低控制帧率并将多帧奖励合并,还有一些其它技巧,数十倍地加快了训练,比赛后期我们训练一个40分的模型只要几个小时,使得大量的对比实验变得可行。

Q:第二轮比赛中,障碍物从3个增加到了10个,这给训练带来了什么样的变化?

A:因为增加的障碍离起点比较远,AI要学会控制模型在高速奔跑时避开障碍,后腿很容易被绊到。模型的摔倒概率上升到接近30%,使得我们不得不花费精力在稳定性上下工夫,后来通过多个actor和 critic 群策群力的方法将摔倒概率降低到5%以下。这方面的工作我们之后会写一个实验报告。

Q:除了DDPG,你们是否还有采用其他方式,例如PPO(雷锋网注:PPO是OpenAI强化学习的默认算法)来实现?

A:我们队伍没有采用其它的训练方式,主要是我能力和精力有限,一些选手尝试了许多方法,似乎也没有本质提高。值得一提的是,有选手使用进化算法获得了很不错的结果。

Q:第一次参加比赛就取得好成绩,有什么想和其他初学者分享的经验吗?

A:多和其它参赛选手交流讨论,获取灵感,及时反思;提高工程能力,将理论和实践结合;注重代码管理和实验的可重现性。

后记

尽管黄哲威一再强调自己是“业余选手”,“能力和精力有限”,但从其认定了一个方向后不断持续深挖的做法来看,最终取得好成绩也有着一定的必然性。有的时候,选择过多不一定是好事,从人工智能发展的历史来看,正是有着一批在人工智能发展遇冷时仍然坚持研究的先驱的不断努力,才迎来了当下以机器学习推动的又一波人工智能的春天。在恭喜黄哲威首次参赛就取得好成绩的同时,也希望有更多机器学习的初学者们能够不畏困难和努力钻研,共同进步。

雷锋网

2017 看雪安全开发者峰会 12个安全议题轮番上阵

时间倒退至17年前,一场洋洋洒洒的大雪中看雪论坛成立了,素未谋面的各路人马凭借对安全技术的热爱在这里彼此交流分享。

而17年后,这群一梦为马的人们在帝都初次聚首,举办第一次峰会。以下为看雪开发者峰会中十二个安全议题,雷锋网现场整理。

Flash 之殇 – 漏洞之王 Flash Player 的末路 

演讲嘉宾:仙果 看雪论坛二进制漏洞版主,兴华永恒公司CSO。

Flash Player 作为最受欢迎的多媒体软件,一直以来都受到大众的软件,遥想当年的闪客精灵时代,何其风光。而随着 2011年11月 Flash Player 宣布不再支持移动端,并在随后放弃 Linus 平台,以及苹果宣布 iOS 不再支持 Flash Player 成为双重打击。

在得移动者得天下的时代,Flash Player显得尤为落寞。

而在 2015 年 Flash Player 荣登"漏洞之王"的宝座后,Flash 成了"千夫所指"的对象。毕竟 Flash Player 作为插件存在于多个平台,因此一个漏洞的爆出就会影响诸多平台。

本议题就以Flash player为题,通过 Flash Player 漏洞利用史展现了 Flash 漏洞利用技术和攻防对抗技巧。

举例来说,2015 年 7 月,adboe 针对 vector 对象引入了 cookie 和 length 检测机制,使得 vector 的利用方式被封堵。

2015 年 12 月加入了隔离堆机制,对一些比较容易出问题的对象进行堆隔离,又引入了 ByteArray 对象的长度 cookie 检测。

2016 年 3 月 引入了针对 MMGC(unmanaged memory)内存的 System Heap 机制,使用系统的分配函数替代了 flash GC的分配函数,使内存更加随机,难以预测。

2016 年 6 月 引入 Memory Protector 机制,有点像延迟释放机制,是用来缓解 UAF 漏洞的,理论上和微软出的机制差不多,但是 adobe 自己做了一些改变。

浅析WEB安全编程 

演讲嘉宾:汤青松 中国婚博会PHP高级工程师、安全顾问。

常见漏洞有哪些?

代码注入、CSRF、0元支付、短信轰炸、密码找回……

汤青松通过对 SQL 注入、XSS 跨站与 CSRF 请求伪造漏洞、越权漏洞以及支付漏洞这几个开发中容易忽略又比较常见的安全问题进行介绍,用以指导在开发中如何避免安全问题的产生。

SQL注入的成因可以理解为使用用户的参数拼接SQL语句,参数改变了原SQL语句的结构。其可分为三种攻击方式,

第一是利用注入漏洞改变页面返回数据,称之为回显注入。

第二是报错注入,在URL加入了一些错误的SQL语句,被执行后返回了异常信息,这些异常信息当中包含了敏感信息,可以通过屏蔽数据库连接错误来防范此问题。

第三是盲注,分为布尔盲注和时间盲注。

那有什么手段可以防范SQL注入呢?这里有三点建议。

  1. 拦截带有SQL语法的参数的传入

  2. 通过预编译处理拼接参数的SQL语句

  3. 定期分析数据库执行日志,是否有异常SQL执行。

XSS 跨站与 CSRF 请求伪造漏洞的成因可能是参数输入未经过安全过滤,恶意脚本被输出到网页,或是用户的浏览器执行恶意脚本。其可分为反射型、存储型、DOOM 型三类,可通过过滤标签、实体转义代码以及设置 httponly 进行防范。

越权漏洞是指业务系统中对用户权限验证不严谨,用户能操作不属于自己权限的操作。汤青松建议前台和后台的查询尽量不要用同一个查询接口,也不要暴露连续ID,比如订单号。

还记得 2014 年,一个天才小学生写代码实现 1 分钱买 2500 元商品的事情吗?

事实上由于开发者在数据包中传递支付金额,后端却没有对金额做校验或者签名,导致攻击者可以随意篡改金额提交的事情比比皆是。汤青松建议商家限制超量购买限量商品,限制低价、免费购买付费商品、限制免费商品获得金钱、积分等。

业务安全发展趋势及对安全研发的挑战议题概要 

演讲嘉宾:彭巍 威胁猎人产品总监。

业务安全包括账号安全、内容安全、营销活动安全等,在此之下又各有分支。

如果说业务安全在 2012 年之前还只是以阿里、腾讯及携程等为主的局部战场,近些年随着垂直电商、社交、移动游戏和 O2O 等领域的快速发展,业务安全及反欺诈被更多的视线关注。

但多数厂商并没有像阿里和腾讯一样与黑产相爱相杀一起成长,面对黑产的攻击会一时无措。作为防守方,除了对抗技术外,更要增强对黑产的认知,了解当前在一些业务核心问题上的对抗阶段和思路。

诸如被视为黑产技术飞跃式的发展——秒拨,实际上也是通过三步实现,

  1. 匿名代理

  2. 批量获取个人ADSL拨号IP

  3. 虚拟化ADSL实现海量的IP资源获取

彭巍通过多个黑产案例证明多数甲方在业务安全及反欺诈上很被动的主要原因是缺乏对黑产的认知,并帮助甲方研发梳理业务安全对抗思路并对当前主要的一些风险场景具体说明。

Windows 10新子系统*新挑战 

演讲嘉宾:陆麟,中国最老的十大黑客之一,Windows系统内核专家。

陆麟分享了他在 Windows 的 Linux 中研发出来的一些成果,即可以直接在 Windows 下直接执行的 Linux,以及一个windows 10的0day漏洞。

智能化的安全: 设备&应用&ICS 

演讲嘉宾:王东 启明星辰ADLab西南团队负责人。

物联网热潮和泛在信息化推动了智能设备和智能应用的迅猛发展,同时野蛮式生长也带来了大量的安全漏洞,一旦被利用就会爆发出远超传统信息化逻辑边界的物理性伤害。

比如智能冰箱,温度被恶意操控,食物隐形变坏,伤人;智能汽车,高速熄火,伤人;智慧医疗,精准诊断信息被利用,特别是敏感疾病的治疗信息被他人获得后果更加严重;工业控制,锅炉温控异常炸锅,伤人。

以智能门锁为例,雷锋网曾报道过酒店幽灵五年盗窃全美,竟师从黑客?文中偷变全美的犯罪分子就是利用智能门锁的漏洞轻易打开了各个酒店房间。

王东在议题中首先对 WIFI 和 BLE 两种组网类型的智能门锁进行安全漏洞分析,相比 WIFI,自带光环的 BLE 可实现点对点通信,不需要中间设备,且可以跳屏传输,信道加密,致使抓包麻烦。

那听说现在很多智能门锁都采用“APP+设备+云端”构架?

云端缺陷就更好利用了,只要登录APP,选择一键开门,并编写代码调用GATT接口即可发送开门密码……

而在最后,王东也分享了工业控制系统方面的安全问题,比如弱口令及数据泄露司空见惯……对于厂商来说,头疼的不止是软件漏洞、协议漏洞、操作系统漏洞交织在一起,更因为一旦要修补这些漏洞就需要中断业务。毕竟,这是一件需要多方协调的事情。

移动APP灰色产业案例分析与防范 

演讲嘉宾:无名侠 陈愉鑫 移动安全爱好者、看雪会员。 

移动互联网时代,互联网业务飞速发展,在这样的大背景下滋润了一条以刷单、倒卖、刷榜、引流、推广为主的灰色产业链。他们以低成本换取了高额的利润,给互联网企业以及用户都带来了巨大的损失。加固技术、风险控制、设备指纹、验证码等技术也都在飞速发展,但实际效果并不能让人满意。

陈愉鑫在此议题中揭露了多个真实案例的技术细节,开发流程,运营流程,并提出一些防护建议,协议安全需要从体系上进行加强。

开启IoT设备的上帝模式 

演讲嘉宾:杨经宇(Jingle)就职于腾讯反病毒实验室,从事恶意代码研究工作。

在议题开始时,杨经宇先讲了 IoT 金字塔。

最为底端的是大众眼中的 IoT 即万物互联,在此之上是软件开发人员眼中的 IoT 是一个带有联网功能的嵌入式设备,更上一层安全研究人眼中 IoT 是一个金矿,只要挖就永远有料(漏洞),处于金字塔顶的是why,为什么要 root IoT设备?

可能是为了突破设备限制,增加功能,也可能是为了做进一步的安全研究,甚至利用 root 设备薅羊毛,挖矿……当然这属于黑产所为。

不可否认,如今 IoT 设备大量涌入智能家居领域,IoT 安全和大众的生活息息相关,智能电饭煲、插座、摄像头、电视、扫地机器人……如果智能家居被如电影中的智能汽车一样被远程遥控,后果不堪设想。

在议题中,杨经宇关注 IoT 设备开启上帝模式(即 root 模式)的相关安全问题,在提到 root IoT设备的常见技术手段比如弱密码和 RCE 漏洞外,杨经宇以一个中兴摄像头固件校验漏洞为例,介绍伪造固件绕过固件校验算法进行 root 设备的方法。

另外,杨经宇也分享来获得 root 权限后引发的潜在安全威胁,并提供缓解安全威胁的一些方法,例如固件加密与签名,防火墙等。此外,还分享了两个已提交 CNNVD 的 IoT 设备 root 漏洞。 

那些年出现的意料之外的漏洞 

演讲嘉宾:邓永凯 绿盟科技 Web 安全研究员。

邓永凯针对开发者在开发编码时最容易产生漏洞以及意料之外的漏洞进行分析,阐述其原因以及应该注意的地方。通过没有防御到防御绕过、错误的防御姿势、错误的使用方法、错误的修复方法、系统及语言自身特性、设计缺陷、二次漏洞、程序员的惰性导致的漏洞等方面进行了实例讲解。

游戏外挂对抗的安全实践 

演讲嘉宾:胡和君 腾讯游戏安全高级工程师。

在议题中胡和君以 FPS 类型游戏的自瞄外挂功能的对抗为例,通过对自瞄外挂实现原理的解析,说明了如何使用定制化的技术思想,达到对外挂作弊功能的持续压制。另外议题中还谈及游戏漏洞挖掘的核心思路和方法技巧,游戏开发者自身提升游戏安全性的技术手段,安全防守方定制化方案分析、开发、实现的方法和技巧等内容。

 java json 反序列化之殇 

廖新喜 绿盟科技网络安全攻防实验室安全研究员。

随着 REST API 的流行,JSON 的使用也越来越多,但其中存在的安全问题却不容忽视,特别是由于反序列化导致的远程代码执行更是威力十足。

在这次演讲中,廖新喜主要阐述 Java Json 库的反序列化特性导致的RCE。

另外,还将以 Fastjson 举例说明,公布部分未公开的反序列化的payload、0day,并会对这些payload分类解读。

另外,议题涉及 Gson,Jackson 和 Fastjson 这三个最常用的 JSON 序列化库的序列化和反序列的操作,并分析其安全机制,从安全机制上发现其潜在的安全漏洞。

反序列化漏洞出来已有一段时间,前期的一些防御方案随着时间的推移不再有效,但是却广泛传播,廖新喜也在议题中从开发、运维的角度来,给出建议,指出哪些防范方案不再有效,为什么是无效的,并进一步提出正确、可靠的防御方案,以防御此类安全问题。让更多的开发者对Java反序列化漏洞有更加透彻的理解,做好安全编码,做好安全防护,减少被黑客骚扰的机会。

一石多鸟——击溃全线移动平台浏览器 

Roysue 看雪iOS版块版主。

浏览器早已成为我们日常生活中不可或缺的一部分,这种攻击可以造成大范围的用户信息泄露,不仅局限于网站上手机上填写的姓名电话、信用卡银行卡等用户基础信息,更包括了我们日常生活中频繁使用的淘宝购物,“扫一扫”、“公众号”、“小程序”、共享单车H5、饿了么H5等等贴近生活的一线App,所有App均不同程度的使用了某种Webview的实现。一旦被意图不轨者掌握并利用,后果非常严重。

针对应用层的攻击频次连年增长,攻击方式更加多元,而越来越多企业的业务又依靠互联网来实现,防止应用层安全失守成为企业不可回避的问题,做好应用层安全也成为厂商和企业不可或缺乃至不可推卸的责任。roysue 在议题中针对应用层的攻击频次连年增长,攻击方式更加多元的现象,提出了相应的策略。

如何黑掉无人机 

谢君 阿里安全IoT安全研究团队Leader。

本议题是基于某品牌创新无人机DJI Phantom 4 Pro和DJI Mavic Pro机型上进行的研究,系统的介绍某品牌无人机的架构体系,功能模块,传感器等,包括各个组件的攻击面,安全防护体系,软硬件反调技术及其绕过方法,并深度解读无线宽带通信等。现场会介绍一个不需要通过软件漏洞就能Root无人机的方法,以及如何远程劫持一台无人机。 

无人机是一个复杂的系统工程,包括飞控系统、避障测距定位系统、图像采集、无线通信等。

谢君在议题中介绍了某品牌无人机的架构体系、功能模块、传感器等,包括各个组件的攻击面、安全防护体系、软硬件反调技术及其绕过方法,并深度解读无线宽带通信等。

而为什么要 Root 无人机?实际上是为了更方便研究无人机及其他模块。

那怎样 Root?

雷锋网了解到,通常需要通过软件漏洞,执行adb_en.sh脚本来进行,而谢君在现场还介绍一个不需要通过软件漏洞就能Root无人机的方法,即修改start_dji_system.sh脚本“Debug=true”也可以达到root目的。另外,谢君还演示了如何远程劫持一台无人机。

写在最后:

结束从不意味着落幕,而是崭新的起点。

而这群热爱安全技术的人们也将继续砥砺前进。

雷锋网

优必选获TRECVID 2017 VTT matching and ranking任务冠军

雷锋网AI科技评论消息,由优必选悉尼 AI 研究院和浙江大学网络与媒体实验室组成的 DL-61-86 队伍参加 TRECVID 2017 和大规模电影描述与理解挑战 Large Scale Movie Description and Understanding Challenge (LSMDC 2017) 的多项任务,并获得了 TRECVID 2017 VTT matching and ranking 任务的第一名,以及 LSMDC 2017 两个任务的第二名。

随着深度学习在计算机视觉方面大放异彩,近几年视频领域的研究也得到了飞速的发展。数据显示,人们在视频上花费的时间是图片的 2.6 倍,因此视频领域的研究具有巨大的研究意义和应用价值。与图像相比,视频拥有更加丰富的信息,该领域的研究也更富挑战性。

TRECVID(http://trecvid.nist.gov)是视频检索领域最权威的国际评测,由美国国家标准技术局(National Institute of Standards and Technology, NIST)组织,得到了包括美国国防部高级研究计划局 (DARPA) 在内的美国多个政府部门的支持,代表国际视频相关技术的领先水平。今年,优必选悉尼 AI 研究院组队参加了 TRECVID 2017 视频到句子匹配和排序的任务(VTT matching and ranking)。

图 1 TRECVID 2017 VTT matching and ranking 任务的结果

VTT matching and ranking 任务吸引了来自全球 35 支队伍报名参赛(包括卡内基梅隆大学、阿姆斯特丹大学、香港城市大学、悉尼科技大学、北京大学、中国人民大学、卡内基梅隆大学博世(BOSCH)研究中心等国内外大学和研究所),是今年报名参加队伍数量排名第二的任务,从侧面也反应了该任务在研究领域的受欢迎程度。

VTT matching and ranking 任务的内容是给定一个视频,参赛者需要从大量的候选句子中选出一个最好的句子来描述视频。该任务的难点在于视频和句子属于两种模态的数据,因此视频和句子不能直接进行比较。这也是跨媒体检索领域的重要研究问题,因此这项任务具有广泛的实际意义。

图 2 DL-61-86 队伍的解决方案框架

在 VTT matching and ranking 任务上,优必选悉尼 AI 研究院的解决方案 (https://ai.ubtrobot.com/sharelink/TRECVID2017_DL-61-86_VTT.pdf) 是利用两个神经网络分支分别把视频和句子编码映射到一个共同的空间里(common space),在这个空间计算视频和句子的相似度(similarity),从而可以根据相似度对所有候选的句子进行排序,网络框架如图 2 所示。

对于视频编码分支网络,优必选悉尼 AI 研究院提出了空间信息增强的视频表达,通过结合 Gated Recurrent Units (GRU) 和 skip connections 来加强对视频空间信息的表达。同时,优必选悉尼 AI 研究院引入注意力机制(Attention mechanism)让模型重点关注视频中的关键帧,从而避免视频帧之间信息的冗余。

对于句子编码分支,优必选悉尼 AI 研究院引入了多尺度的句子编码。多尺度的句子编码同时考虑了单词尺度以及句子尺度的信息,让模型自己学习如何组合这些来自不同尺度的信息,从而学习得到一个更好的句子特征编码器。该解决方案以大幅度的优势获得了 VTT matching and ranking 任务的第一名。

Large Scale Movie Description and Understanding Challenge (LSMDC 2017) 是由普朗克信息学研究所、多伦多大学、迪士尼研究院、Facebook 人工智能研究院等大学和研究机构联合创办。今年的 LSMDC 2017 比赛,作为 ICCV 2017 的一个 workshop,吸引了来自全世界的众多队伍参加。优必选悉尼 AI 研究院参加了该比赛的两个任务,分别是电影描述(Movie Description)以及电影的标注与检索(Movie Annotation and Retrieval)。

图 3 DL-61-86 队伍在 Movie Description 任务中的解决方案

Movie Description 的任务内容是通过自动生成一句话来描述给定的电影片段。优必选悉尼 AI 研究院的解决方案 (https://ai.ubtrobot.com/sharelink/03-Dong.pdf) 是利用编码和解码的网络框架(encoder-decoder framework)来实现,首先利用空间信息增强的视频表达来对电影片段进行编码,然后通过 GRU 把编码后电影解码成一句话。

该方案在 7 个评测指标中获得 3 个第一、2 个第二以及 2 个第三。Movie Annotation and Retrieval 任务分成两个子任务,分别是 Movie Multiple-Choice Test 和 Movie Retrieval。Movie Multiple-Choice Test 任务是给定一个电影片段,参赛者需要从 5 个句子中挑选一个句子来描述电影片段,而 Movie Retrieval 任务是给定一个句子,参赛者需要对所有候选电影片段进行排序。

这两个任务的核心问题都是如何计算电影片段和句子的相似度,因此优必选悉尼 AI 研究院采用了 TRECVID 2017 VTT matching and ranking 任务上的相同方案,最终都获得了第二名的成绩(图 4、图 5 和图 6 为 LSMDC 2017 比赛任务的排行榜)。

图 4 LSMDC 2017 Movie Description 任务排行榜

图 5 LSMDC 2017 Movie Multiple-Choice Test 任务排行榜

图 6 LSMDC 2017 Movie Retrieval 任务排行榜

 除了 TRECVID,今年 7 月,在 CVPR 2017 的 VQA 比赛中,优必选悉尼 AI 研究院与杭州电子科技大学、北卡罗来纳大学夏洛特分校组成联合队伍 HDU-USYD-UNCC,在来自全球最顶级的几十支大学、研究机构和企业队伍中获得了第二名的成绩,仅次于阿德莱德大学与微软研究院组成的联合队伍。

VQA(视觉问答,Visual Question Answering)以一张图片或者一段视频和一个关于这张图片形式自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。简单来说,VQA 就是给定的图片进行问答。这是未来机器人通过视觉系统认知和理解世界,并与人互动的关键技术。VQA 是一种涉及计算机视觉和自然语言处理的学习任务,是近年来非常热门的一个研究领域,也是 AI 落地的一项重要技术领域。

同时,在 CVPR 2017 的 ILSVRC 2017(ImageNet Large Scale Visual Recognition Challenge 2017) 视频物体检测(Object Detection from Video)竞赛的四个项目(包括给定训练数据条件下的视频物体识别、额外训练数据条件下的视频物体识别、给定训练数据条件下的视频物体识别/追踪,以及额外训练数据条件下的视频物体识别/追踪)中,优必选悉尼 AI 研究院与帝国理工学院组成的联合队伍 IC-USYD 都以领先第二名超过 5% 的成绩取得了第一名。

ILSVRC 2017 视频物体检测竞赛主要考察在视频里中获取物体的能力,对于机器人而言这是一项非常重要的工作,例如它在行走过程中就能知道这个场景里有多少物体,有什么物体。人眼看到的视觉不是一张张照片,而是连续的视觉的信息,未来机器人的视觉系统也将是对连续视觉的理解。

图 7 优必选与清华合作的仿人形机器人获得 RoboCup 人形组 AdultSize 比赛第二名

2017 年 7 月 30 日,优必选还与清华大学联队参加了 RoboCup(机器人世界杯)人形组 AdultSize 的比赛,并以 13 分的成绩获得了该组技术挑战赛的第二名,仅次于拿下了 15 分的德国 NimbRo 队。RoboCup 是目前全球规模最大、水平最高、影响最广的机器人专业赛事,其机器人足球项目被分为仿真组、小型组、大型组、标准平台组和人形组五个组别,代表了未来几年双足人形机器人进行足球比赛的技术方向。

正是得益于在科研层面的厚积薄发,优必选不仅在全球重要国家及地区如美、欧、日、韩及 PCT 国际申请都进行了相应的专利规划及战略布局,还在多项国际重大赛事上取得了优异的成绩。未来,优必选将继续以核心人才和原创技术作为驱动,积极打造「硬件+软件+服务+内容」机器人生态圈,通过技术创新和产品创新为人类缔造更美好的生活。

雷锋网

小鹏汽车何涛:如何利用电动化和数字化推动产品发展? | 2017 未来出行

雷锋网按:全球未来出行高层论坛在杭州国际博览中心召开,论坛主题是“智能网联时代的汽车与出行变革”。除主题论坛外,还有八场主题峰会,包括:全球新能源汽车发展战略、智能交通与未来出行新生态、未来出行产业投融资峰会、智能汽车政策与战略、自动驾驶的技术与未来、新能源汽车技术变革与产业链重塑、百人会硅谷论坛、未来出行时代的品牌塑造等。

120 多位嘉宾和 3800 名听众将共同探讨新能源汽车与智能汽车相关产业的政策法规标准、产业变革趋势、新能源汽车产业链的技术创新、商业模式创新、未来出行产业的发展路径等。

小鹏汽车联合创始人&副总裁何涛出席“全球新能源汽车发展战略”主题峰会并做主旨演讲。何涛表示,小鹏汽车的核心战略是以用户体验为中心,以电动化和数字化为双引擎驱动公司发展,让场景化的自动驾驶和互联网应用成为打造极致用户体验的差异化优势。

以下为何涛的分享,由雷锋网整理与编辑。

小鹏汽车成立3年了,3年时间小鹏汽车取得了很快的进展。小鹏汽车的巨大发展正是中国电动汽车产业快速发展的一个缩影。

我们都坚信电动化是中国汽车产业发展的未来必然趋势和巨大机会所在,对于小鹏汽车这样的新玩家来说,如何在未来电动汽车的竞争格局中取得竞争优势,建立壁垒,或者说为电动汽车产业做出自己的贡献,这将是一个新的话题。

我们认为电动化是汽车发展的必由之路,但绝不是终点,电动汽车将会是未来消费者选择出行工具的首选,而且更将是互联网汽车的基础和平台。

小鹏汽车将会以用户体验为中心,利用“双擎驱动”的方式推动产品的发展,第一是电动化引擎,第二是数字化引擎。

电动化引擎

在电动化方面,我们从用户体验的角度来进行考虑,其实用户并不太关心什么是能量密度、什么是轻量化、什么是复合材料,用户最关心的是在现阶段电动车能不能像燃油车一样使用方便、快的或者说没有后顾之忧。这对我们就提出了很高的要求。

过去3年,我们对电池PACK技术、电池液冷技术做了相当多的研究,现在小鹏汽车的量产车型的电池能量密度可以达到152瓦时/千克。

为了提高续航里程,我们在轻量化方面也作出了很多可落地的实际的创举,首先我们采用了铝合金和钢混合的车身。一方面我们没有采用全铝车身,这是基于量产的可能性以及成本的可控性,在钢铝混合的车身上下足了工夫。

在电池包方面,我们使用了全铝合金的电池包的PACK技术。电气控制系统里我们使用了自主研发的电气控制系统来保证整个系统的高效运行。提高续航里程的源头在于电芯,我们下一阶段会与一流的电芯供应商在战略层面、资本层面展开相当大的合作。

现在电动车的一个痛点是充电的不便利性,因此我们在如何使用户更加便利、更加快速的充电也做了一些工作。

我们都会在条件允许的情况下为用户配备家用充电桩,另外我们会开启超级充电桩的研发以及铺设的工作。这一方面可能需要三方合作,但是我们也已经投入了大量的财力和无力。

数字化引擎

我们认为在数字化引擎下包含两个方面的应用,一个是自动驾驶,另一个是互联网能力在汽车上的应用。

在数字化的引擎下,不论是自动驾驶还是互联网体验,每一个功能都是各项复杂系统整合的结果,并且需要数据和服务的支持,这个需要从OEM的角度做大量的改变和整合。

另外,我们有一个专利技术是车顶的摄像头系统。摄像头、整车控制、大屏交互等都要进行整合,我们必须在设计开发的组织结构上和制造领域都做一些变革。

汽车的大脑系统、神经系统都需要硬件、软件的整合,这是一项很高难度的动作,并且需要有一个新基因的公司才能完成这一项工作。

自动驾驶领域,我们首先会瞄准Level 3、Level 4(SAE)级别自动驾驶。同时,在我们陆续推出的量产车型上,我们也会去搭载更多场景化的自动驾驶功能。

我们在展馆带来的第一辆车上,已经搭载了自动泊车功能,很多豪华汽车已经具备自动泊车的功能,但是可能消费者用起来并不方便或者说用起来太麻烦,使用的场景并不多,所以我们在自动泊车整个系统功能开发过程当中非常注重用户体验和用户的场景化。

我们希望使用我们电动车的消费者能够更多的去使用自动泊车的功能,这样我们可以获得更多的数据,而这些数据反过来又可以成为自动泊车算法更新的一个源头。

现在我们下线的量产车型上也搭载了更多自动驾驶的功能,比如低速拥堵路况的自动跟随以及高速单车道的自动驾驶。这些是针对用户实际的痛点问题去解决,而且我们也考虑到这些技术可落地性和安全性能。

数字化的另一方面,我认为是互联网技术在汽车上的落地化的应用。

我们认为信息可视化是一切沟通的基础,因此小鹏汽车搭载了15寸的大屏和13寸的液晶仪表,让更多汽车信息成为交互的基础。

在语音操控方面,除了视觉方面的可视信息交互以外,我们还通过在驾驶过程中更加便捷和更加安全的语音交互来进行沟通,使车和人的沟通变得更加便利。

对于小鹏汽车这样的新公司来说,我们认为最大的挑战不是来自于聪明的想法,而是来自于如何把聪明的想法变成严谨的设计,最后变成产业化和规模化的应用,我相信这个过程中供应链会产生巨大的作用。

只有打通供应链的公司才会真正有量产化的能力,所以小鹏汽车在过去3年半时间里已经建立了完整的供应链配套体系,足以去支撑研发和生产的进行。

雷锋网推荐阅读:

新车下线,小鹏汽车高速增长:每月至少一名高管加入,同步进行三轮融资

雷锋网

零跑汽车推动首款电动车S01:2018年实现Level 2级别自动驾驶,2019年开始交付 | 2017 未来出行

来自杭州的零跑汽车,推出了首款纯电动轿跑。

成立于 2015 年 9 月的零跑,经过两年的成长,11 月 10 日在自己的大本营杭州推出了旗下首款纯电动轿跑 LP-S01

这是一款 2 门 4 座车型,无框车门,匀速工况下续航里程为 360 公里,百公里加速 6.9 秒,整车标配智能驾驶和智能网联系统,前后全 LED 大灯,计划在 2019 年 3 月量产上市。

据零跑汽车产品研发副总裁许炜介绍,零跑非常重视车型平台化的开发,目前共有 T(A00 级)、S(A0 级)、C(A 级)三个车型平台。

今天发布的 S01 则是 S 平台的第一款车型。据许透露,C 平台的两款车型已经在开发当中。零跑希望通过车型的平台化,力争实现「全新平台全新车型 3 年、同平台全新车型 2 年,车型改款一年的『321』研发周期计划。」

许炜表示,零跑从成立之初便一直坚持车辆正向设计开发,同时强调性能开发。「在整个底盘调教、操控、车身内外饰的轻量化上,在智能互联、智能驾驶、动力电池、电驱总成等核心系统方面,全部坚持自主开发。」

电驱总成最大功率达到 125kw,峰值扭矩达到 250 牛米,系统效率高达 93.6%,总成重量只有 91 公斤——这是因为实现了超高的集成化,整个电驱总成由电机、减速器和控制器三部分组成。

同时针对控制器,零跑还进行了包括 MCU、VCU 在内的五合一控制器的集成。「这样的好处是节约空间,合理利用冷却系统。」零跑的一位工程师这样向雷锋网解释。

动力电池总成最大电量为 36 kwh,能量密度达到 130Wh/kg,充放电效率达 97.7% 以上。

许炜表示,电芯的安全设计非常重要。因此零跑的电芯通过双极双保险安全设计结合 PACK 高低压全隔离设计,可以保障电池包的安全性。

零跑的一位工程师告诉雷锋网,这块电池总成的重量为 280 公斤,电池能量密度在量产时会提升 10% 左右,达到 140Wh/kg。

据这位工程师介绍,零跑自主研发的电池包,包括 BMS 和整个模组,在充分优化 BMS 的算法性能后,目前 SOC 和 SOF 估算精度能够控制在 ±3% 以内,SOH 的估算精度控制在 ±5% 以内。

车联网系统架构包括产品应用端,数据云端和行业平台端。

具体来说,产品应用端主要包含车机仪表和手机 App,后者可以远程控制车辆,并进行自动泊车。数据云端则进行整车数据的存储和分析,为行业平台端提供 API 和接口支撑,扩展行业应用。

智能驾驶系统基于大华在智能交通和安防领域多年算法及数据积累。在摄像头应用上,零跑采用大华自主研发的国际标准的 HDCVI 技术,以此保障图像清晰度和传输的实时性。

据雷锋网了解,零跑 S01 整个系统包含了 20 个以上的传感器,实现车内外 720°全覆盖。整个系统包含自动泊车、ACC 自适应巡航,前防撞预警等智能驾驶功能。

许炜介绍,零跑 S01 含 EPS 和 ESC 系统,可以完全控制整车的加减速和转向,方便日后对智能驾驶系统进行升级。

目前零跑的规划是在 2018 年实现 Level 2 级别的自动驾驶,在 2019 年到 2020 年逐步实现 Level 3 级别自动驾驶功能。

零跑 S01 定位于一款两门四座布局的纯电动轿跑车,是「年轻人的第一辆车以及年轻家庭的第二辆车」。2018 年底,这辆属于零跑自主研发的首款车型就会正式量产。

虽然零跑汽车的新工厂已经在规划当中,今年 2 月底获批的建厂用地位于金华市新能源汽车小镇,已于今年 4 月开工。

新工厂占地 551 亩,预计投资 26 亿元人民币,一期规划产能 5 万辆/年。后续可扩展到年产能 25 万台,生产基地配备五大车间,不仅配有冲压车间、焊装车间、涂装车间、总装车间这四大传统工艺车间,还配有三电(电机、电池、电控)研发设计及生产车间。

但眼下,量产时间对一家新造车公司来说,依然十分紧迫。零跑汽车董事长朱江明此前在接受雷锋网采访时表示,「新工厂预计今年春节期间要完成建设节点,预计 2018 年 8 月完成设备安装调试并投入使用,2018 年年底开始量产。」

对于电动车的生产资质问题,朱江明曾表示:希望抱有决心拿到生产资质,他说目前零跑的各项准备工作井然有序,但最终也不排除与某些传统车企合作。

曾经作为大华的联合创始人、CTO,朱江明自认是公司最大的产品经理,对产品和技术有着无限的热爱和浓厚的兴趣。

在朱江明看来,零跑汽车的背景是属于 IT 类的企业、产品导向型的企业,基因更像华为,更崇尚技术、崇尚整体的管理和综合竞争力。零跑目前拥有 400 人规模的团队,其中 330 人为研发人员,技术导向型非常明显。这一点,其实从今天零跑汽车的发布会上已经部分得到印证。

「零跑从创建之初,就注重基础技术的研发。核心三大部件,动力总成、电池和主控系统,以及智能驾驶系统和车机互联系统等,这些核心零部件都是自主研发。这是零跑的源泉一。」朱江明这样表示。

对朱江明而言,这是他的第二次创业。虽然造车是一件路程遥远且充满挑战的事业,但他对零跑的未来充满信心。

这个底气来自于此前大华发展二十余年的积累:从零开始到成长为一家 800 亿市值公司的成功经验。「零跑有很好的资金背景为基础,以及大华在汽车上智能交通方面的技术,这些都是很好的基础。」他说。

雷锋网推荐阅读:

大华低调造车两年,零跑有没有机会成为中国的“丰田”?

雷锋网

博世称正进行激光雷达研发,将于2022年投入市场 | 2017 未来出行

雷锋网按:全球未来出行高层论坛在杭州国际博览中心召开,论坛主题是“智能网联时代的汽车与出行变革”。除主题论坛外,还有八场主题峰会,包括:全球新能源汽车发展战略、智能交通与未来出行新生态、未来出行产业投融资峰会、智能汽车政策与战略、自动驾驶的技术与未来、新能源汽车技术变革与产业链重塑、百人会硅谷论坛、未来出行时代的品牌塑造等。

120 多位嘉宾和 3800 名听众将共同探讨新能源汽车与智能汽车相关产业的政策法规标准、产业变革趋势、新能源汽车产业链的技术创新、商业模式创新、未来出行产业的发展路径等。

以下是博世底盘控制系统中国区副总裁蒋京芳关于自动驾驶方面的分享,由雷锋网整理与编辑。

电动汽车公司、互联网公司、AI 公司以及出行解决方案提供商等介入智能网联汽车,使原本非常单一的汽车行业逐步变得多样化,而且更富有吸引力。

蒋京芳认为,中国在汽车电动化的布局、互联网快速应用、AI 技术能力应用、消费者超前开放意识等因素,使博世有理由相信未来智能网联在中国有非常大的机遇。

她表示,100 年前,德国定义了现代意义的汽车。未来,汽车由中国参与定义。

博世从 2011 年开始了自动驾驶研究,并将自动驾驶分为三类:一是高速公路,介于 1 级、2 级之间;二是城市自动驾驶;三是自动泊车的低速自动驾驶;中间(如上图)则是城市工况的城市共享出租车。

今年 4 月,博世发布了第二代自动驾驶技术。蒋京芳表示,目前自动泊车功能技术已经成为非常常见的功能。

据她透露,明年将有多款搭载博世超声波雷达的自动泊车功能的车型上市,遥控泊车的车型预计将在 2019 年左右上市,家庭区域固定车位泊车辅助的车型将在 2020 年左右推出。

蒋京芳表示,自动驾驶是一个非常复杂的系统,是一个结合了许多子系统的大系统,但是也可以简单分为三大类:感知、决策和执行。

驾驶员已经不在驾驶链当中,这意味着我们要保证车辆在任何环境下都能对周围的环境做精准的判断,建立环境模型,同时必须知道自己在地球上的哪个地方、哪个车道,这涉及到高精地图以及博世正在开发的定位传感器技术。

提到「大脑」,传统算法已经不能满足接下来自动驾驶的需求,还需要引入 AI 技术,而传感器冗余、传感器融合则需要更强大的「电脑」,博世称之为「域控制器」;接下来就是执行,它涉及转向、加速、减速等等。

当然,这些并不是自动驾驶的全部,整个电子电器的架构、双电源、功能安全、网络安全以及法规的支持也是需要考虑的因素。

蒋京芳介绍,博世正在开发用于更复杂场景同时满足自动驾驶的传感器。

目前博世的第五代雷达,可以探测距离、宽度,通过增加带宽提高探测时间,更好的提高毫米波分辨率以及探测精度。第五代产品比第四代更加密集,比如说有车辆过来或者有大的转盘,整个地面形状可以进行很好的复展。

博世在开发第三代摄像头,我们把它叫做「革命性的摄像头」,因为靠单个摄像头可以实现五星评分,分辨率到 200 万像素。

博世在利用三大新兴技术:纹理识别、密集光流法、CNN 卷积神经网络进行相应的技术开发。

  • 纹理识别:通过 2D、3D 的有效结合,即使没有在车道线也可以对整个道路进行很好的识别;

  • 密集光流法:可以识别人蹲下来或者微小的球在道路上滚动等以前不能识别的障碍物;

  • 博世将 CNN 技术集成在芯片中,通过 CNN 可以识别 6 种不同目标,比如道路、车道线、房屋、草木、天空等等。

此外,博世还利用超声波雷达增加车辆探测范围,提高刷新时间,每一个超声波雷达有一个代码,避免超声波雷达有噪音,可以更加精准。

蒋京芳表示,与第五代超声波雷达相比,第六代超声波雷达可以很好识别无法识别的低矮物体。

近距离传感器主要用于后视、环视影像。近距离传感器与超声波雷达进行融合后,可以实现更高级别的泊车功能,这其中还需要冗余传感器。蒋京芳透露,博世正在开发激光雷达,预计在 2021 年、2022 年之间投放市场。

除了传感器外,自动驾驶还需要 AI。

目前 AI 技术主要是视频技术,但博世也进行相应研究。毫米波雷达、激光雷达、AI 技术同样可以应用其中,AI 在自动驾驶过程中将会发挥很好的作用。

自动驾驶还需要一个非常强的「大脑」——域控制器。蒋京芳表示,博世也在开发驾驶员辅助系统的域控制器,它是一个具有拓展性的域控制器。

不同自动驾驶功能需要不同的冗余系统。蒋京芳表示,博世为了安全,在不断扩大硬件成本,但博世也在考虑如何在保证安全的情况下,利用最经济的方式将产品和功能用于商业化。

今年 7 月,博世和戴姆勒合作的项目已经实现了自动泊车,这项功能有望在 2018 年在中国演示。当然,这个功能需要依靠智能基础设施帮助推进,需要在场地布满摄像头或是激光雷达、双目摄像头方案,然后根据后台指导停进相应车位中。

蒋京芳最后表示,自动驾驶风起云涌,博世希望在本土建立产品与系统研发技术及能力;在人工智能及高精地图领域建立合作伙伴关系;充分考虑中国驾驶行为及环境工况,发展适合本土的功能;与行业伙伴推动自动驾驶相关法律政策的建立与完善,共同开创自动驾驶的未来。

雷锋网推荐阅读:

专访博世高级副总裁:自动驾驶系统最大的挑战是如何对AI进行验证 | IAA 2017

雷锋网