所有由admin发布的文章

自然语言处理顶会 NAACL 2018 最佳论文、时间检验论文揭晓

雷锋网 AI 科技评论按:ACL、EMNLP、NAACL – HLT、COLING 是 NLP 领域的四大顶会。前三者都由 ACL(Association of Computational Linguistics)举办, 其中 NAACL – HLT(Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies,一般简称为 NAACL)虽然名义上只是 ACL 北美分会,但在 NLP 圈里也是无可争议的顶级会议,名称中的 HLT 也直接宣告了对于人类语言处理技术的关注。

第 16 届 NAACL (NAACL 2018)将于今年 6 月 1 日至 6 月 6 日在美国路易斯安那州新奥尔良市举行,接受论文名单已经公布,共收到长论文投稿 647 篇,其中接受 207 篇,接受率 32%;短论文投稿 425 篇,接受 125 篇,接受率 29%。会议官网也已经提前揭晓了本届会议的 4 篇杰出论文(Outstanding Papers)和 3 篇时间检验奖获奖论文(Test-of-Time Award Papers)。

Outstanding Papers

Deep Contextualized Word Representations

  • 深度上下文单词表征

  • 地址:https://arxiv.org/abs/1802.05365

  • 摘要:本文中作者们介绍了一种新的深度上下文单词表征,它可以建模(1)单词用法中的复杂特性(比如句法和语义),以及(2)这些用法在不同的语言上下文中如何变化(比如为词的多义性建模)。作者们在大文本语料库上预训练了一个深度双向语言模型(biLM),然后把根据它的内部状态学到的函数作为词向量。作者们表明,这些学到的词表征可以轻易地加入到现有的模型中,并在回答问题、文本蕴含、情感分析等 6 个不同的有难度的 NLP 问题中大幅提高最佳表现。作者们也进行了分析,表明显露出预训练模型的深度内部状态这一做法非常重要,这使得后续的模型可以混合不同种类的半监督信号。

Learning to Map Context-Dependent Sentences to Executable Formal Queries

  • 学习把基于上下文的语句映射为可执行的正式查询

  • 地址:https://arxiv.org/abs/1804.06868

  • 摘要:论文中作者们提出了一种基于上下文的模型,用来把一组交互对话中的语句映射为可以执行的正式查询语句。为了把交互过程的历史也包含在内,模型中维持着一个交互对话级别的编码器,它会在每轮对话结束后更新,也能够在生成过程中拷贝之前曾经预测过的查询语句中的子序列。论文中的方法合并了语句之间的显示参照和隐式参照。作者们在 ATIS 航班规划交互上评估了模型,展现出了上下文建模和显式参照的优势。

Neural Text Generation in Stories using Entity Representations as Context

  • 把实体表征作为上下文的叙述文体中的神经文本生成

  • 地址:https://jiyfeng.github.io/publication/papers/clark2018neural.pdf

  • 摘要:作者们介绍了一种神经文本生成方法,它可以显式地表示出文本中提到的实体。实体表征是向量的形式,它们可以随着文本处理过程更新;实体表征是专门为小说或者新闻故事这样的叙述性文本设计的。作者们的实验表明,为实体建模的做法可以在以下两个自动化测试中带来好处:提及生成,即模型需要选择下一个要提及的实体是什么,提及时又需要用哪个词;以及在正确的下一句和来自同一个故事的更靠后的一句之间进行选择。作者们也人工评估了在故事上下文中自动生成的文本,研究结果与作者们希望强调实体的想法相符,并为未来研究指出了方向。

Recurrent Neural Networks as Weighted Language Recognizers

  • 把循环神经网络作为加权语言识别器的研究

  • 地址:https://arxiv.org/abs/1711.05408

  • 摘要:论文中作者们探究了简单的循环神经网络(RNNs)作为正式模型识别加权语言时的不同问题的计算复杂度。作者们重点关注的模型是单层、ReLU 激活函数、有理数权重、带 softmax 的 RNN 网络,这种网络在自然语言处理应用中非常常见。作者们表明对于这样的 RNN 来说,多数的问题都是不可判定的,比如一致性、等价性、最小化以及权重最高的字符串的确定性。然而,对于一致性 RNN 来说,这最后一个问题是可以判定的,虽然解决方案的长度会超出所有计算范围。如果附加条件限定字符串为多项式长度,这个问题变为 NP-complete 以及 APX-hard。总结来说,这表明这种 RNN 的实际应用中近似和启发性算法是必须的。

Test-of-Time Award Papers

雷锋网 AI 科技评论注意到,实际上这是 NAACL 会议首次设立时间检验奖,论文选择范围为 2002-2012 年 ACL 的各个会议(包括 ACL, NAACL, EACL, EMNLP 和 CONLL)、workshop 以及期刊(TACL 和 CL journal)中的关于计算语言学(Computational Linguistics)的论文,意在表彰直到今天都对计算语言学领域有显著、长期影响的论文。在 NAACL 2018 区域主席提名的 19 篇无利益冲突的论文中,最终选出了如下三篇论文, 也都确实很值得回味。

BLEU: a Method for Automatic Evaluation of Machine Translation

  • BLEU:一种自动化评价机器翻译的方法

  • 地址:https://www.aclweb.org/anthology/P02-1040.pdf 

  • 来源:ACL 2002

  • 摘要:如果让人类对机器翻译的结果做评价,虽然拓展性好但较为昂贵。人类评价的过程可能需要好几个月的时间,其中涉及的人类劳动也无法反复使用。这篇论文中提出了一种自动的机器翻译评价方法,它快速、便宜、不依赖于语言,它的评价结果与人类的评价结果高度吻合,而且运行成本相当低。作者们提出的这种方法可以作为有经验的人类评价者的自动化备用方法,在有需要做快速、频繁的评价时就可以使用它。

Discriminative Training Methods for Hidden Markov Models: Theory and Experiments with Perceptron Algorithms

  • 隐马尔可夫模型的判别性训练方法:感知机算法的理论和实验

  • 地址:http://www.aclweb.org/anthology/W02-1001 

  • 来源:EMNLP 2002

  • 摘要:作者提出了一种新的算法用于训练分类模型,它可以作为最大熵模型或者条件随机场模型(CRFs)的替代方法。这种算法依靠的是训练样本的 Viterbi 解码,并且结合了简单的加式更新。作者对感知机算法对于分类问题的收敛性的证明加以修改,据此理论证明了算法。作者在语音段分类和基础名词短语分块任务上进行了实验,所提的方法表现都要优于最大熵分类器。

Thumbs up?: Sentiment Classification using Machine Learning Techniques

  • 你说好不好?机器学习方法的情感分类

  • 地址:http://www.aclweb.org/anthology/W02-1011 

  • 来源:EMNLP 2002

  • 摘要:论文中研究了这样一个问题,文档分类的依据不再按照话题,而是按照总体感情,比如判断一句评论是正面的还是负面的。把电影评论作为数据,作者们发现标准的机器学习技术明确地优于人类设计的基准模型。然而,作者们实验的三种机器学习方法(朴素贝叶斯,最大熵分类,SVM)在情感分类任务中的表现并不如在传统的基于话题的分类任务中表现好。作者们还验证了几个使得情感分类比话题分类更难的因素。

via NAACL Chair's Blog,雷锋网 AI 科技评论编译

雷锋网

François Chollet 谈深度学习的局限性和未来 – 上篇

雷锋网 AI 科技评论按:本文来自 Keras 作者 François Chollet,同时也是根据他撰写的《Deeping Learning with Python》一书第 9 章第 2 节改编的。关于当前深度学习的局限性及其未来的思考,François Chollet 共撰写了两篇文章,这篇是其中第一篇。雷锋网 AI 科技评论编译如下

作者注:这篇文章的受众是已经有深度学习经验的人(例如读过本书第 1 章至第 8 章的人)。 我们假设读者已经具有一定知识储备。

深度学习的几何学视角 

深度学习最令人惊讶之处就在于它十分简单。十年前,没有人指望由梯度下降方法训练的简单参数模型就可以在机器感知问题上获得惊人的结果。现在,事实证明,你只需要一个有足够多参数的模型,并且在足够大的数据集上使用梯度下降进行训练。正如 Feynman 曾经描述宇宙那样,「它并不复杂,只是很多而已」。

在深度学习中,一切都是一个向量,即一切都是几何空间中的一个点。模型输入(可以是文本,图像等)和目标首先被「矢量化」,即变成一些初始输入矢量空间和目标矢量空间。深度学习模型中的每一层对通过它的数据进行简单的几何变换。同时,模型的层次链形成一个非常复杂的几何变换,分解成一系列简单的几何变换。这种复杂的转换尝试将输入空间一次一个点得映射到目标空间。这种转换是通过层的权重进行参数化的,权重根据模型当前执行的情况进行迭代更新。这种几何变换的一个关键特征是它必须是可微分的,这是为了使我们能够通过梯度下降学习它的参数。直观地说,这意味着从输入到输出的几何变形必须平滑且连续——这是一个重要的约束条件。

这种复杂的几何变换应用到输入数据的整个过程可以用三维的形式进行可视化,将其想象成一个人试图将揉成团的纸球恢复平整:皱巴巴的纸球是模型开始时的输入数据的复本。人对纸球的每个操作相当于一层简单几何转换的操作。完整的抚平(纸球)动作顺序是整个模型的复杂转换。深度学习模型是用于解开高维数据复杂流形的数学机器。

深度学习的神奇之处在于:将语义转化为矢量,转化为几何空间,然后逐渐学习将一个空间映射到另一个空间的复杂几何转换。你需要的只是足够高维数的空间,以便捕捉原始数据中全部的关系范围。

深度学习的局限性

用这个简单策略实现的应用程序空间几乎是无限的。然而,现有的深度学习技术对于更多的应用程序完全无能为力——即使提供了大量的人工注释数据。例如,你可以尝试收集成千上万甚至百万的关于软件产品特征的英文描述的数据集,由产品经理编写,以及由工程师团队开发的相应的源代码来满足这些要求。即使有了这些数据,你也无法训练深入的学习模式去简单地阅读产品说明并生成适当的代码库。这只是其中的一个例子。一般来说,无论你投入多少数据,深度学习模型都无法实现任何需要推理的东西,如编程或科学方法的应用——长期规划和类似算法的数据操作。即使使用深度神经网络学习排序算法也是非常困难的。

这是因为深度学习模型仅仅是将一个向量空间映射到另一个向量空间的简单连续几何变换链。它可以做的全部就是将一个数据流形 X 映射到另一个流形 Y,假设存在从  X到 Y 的可学习连续变换的话,并且可以使用密集的 X:Y 采样作为训练数据。因此,尽管深度学习模型可以被解释为一种程序,反过来说的话,大多数程序不能被表达为深度学习模型——对于大多数任务来说,要么没有相应的实际大小的深度神经网络来解决任务,或者存在这样的神经网络,但它可能无法学习,即相应的几何变换可能太复杂,或者可能没有合适的数据可用来学习它。

通过堆叠更多层并使用更多训练数据来扩展当前的深度学习技术,只能在表面上缓解一些问题。它不能解决深度学习模型在他们可以表示的内容种类非常有限的基本问题,并且大多数被期望可学习的程序不能被表示为数据流形的连续几何变形。

拟人化机器学习模型的风险

当代人工智能的一个非常现实的风险是人们误解了深度学习模型的作用,并高估了他们的能力。人类思维的一个基本特征是我们的「心智理论」,我们倾向于将意向,信仰和知识投射到我们身边的事物上。在我们的意识中,在岩石上画一个笑脸石头就突然变「快乐」了。应用于深度学习,这意味着当我们能够「基本成功」的训练模型以生成用于描述图片的标题时,我们就会相信该模型能够「理解」图片的内容以及「理解」它所生成的字幕。然后,当训练数据中出现的图像类别轻微偏离时,我们会非常惊讶地发现模型开始生成完全荒谬的标题。

尤其是「对抗性样本」值得强调,这些例子是一个深度学习网络的输入样本,旨在诱骗模型对它们进行错误分类。你已经意识到,可以在输入空间中进行梯度上升以生成最大化某个闭环过滤器激活的输入,这是我们在第 5 章中介绍的过滤器可视化技术的基础,以及第 8 章的 Deep Dream 算法。同样,通过梯度上升,人们可以稍微修改图像以最大化给定类的类别预测。通过拍摄一张熊猫的图片并添加一个「长臂猿」梯度,我们可以得到一个神经网络,将这只熊猫归类为长臂猿。这证明了这些模型的脆弱性,以及它们的输入——输出映射与我们人类自身认知之间的深刻差异。

总之,深度学习模型并不理解他们的输入,至少没有人类意识上的理解。我们人类对图像,声音和语言的理解是基于我们作为人类的感觉运动体验——正如地球上的生物所表现的一样。机器学习模型无法获得这些经验,因此无法以与人类一致的视角来「理解」他们的输入。 通过注释大量的训练样例来训练我们的模型,我们让他们学习在特定数据集上,将数据映射到人类概念的几何变换,但这个映射只是我们头脑中原始模型的简单概要,这是我们作为人类实体的体验得来的——它就像镜子里的一个模糊的形象。

作为一名机器学习实践者,请始终注意这一点,永远不要陷入这样一个陷阱,即相信神经网络理解他们所执行的任务——他们不会的,至少不会以对我们有意义的方式理解。不同于我们想教他们的任务,他们被训练来执行更为狭窄的任务:仅仅将训练集输入逐点映射到训练目标中。向他们展示任何偏离训练数据的东西,他们将给出最荒谬的结果。

局部泛化与极限泛化

深度学习模型中从输入到输出的直接几何变形,与人类思考和学习的方式之间几乎是完全不同的。这不仅仅是人类从自身的经验中学习而不是通过明确的训练实例来学习的问题。除了学习过程不同之外,基本表征的性质也存在根本差异。

人类能做的远远不只是像深度神经网络或昆虫那样把即时刺激映射成即时反应。人们维持着关于目前处境、关于他们自己和其他人的复杂抽象模型,并且可以使用这些模型来预测不同的可能发生的未来并执行长期规划。他们能够将已知的概念合并在一起,来表示他们以前从未经历过的事物,例如描绘穿着牛仔裤的马,或想象如果他们中了彩票就会做什么。这种处理假设的能力,扩展了我们的心智模型空间,使其远远超出我们可以直接体验到的事物空间,总而言之,进行抽象和推理,可以说是人类认知的决定性特征。我称之为「极限泛化」:这是一种在面对未经历的情况时,使用很少的数据甚至根本没有新的数据就能适应新情况的能力。

这与深度网络所做的形成鲜明对比,我称之为「局部泛化」:如果新输入与训练时看到的略有不同,则由深度网络执行的从输入到输出的映射立马失去意义。例如,来思考这样一问题,想要学习使火箭在月球上着陆的合适的发射参数。如果你要使用深层网络来完成这项任务,无论是使用监督学习还是增强学习进行训练,你都需要用数千乃至数百万次的发射试验进行训练,也就是说,你需要将模型置于密集的输入采样点空间,以便学习从输入空间到输出空间的可靠映射。相比之下,人类可以利用他们的抽象能力来提出物理模型——火箭科学——并得出一个确切的解决方案,只需一次或几次试验即可获得月球上的火箭的发射参数。同样,如果你开发了一个控制人体的深度网络,要它能够在城市中安全地驾驶汽车并不被其他汽车撞,那么这个网络将不得不「死亡」数千次在各种场景中,直到它可以推断出汽车和危险并制定适当的回避措施。放到一个新的城市,网络将不得不重新学习已知的大部分知识。另一方面,人类就不必通过死亡来学习安全的行为,这要归功于他们对假设情境的抽象建模的能力。

局部泛化:模式识别级别的泛化能力; 极限泛化:由抽象和推理得到的泛化能力

总之,尽管我们在机器感知方面取得了进展,但我们离人类级别的 AI 还很远:我们的模型只能执行局部泛化,要适应一种新场景必须与原始数据联系的很紧密,而人类认知能够极限泛化,快速适应全新的情况,或为长期的未来情况做出规划。

引申

以下是您应该记住的内容:到目前为止,深度学习的唯一真正成功之处就是在给定大量人工注释数据的情况下,使用连续几何变换将空间 X 映射到空间 Y 的能力。做好这件事对于每个行业来说都是一件改变行业游戏规则的事儿,但它离人类级别的 AI 还有很长的路要走。

为了解除这些局限性并开始与人类大脑进行竞争,我们需要从简单的输入到输出映射转向推理和抽象。计算机程序可能是对各种情况和概念进行抽象建模的一个合适的基础。我们之前书中已经说过,机器学习模型可以被定义为「可学习程序」;目前我们能学习的程序属于所有可能程序中非常狭窄和特定子集。但是如果我们能够以模块化和可重用的方式学习任何程序呢?让我们在下一部分中讨论深度学习的未来发展之路。

via keras.io,雷锋网 AI 科技评论编译

雷锋网

François Chollet 谈深度学习的局限性和未来 – 下篇

雷锋网 AI 科技评论按:本篇是 Keras 作者 François Chollet 撰写的一篇博客,文中作者结合自己丰富的开发经验分享一些自己对深度学习未来发展方向的洞见。另外本篇也是一个关于深度学习局限性及其未来的两篇系列文章之二。你可以在这里找到另一篇文章——《François Chollet 谈深度学习的局限性和未来 – 上篇》。雷锋网 AI 科技评论根据原文进行了编译。

鉴于我们所了解到的深度神经网络的工作机制、局限性以及当前的研究状况,我们是否可以预见到神经网络在中期之内将如何发展呢?这里分享一些我的个人想法。请注意我并没有能预测未来的水晶球,所以我所做的大部分预测可能都将失败。这完全就是一篇预测性的帖子,我之所以分享这些推测并不是希望它们在不久的未来会被证明是正确的,而是因为这些预测在当前看来非常有趣而且具有实践性的

总的来说,我预见的几个主要方向是:

  • 与通用计算机程序更接近的模型,建立在比我们当前可微分层要丰富得多的基元之上——这也是我们如何令模型获得推理和抽象的策略,而这一点也是当前模型的根本弱点。

  • 使上述成为可能的新式学习策略——它可以使得模型摆脱当前的可微分变换。

  • 需要更少的人类工程师参与的模型——无休止地调参不应该成为你工作的一部分。

  • 对以前学习的特征和架构进行更大和更系统化的复用;基于可复用和模块化子程序的元学习系统(Meta-learning systems)。

此外值得注意的是,我的这些思考并不是针对已经成为监督式学习主力的深度学习。恰恰相反,这些思考适用于任何形式的机器学习,包括无监督学习、自我监督学习和强化学习。你的标签来自于哪里以及你的训练循环是什么样的,这些都不重要。这些机器学习的不同分支只是同一构造的不同方面。接下来让我们开始深入探讨。

模型即程序

正如我们在前一篇文章中所提到的,我们在机器学习领域可以预期的一个转变发展是,从纯粹模式识别并且只能实现局部泛化能力(Local generalization,见上篇)的模型,转向能够实现抽象和推理的模型,也就是可以达到终极的泛化能力。目前人工智能程序能够进行的基本推理形式,都是由人类程序员硬编码的:例如依靠搜索算法、图形处理和形式逻辑的软件。具体而言,比如在 DeepMind 的 AlphaGo 中,大部分的「智能」都是由专业程序员设计和硬编码的(如蒙特卡洛树搜索),从数据中学习只发生在专门的子模块(价值网络和策略网络)。但是在将来,这样的人工智能系统很可能会被完全学习,而不需要人工进行参与。

有什么办法可以做到这一点?让我们来考虑一个众所周知的网络类型:递归循环神经网络(RNN)。重要的一点是,递归循环神经网络比前馈网络的限制来的少。这是因为递归循环神经网络不仅仅是一种几何变换:它们是在 for 循环内重复应用的几何变换。时序 for 循环本身是由人类开发者硬编码的:它是网络的内置假设。自然地,递归神经网络在它们可以表征的内容上依然非常有限,主要是因为它们执行的每一步仍然只是一个可微分的几何变换,而它们从当前步到下一步传送信息的方式是通过连续几何空间(状态向量)中的点。现在,设想一下神经网络将以类似的方式「编程」,比如 for 循环编程基元,但不仅仅是一个带有硬编码的几何内存硬编码 for 循环,而是一大组编程基元,然后模型可以自由操纵这些基元以扩展它们的处理功能,例如 if 分支、while 循环、变量创建、长期记忆的磁盘存储、排序操作和高级数据结构(如列表、图和散列表等)等等。这样的网络可以表征的程序空间将远远大于当前深度学习模型可以表征的空间,并且其中一些程序甚至可以取得优越的泛化能力。

总而言之,我们将远离「硬编码算法智能」(手工软件),以及「学习几何智能」(深度学习)。我们将拥有提供推理和抽象能力的形式化算法模块,以及提供非正式直觉和模式识别功能的几何模块。整个系统只需要很少的人工参与即可完成学习。

我认为人工智能相关的一个子领域可能即将迎来春天,那就是程序合成(Program synthesis),特别是神经程序合成(Neural program synthesis)。程序合成包括通过使用搜索算法(比如在遗传编程中可能是遗传搜索)来自动生成简单的程序,用以探索可能程序的巨大空间。当找到与需求(需求通常以一组输入-输出对进行提供)相匹配的程序时,搜索将停止。正如你所想的,它是否让你想起了机器学习:给出输入-输出对作为「训练数据」,我们找到一个将输入映射到输出的「程序」,并且能将它泛化到其它输入。不同之处在于,我们不是在硬编码程序(神经网络)中学习参数值,而是通过离散搜索过程生成源代码。

我一定会非常期待在接下来的几年内这个子领域会再次迎来第二个春天。特别是,我期待在深度学习和程序合成之间出现一个交叉子领域,在该领域我们不会采用通用语言生成程序,而是增强了一套丰富的算法原语的生成神经网络(几何数据处理流),例如 for 循环等等。这应该比直接生成源代码更加容易处理和有用,它将大大扩展机器学习可以解决的问题范围——我们可以根据适当的训练数据自动生成程序空间。符号 AI(Symbolic AI) 和几何 AI(Geometric AI)的融合,当代递归神经网络可以看做是这种混合算法几何模型的开山鼻祖。

依靠几何基元(模式识别与直觉)和算法基元(推理、搜索和存储)的学习程序

超越反向传播和可微分层

如果机器学习模型变得更像是一段程序,那么它们将变得不再可微——当然这些程序仍然会将连续的几何层作为子程序进行使用,这都是可微的,但是整个模型却不会。因此,在固定的硬编码网络中使用反向传播来调整权重值无法成为将来训练模型的首选办法——至少它无法像现在这样独占鳌头。我们需要找出能有效训练非微分系统的方法。目前的方法包括有遗传算法、进化策略、某些强化学习方法和交替方向乘子法(Alternating direction method of multipliers, ADMM)。自然而然的,梯度下降法哪儿也不会去——梯度信息对于优化可微分参数函数总是有用的。但是我们的模型肯定会比单纯的可微参数函数来的更加强大,因此它们的自主改善(「机器学习」中的「学习」)需要的将不仅仅是反向传播。

此外,反向传播是端到端的学习模式,这对于学习良好的链式转换是一件好事情,但在计算效率上却非常低效,因为它没有充分利用深度神经网络的模块化特性。为了提高效率,有一个通用的策略:引入模块化以及层次结构。所以我们可以通过引入分离的训练模块以及它们之间的一些同步机制,以分层的方式组织起来,从而使得反向传播计算更加高效。DeepMind 近期的工作「合成梯度」在某种程度上反映出了这一策略。我预期不久的将来在这一块将有更多的工作开展。

我们可以预见的一个未来就是,这些模型将变得全局不可微分(但将具有局部可微分性),然后通过有效的搜索过程而不是梯度策略进行训练。另一方面,通过利用一些更高效版本的反向传播以发挥梯度下降策略的最大优点,局部可微分区域将得到更快的训练速度。

自动化机器学习

在将来,模型架构将能够通过学习实现,而不是需要由工程师手工设置。并且自动化学习架构与使用更丰富的基元和程序式机器模型(Program-like machine learning models)将结合在一起。

目前深度学习工程师大部分工作都是使用 Python 脚本来处理数据,然后花费很多的时间来调整深度网络的架构和超参数以获得一个还过得去的模型——或者说甚至获得一个性能最先进的模型,如果这个工程师是够雄心勃勃的话。毋庸置疑,这样的做法并非最佳的,但是此时深度学习技术依然可以发挥一定的效用。不过不幸的是,数据处理部分却很难实现自动化,因为它通常需要领域知识以及对工程师想要的效果有非常清晰的高层次理解。然而,超参数调整是一个非常简单的搜索过程,并且我们已经知道了工程师在这种情况下想要取得什么效果:它由正在被微调的网络的损失函数定义。设置基本的「AutoML」系统已经很常见了,它将负责大部分模型的调整。我甚至在几年前设置了自己的模型并赢得了 Kaggle 竞赛。

在最基本的层面上,这样的系统可以简单地调整栈中堆叠的层数、顺序以及每一层中的单元或者说滤波器的数量。这通常是通过类似于 Hyperopt 这样的库来完成的,我们在《Deep Learning with Python》的第 7 章中曾讨论过这点。但我们的志向可以更加远大,并尝试从零开始学习适当的架构,然后尽可能减少限制条件。这可以通过强化学习或者遗传算法来实现。

另一个重要的 AutoML 方向是与模型权重一起联合学习模型架构。由于从头开始训练一个全新的架构,并且还要在每次尝试中对架构进行微调是非常耗时和低效的,所以一个真正强大的 AutoML 系统可以在通过训练数据反向调整模型特征的同时设法改进体系结构,从而消除所有的计算冗余。当我正在撰写这些内容时,这些方法已经开始出现了。

当这种情况发生时,机器学习工程师的工作不会消失,恰恰相反,工程师将在价值创造链上走上高地。他们将开始投入更多精力来打造真正反映业务目标的复杂损失函数,并深入理解他们的模型如何影响他们所部署的数字生态系统(例如,负责消费模型预测结果以及产生模型训练数据的用户),而这些问题目前只有巨头公司才有暇顾及。

终生学习和模块化子程序复用

如果模型变得越来越复杂并且建立在更丰富的算法基元之上,那么这种增加的复杂度将需要在不同任务之间实现更好地复用性,而不是每当我们有了新任务或者新数据集之后还需要从头开始训练新模型。事实上,许多数据集都因为数据量不够大而不足以支持从头训练新的复杂模型,并且需要利用来自先前数据集中的信息。就像你不需要在每次打开一本新书时都重新学习一遍英语一样。此外,由于当前任务与以前遇到的任务之间可能存在大量的重叠,因此对每个新任务都从头开始训练模型的做法非常低效。 

此外,近年来反复出现的一个显著的观测结果是,训练相同的模型以同时执行几个松散连接的任务,将产生一个对每个任务都更好的模型。例如,训练相同的神经机器翻译模型以覆盖从英语到德语、法语到意大利语的翻译,将得到一个比单独训练来得更好的模型。又比如与图像分割模型一起训练图像分类模型,共享相同的卷积核,从而产生一个在两项任务中都表现更好的模型,等等。这一点非常直观:这些看起来似乎不相关的任务之间总是存在着信息重叠,因此联合训练模型比起只在某一特定任务上训练的模型,可以获取与每项单独任务有关的大量信息。

我们目前沿着跨任务模型复用(Model reuse across tasks)的方向所做的工作就是,利用预训练权重模型来处理常见任务,例如视觉特征提取。你将在第 5 章看到这一点。在将来,我希望这种泛化能力能实现更佳的普适性:我们不仅会复用以前学过的特征(子模型的权重值),还会复用模型架构和训练过程。随着模型变得越来越像程序,我们将开始重用程序子程序(Program subroutines),比如人类编程语言中的函数和类。

想想今天软件开发的过程:一旦工程师解决了一个特定的问题(例如 Python 中的 HTTP 请求问题),他们会将其打包为一个抽象且可以重用的库。这样未来面临类似问题的工程师可以通过简单地搜索现有的库,然后下载并在项目中使用它来解决问题。相类似地,在未来元学习(Meta-learning)系统将可以通过筛选高级可重用块的全局库来组装全新的程序。当系统发现自己为几个不同任务开发了类似的程序子程序时,如果能够具备「抽象」的能力,即子程序的可重用版本,然后就将其存储到全局库种。这样的过程将实现抽象的能力,这是实现「终极泛化」的必要组成部分:在不同任务和领域发现有用的子程序可以被认为「抽象」了一些问题解决方案的某些方面。这里「抽象」的定义与软件工程中的抽象概念相似。这些子程序可以是几何的(具有预训练表征的深度学习模块)也可以是算法的(更接近当代软件工程师使用的软件库)。


元学习器能够使用可复用基元(算法和几何)快速开发针对特定任务的模型,从而实现“极端泛化”。

总结:洞见未来

总而言之,这里是一些我对机器学习长期发展的洞见:

  • 模型将更加像程序,并且将具有远远超出我们目前使用的输入数据的连续几何变换的能力。这些程序可以说更接近人类对周围环境和自身抽象的心理模型,并且由于其丰富的算法性质,它们将具有更强的泛化能力。

  • 特别是,模型将融合算法模块和几何模块,算法模块可以提供正式推理、搜索和抽象能力,而几何模块可以提供非正式的直觉和模式识别功能。AlphaGo(一个需要大量手动软件工程和人为设计决策的系统)提供了一个早期的例子,它展示了当符号 AI 和几何 AI 融合之后将是什么样子。

  • 通过使用存储在可复用子程序全局库(这是一个通过在数以万计的以前的任务和数据集上学习的高性能模型演变而来的库)中的模块部件,它们将实现自动成长,而不是由人类工程师手工设定。由于元学习系统确定了常见的问题解决模式,它们将变成一个可复用的子程序——就像当代软件工程中的函数和类一样——并添加到全局库中,从而实现了抽象能力。

  • 这个全局库和相关联的模型成长系统(Model-growing system)将能够在某种形式上实现类人的「极限泛化」:给定一个新任务、新情况,系统将能够组装一个适用于新任务的全新工作模型,而只需要很少的数据。这要归功于 1) 丰富的具有强泛化能力的类程序基元(Program-like primitives);2) 具有相似任务的丰富经验。就像人类可以花费很少的时间玩好一个全新复杂的视频游戏一样,因为他们有许多以前的游戏经验,并且因为从以前经验得出的模型是抽象和类程序的,而不是刺激和行为之间的基本映射。

  • 因此,这种永久学习模型成长系统(Perpetually-learning model-growing system)可以被称为通用人工智能(Artificial General Intelligence, AGI)。但是不要担忧任何机器人启示录将会降临:因为这单纯只是一个幻想,它来自于人们对智能和技术的一系列深刻误解。然而,对这方面的批评并不在本篇的讨论范畴之内。

Via keras.io,雷锋网 AI 科技评论编译。

雷锋网

京东金融陈生强:数字化企业服务的四维度与智慧城市的构建

雷锋网AI金融评论报道,近日,首届数字中国建设峰会在福建福州举行。京东金融CEO陈生强并受邀演讲。

陈生强表示,发展数字经济,关键是要实现实体企业与新技术的融合。一方面实体企业需要自身不断加大技术投入,另一方面也需要科技公司企业服务助力。

每一次技术升级以及基于新技术的企业服务升级都会驱动一波经济增长。陈生强认为,信息化、SaaS化、移动化、AI化这四化合一的数字化企业服务能够助力实体企业不断释放新的动能。数字化企业服务,是基于企业经营的四个维度进行数字化,即场景数字化、用户数字化、产品数字化,运营和管理数字化。数字化企业服务是B2B2C的模式,可以通过服务实体企业进而服务他们的客户,它既是效率优化工具,又是收入增长工具。

据称,京东金融目前处在2.0阶段。在1.0阶段,京东金融致力于风险定价,将数字资产化,开发出数字化的消费金融、供应链金融等新模式,助力制造业、流通领域和消费领域企业的升级,并推进普惠金融的服务。到了2.0阶段,京东金融的新定位是服务金融机构的数字科技公司,用B2B2C的模式,为金融机构提供数字化的企业服务。“一是助力金融机构将数字资产化,二是助力金融机构将资产数字化,从资产端、资金端两大方面,降低成本、提高效率,增加收入。” 

以资产端的零售信贷业务举例。作为一个有着巨大市场空间的业务,如何做好却一直是中小银行的难题。京东金融利用自身的数字化科技优势,从两方面助力金融机构解决问题:一是帮助金融机构用较低的成本和较高的效率接触全新客群,二是在全新客群和存量客群中识别出优质客户,降低欺诈和信用风险。

城市计算助力智慧城市建设

据雷锋网了解,在本届峰会的闽江夜话上,与会嘉宾还一起探讨了福建省数字建设的话题。福州市民出行刷手机,不用带身份证,用手机就能在图书馆办证借书,数字中国峰会的嘉宾也都是人脸识别入场。在科技力量的帮助下,城市正在变得更加智慧。

据介绍,今年初,京东金融成立了城市计算事业部,目的正是要把服务金融机构的成熟的B2B2C商业模式应用到智慧城市建设中,利用大数据和人工智能技术,致力于解决城市里的交通、规划、环境、能耗、商业和公共安全等问题。

陈生强表示,京东金融作为科技公司,有能力也有意愿携手福建省和福州市共同建设数字经济,打造智慧城市,助力数字福建更上一层楼。

以下为陈生强演讲实录,雷锋网作了不改变原意的编辑:

今天我想跟大家分享一下对中国数字经济的理解,以及基于数字的科技公司与实体企业如何“顺势而为”。前几天召开的全国网络安全与信息化工作会议指出,要发展数字经济,加快推动数字产业化和产业数字化,推动互联网、大数据、人工智能和实体经济深度融合,加快制造业、农业、服务业的数字化、网络化和智能化。

由此可见,发展数字经济,关键是要实现实体企业与新技术的融合。而要实现这个融合,实体企业一方面需要自身不断加大技术投入,另一方面也需要科技公司提供企业服务助力。从过往来看,以技术为底层的企业服务公司能够帮助实体企业不断释放新的动能。

四化合一的数字化企业服务

从全球来看,科技公司的企业服务的发展已经有近50年时间,但在不同的技术条件下,有不同的表现形式和效果。

  • 一是信息化。1970年开始,PC出现并在企业经营中大规模应用。到90年代,以ERP的出现为节点,企业信息化开始规模化应用,企业运营效率得到进一步提升。

  • 二是SaaS化。2000年开始,依托互联网技术发展起来基于云架构的SaaS服务成为新的市场动力。

  • 三是移动化。2013年开始,移动互联网和移动支付开始普及,用户实时在线,科技企业开始用时时刻刻与人连接的数据来服务随时在线的人,线上线下融合成为企业服务的新趋势。

  • 四是AI化。2016年之后, AI的成熟,使得客户精准洞察、市场需求预测、精准营销、柔性制造等成为可能,AI企业服务开始崭露头角,而且很快就展现出极大的潜力。

从信息化、SaaS化,移动化,再到AI化,每一次技术升级以及基于新技术的企业服务升级都会驱动一波经济增长。当下的中国,正处在上述四个模式同步发展的阶段,即信息化、SaaS化、移动化和AI化的四化合一。这四化合一,构成了数字化企业服务。

我们理解的数字化企业服务,实际上是基于企业经营的四个维度,对场景、用户,产品,运营和管理进行全面数字化。通过对上述四个方面的数字化,科技公司可以将分群、分层后的目标客户群带到实体企业面前,并预测用户的需求,然后将这些需求传递到企业的采购、生产、资金管理等环节。也就是说,数字化企业服务是B2B2C的模式,可以通过服务实体企业进而服务他们的客户,它既是效率优化工具,又是收入增长工具。

从时间节点来看,中国当下正在经历从粗放型的高速增长阶段向高质量增长阶段转变、新旧动能转换的关键时刻,需要数字化企业服务助力数字经济真正渗透到中国经济增长的各个支柱产业中去。

从技术条件来看,中国催生新兴数字化企业服务的技术土壤也已经成熟。

首先,移动互联网应用全球领先。基于移动支付衍生出的各种商业模式,超过7亿的全球最接纳移动互联的成熟用户,用户的数字化和场景的数字化初具成效,使得中国现在是全球最具备做线上线下融合基础的一个国家。

其次,AI技术的应用全球领先。在零售、金融、物流等诸多行业,中国科技公司利用AI技术从服务C端逐步转向服务B端转换,连通消费端与生产端,使得产品的数字化和运营管理的数字化成为可能。

适合的时间点,领先的技术,再加上实体企业思考方式的转变,对发展新型数字化企业服务来说,可谓天时、地利、人和俱备。中国的数字科技公司在这种条件下,完全有机会创造出全球范围内独一无二的企业服务新模式,并引领全球企业服务的未来。

 京东金融所处阶段

京东金融现在已经发展到2.0阶段,定位服务金融机构的数字科技公司,实际上就是用B2B2C的模式,为金融机构提供数字化的企业服务。

在1.0阶段,我们用互联网、零售、物流等数据去做风险定价,将数字资产化,开发出数字化的消费金融、供应链金融等新的模式。极大的助力了实体经济中的制造业、流通领域和消费领域企业的升级,并帮助小微企业、95后甚至00后的年轻人以及三农客户享受到了普惠金融的服务。

在2.0阶段,我们与金融机构融合,助力金融机构实现在场景和用户、产品以及运营和管理上实现数字化。一是助力金融机构将数字资产化,二是助力金融机构将资产数字化,从资产端、资金端两大方面,降低成本、提高效率,增加收入。

拿资产端的零售信贷业务来说,这是一个有巨大市场空间的业务,但如何做好这块业务一直是中小银行的难题。一是要能持续用较低的成本和较高的效率接触到全新客群,二是要在全新客群和存量客群中识别出优质客户,降低欺诈和信用风险,这二者对于数字化基础薄弱的中小银行而言,都是很难的事情。

为了解决这个问题,京东金融通过解耦自身的数字化能力,做出“北斗七星”智能信贷服务产品,助力中小银行在获客、审核、运营、风险定价、反欺诈、贷后管理以及资产证券化等业务全链条实现数字化升级。数据显示,北斗七星帮助银行从零开始启动零售信贷业务,筹备期可从原来的至少半年缩短到1个月;线上线下获客效率可以提高3倍以上,信贷审核效率提高10倍以上,客单成本降低70%以上,逾期资产回收率比行业高出15%,零售信贷整体规模提升40%以上。

金融是第三产业,未来,我们还可以利用在金融服务上积累数字化能力,再去服务制造业、农业,直至将整个实体经济实现数字化。

从数字中来,到实体中去,这是发展数字经济的根本出发点和落脚点。在这个过程中,数字科技公司与实体企业应真正弄懂“融合”的精髓所在,建立起数字化的思考方式,推动经济高质量发展,并在这个过程中,实现自我的迭代。

雷锋网

70后杭州法官的中场:AI浪潮下的重生

身板笔直,眼神无他专注。穿法袍的时候,他符合一般人对“70后法官”的想象:正派,情绪收敛,脸上带着两条严谨的法令纹。

他叫萧方训,杭州西湖法院的一名法官。79年生,处女座,他自嘲“先天星座不良”。2008年踏入法院,参与近4000个案件的审理和判决,同事称他为法律界的“老干部”。

而就是在这个独一无二的时代,他身上的轨迹因AI而变的不一样。在产业AI的浪潮中,萧方训成为全国第一批使用AI 语音系统的审判法官,也许是第一个和“机器人”共事的法官。

第一批使用AI的“70后”

近日,杭州市西湖区人民法院再次上演了一场一个人的法庭。原告在家中,被告在1200多千米开外的律师事务所,靠智能系统在线面对面。更令人惊叹的是,书记员是“机器人”。庭现场仅法官萧方训一人。 

2016年3月,国家提出继续深化司法公开,依托现代人工智能,加快建设“智慧法院”。 最严谨之一的行业,开始尝试最新鲜的血液。同年6月,杭州市西湖区人民法院,率先引进阿里云人工智能ET系统试点,智能系统承担起“书记员”,与萧方训为伴。

 “70%的案件,法庭上都不需要人类速记员在现场。人工智能书记员有着超级的打字速度和惊人的正确率,远超过人类书记员”。萧方训微笑道。

接触到人工智能已经是萧方训人生的中场。 2年前,萧方训和所有法官一样,在开庭前要和书记员如影随行,花整整1个小时的时间,阅读复杂的卷宗,让书记员理解案卷的来龙去脉。现在人工智能让一切变的不一样了——“人工智能’书记员’会提前学习所有的卷宗,即便卷宗有10000页。”

“温州口音只有2种人听的懂,温州人和机器人,哈哈。”萧法官冷不丁地说了个笑话,“在司法案件中,不少当事人带有当地口音。人工智能书记员具备双声学模型,大多数时候,即便是H和F不分的温州口音的也能识别出来。”

和偶像剧里《Legal high》里古美门的巧舌如簧不同,萧方训身上隐隐有种韧性。走近他,你会发现时间并没有“驯化”这位中年法官。

重返20岁

说起“人工智能”4个字,萧方训的眼里突然闪过光,像是回到18年前那个第一次摸到电脑鼠标的——20岁的青年。

2001年,在温州长大的萧方训考入中南财经政法大学,毫不犹豫地选择了法律专业。在他眼里,没有A选项和B选项。公平(FAIR)一词给他造了一个后花园,这个后花园成为他一生追求的伊甸园。因为对“公平”的追求,萧方训一脚踏进了法院,一踏就是10年。

大学刚刚赶上互联网时代,他第一次接触到电脑,对技术懵懵懂懂,觉得“新鲜而不可及”。终日与卷宗为伍的萧方训以为“科技”一词和他就像“两条平行线”。 

2015年是萧方训的本命年,他回到一个循环的原点开始“蜕皮”。

2016年,两条平行线交汇了。

随着社会法律意识不断唤醒,在中国每年的的案件数量惊人增长。有人因为一颗鸡蛋的事情来到法庭,也有人因为一个羽毛的分寸而来到法庭。

“我一生都在追求公平。” 萧方训刚刚结束一场判案后,卸下法袍说道,“最有力量的往往藏在细节里。细节是难以全部编造的,它有自身的力量,每个细节之间环环相扣。人工智能记录下了这种不被察觉的细节。也让我们法官专注到更多更复杂的案件当中去。”

萧方训理了理衣领:“智能语音助手和系统让办案效率大大提升,百姓们成为AI产业浪潮中的受益人。”

中国面孔的亿万份之一

单车,羊毛衫,旧街道。下班脱下法袍,萧方训淹没在人来人往的街道里,成为了众多中国面孔之一。他脸上独有的威严感消失了,面对笔者露出一天中唯一的“看的见牙齿”的笑容。 

回到家,萧方训摇身变成了一个“极客爱好者”。现在,萧方训开始认真学习和了解人工智能和大数据信息,他笑称:“抓住人生的第二学习阶段。”

不仅自己抓住了人工智能的时代潮流,萧方训也把技术的期待赋予了8岁的儿子。“人工智能和科技发展太快了。”现在,萧方训还在上二年级的儿子,已经开始学习了编程。下班后,一家子围在一起探讨代码成为了常态。 

图:一家学习编程

“又年轻了一把啊,哈哈。”提到“第一批使用AI的70后法官”这个称号,严肃的萧方训突然大笑,“我的人生有3个偶遇,偶遇法律学,偶遇老婆,偶遇产业AI浪潮。”

说罢,萧方训径直走进书房,在一本《大数据时代》书本前坐了下来。

雷锋网

以云存储起家的七牛云,如何用 AI 与安防巨头共舞?

云和安防的结合可以带来多大的想象空间?

安防行业经历了从模糊到清晰的发展过程,画质不断提高的同时,对于数据存储和处理的需求也成倍增加。毫无疑问,云存储和云计算已经成为安防行业快速发展的助推器,云服务厂商凭借着技术积累,开始在安防领域安营扎寨。

七牛云就是一家具有代表性的云计算服务商。在七牛人工智能实验室联合创始人林亦宁看来,行业需求是水,七牛云是渠,入局安防只是一件水到渠成的事情。凭借着自己多年在云存储上积累的优势,七牛云在安防领域走出了一条新路。

以云存储服务起家

七牛云诞生在移动互联网兴起的时代,以云存储服务起家,主要为用户提供云存储、CDN等服务。移动社交兴起后,互联网上并没有一款产品可以让用户非常方便地存储图片、视频等数据,这也成为了七牛云眼中的机遇。

对拥有大量图像视频的客户而言,他们需要去审核这些内容是否健康、合法。更深远的意义在于,客户希望通过这些用户上传的数据内容进行深度分析,以此来用户画像的构建,增加平台对用户的粘性。

顺着这个需求,七牛云迅速崛起。

经过7年多的发展,七牛云成为一个以数据管理和数据智能为核心的企业级云服务商,同时也是国内知名的智能视频云服务商,每年营收增速超300%,累计为70多万家企业提供服务。到目前为止,七牛云的文件数超过2000亿,每日新增文件20亿,覆盖了国内80%网民和金融、公安、广电媒体、互联网等行业。

除了自己的看家本领之外,七牛云还围绕富媒体场景推出了对象存储、融合 CDN 加速、容器云、大数据平台、深度学习平台等产品,并提供一站式智能视频云解决方案。

在海外战略布局上,七牛云在2014年推出了全球加速服务,并在2017年升级为海外融合,融合 Highwinds、Edgecast、CDNetworks 等海外CDN厂商。全球节点数量已超过1000,覆盖全球6大洲,100多个国家,带宽能力储备超过 20Tbps。

抢占市场的两把利器

依靠自有的技术水平和覆盖范围,七牛云上成功聚合了大量富媒体互联网用户的UGC内容。在数据积累的基础上,七牛云开始构建以数据管理与应用为核心的产品线。

从公司的战略出发,林亦宁认为图片、视频的审核是未来的需求热点。选定了这一条路就心无旁骛,偏离这个路线很多的项目,七牛云就不去碰。

我们都知道,互联网的多媒体数据,传播时都需要经过审核,主要包括色情、暴力恐怖图片的审核及敏感政治人物的图片。早在2015年,七牛云就推出了图片鉴黄服务,这是一块已经相当成熟的业务,可以实现毫秒级响应,准确度超过99.5%,替代80%以上的人工审核。在人物属性识别方面,七牛云可以提供多达30类的结构化标签,可根据客户需求定制开发结构化标签。

除了图片鉴别之外,视频分析也是七牛云未来较为看重的一个领域。2016年是直播元年,视频云服务的元年也随之开启,不管是互联网巨头还是初创企业都纷纷进军视频云行业,拥有互联网敏锐嗅觉的七牛云自然也不例外。据了解,七牛云的图片视频智能分析产品已经拥有400多类的场景检测和1600多类的物体识别。

林亦宁向雷锋网表示,视频分析是AI认知整体能力的体现,不是传统的计算机视觉、而是把视觉、语音识别、文字文本的理解综合而来的分析。七牛云后期还会去针对短视频和直播客户进行视频分析优化等业务。

为了能够检验自家的技术水平,七牛云一直活跃在国际上的视频分析竞赛上,其中就包括LSVC(超大规模视频分析比赛),这项比赛意在考察大规模未分割视频的算法识别能力,它包含了来自YouTube和Flicker的超过8000小时的视频,标注为500种分类,包括社交事件、动作、物体、场景等多种类型。在这项赛事上,七牛云的人工智能实验室夺得了亚军。

用成熟的AI技术进军安防

利用先前在图片审核和视频分析方面的技术优势和良好口碑,七牛云开始有意识地向行业方向纵深,这其中就包括安防。

智能化成为安防行业新的发展方向,不管是“AI+安防”还是“安防+AI”,各路企业纷纷高举技术大旗,以抓住这难得的市场变革机遇。在林亦宁看来,进军安防领域是技术积累到一定程度后的必然之举。

林亦宁认为,人工智能技术可以在安防方面扮演着非常重要的角色。其中最重要的一点是减轻现有工作量。其次,通过大数据分析技术,能够在用户进行分析和决策时有更多辅助的数据来源。“今年我们公司的战略方向是在夯实基础平台之上,用AI技术在包括安防的传统行业里进行深耕。”

由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离快速确认人员身份,实现智能预警的技术。人脸识别无疑是最佳的选择,采用快速人脸检测技术可以从监控视频图象中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别。

在他看来,人脸识别技术是非常通用的需求,而且也是进军安防行业时的基础条件。七牛云将把这类内容重点发展,变成独立的产品线。在人脸识别等技术完善的基础上,七牛云为客户提供了一套安防解决方案,可以实现智能调度网络、云存储集群、多样的数据处理等技术服务,在原有传统安防架构之上满足更多的互联网远程监控需求。

雷锋网了解到,以七牛云现有的视频卡口产品为例,人脸抓拍相机、网络摄像机获取数据后,上传到人脸比对服务器、场景识别服务器等,系统可以实时进行监控比对和智能预警,目前这款产品的准确率可以达到96%。

在合作成熟的基础上,客户也放心地将前端项目交给七牛云来开发。如为酒店开发人脸识别系统,在线下进行设备布控、通过七牛云的技术实现身份识别。

助力企业完成智能化转型

在自身业务不断发展壮大之外,七牛云也在利用自己的技术优势帮助新老用户完成智能化转型。

2016年6月,七牛云建立了AI实验室AtLab,在底层构建了弹性深度学习平台AVA来满足巨大的计算需求。在应用层提供多个计算机视觉API,帮助企业把人工智能与具体的业务结合,目前研究团队已超过100人。

七牛云的发展得益于早期的互联网用户,作为实验室的联合创始人,林亦宁一直在思考如何为这些客户提供更多的服务。“中国互联网发展迅速的一大原因在于企业快速的互联网思维。正是因为企业有快速上线、快速迭代的需求,所以建立一个有训练、有模型、有数据反馈的闭环非常重要。”

为此,七牛云建立了一套大规模的机器学习平台,通过专业化的数据预处理、先进的深度学习算法,提供预训练模型和高效分布式算法平台生成的定制化模型,为传统企业和互联网客户提供智能分析能力。

搭建平台就是要提供各种效率工具,这个平台是七牛云人工智能实验室源源不断进行快速产出的一个非常重要的动力。“与传统的模型发布流程相比,七牛云的深度学习平台可以节省80%的人力成本,缩短50%的实现周期。”

除了为用户搭建平台,作为一家互联网公司,七牛还有一个非常明确的使命,就是缩短产品与想法之间的距离。此前,七牛云的人工智能实验室曾提出了AI创新服务计划,主要是帮助从业者解决产品落地中的一些困难。具体到人工智能领域,就是帮助从业者缩短想法到模型产出的距离。人工智能的产业链条比较长,涉及到从基础算法模型、基础硬件、基础产品、行业应用、解决方案到应用交付的不同环节,就需要不同环节之间的分工协作才能打造出一个完整的产业链。

林亦宁向雷锋网透露,七牛云开展这一计划的最重要目的,就是帮客户分辨哪些需求可以落地,哪些则是伪需求。“我们先帮客户理清逻辑,我们再去用自己的经验拆解用户的问题,例如在公安行业,我们需要把老民警的经验转化成算法模型,但是一些公安数据又相对敏感,只能在场内迭代。那么,我们就聚焦到算法的能力上,去给提供客户可用的服务。”

结语

从先前的互联网时代到现在的人工智能时代,七牛云自有一套独特的打法。经过互联网创业的那波浪潮之后,七牛云也深刻理解了传统企业转型过程中的需求场景,推出了一系列有针对性的行业解决方案。在巨头的夹击下,七牛云前进的步伐不仅没有受到影响,而且还开辟了自己的一番天地。

未来,随着行业不断向智能化方向迈进,七牛云如何用技术能量革新自我和传统行业,我们拭目以待!

雷锋网

AI科技评论数据库项目【AI影响因子】:谁在影响你,你在影响谁?

「AI 科技评论」(微信公众号:aitechtalk)系雷锋网旗下学术频道,密切关注高校实验室和企业研究院动向,以顶级学术会议论文、海内外巅峰赛事及相关开发内容为导向,凭借「GAIR 大讲堂」线上直播、深度访谈、技术解读、独家约稿等多种形式,秉承「连接学术前沿,洞见产业未来」的宗旨,为产业界人士与学术青年们提供一个分享交流的平台。

在一年多的内容报道中,AI 科技评论不仅积累了一批忠实的高校博士生、研究生读者,也与多家国内人工智能企业研究院保持密切联系。

与此同时,AI 科技评论也了解到,学术青年们在择业过程中面临着信息不对称的问题:一方面,学生们固然希望能结合专业特长寻找与自己最为匹配的企业,但人工智能企业研究院数目繁多,研究成果及相关报道层出不穷,如何从浩如烟海的信息中分门别类地看懂企业研究院的学术/开发专长?

近年来,中国企业的身影越发频繁地出现在在国际顶尖学术会议及赛事上,国内企业研究院及相应的优秀研究成果也如雨后春笋一般涌现。企业研究院在 AI 浪潮下也同样面临困惑:如何让对口专业的学术青年更好地关注到企业研究院的研发实力,让潜心做研究的同学和愿意做开发的同学更好地对号入座,在这个过程中发掘人才?

AI 科技评论一方面为学界与业界的活跃感到欣喜;另一方面也深刻地认识到,作为一个服务和连接 AI 学术力量的公号,AI 科技评论有义务、也有责任为企业研究院提供更多的展示机会,推动企业研究院更好地获取学术青年的认可,带动学术青年更多地关注与自身专业相匹配的企业研究院,实现学术界与工业界的连接。

AI 科技评论在今天,也很荣幸地为读者们呈现我们历时半年规划而成的数据库产品——「AI 影响因子」。

「AI 影响因子」是一个呈现国内企业研究院学术&开发实力的数据库,为高校学生及从业者提供在会议/期刊论文、数据集比赛及开发项目三大领域的横向对比参考。此外,AI 科技评论也整合了诸如与高校实验室合作、学术会议赞助等企业活动,尝试为读者们提供一个全面的数据平台。

  • 从会议/期刊论文出发,AI 科技评论以「中国计算机学会 CCF 推荐国际学术期刊会议」所推荐的国际学术会议及期刊为主要标准,向企业研究院征集统计该年会议/期刊被录用的论文,以作为评选标准的一部分。此外,以 ICLR 为代表的新生会议也在 AI 科技评论的评选考虑范围之内。

  • 从比赛出发,AI 科技评论围绕目前国际与国内较受认可的比赛(包括但不限于数据竞赛平台 Kaggle 的下属比赛、各类数据库竞赛等),向企业研究院征集统计该年获得优秀名次的赛事,以作为评选标准的一部分。

  • 从开发项目出发,围绕发起开源项目/工具及相关更新,企业研究院所构建的开源生态同样是 AI 科技评论密切关注的领域。

这三部分的内容将帮助学术青年更客观、更全面地了解企业研究院在不同领域上的侧重点,做到有的放矢。与此同时,这三部分的内容也为企业研究院在「AI 影响因子」上的展示提供翔实而准确的数据基础,并作为「AI 影响因子」数据库及衍生榜单的重要标准。

除此之外,「AI 影响因子」数据库还将收录企业研究院的一些企业相关活动,如人事变动、高校合作、会议赞助等。

「AI 影响因子」数据库的一个重要数据源是雷锋网及 AI 科技评论的往期报道。经过一年多的选题流程中,也了解读者关心什么样的企业新闻,哪些报道企业研究院的文章更受到读者的认可。

在未来,我们将以三大呈现形式进行「AI 影响因子」数据库的集中展示。

  1. 「AI 影响因子」子站

    我们会针对国内企业研究院在学术领域上的表现进行榜单排序及评选,包括总榜、论文榜、比赛榜、开发榜等四个榜单,并呈现 AI 科技评论关于企业研究院的相关报道文章。此外在每一篇企业研究院的相关文章中,「AI 影响因子」都会在雷锋网对应子站及 AI 科技评论公众号上进行相应露出及得分更新。

  2. 「AI 影响因子」企业专区

    根据每个企业的数据统计,我们将企业的往期活动及报道集合为企业专区。读者们可以根据企业研究院名称访问「AI 影响因子」专区页面,从论文、比赛及开发项目综合了解企业的研究动态。

  3. 「 AI 影响因子」年度榜单

    围绕以上数项标准,AI 科技评论将综合考量企业研究院的表现,预计在今年颁布「AI 影响因子」相关榜单。

企业如有兴趣深度参与「AI 影响因子」的数据库构建,欢迎添加小编微信(aitechreview)为好友,注明「AI 影响因子」及企业名称。

AI 科技评论竭诚希望国内的企业研究院能与我们一起构建「AI 影响因子」,以「连接学术前沿,洞见产业未来」的宗旨,吸引更多的学术青年以更系统、更权威的「打开方式」关注国内企业研究院的学术研究。

脚注:

[1]中国计算机学会 CCF 推荐国际学术期刊会议, http://history.ccf.org.cn/sites/paiming/2015ccfmulu.pdf

雷锋网

自动驾驶商业化后,我们的日常生活会受到哪些影响?

因为有了汽车,才出现了公路旅行、大型购物中心、高速公路等事物。但同时,汽车也带来了拥堵、事故等问题。汽车以各种不可预见的方式改变了世界,它们给予了人类巨大的自由,但作为回报,也让人类付出了沉重的代价。

自动驾驶的从业者们认为,自动驾驶最大的优势就是减轻这些代价,尤其是事故、污染和交通拥堵。通用汽车的CEO Mary Barra就经常提到“零车祸、零排放和零拥挤”这三个美好愿景。

交通伤亡减少

自动驾驶车辆可以大大减少交通事故的伤亡。据世界卫生组织统计,每年,全球约有125万人死于此类事故。交通事故也是15至29岁人群的主要死因。另外,每年还有20至50万人在交通事故中受伤。大多数事故都发生在发展中国家,在这些地方,自动驾驶车辆仍遥不可及。

试想一下,如果自动驾驶车辆能够提前一年进入我们的生活,那么“这125万人就不会死,”自动驾驶初创公司Aurora的创始人Chris Urmson说。近几十年,由于安全带和安全气囊等安全设备的出现,汽车已经变得更加安全。但是,自2014年以来,美国交通事故中死亡的人数开始上升,这主要是因为智能手机分散了他们的注意力。

自动驾驶车辆已经获得了越来越多的认可。Waymo的自动驾驶车辆已经在公共道路上行驶了400万英里;在这一过程中,自动驾驶的唯一事故也与自动驾驶技术无关,而是由人类驾驶的车辆造成的。

自动驾驶车辆拥有超凡的感知力,并且可以在不到一毫秒的时间内开始刹车,而人类驾驶员则需要一秒左右的时间。不过,“比人做得更好”只是一个低级标准。人们似乎能够容忍人类司机的致命失误,但自动驾驶车辆则必须做到万无一失。

自动驾驶技术公司Mobileye的CEO Amnon Shashua表示,具体说来,在人类驾驶员的基础之上进行上尽可能多的改进,是对自动驾驶技术来说,更具实际意义的目标。这可以使每年死于交通事故的人数有一个明显的下降。

生活的方方面面都将迎来改变

为了减少每公里的运营成本,大多数自动驾驶车辆几乎都是电动的,这将减少两种有害的排放物:导致肺部和心脏疾病的颗粒物和引起气候变化的温室气体。然而,即使是电动汽车,仍然会有轮胎和道路摩擦产生的微粒排放。

温室气体排放量能否下降,取决于电能的供应水平。车辆的电动化需要更强的发电能力(瑞银估计,到2050年欧洲电力消耗将增加20-30%)和更多的基础设施,例如增加充电站和升级电网等。对于城市居民来说,好处是空气质量将变好,噪音将变小。

我们也有理由相信未来的道路是不会那么拥挤的。因为由计算机控制的汽车更擅长做路径规划,被广泛使用的共享车辆就可以更有效地利用道路空间。它们一旦被广泛使用,就可以缩短和前方车辆的车距,从而提高道路通行能力。

另外,可以肯定的是,被解放的司机将获得许多可用于工作、娱乐或社交的时间。“这将为美国人每年节省总计300亿小时的时间。”波士顿咨询表示。

汽车改变了零售业态,让许多商店和大量停车场在郊区增长。与电子商务同期出现的自动驾驶车辆,则可能再次改变零售业。弗吉尼亚大学的Peter Norton说:“未来的沃尔玛可能是一支车队,将原来你在沃尔玛买的东西送到你的家门前。”或者你可以约一辆自动驾驶车辆接你下班回家,或者安排购物或吃饭行程,给你接机。

此外,商店和餐馆也不必固定在一个地方,加州大学伯克利分校的建筑设计师Chenoe Hart建议,咖啡店或食品摊可以在中央仓库进行补给,早上在商业区营业,而到了傍晚则转移到娱乐区。售卖鞋子、衣服或化妆品等物品的移动商店可定期到特定的社区,或者接受顾客的邀请到指定的地点。“这让我们可以灵活地重新分配空间。” Hart说。

汽车制造商们正在研究自动驾驶配送车,通过短信通知用户它们已经到达,并通过输入取件码的方式让用户从锁好的车厢中取出快递物品。使用低成本的自动驾驶配送有助于各种东西的本地生产,特别是食品。

大众汽车公司的Johann Jungwirth说,另一种可能的模式是餐馆或零售商可能会承担顾客的出行费用,从而吸引更多的消费者。豪华的自动驾驶车可能会变身为花哨的餐馆,酩酊大醉的顾客可能会躺在车上,被自动驾驶车辆送回家。

整个出行系统将有大量数据可用于靶向客户的车载广告,运营商可以提供便宜但有广告和昂贵但是无广告的两种出行服务。

自动驾驶车还可以提供其他服务,让你在前往办公室的途中接受私人教练的训练,甚至将理发师约到家中。丰田的概念车e-Palette有几种不同尺寸的车型选择,可改造为移动商店、办公室或美容院。


此外,就像汽车为青少年提供新的社交机会一样,自动驾驶车辆可能会带来新的社交活动。在分配车辆时,出行系统可能将有相似兴趣或是有共同朋友的人安排到同一辆车上。

自动驾驶车辆还可以与约会应用程序一起使用,在搭车时将有可能匹配成功的人安排到同一辆车上。这些车辆也可以作为举行移动派对场所,或者在长途旅行时可以提供睡眠场所,节省酒店和机票费用。

一些可能的弊端

然而,对自动驾驶的期待,有可能会让我们陷入一个熟悉的历史陷阱。人们在汽车出现时,对汽车寄予了希望,希望汽车能解决由马车引起的问题。

在19世纪90年代,世界各大城市都在面对应对日益增多的马粪和马尿以及死马的腐烂尸体、肆虐的疾病问题。1894年,《伦敦时报》有一则著名的预言:到20世纪40年代,各大城市的每条街道都将被埋在9英尺的马粪之下。相比之下,汽车看起来干净卫生,这是他们在20世纪如此迅速被接纳的关键原因。

洛杉矶加利福尼亚大学的Donald Shoup说:“汽车淘汰了一些在很多角度看来都非常糟糕的东西。但是由于规划不周,汽车也产生了许多意想不到的后果。”自动驾驶情况又可能会出现什么情况呢?

自动驾驶车辆也可能因为侵犯人们的隐私而破坏人们的自由。

自动驾驶车辆运营商会记录乘客的每一次出行,因此,他们最终会对这些乘客了如指掌。出于安全原因,一些出租车公司已经在记录乘客信息;自动驾驶出租车公司肯定会同时监视乘客和周围环境,以保护乘客。警方在调查案件时也将会向附近的自动驾驶车辆获取它们所收集的数据。

Hart指出,如果人们不再开车,一种可能的后果是出现一些新的隔离。某些地方可能会成为仅限于某些乘客或自动驾驶出租车公司才能到的地方。就像在某些网络服务被“墙”而无法访问一样。她认为,可能需要一些规则,以确保任何地方都不会对某些服务商提供特权。而在某些社会中,自动驾驶车辆可能会成为控制社会的有力工具。

自动驾驶车辆也可能导致器官捐献者短缺(不得不提,许多器官捐献者都是车祸中丧生的年轻人)。

如果汽车不再是年轻人的独立和自我的象征,就会有新的事物出现,取代汽车的地位。就像之前的汽车一样,自动驾驶汽车会改变我们的日常生活。

雷锋网新智驾6 项会员专享特权,全年 100 期精华内容,雷锋网新智驾带你深入浅出看懂自动驾驶。如果想加入雷锋网「新智驾会员计划」,欢迎点击链接 :https://www.leiphone.com/aidrive/vip或扫描海报下方二维码了解详情。

雷锋网

风控·命门金融科技风控大会:金融科技可持续发展2.0时代到来

雷锋网AI金融评论消息,4月21日,“风控·命门 2018年第二届全球金融科技风控大会”在北京粤财JW万豪酒店召开。本次大会由一本财经主办,据雷锋网观察,来自银行、金融科技公司、学术研究机构的超过800名代表参加了会议。

如果将2013年算为中国互联网金融的元年,到现在不过短短五年的时间。从2014年开始,大数据、人工智能等技术开始真正进入互联网金融的风控领域,科技与金融的结合日渐紧密。随着近年来监管日趋收紧,科技公司与金融机构更多地立足于自己的优势领域开展合作,越来越多的金融科技公司定位为利用自己的科技优势,帮助传统金融机构改善业务,以合作者的身份,帮助金融机构做相关运营。

在这短短五年中,中国金融科技的发展走出了一条独具特色的道路。相比起美国等金融产业成熟的国家,中国的金融发展的历史、产品数量还有一定距离,安全性、制度等方面也需要向成熟国家学习,对中国金融科技行业来说,当前的主要挑战是风控,在本次大会上,多位金融科技公司的代表分享了自己在风控方面的实践,为在监管趋严、资金成本高企的背景下实现互联网金融行业的可持续发展提供了宝贵的经验。

立足技术、聚焦场景、服务客群

不约而同地,参加本次大会的三大金融科技平台百度金融、蚂蚁金服和京东金融均提及技术、场景、客户的“三位一体”关系。

百度副总裁黄爽发表了《风控、产品、客群,如何相互作用形成“铁三角”》的主题演讲并指出:

1、信贷领域习惯“贩卖焦虑”,但脱离了产品、客群、和风险的三角关系,这种焦虑显得很片面,不可持续且不解决实际问题;

2、科技在产品、客群、风险的铁三角关系中发挥着不可或缺的作用; 

3、针对同样的客群如果你对客群的认知更好、风险管理水平更高,你的产品就会比较有竞争力。

蚂蚁金服微贷风险管理部总经理余泉则针对服务线下商户背后的智能风控进行了分享。在演讲中余泉认为:

  1. 服务微小企业客群,需要了解场景,全面了解客户;

  2. 大数据风控首先需要和线下风控一样严谨,数据的更有效处理和运用最新算法是第二位的;

  3. 客群、风险、产品三位一体的网络运转起来会有不一样的化学反应,起到不一样的风险管理效果。

在随后的演讲中,京东金融风险管理部总经理沈晓春发表了《科技正在风控领域加速落地》的主题演讲,并从数据、技术、运营三方面分析对风控的影响:

  1. 风控能力的三个方向是数据、技术、运营,其中数据能力是风控真正的核心基础;

  2.  在技术层面上,算法的最终能力取决于底层的算例资源如何实现优化;

  3. 运营能力实际上驱动了产品和实际场景的复杂度,深化运营能力可以从多维、动态的角度了解客户的需求、了解客户的风险点,达到用户体验与系统风控的极致。

近日,蚂蚁金服、京东金融、百度金融均在一定程度上表达了强调技术,“不做金融”的提法。立足技术、聚焦场景、服务客群的策略则在此基础上更进一步,这一策略有望充分利用互联网公司在数据和技术上的积累,并从场景设计、用户需求点分析、客户运营商进一步深化运营,扬其所长服务于金融机构。

数据技术进入2.0时代

此外,来自快催收、ZRobot、快牛金科、趣店、电话邦等企业的代表也就用大数据、AI、知识图谱等创新技术在催收、风险管理、业务领域等进行了主题演讲分享,多位演讲嘉宾认为,创新科技将重新定义传统业务,而数据技术本身在也面临新的突破和创新,在风控领域,数据技术2.0已经到来。

如捷越联合创始人王晓婷在《Collection 2.0·科技清收新机遇》主题演讲中表示,在催收领域,每期正常还款的客户是好的客户,而每期都逾期,但每期都还款的客户是更好的客户。随着数据技术在金融领域的应用,金融机构比以往可以更准确地进行客户分析和刻画,而催收也不单纯是业务部门,而应将其定义为利润中心,对客户做重新认知,对客户的区分放弃好和坏这个概念,用收益和损失做。

京东金融与美国ZestFinance合资的数据技术公司ZRobot的CEO乔杨也表达了类似的观点。他认为,在金融信贷领域,风险管理永远是第一位的,它必须穿插信贷交易的全过程,因此利润一定是风险管理的产品而不是欲望的产品。此外他还表示,得益于整个互联网和智能终端的高速发展,数据技术的2.0时代已经到来,这意味着对数据的处理重点已经由“收集”转为“解读”,他同时引用达尔文的“适者生存”理论,不是最强的物种、最聪明的物种能生存下来,而是那些最适应变化的物种能够生存,而在数据技术的2.0时代,谁能够有效深度解读获取的数据才就能在竞争中脱颖而出。

此外,大会还举办了题为《大数据、区块链、人工智能如何落地风控》、《根据细分场景特征,如何搭建出有效的风控体系》和《传统金融机构的风控,如何转型升级》的论坛讨论。大会同时发布了一本财经第一届金融科技最佳风控企业Top50和最佳风控服务商Top30榜单,雷锋网发现,蚂蚁金服、京东金融、百度金融、陆金所等金融科技平台和冰鉴科技、百融金服、第四范式等金融科技技术服务公司榜上有名。


雷锋网

Michael I. Jordan 撰文:不要被深度学习一叶障目不见泰山

雷锋网 AI 科技评论按:正如大家讨论人工智能时经常把它和机器学习甚至深度学习近似等价,工业界和学术界的许多研究、开发人员们也往往过于关注深度学习,忽略了实际上范围更广的机器学习和人工智能领域还有许多有价值的问题等待研究。

近日,UC 伯克利大学电子工程与计算机学院和统计学院教授、机器学习领域的宗师、被称为「人工智能界的迈克尔乔丹的」Michael I. Jordan 就发表了一篇文章,提醒大家不仅深度学习不是「人工智能」的全部,甚至我们日常讨论的「人工智能」都不是真正意义上的「人工智能」的全部;这里不仅有许多我们忽略了的问题,而且为了真正造福全人类,还有一个关于如何构建人工智能系统的新学科才刚刚萌芽、 等待建立。雷锋网 AI 科技评论把这篇文章全文编译如下。

人工智能(AI)是这个时代的人们的口头禅,它被技术专家、学者、记者和投资者们一遍遍反复念叨。就像以往许许多多先从技术学术领域出现再传播到普罗大众中的短语一样,人们使用 AI 这个短语时存在严重的误解。以往可能是因为公众没能理解科学家,但这次是科学家们和公众一样迷惑。这个时代出现和我们具有同等智力的硅基智慧的可能性让我们所有人都觉得有趣,它既吸引我们又让我们害怕。但是,它还会让我们分心。

对于这个时代发生的事情,我想讲一个视角独特的故事。这个故事里涉及到人类、计算机、数据和生死抉择,但这里的重点是硅基智能的幻想之外的一些东西。14 年前,当我的妻子怀孕时,我们做了超声波检查。为她检查的遗传学家指出胎儿心脏周围有一些些白色斑点。「这些是唐氏综合症的标志,」她说,「患病风险已经上升到二十分之一了。」她进一步告诉我们,可以通过羊膜穿刺术检查出胎儿是否带有唐氏综合症突变基因。但是羊膜穿刺术存在风险,在手术过程中胎儿的死亡率大约是三百分之一。

作为一名统计学家,我决定找出这些数字的来源。长话短说,我找到了一份来自英国的 10 年前的针对这一疾病的统计分析,其中认为这些白色的斑点反映了钙的积累,是唐氏综合症的预测因子之一。但我也注意到,检查我妻子的成像机器比英国研究中使用的机器每平方英寸多几百个像素。我就回去告诉遗传学家,这些白色的斑点很可能是假阳性——它们实际上是「白噪音」。她说到,「啊,那我知道为什么我们诊断出的唐氏综合症几年前一下子变多了,我们就是那个时候换的新机器。」

我们最终没有做羊膜穿刺术,几个月后,我们的女儿出生了,非常健康。但这件事让我心中五味陈杂,尤其是在粗略计算之后,我确信,在医生告诉我们诊断结果的那一天,全世界上有成千上万的人得到了与我们相同的诊断结果,他们中的许多人选择了羊膜穿刺术,许多婴儿不必要地死去。这种事情每天都会发生,直到某一天人们找出原因。这一事件体现出的医疗问题并不是只有我一个人会遇到,这是整个医疗系统的问题 —— 在某一些时间地点测量变量、得出结果,进行统计分析,然后在其他时间地点使用这些结论。

准确地说,问题不仅在于数据分析本身,还在于数据库研究人员所称的「溯源(provenance)」—— 广义上说,数据出现在哪里,从数据中得出了什么推论,以及这些推论与当前情况关联性有多大?虽然一个受过专业训练的人可能能够针对每一种情况具体分析、具体解决,但真正需要解决的问题是全世界范围使用的医疗系统如何在不需要精细的人类监督情况下就能做到这一点。

我也是一名计算机科学家,我突然意识到建立这种世界性规模的推理和决策系统的学科 —— 将计算机科学与统计学融合,并将人类经验考虑在内 —— 从来就没有任何学校教授过。我也意识到,不仅在医学领域,在商务、运输和教育等领域也类似,这种法则的建立至少与构建 AI 系统(让我们眼花缭乱的游戏 AI 和运动感知系统)同等重要。

无论我们能否在短时间内理解「智能」,我们都面临着一个巨大的挑战,那就是如何将计算机和人类结合,让人类更好地生存。这一难题被一些人看作是「人工智能」的诞生,但我们也可以用平常心、以敬畏之心把它看作工程学科的一个新的分支。

就像几十年前的土木工程和化学工程一样,这个新学科的目标是集合一些关键思想的力量,安全地为人们带来新的资源和能力。就像土木工程和化学工程是建立在物理理论和化学理论的基础之上,这个新学科建立在我们在上个世纪中发现的思想之上,在诸如「信息」、「算法」、「数据」、「不确定性」、「计算」、「推理」和「优化」等概念之上。此外,由于这一学科的大部分重点都是来自于人类、关于人类的数据,它的发展也需要社会科学和人文学科提供帮助。

虽然这个学科的一些基础理论已经逐渐出现,但把它们组合到一起的法则还不见踪影。这些基础理论之间现在就只能单个单个地产生联系、堆在一起。

就像土木工程学科出现之前人们就已经在造房子、造桥一样,人们现在也是在没有建立起新的学科的情况下,就在着手建造把机器、人类、环境都包含在内的全社会尺度的推理和决策系统。同样地,就像早期的建筑和桥梁有时会以完全无法预料的方式倒塌,造成悲剧的后果,我们许多早期的全社会尺度的推理和决策系统也已经暴露出了严重的观念问题。

更难堪的是,我们人类并不是很擅长预测下一次会在哪里出现严重问题。我们现在缺少它对应的工程学科,缺少其中的分析和设计的法则。

当下的公众谈起这些问题的时候总是用「人工智能」这个词宽泛地囊括了所有和智慧相关的概念,这也就让新出现的科学技术的影响范围和后果变得很难讨论。我们先仔细看看「人工智能」这个词近期以及历史上都表示过哪些含义吧。

如今的「人工智能」在大多数情况下所指的,尤其是在公众讨论中,就是过去的几十年中我们称作「机器学习 Machine Learning」的东西。机器学习是一门研究算法的学科,它从统计学、计算机科学和其它一些学科汲取了思想,用来设计能处理数据、做出预测、帮助人类决策的算法。至于对真实世界的影响,机器学习的影响是实实在在的,而且远不止是近期才有影响。实际上,早在 1990 年代初的时候机器学习就已经表现出了明显的迹象可以对工业界产生巨大的影响,到了二十一世纪,亚马逊这样的有前瞻性的公司就已经把机器学习用到了公司业务的上上下下当中,处理着诈骗检测、逻辑链预测这样的后端问题,也构建了推荐系统这样的面向用户的创新服务。随着数据集的大小和计算资源在过去的 20 年里突飞猛进,我们现在可以清楚地看到,不只是亚马逊,几乎任何可以依据大规模数据做出决策的企业都很快会把机器学习作为动力。新的商业模式会涌现。也已经出现了「数据科学」这个短语用来称呼这种现象,其中反应的就是机器学习算法专家和数据库、分布式系统专家携手构建可拓展的、鲁棒的机器学习系统的需求,也反应了这样的系统对更大的社会和环境范围的影响。

在过去的几年里,这种思想和技术潮流的融合也被我们称作了「人工智能」。然而这种称呼是值得我们仔细审视的。

历史上来说,人们在 50 年代末产生了一股用软硬件共同重现出人类水平智慧的热情,同时也创造出了「人工智能」/「AI」这个词。这种志向我们可以称为仿人类人工智能(human-imitative AI),在这种观念里具有人造智慧的实体应当被看作我们的伙伴,即便看上去不像,精神上也应当像。这很大程度上可以看作学术研究领域的一种野心。一些相关的学术领域当时就已经存在,比如运筹学、统计学、模式识别、信息学和控制学这些学科,而且他们也经常从人类的智慧(以及动物的智慧中)获得启发,但一定程度上这些学科都关注的是“低层次”的信号和决策。比如说一只松鼠理解它所居住的森林的三维结构的能力、在树枝间跳跃的能力,都对这些学科有启发作用。而「人工智能」应当关注的是另一些东西,是人类推理、思考中的「高层次」的、「认知性」的能力。一晃六十年过去了,高层次的推理和思考能力我们仍然捉摸不到。如今被称作人工智能的技术进步基本都来自于低层次模式识别、运动控制相关的工程领域,以及在数据中寻找模式,据此做出预测、验证猜想和决策的统计领域。

实际上,David Rumelhart 在八十年代重新发现的、如今被看作是所谓「人工智能革命」的核心的反向传播算法,最早在五六十年代就出现在了控制领域。当时它最早的应用之一就是为阿波罗飞船计算飞向月球时的推力。

六十年代以来,我们的技术有了许多突破性发展,但是很大程度上这些进步并不是来自于对仿人类人工智能的追求的。倒不如说,就像阿波罗飞船的这个例子里一样,这些思想都是隐藏在幕后的,是尝试解决一些非常具体的工程挑战的研究人员们的研究成果。虽然一般大众看不到,但在文档索引、文本分类、腐败监控、推荐系统、个性化搜索、社交网络分析、规划、诊断和 A/B 测试方面的研究和系统构建都非常的成功;谷歌、Netflix、Facebook、Amazon 这些大公司的驱动力也正是这样的技术进步。

现在我们会简单地把上面这些东西全都统称为「人工智能」,看上去也似乎确实是那么回事。对于优化或者统计领域的研究员来说,这种归类方式算是一个不大不小的惊喜,他们一下子就变成了「人工智能研究员」。但除了研究员的归类问题之外,更大的问题是这种单个的、定义得并不准确的缩写词汇会阻止我们清晰地理解当下大规模的智能化和商业化问题。

过去的 20 年里我们有许多重大突破,工业界和学术界也一同创造出了一种新的思维,作为仿人类人工智能的补充;我们常常把它称作「智慧增强」(Intelligence Augmentation)。在这里,我们用计算能力和数据构建一些服务,它们可以增强人类的智力和创造能力。搜索引擎就可以看作是智慧增强的一个例子,它增强了人类的记忆能力、增强了人类对客观事实的认识;自然语言翻译也是这样,它增强了人类的沟通的能力。基于电脑的声音和图像生成也可以成为艺术家创作时的调色板和创新思想的增强。不过,虽然这样的服务最终不可避免地会涉及到高层级的推理和思维能力,目前它们却在这方面是一篇空白:它们所做的只不过是通过各种各样的字符串匹配和数值计算找到一些人类可以加以利用的模式而已。

这里我还需要再提出一个概念,就是广义地认识到「智慧基础设施」(Intelligent Infrastructure)这个学科。它是指一种计算能力、数据和相关的物理实体组成的网络,这个网络可以让人类的生存环境对人类更有帮助性、更有趣、也更安全。这样的基础设施已经在物流运输、医药、商业和金融这样的领域显露头角,影响到了无数的个人和社会活动。有时候人们谈起物联网(IoT)也会提起某种网络的建立,不过物联网领域的网仅仅是把「物」连接到了「网」上而已,对于如何让这些「物」处理数据流、发现关于世界的信息、与人类互动等等超越 0 和 1 组成的数据的高级抽象问题完全没有触及。

比如我可以再讲一个自己的想法,我们可能幻想过生活在一个「全社会尺度的医疗系统」中,它会设置好医生和病人身边的医疗设备间的数据流和数据分析流,从而在疾病诊断和医疗护理中为人类的智慧提供帮助。这个系统可以收集身体细胞中的信息、DNA 中的信息、血液诊断中的信息、环境、群体遗传学以及关于药物和医疗方法的海量文献中的信息,然后把它们集成在一起。它关注的不是单个病人和医生,而是所有人类之间的关系,就像现代的医学实验是在某一部分人身上(或者动物身上)做实验,然后用依据实验结果医治别的人。同样,就像现代银行系统可以在金融和支付领域中注重关联性、可追溯性和可靠性这些问题一样,这个医疗系统也最好可以注重这些理念。并且,虽然我们可以预见到构建这样的系统会遇到各种各样的问题,包括隐私问题、责任问题、安全问题等等,但这些问题都应当被正确看待为等待解决的挑战,而不是阻止构建这样系统的理由。

我们现在就遇到了这样一个关键问题:面对这些更大的挑战,研究仿人类人工智能是应对它们的最好的方法,甚至是唯一的方法吗?机器学习领域最常被提起的成功故事里有不少就是和仿人类人工智能相关的,比如在计算机视觉、语音识别、游戏 AI 和机器人领域。所以似乎看起来我们就只要等着这样的领域里不断出现新的进步就好了。

在这里我想指出两件事。一,虽然报纸上不会这样讲,但仿人类人工智能方向的研究实际上有很大限制,我们距离达到真正的仿人类人工智能的目标还非常远。不幸的是,仿人类人工智能领域的有限的进步也很容易引发人们的激动(以及恐惧),这让这个方向的研究本身过于火热、媒体关注也过多。任何其它的工程领域都看不到这样的现象。二,而且更重要的是,如果是为了解决重要的智慧增强和智慧基础设施问题,那么仿人类人工智能相关领域的成功既不充分也不必要

对于充分性这一边,可以想想自动驾驶汽车。为了实现这样的技术,等待解决的一系列工程问题和人类胜任驾驶的程度(以及人类不胜任驾驶的程度)几乎没有任何关系。一个总体性的交通运输系统(一个智慧基础设施)会非常接近现代的空中管制系统,而不太像目前的几乎没有分组的、前向的、漫不经心的人类司机的集合体。它将会比目前的空中管制系统复杂得多,尤其在于它可以利用海量数据和自适应性建模能力,做出细粒度决策。我们最先需要考虑的正是这样的问题,而对于这样的问题,仿人类人工智能方面的努力反倒会分散我们的注意力。

对于必要性,有一些人提出仿人类人工智能的愿望其实包含了智慧增强和智慧基础设施在内,因为仿人类人工智能将不仅可以解决各种经典 AI 问题(字面意思上,比如图灵测试),而且它最有可能同时解决智慧增强和智慧基础设施问题。这样的观点其实找不到什么历史先例作为支撑。土木工程的发展难道靠的是设想如何设计人造的粉刷匠和泥瓦匠吗?难道化学工程的学科框架是如何创造出一个人造化学家?甚至更有意思的是,如果我们的目标是建造一个化学工厂,那我们难道应该要先造出一个人造化学家,然后让它来思考如何建造一个化学工厂?

还有一种有关联的观点,是说人类智能是我们唯一知道的一种智能,我们发展人工智能的第一步就应当是尝试模仿这种智能。但是实际上有一些类型的推理人类并不是很擅长,人类有很多失误、偏见和限制。更重要的是,人类进化的目的就不是为了处理现代智慧基础设施那样的大规模决策问题的,也同样不是为了处理智慧基础设施环境下的不确定性问题的。有的人可能会说,一个人工智能系统将不仅可以模仿人类的智慧,而且还可以「纠正」它,当然也就可以拓展到任何大规模问题上去。但这样的想法就跑到了科幻小说的领域去了,这样的纯粹猜想性的观点当然符合科学幻想,但不应当作为我们面对逐渐显现的重要的智能强化和智慧基础设施问题时的主要策略。我们应当分别以它们应有的方式处理智能强化和智慧基础设施问题,而不是仅仅当作仿人类人工智能目标的推论。

其实不难看到,智慧基础设施系统中的算法和基础设施挑战并不是仿人类人工智能研究中的核心主题。智慧基础设施需要的是管理快速变化的、而且很有可能全局不相干的分布式知识存储的能力。这样的系统需要云计算和边缘计算之间的互动,才能做出即时的、分布式的决策;而且还需要能够处理数据中的长尾现象,即关于某一些个体有很多的数据,但大多数个体都只有很少的数据。它们需要能处理在穿越管理性和竞争性的边界分享数据的问题。最后,而且也非常重要的是,智慧基础设施系统需要把动机和定价这样的经济学理念融入到连接了人与人、人与商品的统计和计算基础设施中。这样的智慧基础设施系统就不仅仅是提供了服务,更重要的是它提供了市场。音乐、文学、新闻等一些领域就非常需要这样的市场,其中的数据分析就可以吧创作者和消费者连接到一起。而这一切也都需要在进化出社会性的、符合道德的、合乎法律的前提之下。

当然了,经典的仿人类人工智能问题也仍然是重要的研究课题。但是,目前的人工智能研究都是借助收集数据、借助部署深度学习基础架构,这些系统所展现出的模仿某一些非常专门的人类技术的能力、同时还无法在解释其中的规律上起到什么帮助的现状,实际上分散了我们的注意力,让我们忽视了经典人工智能中的许多开放性问题。这些问题包括:如何给能够处理自然语言的系统增加意义和推理能力,如何推理和表示因果关系,如何开发出可计算的不确定性的表示方法,以及如何开发出能够形式化并追寻长期目标的系统,等等。这些同样都是仿人类人工智能中的经典目标,但在当下的「人工智能革命热潮」中,我们很容易忘记这些问题都还没有解决。

智能增强也依然是足够关键的,在真实世界状况的抽象推理这件事上,在可见的未来内计算机都不可能达到人类的水平。人类和计算机之间需要构建思考足够深入的沟通方式才能解决我们最紧迫的问题。而且我们也希望用计算机把人类的创造力推向新的高度,而不是用计算机取代人类的创造力(各种意义上的)。

John McCarthy(约翰麦卡锡)在达特茅斯学院时提出了「人工智能」这个词,当时明显是为了把他和 Norbert Wiener(诺伯特维纳)两人的不同的研究目标区分开。Wiener 提出词是「神经机械学」(cybernetics),以表示他对智能系统的憧憬是和运筹学、统计、模式识别、信息论和控制理论紧密相关的。McCarthy 则更看重的是智能和逻辑之间的联系。不过后来发生了有趣的反转,目前正是 Wiener 阐述的智力目标统治了这个领域,但打的却是 McCarthy 的旗号。(目前的现状当然是暂时的;AI 领域的风向转换得比其它领域快得多)

但对我们来说,McCarthy 和 Wiener 两人的历史视角我们都需要超越。

我们需要明白,如今普通大众讨论的这种专注于工业和学术中的很小一部分问题的人工智能,有极大的风险会让我们不再注意到人工智能、智能增强和智慧基础设施的全部范围内的挑战和问题。

这个范围并不仅仅是关于某些关于超人类电脑的科幻梦想以及恐惧的,而更关注的是,随着科学技术在人类的生活中越来越显著、越来越有影响力,人类需要能够理解和控制它。并且,在这种理解和控制中,所有人类都应该发出各自的声音,而不是仅仅在了解技术的人之间进行讨论。狭隘地只关注仿人类人工智能会让很多应当被听到的声音无法听到。

虽然业界公司会继续不断地带来更多技术进步,学术界也要扮演好自己的关键角色。不是仅仅提供一些创新的技术思路就结束,而应该把计算学科、统计学科的研究者和值得倾听的其它学科的研究者联系起来,尤其值得一提的是社会科学、认知科学以及人文学科。

另一方面,虽然人文学科和自然科学学科对我们的前进来说都非常重要,我们也应当牢记我们讨论的内容是关于一个前所未见的尺度和范围的工程项目,是这个社会需要构建一些新的人造物。这些人造物应当建造得符合承诺。我们都不希望在一些帮助医疗的、交通的、商务的系统建造完毕之后才发现它们其实不好使,发现它们其实会减少人类的寿命和幸福感。出于这种理念,正如我刚才强调过的,我们需要一种新的工程学科来引导这种数据向的、学习向的领域。虽然这中想法听起来很不错,但目前我们还无法真正地把它看作一门学科。

更进一步地,我们正在见证新的工程领域的出现,我们应该为此感到高兴。「工程」这个词经常被人们理解得很狭隘,不管是在学术界还是更多语境下,好像都隐喻着冷酷无情的机器、或者是失去人类的控制。但其实一门工程学科可以成为任何我们希望它成为的样子。

现在这个时代,我们真的可以设想一种历史上从未出现过的东西:一个新的以人为中心的工程学科。

我现在没法给这个正在萌发的新学科给出一个名字,但如果「人工智能」/「AI」这个词会作为这个学科的命名的词根的话,我们一定要谨记这个词根的极为有限的实际意义。让我们放宽视野、收起狂热,仔细地观察观察我们面前等待着的挑战吧。

Michael I. Jordan

via Michael I. Jordan,雷锋网 AI 科技评论编译

雷锋网