标签归档:深度

深度 | AI芯片之智能边缘计算的崛起

雷锋网注:本文是线性资本黄松延对终端智能芯片前沿技术和市场动态的分析,松延是浙江大学机器学习博士,前华为数据科学家,对机器学习及其应用有深入的研究,阅后若有所感,欢迎通过微信号Nikola_629与他交流。本文转载自公众号“线性资本”,雷锋网已获取授权。

基础层、算法层与应用层是人工智能产业链的三个组成部分。人工智能(AI)正在作为基础技术,改变不同的行业,并具有极其广阔的应用市场。考虑到深度学习等AI算法开源的发展趋势,基础层的数据与芯片将在未来竞争中占据越来越重要的地位。作为人工智能发展支柱的AI芯片(特指专门针对AI算法做了特定设计的芯片)更是人工智能行业的核心竞争力。

基于深度神经网络(DNN)在各个应用中表现出的巨大优势,本文的AI仅限于深度学习。下文将从AI计算与AI芯片出发,分析不同种类AI芯片间的区别,探索应用于终端推断(Edge Inference,EI)的AI芯片,即AI-EI芯片,并给出AI-EI芯片硬件架构特性,讨论多家AI-EI芯片公司,最后给出AI-EI芯片发展趋势及投资逻辑。

一、AI计算及AI芯片

近几年,深度神经网络(DNN)在图像识别、自然语言处理等方向上取得了前所未有的成功,并推动相关行业的快速发展。但是,这些应用中使用的深度神经网络的参数量巨大,模型训练(training)与推断(inference)都需要大量的计算,传统计算芯片的算力无法满足DNN计算需求。具有高算力的AI芯片能够满足AI行业计算需求并得到了快速发展。

2016年AI芯片全球市场规模为23.88亿美元,有机构预计到2020年AI芯片全球市场规模将达到146.16亿美元(终端AI芯片的市场规模),发展空间巨大。另外,各国纷纷把AI芯片定为自己的战略发展方向。 

与传统CPU不同的是,AI芯片具有大量的计算单元,能够适合大规模并行计算的需求。基于通用性与计算性能的不同,可以把AI芯片分为GPU、FPGA、ASIC三大类。深度神经网络的基本运算单元是“乘-加”(MAC)操作。每次MAC中存储器读写操作如图1所示。

图1:每个MAC的读写操作

在AI应用中,CPU与AI芯片的计算能力是由芯片所具备的MAC能力及如何发挥芯片的MAC能力两个因素决定。

CPU是通用芯片,CPU的大部分面积都被控制单元与缓存单元所占,只有少量的计算单元。另外,CPU的指令执行过程包括取指令、指令译码与指令执行三部分。只有在指令执行的时候,计算单元才能发挥作用。因而,CPU在发挥芯片的MAC能力方面亦比较一般。为了提高指令执行效率,CPU采用指令流水处理方式。


GPU有大量的计算单元,适合大规模并行计算。但是,GPU也是通用芯片,其指令执行过程也由取指令、指令译码与指令执行三部分组成。该特征是制约GPU计算能力的主要原因之一。


FPGA,即,现场可编程逻辑门阵列,是一种更接近I/O的高性能、低功耗芯片。FPGA是算法即电路,软硬合一的芯片。基于硬件描述语言,可以把算法逻辑直接编译为晶体管电路组合。由于FPGA的硬件电路是由算法定制的,其不需要取指令与指令译码过程,因而,FPGA能够充分发挥芯片的计算能力。另外,FPGA可以重复编程,因而具备一定的灵活性。


ASIC,即,专用集成电路。类似于FPGA,ASIC采用的也是算法即电路的逻辑,亦不需要取指令与指令执行过程。另外,ASIC是为了特定的需求而专门定制的芯片,因而,能够最大程度发挥芯片的计算能力。但是,不同于FPGA的可重复编程,ASIC的设计制造一旦完成,就无法再改变,其灵活性较差。

在评价一个芯片架构性好坏时,有多种指标可供参考。其中,能耗与峰值计算能力(芯片结构中每秒计算操作数的总和,用OPS表示)是两个重要的衡量指标。不同指标间会相互制衡,一个指标的增高可能是以牺牲其它指标为代价而获取的。因而,常采用归一化的指标单位能耗算力(OPS/W),即,能效,来衡量芯片计算性能。实质上看,上述的四种芯片是通用性与能效trade-off的结果。能效方面,ASIC>FPGA>GPU>CPU。通用性则反之。

对于AI芯片,从市场格局来看,NVIDIA是GPU行业的绝对龙头。对于FPGA,XILINX、ALTERA(现并入INTEL)、LATTICE、MICROSEMI四家占据全球99%的市场份额。其中,XILINX、ALTERA两家占据全球90%的市场份额。另外,FPGA四大巨头拥有6000多项行业专利,形成该行业极高的技术壁垒。对于ASIC芯片,目前还未形成巨头垄断的市场格局,但是对于不同垂直领域,其情况不同,我们将在下文中给出详细分析。

图2:AI芯片象限图

深度学习分为两个阶段:模型训练与智能推断,如图2所示。模型训练需要大量的训练样本,基于梯度下降法,模型优化收敛到局部最优点。深度学习的模型训练需要几小时到多天的迭代优化,因而,现阶段,模型训练都在云端完成(我们认为具备持续学习能力是智能终端未来发展的方向,因而这里并不认为训练一定只在云端完成)。模型训练好之后,则能够基于该模型与输入数据,计算得到输出,完成智能推断。相比于模型训练,推断的计算量要小很多,可以在云端与终端完成。

现阶段,由于终端设备的计算力普遍有限,模型训练与推断大都在云端服务器上完成。在云端模型训练中,NVIDIA的GPU占主导地位,多GPU并行架构是云端训练常用的基础架构方案。在云端识别中,基于功耗与运算速度的考量,单独基于GPU的方式并非最优方案,利用CPU、GPU、FPGA、ASIC各自的优势,采用异构计算(CPU+GPU+FPGA/ASIC)是目前主流方案。

在计算机视觉、语音识别等应用中,终端采集数据(特别是图像数据),然后上传到云端处理的云计算对网络带宽与数据中心存储都带来越来越大的挑战。另外,无人驾驶等应用对实时性与安全性要求极高。网络的时延与稳定性所带来的安全隐患是无人驾驶等应用所无法忍受的。在终端采集数据,并完成数据处理,提供智能终端推断的边缘计算(Edge computing),因其能够满足实时性、安全性的需求,且能节约带宽与存储,得到越来越多的关注。我们判断inference将越来越多的在终端设备上完成,即,智能将会下沉到终端设备,智能边缘计算将会崛起。

图3:2017-2020全球AI终端芯片市场规模预测

实时性是选择在终端完成推断最主要的原因之一。但是,由于深度神经网络参数量巨大,推断过程需要完成大量的计算,其对终端硬件的计算力提出了很高的要求。另外,电池供电的终端设备对功耗也有极高的要求,且大多数的终端产品价格敏感。即,执行DNN推断的终端芯片对算力、功耗、价格都有严格的限制。研究用于DNN推断的AI-EI芯片是目前AI芯片行业最热的方向。现阶段,已有大量的初创公司,针对不同领域及应用,提出多种AI-EI芯片硬件设计架构,下文将详细给出AI-EI芯片的架构思路及发展现状。

二、AI-EI芯片及其架构

基于深度神经网络的广泛应用,科技巨头及初创公司都根据DNN的特性进行有针对性的硬件处理器研发。其中包括Google的TPU、寒武纪的DianNao系列、Eyeriss的NPU等AI芯片。本节将总结并给出这些AI-EI芯片如何在不降低准确率的前提下实现运算吞吐量提升,并降低能耗。

由前文可知,深度神经网络的基本运算为MAC操作,且MAC操作很容易被并行化。在DNN硬件设计中,常使用时间架构(temporal architecture)与空间架构(spatial architecture)两种高度并行化的计算架构,来获取高计算性能。

时间架构(Temporalarchitecture)

通用芯片CPU与GPU常采用时间架构,并使用单指令多数据流(SIMD)或者单指令多线程(SIMT)来提高并行化处理性能。时间架构基于中央控制器统一控制所有的ALU。这些ALU只能从层次存储器中取数据,而不能相互通信。

时间架构中,通常使用各种计算变换,特别是对卷积操作的计算变换,来减小计算复杂度,从而提升吞吐量,常用的方法包括:

Toeplitz矩阵方法:把卷积操作转换为矩阵乘操作


FFT方法:经过FFT变换,把卷积运算变成矩阵乘操作


Winograd方法:比较适合较小的滤波器的情况

空间架构(spatial architecture)

基于ASIC或者FPGA的AI-EI芯片常使用空间架构。相对于通用芯片,专用芯片应用在特定场景,其功能有限。简单且规则的硬件架构是降低设计成本的基础,亦是实现低成本专用芯片的先决条件。足够低的芯片成本才能对冲专用芯片功能的局限性。

空间架构采用数据流(Dataflow)处理方式。在空间架构中,ALU形成一条数据处理链,从而能够在ALU间直接地传送数据。该空间架构中,每个ALU都有自己的控制逻辑与本地存储(寄存器堆)。其中,有本地存储的ALU被定义为PE。

对于空间架构,硬件设计基于层次存储器中的低能耗内存,并增加数据重利用率(实质上,卷积是空间重用,这种重用可以获取空间的不变性),来减小能耗。另外,数据流(Dataflow)控制数据读、写及处理。总体上,空间架构基于层次存储器与数据流平衡I/O与运算问题,从而降低能耗并提升运算吞吐量。下文将在分析层次存储器与数据流的基础上,讨论不同的技术路线的AI-EI芯片。

访问内存所需时间要远远大于计算所需时间。由深度神经网络的推断部分运算可知,每个MAC都需要三次内存读与一次内存写操作。其中三次内存读操作分别为读取输入数据、权值数据与部分和数据(partial sum),一次内存写操作为更新部分和数据。层次存储器基于内部寄存器等存储单元来减小对外挂内存访问次数,降低I/O需求。层次存储器如图4所示,该层次存储器包括PE内部的寄存器(RF)、用于ALU间直接传输数据时存储数据的内存单元NoC及连接DRAM的全局缓存器Buffer。由图4可以看到,层次存储器中,不同类别的存储器读写操作所消耗的能量不同,这也是我们能够利用层次存储器及数据复用来降低能耗的原因。

 

图4:层次存储器及各存储器中数据迁移的能耗

Dataflow是一种没有复杂程序指令控制且由操作数,即,数据或者中间结果,激活子计算单元,来实现并行计算的一种计算方式。图5总结出了Dataflow的架构逻辑。

 

图5:数据流架构——来源Shaaban教授的课程

在深度学习的推断中,有大量的计算需求。但是,这些计算是分层顺序执行的。因而,控制流程相对简单、清晰。可以看出,Dataflow处理方式与基于深度神经网络推断部分的计算需求非常吻合。

数据流能够决定哪些数据读入到哪层存储器以及这些数据什么时候被处理。另外,在DNN推断中,没有随机性。因而,可以从最优能耗的角度,设计一个基于Dataflow的固定架构的AI-EI芯片。目前,大多数用于深度学习推断的AI-EI芯片都采用Dataflow。

层次存储器中,存储量大的存储器读写操作所消耗的能量要比小存储的存储器大很多。因而,一旦一块数据从大存储器搬移到小存储器后,要尽可能最大程度复用(reuse)该数据块来最小化能耗。但是低功耗存储器的存储空间有限。如何最大化复用率是设计基于Dataflow加速器时最关注的先前条件。即,通过最大化数据复用率来降低I/O要求,减小数据处理能耗,从而提升吞吐量并降低总体能耗。常见的DNN数据流类型包括:权值固定数据流、输出固定数据流、No local reuse(NLR)及行固定数据流。

权值固定数据流: 从DRAM中读出权值数据,放在PE的RF中并保持不变,之后把输入数据广播(broadcast)到每个PE,最后求取PE阵列的部分和(partialsum)。该处理方式通过最大化从PE的RF中读取权值数据次数,并最小化直接从DRAM中读取权值次数,实现最大化卷积与滤波器对权值的复用率,来减小能耗。NeuFlow即为基于该种数据处理方式的AI-EI芯片。

输出固定(OS)数据流: 通过在PE阵列中stream输入数据,然后把权值数据广播到PE阵列,保持 RF中的部分和的累加不变,从而最小化读写部分和的能耗。寒武纪的ShiDianNao是基于输出固定的AI-EI芯片。另外,根据处理目标的不同,可以把该种数据流分为以卷积层为处理目标的OS_A与以全连接层为处理目标的OS_C,OS_B是介于OS_A与OS_C间的一种OS数据流。 

NLR数据流: PE阵列的RF中并不存储任何固定数据,相反,该情况下,所有数据的读写操作都是在全局buffer中完成。寒武纪的DianNao与DaNiaoNao是基于该数据处理方式的AI-EI芯片。 

行固定数据流: 最大化所有数据复用率并尽可能的使得所有数据的读写操作都在RF中完成,减小对全局buffer的读写操作,来减小功耗。每个PE能够完成1D的卷积运算,多个PE能够完成2D的卷积运算。在二维的PE阵列中,水平轴上的PE单元上,每一行的权值数据被复用,对角线上的PE单元上,每一行的输入数据被复用,垂直轴上的多个PE单元上,每一行的部分和数据被复用,即,行固定的数据流能够最大化所有数据的复用率,从而能够全局最优化功耗。Eyeriss的NPU是基于行固定的AI-EI芯片。

三、AI-EI芯片玩家

本节首先总结三家极具代表性的研发DNN加速器(Google、Wave computing、Graphcore是平台化的计算平台,因而,这里没把他们叫做AI-EI芯片厂家)的公司,后文中结合应用场景总结AI-EI芯片创业公司,其中部分公司的芯片也可以做训练,且不一定应用在终端场景,这里基于行为考虑,把他们称为AI-EI芯片公司。

Google TPU

在2015年就开始部署ASIC张量处理器TPU。TPU采用脉动阵列(systolic array)技术,通过矩阵单元的使用,减小统一缓冲区的读写来降低能耗,即脉动运行。脉动阵列不是严格意义的Dataflow,但也是数据流驱动的设计方式。该技术早在1982年就被提出,但是受限于当时的工艺水平及应用,该技术在当时并没有引起太多关注。脉动阵列在TPU上的应用,让该技术回归大众视野,并得到了极大的关注。

Google在TPU上使用该技术的逻辑在于脉动阵列简单、规则且能够平衡运算与I/O通信。TPU中基本计算单元是功能单一的处理单元PE,每个PE需要先从存储中读取数据,进行处理,然后把处理后的结果再写入到存储中。TPU脉动阵列中的PE与前文中其他DNN加速器的PE基本一样,能够实现MAC操作,有存储能力有限的RF。由前文可知,对数据读写的速度要远远小于数据处理的速度。因而,访问内存的速度决定了处理器的处理能力。TPU的脉动阵列采用数据复用及数据在阵列中的脉动运行的策略来减小访问存储器次数,从而提高TPU的吞吐量。

TPU在实现卷积等运算时,要先调整好数据的形式(即对原始矩阵做好调整),之后才能完成相应的计算。因而,TPU的灵活性一般,只能处理特定的运算,这也是其它基于PE阵列Dataflow DNN加速器共有的问题。但是脉动阵列特别适合卷积运算,TPU有多种实现卷积运算的方式,其中包括:

权值存储在PE中保持不变,广播输入数据到各个PE,部分和的结果在PE阵列中脉动运行


部分和的结果存储在PE中保持不变,广播输入数据到各个PE,权值在PE阵列中脉动运行


部分和的结果存储在PE中保持不变,输入数据与权值在PE阵列中按相反方向脉动运行


部分和的结果存储在PE中保持不变,输入数据与权值在PE阵列中按相同方向但不同速度脉动运行


权值存储在PE中保持不变,输入数据与部分和的结果在PE阵列中按相反方向脉动运行


权值存储在PE中保持不变,输入数据与部分和的结果在PE阵列中按相同方向但不同速度脉动运行

Wave computing

基于Coarse GrainReconfigurable Array (CGRA) 阵列,实现数据流计算。另外,Wave的DNN加速器是clockless,其基于握手信号来实现模块间的同步。因而,不需要时钟树,从而能够减小芯片面积并降低功耗。

Graphcore

打造专门针对graph计算的智能处理器IPU。Graphcore在芯片设计上做出了很大的改变。相比于CPU以scalar为基础表示,GPU以矢量为基础表示,Graphcore的IPU是为了high-dimensional graph workload而设计的。这种表示既适用于神经网络,也适用于贝叶斯网络和马尔科夫场,包括未来可能出现的新的模型和算法。该IPU采用同构多核架构,有k级的独立处理器。另外,该芯片使用大量片上SRAM,不直接连接DRAM。该芯片能够直接做卷积运算,而不需要把转换成矩阵乘法之后使用MAC操作完成。该IPU不仅能够支持推断,也能支持训练。

商业应用是AI的关键因素之一,AI只有解决了实际的问题才具有价值,下文,我们从终端不同的应用,探讨AI-EI芯片。不同的加速器在各个子行业都有应用布局,我们从主要应用领域出发,给出公司产品、最新产品性能及融资情况的终结。

AI-EI芯片+自动驾驶

在汽车行业,安全性是最重要的问题。高速驾驶情况下,实时性是保证安全性的首要前提。由于网络终端机延时的问题,云端计算无法保证实时性。车载终端计算平台是自动驾驶计算发展的未来。另外,随着电动化的发展趋势,对于汽车行业,低功耗变的越来越重要。天然能够满足实时性与低功耗的ASIC芯片将是车载计算平台未来发展趋势。目前地平线机器人与Mobileye是OEM与Tier1的主要合作者。

 

AI-EI芯片+安防、无人机

对于如何解决“虐童”问题,我们认为能够“看得懂”的AI安防视频监控是可行方案之一。相比于传统视频监控,AI+视频监控,最主要的变化是把被动监控变为主动分析与预警,因而,解决了需要人工处理海量监控数据的问题(也绕开了硬盘关键时刻掉链子问题)。安防、无人机等终端设备对算力及成本有很高的要求。随着图像识别与硬件技术的发展,在终端完成智能安防的条件日益成熟。安防行业龙头海康威视、无人机龙头大疆已经在智能摄像头上使用了Movidious的Myriad系列芯片。

AI-EI芯片+消费电子

搭载麒麟970芯片的华为mate10手机与同样嵌入AI芯片的iPhoneX带领手机进入智能时代。另外,亚马逊的Echo引爆了智能家居市场。对于包括手机、家居电子产品在内的消费电子行业,实现智能的前提要解决功耗、安全隐私等问题。据市场调研表明,搭载ASIC芯片的智能家电、智能手机、AR/VR设备等智能消费电子已经处在爆发的前夜。 

其他

随着AI应用的推广,越来越多的公司加入AI-EI芯片行业,其中,既包括Bitmain这样的比特币芯片厂商,也包括从GoogleTPU团队出来的创业公司Groq,还有技术路线极具前瞻性的Vathys。由于这些Startups都还处于非常早期阶段,具体应用方向还未公布,因而放在“其他”中。另外,我们判断终端AI芯片的参与者还会增加,整个终端智能硬件行业还处在快速上升期。

四、AI-EI芯片发展趋势 

上文介绍的AI-EI芯片是在优化硬件架构基础上,实现低功耗、高吞吐量。现有研究中有采用Processing in Memory(PIM)的方式,把处理直接放在存储单元的位置,降低整个系统的复杂度,减少不必要的数据搬移,从而优化功耗和硬件成本。同时,这也需要在电路(模拟信号)的层面重新设计存储器。初创公司Mythic即采用PIM技术来设计AI芯片。另外,通过研究具备高带宽和低功耗特性的存储器来解决I/O与运算不平衡的问题也是当前的研究热点。

类脑芯片是处理Spiking neural network (SNN)而设计的一种AI芯片。IBM的TrueNorth、高通的Zeroth及国内的Westwell是类脑芯片的代表公司。类脑芯片能够实现极低的功耗。但是在图像处理方面,SNN并没有表现的比CNN好,且类脑芯片现在处在研究阶段,离商业应用还有较远的距离。

2017年芯片行业的融资额是2015年的3倍。巨头公司与资本都在积极布局AI芯片,特别是在智能边缘计算有技术积累的公司。我们无法预测未来哪家公司能够最终胜出。

但是,一家AI芯片公司要想持续发展并壮大,需要具备包括硬件及软件生态的全AI服务流程能力。从现阶段的投资动向可以看出,创业公司要想获取资本青睐,需要在硬件设计架构上有足够吸引人的变动。另外,性能指标与技术路线可以靠讲,只要合理既有可能,但是在未来1到2年的时间内再拿不出产品是很难继续讲下去的。

雷锋网

深度 | CMU 邢波教授团队最新成果:利用 AI 自动生成医学影像报告

雷锋网消息,近日,由卡内基梅隆大学机器学习系副主任邢波教授创立的 Petuum 公司近期发表了几篇论文,介绍了如何使用机器学习自动生成医学影像报告,从而更好地辅助医生做治疗与诊断。

医学影像在临床实践中被广泛应用于诊断和治疗。专业医师阅读医学影响并撰写文字报告来描述自己的发现。对于没有经验的医生来说,撰写报告很可能会出错,对于人口众多的国家的医生来说,这样的工作又耗时又枯燥。为了解决这些问题,邢波教授的团队研究了医学影像报告的自动生成,作为人类医生更准确高效地生成报告的辅助工具。

为了应对这些挑战,邢波的团队建立了一个多任务学习框架,共同执行标签的预测和段落的生成;提出一个共同注意机制(co-attention mechanism),将包含异常的区域标注出来;利用一个层次LSTM模型来产生长的段落。

医生不愿撰写“医学影像报告”

放射学和病理学的医学图像被广泛用于医院和诊所,例如肺炎、气胸、间质性肺病、心力衰竭、骨折等等。他们通过撰写文字报告(图1)来描述在影像学检查中所检查的每个身体部位的发现,特别是每个部位是否被发现是正常的,异常的或潜在的异常。

图 1. 一个包含三部分信息的胸部 X 光报告示例。在 impression 部分,放射专家结合 Findings、病人临床历史及影像学研究的指导做出诊断。Findings 部分列出了影像学检查中所检测的身体各部分放射学观察结果。Tags 部分给出了表示 Findings 核心信息的关键词。这些关键词使用医学文本索引器(MTI)进行标识。

对于经验较少的放射科医师和病理科医师,特别是那些在医疗保健条件落后的医生,写医学影像报告是一件困难的事情。要正确读取胸部X线图像,他们需要以下的几项技能:

对胸部正常解剖结构和胸部疾病的基本生理学的全面了解

通过固定模式分析射线照片的技能

评估随时间变化的能力

临床表现和病史知识

与其他诊断结果(实验室结果、心电图、呼吸功能检查)相关的知识

但是,对于有经验的放射科医师和病理学家来说,撰写影像报告又过于繁琐和费时。在中国这样人口众多的国家里,放射科医生每天可能需要阅读数百张放射图像。将每幅图像的分析结果输入计算机大约需要5-10分钟,这占用了他们大部分的工作时间。

邢波的团队认为,自动生成医学影像报告是一件有意义而且有必要的事情,但同时,这项任务也面临几个挑战。

首先,一份完整的诊断报告由多种不同信息形式的内部报告组成,如图1所示,胸部X射线的报告包含 Impression描述,通常是一句话;Findings 是一段描述;Tags 是一列关键词。用一个统一的框架生成这样的不同信息,对技术提出的要求很高。我们通过构建一个多任务框架来解决这个问题,该框架将标签的预测作为一个多标签分类任务来处理,并将长描述(例如生成 Impression 和 Findings)的生成视为文本生成任务。在这个框架中,两个任务共享相同的用于学习视觉特征的CNN并且共同执行。

其次,一个影像报告通常更多地集中于描述异常的结果,因为它们能直接指出疾病并指导治疗。但如何定位图片中的病变区域并附上正确的描述非常困难。我们通过引入共同注意机制(co-attention mechanism)来解决这个问题,同时参与图像和预测到的标签,并探讨视觉和语义信息的协同效应。

最后,成像报告中的描述通常很长,包含多个句子甚至多个段落。生成长文本是非常重要的,我们没有采用单层LSTM(这种LSTM不能模拟长序列),而是利用报告的组成性质,采用分层LSTM来生成长文本。结合共同注意机制,层次型LSTM首先生成高级主题,然后根据主题生成详细的描述。

数据集方面,研究人员使用的是印第安纳大学胸部X射线组(IU X射线),这是一组与相应的诊断报告对应的胸部X射线图像集。该数据集包含7470对图像和报告。每个报告包括以下部分:impression, findings, tags, comparison and indication 。邢波团队将impressionfindings中的内容视为要生成的目标,并将MTI生成的标记作为报告的标记。

相关的工作

为医学影像添加文本报告

为了将文本报告添加到医学影像上,需要几个步骤。在我们的设置中,添加到医学影像上的文本是完全结构化的或半结构化的(例如标签,属性,模板),而不是自然文本。通过建立传递系统来预测医学影像的特征性,其中一些特征性通过文本标签显示。给定一个医学图像,首先运用局部图像分析法进行局部分析,然后提取每个局部图像的视觉特征,最后建立一个分类器,将视觉特征按照预定义的类别分类。

Shin和其他研究人员,建立了运用CNN-RNN框架的系统,可以为胸部X射线影像添加文本标签。他们使用CNN(卷积神经网络)从影像中检测疾病,并使用RNN(循环神经网络)来描述检测到的疾病的详细信息,例如:发病位置,病变程度及受影响的器官等。Zhang及其研究团队的最新研究报告显示,他们可以提供生成医疗报告。他们的目标是生成30-59字的病理报告。然而,他们生成的病理报告是半结构化的,语言不够流畅自然。通过将少量标准报告重新编写生成最后的病理报告,报告内容限于5个预定义的主题。

我们研究的最终目标是:生成的病理报告可以替代医生在自然情况下撰写的病理报告。这些病理报告很长,涵盖了很多方面,相比之前研究给影像添加标签和半结构化段落来说,难度系数更大。

图像说明与深度学习

图像说明技术可以为指定图像自动生成文字描述。最近研究的图像文本模型大多是基于CNN-RNN框架。Vinyals及其研究团队将从CNN的最后隐藏层提取的图像特征提供给LSTM(长短期记忆网络)以生成文本。Fang 及其研究团队首先使用CNN来检测图像中的异常,然后将这些检测到的异常通过语言模型生成一个完整的句子。Karpathy及其研究团队提出使用多模式递归神经网络将视觉和语义特征二者达到一致,然后生成对于图像的描述。

最近,注意机制(attention mechanisms)已被证明对于添加图像文本是有用的。Xu及其研究团队将空间视觉注意机制引入CNN中间层提取的图像特征中。You及其研究团队提出了针对给定图像标签的语义注意机制。为了更好地利用视觉特征并生成语义标签,研究团队提出了共同注意机制。

我们的目标不仅仅是为图像生成一个说明。Johnson及其研究团队正在研究密集型文本,要求模型可以生成对于每个检测图像区域的文字描述。Krause,Liang及其研究团队通过分层LSTM为图像生成段落说明。我们的研究方法也是采用分层次的LSTM来生成段落标题,而与Krause及其研究团队不同的是,我们使用一个共同关注网络来生成主题。

图 2. 整个模型的结构与过程。其中 MLC 代表多标签分类网络,语义特征是预测标签的词向量。粗体标记的「calcified granuloma」和「granuloma」是共同注意网络关注的标签。

定量结果

我们使用以下文本生成评估手段(BLEU 、METEOR 、ROUGE  和 CIDER)度量段落生成(表 1 上半部分)和单语句生成(表 1 下半部分)的结果。

如表1的上半部分所示,对于段落生成来讲,使用单个 LSTM 解码器的模型的表现明显要差于使用层级 LSTM 解码器的模型。表1中的Ours-No-Attention和CNN-RNN 之间的唯一区别在于,Ours-No- Attention采用层级LSTM解码器,而CNN-RNN 仅采用单层LSTM。这两个模型之间的比较直接证明了层级LSTM的有效性。

这个结果并不令人惊讶,众所周知,单层LSTM不能有效地模拟长序列。此外,单独使用语义注意(Ours-Semantic-Only)或单独使用视觉注意(Ours-Visual-Only)来生成主题向量似乎帮助不大。潜在的原因可能是视觉注意力只能捕捉图像分区域的视觉信息,而不能正确描述。虽然语义注意只知道潜在的异常,但不能通过查看图像来确认其发现。最后,我们的完整模型(Ours-CoAttention)在所有的评估指标上都取得了最好的结果,说明了提出的共同注意机制的有效性。

对于单句生成的结果(如表1下半部分所示),我们模型的控制变量版(Ours-Semantic-Only和Ours-Visual-Only)与其他版本相比,要优于所有的基线模型,这表明了所提出的共同注意机制的有效性。

定性结果

段落生成

三个模型生成影像病理报告的示例见图3,分别为Ours-CoAttention模型,Ours-No-Attention模型和Soft Attention模型。值得注意的是,下划线的句子是对异常情况的描述。首先,我们可以观察到三个模型生成的报告所包含的句子比真实报告多。其次,三个模型生成的报告和真实报告大多数的语句都是对于正常区域的描述,而只有几句话是关于异常情况的。这个观察可以解释为什么 Ours-No-Attention模型在一定程度上不能达到非常好的水平。

图 3. 协同注意力 、无注意力、软注意力模型生成的段落图示。划线句子是检测到异常情况的描述。第二个图是胸部侧面 x 光图像。前两个例子的结果是与真实报告相一致的,第三个出现了部分失败,最底下的图像完全失败。这些图像来自测试数据集

当我们深入了解生成文本的内容时,发现不同句子具有不同的主题,这是令人惊讶的。第一个句子通常是对图像的整体描述,而以下的句子分别描述图像的其他区域,例如:肺脏、心脏等。另外值得注意的是,Soft Attention模型和Ours-No-Attention模型只能检测图像中的异常情况,往往检测到的异常情况还是错误的。但是,Ours-CoAttention模型在前三幅图像中均能够正确描述图像中异常情况。结果表明,与Ours-CoAttention 模型及Ours-No-Attention模型相比,层次型LSTM可以更好地生成病理报告。

在第三张X射线图中,Ours-CoAttention模型成功检测到右下叶肺部有异常。然而,它没有准确地描述这种异常。相比于其他X射线图来说,第三张X射线图比较暗,这可能就是Ours-CoAttention模型描述错误的潜在原因,我们的模型对这个变化非常敏感。Ours-CoAttention模型对于第四张X射线图的描述是一个失败案例。虽然模型错误地判断了图像中的主要异常,但是它确实找到了一些不寻常的区域。比如:左下叶肺部异常。此外,发现模型给出的报告中有“这可能表明”的字眼,说明模型试图推断所患疾病,这是十分令人惊讶的。

为了更好地理解模型检测疾病或潜在疾病的能力,我们在表2中,给出了三大模型正态性和异常性的概率。我们认为句子包含“否”、“正常”、“清除”、“稳定”作为句子描述正常。很显然,Ours-CoAttention模型在正态性和异常性的概率上最接近真实情况。

表3中的结果表明,Ours-CoAttention和VGG-19 网络对于标签预测的执行非常相似。尽管多任务学习没有改进,但我们认为,这个模型是一个端到端的模型,避免了管理复杂的流水线模式。

图4显示了共同注意的可视化。图4所示的第一个特性是 Sentence LSTM 能够关注图像的不同区域和语句的不同标签,并在不同的时间步骤生成不同的主题。第二个特性是视觉注意力可以指引模型关注图像的相关区域。例如,第一个例子的第三个句子是关于“有氧”的,视觉注意力集中在心脏附近的区域。类似的行为也可以被发现的语义注意:对于第一个例子中的最后一句话,我们的模型正确地集中在作为句子的主题“退化变化”。

此外,第二个例子中的第一句话的内容与语义注意力的集中矛盾是令人惊讶的。单一关注机制不太可能发生。这种矛盾意味着共同关注机制具有一定的容错性,因此共同注意可能比单一关注更为强大。

最后,最后一个例子的第一句话是由于对标签不正确的注意而导致的错误描述。我们相信通过建立一个更好的标签预测模块可以减少不正确的注意力。

图 4. 协同注意力在三个示例上的可视化。每个示例由四部分组成:(1)图像和视觉注意力;(2)真实标签,预测标签以及预测标签上的语义注意力;(3)生成的描述;(4)真实描述。对于语义注意力而言,注意力分数最高的三个标签被突出显示。加下划线的标签是在真实标签中出现的标签。

图4还提供了标签预测的一些定性结果。结果表明,除了与图像相关的标签之外,该模型还产生许多不相关的标签。尽管共同注意机制可以过滤掉很多干扰标签,但不相关的标签仍然会误导模型,产生很多误报。我们相信一个更好的标签预测模块将有助于建模来关注正确的标签,从而帮助提高生成文本的质量。

结语

雷锋网了解到,近年来,人工智能,尤其是深度学习的成熟使得市场上出现了很多AI辅助诊断产品。人类基因组测序技术的革新、生物医学分析技术的进步、以及大数据分析工具的出现,为病人提供更精准、高效、安全的诊断及治疗。虽然,人工智能+影像领域也是参与企业最多,产品最丰富、涉及疾病种类最多的疾病诊断领域。,但是AI也能够参与疾病的筛查和预测、写结构化的病历、在基层担任全科医生助手的角色,AI在减少医生工作时间、提高诊断治疗效率方面起到非常大的作用。

邢波的研究团队认为,他们工作的主要贡献是:提出了一个多任务学习框架,可以同时预测标签和生成文本描述;引入一个用于定位异常区域的共同注意机制,并生成相应的描述;建立一个分层的LSTM来产生长句和段落;进行大量的定性和定量的实验,以显示实验方法的有效性。

雷锋网认为,邢波教授团队的研究成果不是第一家,相信也不会是最后一家。未来,随着产品迭代的不断升级,算法层面的不断打磨,医学影像结构化报告的生成方面的研究,将陆续有其他玩家进入。

雷锋网

深度 | 以太坊“大都会”终极指南:现在正在发生什么?!

雷锋网AI金融评论按:本文转载自token.im,译者为imToken 郭辉。

译者注:随着以太坊第三阶段 Metropolis ("大都会")临近(区块高度 4370000),imToken 用户非常关注此次硬分叉将带来的影响。简短说明一下:imToken 会处理好所有节点升级和硬分叉带来的变化,用户无需任何操作,本次分叉也没有预期会产生新的币种。为让大家更好理解 Metropolis 技术升级的细节,翻译此文,欢迎指正。

作为以太坊的里程碑事件,大都会终于要来到我们身边了。以太坊开发团队计划于9月18日在测试网络上测试"大都会"(Metropolis),测试至少3周时间。如果测试正常,"大都会"将被部署在主网络。所以,升级到"大都会"阶段的最早时间是10月9日(译者注:实际部署时间已经推迟)。所以,问题来了:

  • 什么是"大都会"?

  • "大都会"会给以太网络带来什么新的特性?

  • "大都会"后会分叉产生新的 Ethereum?

  • 以太币的价格会上涨吗?

这些问题在本指南都可以找到答案。

(一)何谓“大都会”之以太坊的四大阶段

这不是以太坊第一次升级,也不会是最后一次。以太坊不仅仅被设计为一种货币模式,更是一个去中心化的应用平台。在最终达到这个目标之前,它需要经历不同的增长阶段,在每一个阶段,以太坊都会引入不同的特性来使得系统变得更加稳定和强大。 以太坊的完整发展路线分为四个阶段,即"前沿"(Frontier)、"家园"(Homestead)、"大都会"(Metropolis)和"宁静"(Serenity)。"大都会"是以太坊发展的四个阶段里面的第三个,随着它的到来,以太坊将会增加许多有趣的特性,下面介绍一些会对以太坊造成重大影响的特性,即:

  • zk-Snarks

  • PoS(Proof of Stake , 即权益证明)早期实施

  • 智能合约的灵活性和稳定性

  • 抽象账户

(二)"大都会"之四大特性

特性1:zk-Snarks

"大都会"最大和最重要的特性就是执行 zk-Snarks,zk-Snarks 全称 Zero-Knowledge Succinct Non-Interactive Argument of Knowledge,即"简明非交互零知识证明"。zk-Snarks基于"零知识证明"(zero knowledge proof,即ZKP)。

何谓"零知识证明"?

"零知识证明"是由 S.Goldwasser、S.Micali 及 C.Rackoff 在 20 世纪 80 年代初提出的。它指的是证明者能够在不向验证者提供任何有用的信息的情况下,使验证者相信某个论断是正确的。"零知识证明"实质上是一种涉及两方或更多方的协议,即两方或更多方完成一项任务所需采取的一系列步骤。证明者向验证者证明并使其相信自己知道或拥有某一消息,但证明过程不能向验证者泄漏任何关于被证明消息的信息。大量事实证明,"零知识证明"在密码学中非常有用。如果能够将"零知识证明"用于验证,将可以有效解决许多问题。 "零知识证明"能够成立必须具备以下三个要素:

  • 完整性:如果声明为真,那么一个诚实的验证者可以被诚实的证明者相信;

  • 可靠性:如果声明为假,不排除有一定概率欺骗者可以说服诚实的验证者它是真的;

  • 零知识:如果声明为真,那么验证者在证明过程中并不知道任何关于声明的消息;

"零知识证明"并不是数学意义上的证明,因为它存在小概率的误差,欺骗者有可能通过虚假陈述骗过证明者。换句话来说,"零知识证明"是概率证明而不是确定性证明。但是也存在有技术能将误差降低到可以忽略的值。 零知识的形式定义必须使用一些计算模型,最常见的是图灵机的计算模型。

下面举两个例子说明零知识证明: 

1)假设有一个房间只能用钥匙打开锁,其他任何方法都打不开。Alice 要向 Bob 证明自己拥有这个房间的钥匙,这时有2个方法: ① Alice 把钥匙出示给 Bob,Bob 用这把钥匙打开该房间的锁,从而证明 Alice 拥有该房间的正确的钥匙。 ② Bob 确定该房间内有某一物体,Alice 用自己拥有的钥匙打开该房间的门,然后把物体拿出来出示给 Bob,从而证明自己确实拥有该房间的钥匙。 

后面的 ② 方法属于零知识证明。好处在于在整个证明的过程中,Bob 始终不能看到钥匙的样子,从而避免了钥匙的泄露。

2)这是一个很经典的例子:有一个缺口的环形长廊 ,出口和入口距离非常近(在目距之内),但走廊中间某处有一道只能用钥匙打开的门,Alice 要向 Bob 证明自己拥有该门的钥匙。采用零知识证明,则 Bob 看着 Alice 从入口进入走廊,然后又从出口走出走廊,这时Bob没有得到任何关于这个钥匙的信息,但是完全可以证明Alice拥有钥匙。 file 上面这两个例子都是零知识证明在现实世界的"运作",那么我们如何通过 ZK-Snarks 实现零知识证明在区块链中的应用呢?

zk-Snarks如何工作?

zk-Snarks由3种算法组成:G、P、V。 

G是一个密钥生成器,需要通过生成随机变量 L(必须保证任何情况下不能泄露)和程序C。然后生成两个公钥——证明公钥 Pk 和验证公钥 Vk ,这两个公钥都是公开的,任何人都可以查 看。 

P是证明者,需要输入三个参数,即证明公钥 Pk、公开的随机输入散列值 x 以及需要证明的隐私声明 w 。P 算法生成证明 prf ,函数表达为:prf = P ( Pk , x , w ) 

V 作为验证者将会返回一个布尔类型的结果,即 true 或者 false 。V 将验证公钥 Vk 、P 中的随机输入散列值 x 以及证明 prf 作为输入参数进行验证,即 V (Vk , x , prf)。如果证明者正确,返回 true ,否则返回 false 。 

由以上G、P、V三者的关系可以看出,随机变量 L 至关重要,必须保密。因为任何人都可以用它来生成假的证明,这些假的证明也能返回 true ,而不管证明者是否拥有隐私声明 w 的知识。 下面让我们继续回到我们的老朋友 Alice 和 Bob 的身上,Alice 是证明者,Bob 是验证者。 

Bob 作为验证者第一件事就是要使用 G 生成证明公钥 Pk 和验证公钥 Vk ,为此他需要生成随机变量 L,正如上面提到的,Bob对 L 必须非常小心,他不能让 Alice 知道 L 的价值以防 Alice制造假的证明。 

既然Bob生成了两个公钥,Alice 需要生成证明 prf 来证明声明的有效性。她将使用证明算法P生成证明,来证明她知道隐私声明 w 的哈希值为 x 。接下来 Alice 将把这些证明参数交给最终运行ZK-Snarks验证算法的 Bob 。Bob 将会使用验证算法 V (Vk , x , prf)来验证结果,如果返回 true ,则 Alice 很真诚,确实知道隐私声明 w 是什么。如果返回 false ,则 Alice 在说谎她知道 w 是什么。

以太坊 & zk-Snarks

以太坊和 Zcash (Zero Cash,完全基于 zk-Snarks 的一种加密货币)正在紧密合作,如果你问我把 zk-Snarks 和区块链结合最紧密的是谁,那毫无疑问是 Zcash 。就个人而言,我已经迫不及待的想看到大都会和 zk-Snarks 的结合了。

特性2:PoS(Proof of Stake,即权益证明)早期实施

这一部分我们将会详细阐述吵得沸沸扬扬的 PoS 协议,并和 PoW (Proof of Work,工作量证明)作比较。

PoS vs PoW

PoW:包括 ETH 和 BTC 在内的绝大多数主流加密货币采用的就是这种协议,PoW 需要矿工(或者节点)不断消耗算力进行哈希计算,以找到期望的随机数,这就意味着系统需要消耗大量的算力和电力。 

PoS:在这个系统里,我们有验证者而不是矿工,它的原理是,作为验证节点,首先你必须拥有一定数量的以太币,根据以太币的数量和时间会产生用于下注验证区块的权益。只有拥有权益的节点才能有效验证区块,当你验证的区块被打包进链,你将获得和你权益成正比的区块奖励。如果你验证恶意或错误的区块,那么你所下注的权益将被扣除。 

为了实施 PoS,以太坊将采用 Casper 的共识算法,一开始,它将是一个 PoW 和 PoS 共存的系统,区块的绝大多数交易还是采用 PoW 协议,每100个区块有一个采用 PoS 协议挖出,这样做的目的就是为在以太坊平台上创建了一个真实的测试环境,但是这种协议究竟能给以太坊带来什么好处呢?让我们慢慢道来:

  • 降低系统的整体能源成本:全世界的比特币矿工每小时耗资约5万美元,一年耗资约4.5亿美元!通过使用 PoS 协议,你可以将整个过程虚拟化,大幅减少成本;

  • 无 ASIC 优势:由于整个过程是虚拟的,它将不再依赖谁有更好的设备或者 ASICs 。

  • 51%攻击变得更困难:PoW 协议存在算力集中问题,51%攻击风险很大,PoS 则让这一攻击变得更加困难;

  • 无恶意验证者:任何验证者都需要将其权益锁定在区块链中,将确保他们不会向链中添加任何恶意或错误的块,因为这意味着所有权益将被扣除;

  • 创建区块:出块和整个进程都会更快(后面会详细介绍);

  • 可拓展性:通过引入“分片”概念,让区块链变得可拓展;

虽然之前有过各种各样的简单的 PoS 协议部署过,但是真正让 Casper 共识算法从中脱颖而出的是它能激励诚实的矿工并且惩罚不诚实的矿工,如果你试图去验证恶意的区块,那不好意思,你所有的权益将被扣除,它会狠狠地惩罚任何不遵守游戏规则的人。

Vitalik 是这样解释的: 

想象现在有 100 个人围着圆桌,其中有一个人拿着很多张纸,每张纸记录着很多笔历史交易信息。第一个人拿起笔签完后递给第二个人,第二个人也做出了相同的选择,如果大多数人做出了相同的选择,即都签署了同一张纸那么每一个参与者会获得1美元,当你做出和绝大多数人不同的选择时,那么你的房子就会着火! 

然后他补充道,这可能是一个比较正确的激励措施去保证大家都能签署正确的纸张!那么:

  • 什么是时间 "难度炸弹"?

  • 如何激励矿工从 PoW 转向 PoS?

矿工花费了大量的金钱购买设备用于挖矿,然而随着 PoS 的到来,大量的设备变得一文不值;想象一下,花费大量金钱搭建的超级复杂的矿池突然变得毫无用处! 

如果真的不能阻止矿工停留在 PoW 上继续挖矿,那将会创建三种以太坊币:ETC、ETH-PoW、ETH-PoS,这对以太坊绝对是个噩梦!因为那不仅会降低以太坊的可信度和经济价值,还会稀释整个系统的哈希值比例,使得它更容易被黑客攻击! 

为了确保以太坊的矿工能加入到新链条中来,开发团队引入了"难度炸弹"机制。"难度炸弹" 是在2015年9月7日推出的,想要了解"难度炸弹"是如何工作的,首先我们需要了解什么是 "难度" 和挖矿。

什么是 "难度" 以及它是如何工作的?

"难度" 这一概念起源于比特币,比特币在最初的时候,由于挖矿的人比较少,挖矿显得比较简单,任何人只要使用他们的电脑都可以从事挖矿活动。随着比特币越来越受欢迎,矿工的数量也越来越多,为了防止过早的把所有的比特币都挖完,中本聪在比特币中一开始就引入了难度系统。 

难度系统的工作原理大致如下:矿工们使用他们的电脑算力进行解密,解密的过程就是随机地往已经进行过哈希运算的区块上添加一个随机字符串(也叫随机数),然后对整个字符串再进行一次哈希运算。如果结果数小于某个特定的数值,则认为解密正确,并且会将这个新的区块添加到链上。然而找到这个随机数通常是及其困难和随机的,这正是挖矿的核心所在。 

这一过程也可以简明扼要的总结如下:

  • 获取新块内容的哈希值

  • 将随机字符串添加到区块上

  • 对新的字符串再次哈希运算

  • 然后将最终的哈希与难度系数进行比较,是否小于等于难度系数。

  • 如果不是,则改变随机数重新进行运算

  • 如果是,则将新的区块添加到链上并对全网进行广播

  • 相应的矿工将获得新区块的奖励

比特币的难度每 2016 个区块调整一次,难度系数与出块的速度成正比,比特币每 10 分钟产生一个新的区块。如果出块时间低于 10 分钟,则难度系数增加;否则难度系数减少,比特币就是通过调整难度系数来保证出块的时间能始终保持在10分钟左右。 

以上就是比特币挖矿的工作机制,以太坊也采用了相同的协议。

那么以太坊的"难度炸弹"又将如何呢?

难度炸弹将会使难度系数呈指数增加以至于让挖矿变得几乎不可能。就像我们之前说的,难度系数会根据出块的速度进行调整,以太坊的难度调整算法如下:

block_diff = parent_diff + parent_diff // 2048 * max(1 – (block_timestamp – parent_timestamp) // 10, -99) + int(2**((block.number // 100000) – 2))

(In here “//” is the division operator such that 6//2 = 3 and 9//2 = 4.)

下面让我们用更直白的方式来讲清楚上面两行代码的意思:

block_timestamp: 最新一个区块出块时刻;

parent_timestamp:上一个区块出块时刻;

如果  (block_timestamp – parent_timestamp) < 10秒,那么难度系数会增加 parent_diff // 2048 * 1

如果 (block_timestamp – parent_timestamp)在10-19秒之间,则难度系数保持不变。

如果  (block_timestamp – parent_timestamp)> 20 秒,则将parent_diff // 2048 * -1的难度降低到最大值parent_diff // 2048 * -99。

这就是以太坊在"家园"(Homestead)阶段的难度调整算法,它最终的结果就是使出块时间始终稳定在15秒。而"难度炸弹"在于它会使难度系数呈指数增加,从而出块的时间也会显著增加,直到最后几乎挖不出区块,我们把这一状态称为“以太坊冰河期”(Ethereum Ice Age),到那时,矿工除了转向新的PoS协议将别无选择。

难度炸弹会在“大都会”时期引爆吗?

难度炸弹原本计划在2017年年底引爆,现在看来似乎比原计划推迟了一年半,然而,随着大都会的到来,开发团队将通过其它两个措施使其平稳过渡到 PoS。即:

部署之前提到的 Casper 算法,每 100 个区块将有一个采用 PoS 协议挖出

每个区块的奖励由之前的 5 个 ETH 减少为3个

所有的这些措施都是为了在以太坊的最后一个阶段"宁静"(Serenity)到来之前所有的节点都能部署好 PoS 协议并且消除之前遇到的问题。

特性3:智能合约的灵活性和稳定性

可以毫不夸张地说,智能合约就是以太坊的命脉。 智能合约是如何在以太坊中被执行的呢?可以用一个简单的例子来说明,假设 Alice 和 Bob 在没有任何第三方干预的情况下完成某个交易或功能,Alice 要 Bob 完成一个任务,Bob 收取一个 ETH ,Alice 将一个 ETH 放在盒子里,如果Bob 执行任务,那么盒子里的 1 个 ETH 会自动到 Bob 的账户,否则,那 1 个 ETH 自动返回到Alice的账户。在这个例子中,盒子就像智能合约,虽然这个例子比较粗略,但它仍然能帮你了解智能合约是如何工作的。 那么以太坊给智能合约带来了什么创新能使它变得更好呢?

智能合约如何在以太坊中发挥作用?

假设 Alice 让 Bob 执行一个智能合约,该合约中的每个功能需要 Bob 使用某些计算能力。这种计算能力被称为 gas ,支付这种算力的钱叫做 ETH 。通常比特币中为所有的交易支付相同的费用,但以太坊能为每个智能合约设置所花费的算力(即 gas )。每个智能合约都有自己 gas 的限制值,这个限制值由合约创建者设置,显然,这会导致两种情况发生:

所需要的 gas 大于限制值:如果是这种情况,合约执行状态将会回滚到之前的状态,同时 gas 将会全部消耗掉。

所需要的 gas 小于限制值:如果是这种情况,合约成功执行,同时剩余 gas 将会返回给合约创建者。

如果有人想在合约执行期间返回到较早的状态,需要手动触发异常。例如,如果有人想阻止某笔交易,那么他为此不得不付出双倍代价。为了将合约回滚到之前的状态,开发人员可以使用 "throw" 功能,虽然 "throw" 功能确实有助于合约状态回滚,但同时也会耗尽合约中所有的 gas 。 为了解决这个问题,"大都会" 正在加强 "revert" 功能,它能使合约恢复到之前的状态而不用耗光所有的 gas ,合约中未使用的 gas 将会退还给合约创建者。伴随着 "revert" 功能,"大都会" 正在通过引入 "returndata" 指令让合约能恢复到一个任意可变大小 gas 的状态。

特性4:抽象账户

在我们正式了解什么是抽象账户之前,让我们首先来了解一下什么是"抽象"。"抽象"的意思是任何人都可以使用某个系统或者协议而不必完全了解它内部或外部的技术细节。例如当你使用你的 iPhone 时,你不需要是一名程序员或者工程师,你只需要按压或者滑动屏幕就能使用 APP 或者打电话。你也不需要知道这些 APP 是如何激活 iPhone 内部的电路的。总而言之,"抽象"能够极大降低普通民众使用复杂技术的门槛。正因为如此,"抽象"才成为以太坊未来要实现的一部分,想象一下,在一个去中心化的未来,每一个人都在使用 DApps,他们甚至察觉不到这些 DApps 是基于以太坊的,"大都会" 正在通过引入 "抽象账户" 向实现这一宏伟目标迈出了重要的一步。 

众所周知,现在的以太坊有两类账户,即外部账户和合约账户。外部账户由私钥控制,合约账户由创建者编写的代码控制。以太坊正在试图模糊二者的界限,即你可以同时拥有合约账户和外部账户,这种做法本质上就是让用户按照合约账户的格式来定义外部账户。一旦这样做,代码支持密钥将用户特殊的标识加入到交易中,可是这又有什么用呢?因为你可能会说随着量子计算机的发展,它会让加密货币变得不那么安全,假设你想保存一笔被量子计算机攻击过的交易,那又该怎么办呢?随着"抽象账户"的实施,你可以使用签名机制就像哈希梯子一样来定义你的账户,这样你的账户就会具备量子级别的安全性,同时你的账户也会完全变成可定制化, 就像智能合约一样。

(三)"大都会"之番外篇

什么是"拜占庭"和"君士坦丁堡"?

熟悉以太坊的朋友对"拜占庭"和"君士坦丁堡"应该都不会陌生,那么这两个术语究竟是什么意思呢?"大都会"为以太坊带来了大量重要的特性,不可能一次性引入这么多特性,毕竟开发人员精力也有限,这就是为什么以太坊要通过两个阶段发布"大都会"并且这两个阶段都会硬分叉,而这两个阶段就是"拜占庭"和"君士坦丁堡"。 经过几次推迟以后,"拜占庭"将在第4370000区块左右硬分叉。 "拜占庭"将会引入大量新特性,主要包括前面讲的:

  • zk-Snarks

  • "revert"功能和"returndata"指令

  • 抽象账户

"君士坦丁堡"具体什么时候部署还不太清楚,但是应该会在 2018 年部署。它主要的特性就是平滑处理掉所有由于"拜占庭"所引发的问题,并引入 PoW 和 PoS 的混合链模式。

以太坊将会再次硬分叉?会产生第三种以太币吗?

由于之前发生的 ETH-ETC、BTC-BCC 硬分叉,人们开始想当然的认为所有的硬分叉都必然会导致链条分裂,事实上根本不是这样。 之前硬分叉导致链条分裂的主要原因是提出的修改方案在社区有很大的争议,不是所有人都同意。然而,"大都会"的这次升级已经在社区一致同意过了,大家都知道这终将到来,这次硬分叉是升级的结果,不是紧急情况下的临时处理办法。这就是为什么不会有任何社区分裂,不会有新的以太币。可能存在的争论焦点就是 PoS 的实施,当然,争论也没用,矿工不会因为留在旧链上而获得更多的收益,相反,就像前面所说的那样,"难度炸弹"的引爆将会使挖矿变得几乎不太可能。

以太坊"大都会"结论:现在正在发生什么?

那么以太币的价格会上涨吗?我们不知道,我们不是投资顾问,投资任何一个虚拟货币之前,你都需要自己去做一定的研究。拜占庭给以太坊带来如此多的改变,很兴奋它最终会变成怎样。zk-Snarks 的执行也是一项勇敢的改变。当然,"君士坦丁堡"和它的 PoS 将会成为密码世界里每个人都会关注的事情。即将到来的一年在以太坊去中心化的道路上绝对是革命性的!

雷锋网

深度 | 追求0.01%突破 vs 看重临床效果,AI公司与医生合作的“利益点”在哪里?

一个月的时间里,AI医疗影像圈内两个“世界冠军”相继诞生。

7月14日,阿里云ET以89.7%平均召回率打破国际权威肺结节检测大赛LUNA16记录,得世界冠军;8月7日,科大讯飞的重磅喜讯又铺天盖地传来,以92.3%的平均召回率获得LUNA评测第一名,再次刷新世界记录。

LUNA,全称为LUng Nodule Analysis,是肺结节检测领域权威的国际评测,随着国内AI公司蜂拥进入智能肺结节筛查领域,这项评测也成为各大公司算法实力近身肉搏的场合。“这个比赛和高考成绩一样,不能作为一个系统整体水平和应用能力的唯一标准,但是在缺乏更有效的综合评估标准(像himss的电子病历应用评级水平)之前,可以作为一个核心客观评价指标来看。就像高考成绩高的不一定能力强,但是至少有了学习能力的初步评价参考。”科大讯飞医疗影像负责人马文君称。

但细细斟酌,会发现一个问题:算法能力的提升是IT界追求的进步,当AI进军传统的医疗行业,这0.01%级别的提升是否还是值得道贺的突破?

“我根本不关注公司的这些算法,我关注的临床效果。”一位影像科主任告诉雷锋网。一个是日新月异的IT界,一个是传统保守得近乎偏执的医疗界,当AI医疗潮水兴起,什么是两者结合的“点”?

AI医疗:不能当饭吃,还不能打酱油,只是调味品

当下,AI公司与医院以科研合作的形式共同开发AI产品是通用的打法。

所谓“科研合作”,科大讯飞马文君告诉雷锋网,“公司与医院合作之初就签订了合作协议,产品和未来市场是公司的,医院拥有使用权、论文发表等学术上的成就,另外双方共同研究,共同拥有知识产权。”

除此之外,更多是基于发展阶段的定义。

早在2016年,科大讯飞便与安徽省立医院合作,共建医学人工智能联合实验室,探索AI技术在医学领域的应用。马文君表示,AI技术在医疗领域的应用是从2014年或2015年开始的,AI界关注的东西与临床有一定差距,业内都在和医院进行一些科研合作,这是必然的。同时,科研合作不仅是企业和医院之间,还包括企业和企业之间、软件和硬件之间、软件和软件之间、企业和大学之间、大学和大学之间等的交叉合作。

朗通医疗是一家专注于打造智能辅助诊断系统的公司,以全科医学为核心,辅助各个专科临床诊断。此前,公司与浙江大学邵逸夫医院、浙江大学申报成立了一个省级重点实验室——浙江省精准医疗中心,探索智能辅助诊断系统的落地应用。对此,朗通医疗徐哲说道,“我认为一家公司做AI还很难实现的,因为医生是最终使用者,打造过程需要把医生体验和他们的临床思维放进去,如果没有的话,这个系统是失败的。”“要真正有用的系统,而非科研的,就需要找医院,即所谓的产学研合作。”

初创公司宜远智能在这条路上甚至走得更远,“本质上,我们就是画一个圆,团结一切可以团结的力量,与不同医院(医生)进行科研合作。”宜远智能成立于2017年4月,目前与南方医科大、港大医院等多家医院展开科研合作,公司CEO吴博称,先与医生开展科研合作,或者以医学切入进来,是现阶段必须做的,能实打实给医疗行业带来改变,该走的路必须走。

中国科学院自动化研究所研究员田捷表示,如今AI医疗虽然很火,但AI在医学上的应用毕竟处于探索阶段,很难取得效益。这时候,如果AI公司把AI公司把前景看得太好或想借此盈利很难,因为辅助诊断的法律法规和标准还不太清楚,所以这需要长时间的培育和足够的资金支撑其从科研到产品的转换,同时转换时间可能比较长。

“科研作为切入点,两者合作,对于产品成熟也更加有效,如同互联网刚起来时一样,我觉得马云说得很有道理,不能当饭吃,还不能打酱油,只是调味品,如果公司抱有很大盈利希望的话,很难与医院长期合作,不利于真正有效的产品培育和发展。”他告诉雷锋网。

AI公司与医生之间如何求同存异?

世界一定属于少数人,我希望找到真正优秀、聪明的团队跟我一起做这件事。


谁愿意提供给我一台数字病理切片扫描仪,我就愿意提供切片和专业知识配合AI分析。


我本身有清洗后的医疗数据和数据人才,要让我拿数据出来,AI公司能提供我什么?工资吗?至少是我现在工资的双倍我才可能考虑,但一个创业公司又负担不了这个。


……

在问起“想与什么样的AI公司合作?目的是什么?”时,每位医生各执己见,更多是基于自身的情况做出的回答。但若问AI公司相同的问题,答案可能是大同小异:做出牛逼的产品,然后卖出去。

医生与AI公司诉求不同,如何求同存异,一起做事呢?

求同:找契合点

朗通医疗徐哲称,医院希望借由深度学习、精准医疗等项目提升医院的形象;卫生局希望与AI公司合作,未来能真正提升医生的能力;具体到医生,他们的诉求就是做课题、发文章,对职称有帮助,这需要高质量、有价值的数据,“这时,AI公司与医生之间就有了契合点。”一个AI产品的开发少不了的也是高质量、有价值的结构化数据。

“医生并不关系你用了哪个系统,更希望了解系统结构化后的数据,对他的课题有什么价值。”“有的医生跟我们说,‘你们的数据太棒了,以后发表文章,就要把你的数据拿来用’”

除此之外,据徐哲介绍,有的医生并不以课题为目的,而更在意临床效果的提升。“在急诊科,智能辅助系统对防止误诊漏诊的作用很大,医生非常愿意把他们的临床经验灌输进去。”

对此,科大讯飞马文君深表赞同,“医生分为两类:学术型医生和临床类医生,前者对论文有强需求;后者不关注论文,真正的临床疗效、应用验证是强需求。”“发论文和赚钱都是功利,还有很多大专家有更高的追求。”

据马文君介绍,随着肺结节智能筛查的流行,让原先难以操作的一些科研项目变得容易起来,这些大都是IT专家一直不太关注的问题,“机器学习只关注召回率、假阳性多少,而医生关注更多指标,假阴性率、假阳性率等。”

拿肺结节漏诊率为例,在此之前很难统计,需要统计经过病理诊断金标准后确诊为肺癌的肺结节患者的历史病例,才能确定其漏诊,在医疗界没有公认的数值。而如今在SaaS区域平台上,有更客观的样本,可以进行大规模分析统计其漏诊率。除此之外,还涌现出一些新兴的研究方向,比如肺癌预测、区域流行病学分析等。

存异:可以协调

“AI公司是需要收入的,课题意义不大,企业都养不活,要课题干嘛。”徐哲的这番话反映了AI公司与医院的根本分歧,前者为了钱,后者不能碰钱,该怎么好好做朋友?

徐哲称,这也是可协调的,办法就是“都做一点”。

据他介绍,其智能辅助系统能提升基础医院的能力,“国家卫计委已经发了文,专门对此进行研究。”“卫计委和扶贫办已经跟我们签了协议,如果能成功的话,可能获得1200~2000万的项目基金。”

而对于科大讯飞这样的巨擘来说,钱的问题就没那么迫切。据马文君介绍,在双方的合作中,公司负担研发项目、购买设备,医院投入医疗设备、专家、数据等。“我们也不是完全没有收入,我们会申请一些科研扶持项目、基金项目。”

对此,田捷博士表示,做医疗的AI公司,应做好打长期持久战的准备,这个行业需要培育过程,待相关法规和标准逐渐成熟,才能逐渐取得效益。“但短期来说很难实现,所以这是持久战。”

智能医疗创业中,谁是主导?

“谨慎欢迎。”

这句精准的描述与三甲医院信息中心主任悟空(网名)的背景很契合,在雷锋网问起医生对于AI的态度时,他如是回答。“大多数医生对AI还不是很了解,因为工作很忙,忙着看病了。”

华山医院病理科医生祝迎锋也现身说法,他表示,“目前我们都处于观望状态,这种项目太费精力了。医生通常没有这么多时间来做这样的事情。”

南方医科大学副教授刘再毅告诉雷锋网,“我不是创业,我是从研究角度看,临床问题比什么都关键,算法有多好不重要,重点在于临床设计。”“很多公司都在比拼算法,我觉得这也很好,但是你有没有一个实际的原创目的?我为什么要用这样的算法?实际上我们有些时候,也不需要很炫的算法,如果我用常规的方法都能够解决这个问题,算法是不重要的。”

现阶段,他们或其所在的单位都没有参与AI医疗项目中,都处于“谨慎欢迎”的状态,这取决于“跟AI公司合作能不能得到我想要的东西”。

据悟空介绍,其所在医院与AI公司的合作持欢迎态度,除考虑联合科研能减轻医生的工作强度外,医院早期参与,能避免AI公司走弯路。“比如肺结节早期筛查对于有经验的医生来说意义不大,他们更关注诊断完后,临床治疗环节。”而如果真正与AI公司合作,更希望大学牵头。“他们有一定的科研经费,还有资源能用,对于机器学习来说,单个医院的数据量不够,每个医院的治疗方案也不太一样,如果大学牵头搞区域性的,样本量大,广泛程度好。”但医院并不会主动牵头做这样的事情,“医院时间主要用在治病和医疗管理,很少主动做,除非有国家的科研项目。”

而在方向选择上,更希望打造智能辅助诊疗系统,能解决基层很多问题,推动分级诊疗,“让基层知道某个病发展到什么程度基层可以搞定;什么程度需要大医院专家干预。”“我对商业不了解,不知道推广价值怎么样,但对于基层医生诊疗水平的提升,对于分级诊疗的推广是有帮助的。”

对此,田捷博士表示,医院与AI团队的合作时,医生更关注工科团队是否理解其需求,“工科做了所有的事情,对临床的事情不太了解,往往成了盲人摸象。”因为,他认为AI公司与医院合作过程中比较重要的问题是AI团队与医院的沟通,关键在于能不能解决临床需求。AI团队对医疗的医疗需求有基本了解,甚至团队中有医疗背景的人,同时医院也招一些工科背景的人,人员上有一些交叉的话,往往会事半功倍,取得更好效果。“所以我觉得合作的关键在于沟通上,沟通的质量决定合作的成败。”

这让雷锋网想起一个类似的问题:医疗机器人的创业中,医生与技术人员谁是主导?对此,加拿大斯喀彻温大学机械工程系高级工程设计工程实验室主任、加拿大工程院院士Chris  Zhang认为,“医疗机器人行业初期创业时,医生是主导,技术人员是就提出问题来思考,相对被动。”初期创新是发散的,所有的问题来自于医学和医学专家,但是如果有了突破而要创办一个公司时,就应该以企业为核心,去市场分析、包括难点、成本等。

雷锋网

深度 | 没有了手机的诺基亚,现在过得怎么样?

雷锋网按:十几年前,从芬兰走向世界的诺基亚让手机得以普及,但在接下来的时间里,这家曾经爱冒险的公司错过了智能手机的时代,最终落得变卖手机业务的下场。如今的诺基亚手机,已经不再属于诺基亚这家公司。而转向通信设备市场的诺基亚,顽强地度过了寒冬,准备拥抱5G的春天。

没有诺基亚手机的诺基亚,现在怎样了,5G对它有多重要?彭博周刊为我们做了详细报道,雷锋网对原文编译如下。

原文作者体验诺基亚低时延蜂窝设备支持的VR演示

这个芬兰巨头错过了智能手机革命,现在它想拥抱无人驾驶和远程医疗。

诺基亚在通信技术业务中已经神奇地打拼了半个世纪。之所以说神奇,是因为这家公司的最原始的“通讯技术”是纸浆。此外,请读者们注意,“诺基亚集团”目前还在营业。

对于一听到诺基亚就怀旧地想起手机的人来说,可能并不知道诺基亚是靠纸浆起家的。这个科技巨头当了14年世界最大的手机制造商,与此同时,它也是芬兰经济的主要引擎。然而,风光很快就消失了。2012年,它损失了40亿美元。2013年,它的手机业务以及32000名员工都转让给了微软。公司董事长Risto Siilasmaa对此宣布:“很明显,诺基亚没有足够的资金可以投入到加速移动电话和智能设备中。”

诺基亚虽然减小了规模,但仍然是一家大公司,其去年的净销售额达261亿美元。但比起全盛时期,诺基亚已经变了,那时候它简单、耐用、可爱的大块头电话非常受欢迎。总的来说,它的售对象不再是普通消费者了。今天,我们熟悉的大写NOKIA标志,主要出现在网络处理器、路由器、基站无线电接入元件,以及消费者基本接触不到的,移动互联网基础设施的其他组件上。

诺基亚的冒险的精神

满足世界不断增长的数据需求,是诺基亚必须解决的非常复杂的问题。面对爱立信和华为等竞争对手,诺基亚已经重新发明了带有复杂软件的信号塔,旨在收集在全球移动的个人用户的大量信息。

随着通信行业开始推出下一代无线网络,未来两年将成为诺基亚特别重要的两年。所谓的5G将带来更快和更丰富的数据。根据诺基亚及其竞争对手(底层设备的开发商),这些变化将使全新的移动技术成为可能,包括无人驾驶、远程医疗、更全面自动化的工作场所,以及我们尚未想到的其他变化。

诺基亚CEO Rajeev Suri说:“诺基亚想成为一家帮助大型企业实现数字化的公司。”撤离手机业务之后,该公司在5G方面下了大注,如果失败了,它将要再一次从根本上改变自己。

诺基亚的历史比芬兰还长。在当时俄罗斯大公国的西南部,坦佩雷镇附近,诺基亚从一个建于1865年的磨木浆厂起步。虽然芬兰在1917年获得独立,但这一北欧国家的经济仍然处于俄罗斯的阴影下。芬兰在第二次世界大战期间与纳粹德国联合对抗苏联,战争结束之后不得不向斯大林的苏联政府支付巨额的战争赔偿。芬兰人会告诉你,只有他们国家支付了全部的总额,即3亿美元(是1938年的3亿美元)。斯大林对卡车和火车的需求,让让芬兰从一个农业国家变成为一个工业国家。

诺基亚恰好赶上了这个时机。到20世纪初,公司业务已经涉足发电、布线、电话线、橡胶轮胎和靴子制造。到上世纪下半叶,它已成为一个生产从电视到防毒面具的集团公司。在20世纪60年代初,诺基亚开始生产警用和军事无线电设备。在1982年,它发明了一个车用电话,并通过用于通话的数字交换机,开展了网络业务。在20世纪80年代后期,诺基亚投入了更多资源到蓬勃发展的手机业务中。

诺基亚的成功,可以追溯到负责当时北欧移动电话系统(Nordic Mobile Telephone system, NMT)的一部分开发。北欧各国政府机构负责协调合作,设计了一个即使公民到了临近国家,也能使用的公共通信平台。这是一个模拟系统,还不是数字的,但它能够解决定位移动用户的问题,以及将用户的通信从一个信号塔转到下一个的问题。从那时起,包括5G的每一代都是NMT的后代。

起初,摩托罗拉主宰了这个新兴的全球产业,但是诺基亚在1999年超越了他们。部分原因是诺基亚转向了更快更安全的数字系统,而摩托罗拉则坚持使用模拟信号。可以说,几十年来诺基亚一直都有冒险的精神。当它在90年代初将精力集中于移动电话时,很多人都认为诺基亚失去了理智,因为当时它还是个电缆制造商。当在九十年代中期决定从模拟信号转为数字信号时,很多人都认为诺基亚求胜过于心切。

诺基亚对芬兰经济和国家精神的价值,怎么说都不算夸张。由于苏联是芬兰最大的贸易伙伴,苏联解体成了芬兰经济陷入萧条一部分原因。但是诺基亚的崛起挽救了芬兰。根据赫尔辛基智库ETLA的研究,2000年,芬兰GDP的三分之一是诺基亚贡献的。为支持芬兰的高福利政策和全球一流的教育,诺基亚和它的大量本地零部件供应商贡献了大量税收。芬兰全国研发资金的近三分之一,不论是公共的还是私人的,都是诺基亚贡献的。

诺基亚总部

但是,迅速看到数字网络利好的诺基亚,对智能手机的前景反应太慢了。iPhone等所用的触摸屏成本高,于是诺基亚选择做更便宜的触摸屏甚至沿用物理键盘。即使在芬兰,也有人抱怨诺基亚的触摸屏不花大力气都按不动。他们复杂的菜单根本无法与简约的iPhone交互模式相比,更别提之后的应用程序了。苹果、三星和LG等将诺基亚甩在了背后。

诺基亚的麻烦也是芬兰的麻烦。诺基亚是芬兰最大的公司,也是芬兰主要的经济依靠。它的萎缩让一个已经在劳动成本和公共支出都十分高昂的经济体雪上加霜。作为欧元区的一分子,芬兰也无法通过让货币贬值来刺激消费。这个国家的经济陷入了很长的一段停滞时期,现在才开始复苏。

Siilasmaa回忆起在2012年被任命为诺基亚董事会主席时说:“在许多方面,我们都处于非常困难的时期。”

Siilasmaa是芬兰本地网络安全公司F-Secure的创始人。他刚到诺基亚时,公司正风雨飘摇。2012年第二季度设备销售额比上一年下降了26%,只有45亿美元。“员工因为坏消息变得消极,媒体还在猜测我们什么时候破产,而不是会不会。”Siilasmaa主导了将诺基亚手机业务出售给为手机提供操作系统的微软。曾在微软工作的时任诺基亚CEO Stephen Elop,又回到了微软,继续手机业务,Siilasmaa则临时担任诺基亚CEO。

现在使用的诺基亚基站

这笔交易对芬兰来说是一个小打击,但这也是扭转糟糕和快速恶化局势的最好办法。此举让诺基亚专注于销售设备给无线网络服务商。此前,Suri已经与西门子公司合资经营该业务。自从2009年采取控制措施以来,他通过降低成本,把重心放在美国、日本、韩国等更富裕的市场上,让诺基亚扭亏为盈,达到12%的营业利润率。

到2013年中期,诺基亚已经购买了西门子所有的股份。Suri说:“个人设备业务出售后,网络业务成了新诺基亚的核心。”Siilasmaa透露,当时董事会还在衡量是否要购买法国竞争对手阿尔卡特朗讯公司一部分股份。去年,诺基亚已经完全收购了该公司。

不过,诺基亚手机尚未完全消失。去年,微软将他们也搞不定的诺基亚手机业务,卖给了富士康的子公司。富士康与芬兰公司HMD Global Oy合作,正在开发一系列从入门到中等的诺基亚手机和平板电脑。今年年初,运行Android系统的第一款诺基亚手机开始发货。这对诺基亚的实际好处是,它持有手机相关的知识产权,这已无疑能带来相当可观的收入,但也避免不了一些摩擦。诺基亚与苹果多次因这些专利发生冲突,五月才刚结束完一起。这两家公司还宣布,诺基亚将向苹果提供网络服务,而苹果App Store也会支持一些诺基亚产品。

做好准备,等待前程

然而,诺基亚的大部分收入来自无线通信设备的销售。顾客有:Verizon,AT&T,T-Mobile,韩国电信,德国电信等无线服务提供商。诺基亚销售的产品,包括这些网络提供商连接客户所需的一切:无线电发射器、交换机、服务器、天线和协调设备的软件。诺基亚建设好网络、测试通过后收取费用,有时甚至还负责运行这些设备。收购了阿尔卡特朗讯后,诺基亚还销售一些有限电视公司用来将数据带入家庭的、所谓的固定系统。

虽然移动服务提供商必须不断更换和更新部分基础设施,但真正的商机出现在每个人愿意升级到最新一代网络平台的时候。每一“代”通信技术,是在一系列国际会议上提出的一系列技术要求,以确保所有设备,包括服务器、交换机、发射机和电话,都可以通信。

预计在一年内,5G所需的要求可以敲定。5G将在下载速度、可靠性、任何区域可支持的设备数量,以及延迟方面有显着改进。Verizon、AT&T和T-Mobile都在美国各大城市进行了试验。韩国电信承诺在明年二月份举办冬奥会之前,让5G系统落地。

普遍的共识是,5G的障碍是可以解决的。据诺基亚研发部门主管Lauri Oksanen介绍,“真正的瓶颈在空中,如何保证天线和手机之间的通信。”他的研究人员正在开展一些相互关联的技术修补,以解决这种问题。解决方案的一部分,是将信号调到未使用过的更高的频率。诺基亚及其竞争对手正在设计天线,让信号以微波和红外波之间的频率传输,这段频率远高于当今大多数手机使用的频率。

但这也带来了一些问题:频率越高,波长越短,于是这些所谓的毫米波不能穿过墙壁,树木或人。Oksanen说,甚至天线上的塑料壳也可能阻碍信号。这意味着网络服务提供商将不得不在四处设置小天线,例如灯柱和屋顶,以及建筑内部。这个过程将需要与业主商谈,所有这些,都不是阻碍5G普及的技术障碍。

Oksanen团队的关键,将是把此前普通的金属天线,制造成智能、更高效的天线。诺基亚产品的性能,也越来越依赖于能灵活选择路线传输信息和数据的软件。满足5G要求,意味着诺基亚需要改变他们已使用的技术。MIMO(multiple input multiple output,即多输入多输出技术)就是这些技术之一。该技术包括排列大量非常小的天线,使用软件进行协调,令数据的传输能更快也更可靠。

另一种技术,波束形成(beam-forming),就是像聚光灯一样将蜂窝信号聚集起来,甚至可以追踪单个用户,而不是全方位发射信号。这种技术通过操纵从不同天线元件传输来的实时信号来实现。“将信号传输到天线时,可以稍微更改每个信号的相位。从而在没有任何物理实体改变方向的情况下,就可以通过天线之间信号的相位差,来转动无线电波束的方向。”Oksanen举起手来模拟天线阵列,解释道,“我在想如何能解释德更形象些,但可能你还是只能听我来说。”

不放弃消费业务

消费者是否能够注意到诺基亚及其竞争对手所承诺的改进,目前还不清楚。今年春天,巴塞罗那(MWC)世界移动大会的议题是:5G是真正的革命,还是纯属营销炒作。Suri对外界的怀疑表示理解。对于典型的iPhone或Android用户,4G已经够快了。“今天我们的时延是50毫秒。如果它变成1毫秒,行,三秒钟可以下载一部电影,那很好,可是我不认为我们愿意为此掏钱。”

他认为,5G的真正可能用途在其他地方:将时延下降到1毫秒可以更好地协调无人驾驶汽车和卡车;工厂机器人可以摆脱复杂的布线,流水线会更加流畅;家庭网络可以连接到无线互联网,使得家庭网络不再被有限电视供应商垄断;甚至有人提到可以进行机器人远程手术。

但据一些分析师的说法,这样的用途令人着迷,但问题在于,它们不仅仅还只是猜想,而是即使它们成为现实,也不需要跳跃到5G,不需要诺基亚的网络升级。Gartner研究院的总监Bill Ray说:“虽然说,只有当你开始做了,事情才会慢慢发展,但在未知面前表现的有先见之明固然感觉良好,这也需要无线设备公司成百上千万美元的投资。”诺基亚及其竞争对手所谈及的5G应用,他说,全部都可以在现有的无线网络或Wi-Fi上实现。

当然,之前的每一代网络都面临过类似的嘲讽。但是诺基亚的领导层坚信,人们对更快、更丰富、更无处不在的无线数据的需求将会持续增长。诺基亚也需要这种增长。即使在收购了阿尔卡特朗讯之后,网络设备销售上,诺基亚仍然还在华为之后。而近年来,由于运营商在向5G过渡,减少了原来设备的采购,诺基亚的业务也随之放缓。

该公司也试图回到电子消费业务。去年,它购买了一家名为“Withings”的法国公司,它主要制造时尚的健身追踪器、温度计和婴儿监视器。现在他们的名字都归为诺基亚品牌旗下。

诺基亚还刚刚开始销售一款名为Ozo的40000美元的虚拟现实相机,目标群体是专业影视制作人员。VR是一种可以推动大多数用户放弃4G的技术,因为它需要很快的数据传输速度和非常低的时延,以保持用户的沉浸式体验,避免用户感到恶心。

如果诺基亚不断增长的多种工具和玩具能增加用户对数据的更大需求,这对5G的建设者来说是非有利的。如果诺基亚能再一次够创造出普通人想要购买的产品,或许一切都会更好。

via bloomberg 雷锋网编译

雷锋网

深度 | 宣称专注做技术的蚂蚁金服,到底为保险公司输送了哪些“弹药”?

6月27日,《麻省理工科技评论》2017 年度全球 50 大最聪明公司榜单发布,蚂蚁金服作为唯一一家金融科技公司位列49,排在拥有1700名AI专职员工的百度之前。上榜评论为:探索使用AI进行信贷业务,以及通过区块链提高安全性。

说起金融科技,大家会很容易联想到Fintech这个词,但蚂蚁金服CEO井贤栋曾表示,尽管Fintech已经变成一个热门词汇,但我们更愿意用“Techfin”而不是“Fintech”来定义自己。他说:“这不是玩概念,而是从根本上的理念的不同。金融的核心是管理风险,“Techfin”是用技术,数据能力去助力金融,去服务那些普通消费者、普通商户,去提升金融机构的风险管理能力,帮助他们全面升级。

蚂蚁金服保险事业群总裁:尹铭

6月27日的几乎同一时间,蚂蚁金服在北京面向保险行业发布了一款重磅的人工智能产品——“定损宝”。雷锋网对此产品和发布会进行了详细的报道,该产品用 AI 模拟车险定损环节中的定损员作业流程,这也是图像定损技术首次在车险领域实现商业应用。

其实,蚂蚁金服在保险方面战略定位的达成也是一波三折,今年5月,在给员工的内部信中,蚂蚁金服保险事业群总裁尹铭梳理了他赴任蚂蚁至今的完整心路历程:从希望帮保险公司卖保险,到研究保险买卖两难中的沟壑,再到清晰指出蚂蚁金服保险平台今后只做一件事:专心做好技术。

那么宣称专注做tech的蚂蚁金服,到底为保险公司输送了哪些“弹药”呢?今天雷锋网就为大家盘点一二。

基本情况

据雷锋网了解,蚂蚁金服保险服务平台,在公司内部被称为保险事业群,正式成立于2015年,它的定位是“用技术助力保险机构,以此更好服务个人消费者和中小企业(Tech-Insurance)”。 

一方面,它通过人工智能等技术,支持和助力保险行业实现转型升级。目前已经同80余家保险机构深度合作,合作领域包括:区块链技术精准扶贫、数据共创定价参考系统、图像识别技术提效理赔、数据分析反欺诈打黑产等。

另一方面,通过技术助力保险机构,更好服务个人消费者和小微企业,目前参与合作的保险机构通过蚂蚁金服生态体系内各平台服务消费者3.9亿,其中80后90后占比超过80%。2016年全年线上理赔超过1亿笔,智能客服实现千万人次量级的保险教育、为新兴共享经济提供保障、消费保险使中小企业经营成本大幅下降等。

据悉,目前蚂蚁金服保险事业群超过200人的团队中,近70%为技术和数据分析岗位。此外保险数据团队还与蚂蚁金服集团的人工智能、驻美国硅谷数据研究院组成“保险数据科技实验室”,该实验室拥有62项技术专利,汇集蚂蚁金服集团全部技术资源为保险行业服务。

一、区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。是中本聪2008年在比特币白皮书中提出地概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

据维基百科介绍,区块链技术基于去中心化的对等网络,用开源软件把密码学原理、时序数据和共识机制相结合,来保障分布式数据库中各节点的连贯和持续,使信息能即时验证、可追溯、但难以篡改和无法屏蔽,从而创造了一套隐私、高效、安全的共享价值体系。

2016年7月,全球咨询巨头麦肯锡于发布了一份区块链研报,阐述了区块链技术对保险业产生的影响。报告指出当时有20多家区块链创业公司正在专注于研究区块链在保险业的应用。麦肯锡将“最有前途的保险相关用例”分为三类:促进增长、提高效率和通过将关键程序自动化来降低成本,报告称这些都对保险公司有积极的影响。

最后麦肯锡认为区块链技术完全适合保险商进行探索。但是这种技术的推广还有很长一段时间要走,因为区块链是一种分布式系统,它的价值主要取决于与竞争对手、供应商或其他人的合作。

2016年年底,区块链的创新和试验应用被列为「十三五」国家信息化规划的重点。

同年,蚂蚁携手图灵奖唯一华人获得者,清华大学交叉信息研究院院长姚期智,成立数字金融科技实验室,双方在区块链技术、人工智能、智能投顾等领域开展研究。

对于蚂蚁金服而言,有一个区块链应用于公益保险的经典案例:

100元现金捐赠,只能解决贫困家庭几周之需,但100元保险,则可让贫困家庭患难时具备一定经济保障,甚至获得“救命钱”。

2016年7月,苏北贫困县泗洪县政府尝试联合中国人寿、人保公司和蚂蚁金服共同尝试“互联网+保险”精准扶贫计划。为低收入户投保综合型保险,人均保费100元,保障范围涉及疾病、意外伤害、家庭财产和教育。

保费由当地政府和蚂蚁金服公益平台联合筹措,赔付、查询都可在支付宝APP中完成。这样的尝试,提高了扶贫效率,也促进了扶贫行为从粗放向精准转型。截至2017年6月20日,共2224人次获得理赔,理赔总计近759万元。

该平台引入区块链技术,捐赠者可实时查看到捐款金额、理赔额度、运营开销等全部流程数据,而捐赠保险获得者可查询保险保障范围、理赔进度。区块链技术应用在保险扶贫领域,让捐赠更透明,让公益更高效。

该模式很快得到复制。2017年1月,蚂蚁金服上线“益起保”公益保险服务平台,与公益机构合作,为更多人群筹措保险资金。首个项目与“大病医保”公益基金会合作,为湖南贫困县新晃的4万名儿童募集大病保险费用,每份保额20万元,承保公司为中国人寿。

二、人工智能

2016年3月AlphaGo用几盘棋将人工智能推到了媒体和大众面前,而此时蚂蚁金服的人工智能团队早已有大咖坐镇。

2014年,一位专注于机器学习和人工智能的专家加盟阿里巴巴并组建AI团队,他就是蚂蚁金服副总裁、首席数据科学家漆远。

蚂蚁金服首席数据科学家:漆远

漆远是麻省理工媒体实验室博士,普渡大学计算机系终身教授,担任过机器学习权威杂志Journal of Machine Learning Research的执行编辑和全球机器学习顶级会议ICML的领域主席,获得过微软牛顿研究奖和美国科学基金NSF Career奖。他的专业方向是大规模机器学习和贝叶斯推理。

2017年初,蚂蚁成为美国加州伯克利大学RISE实验室合作伙伴,共同致力于为AI提供安全实时智能决策计算平台的研发。

2017年3月,蚂蚁金服在基础科学上的布局成为阿里巴巴NASA计划的一部分。NASA计划旨在动员全球两万多名科学家和工程师投身新技术战略,面向未来20年组建强大的独立研发部分,建立新的机制体制,为服务20亿人储备核心科技。

不久前的5月27日,素有人工智能教父之称的迈克尔·欧文·乔丹加盟蚂蚁金服的科学智囊团并出任首任主席。乔丹执教于加州大学伯克利分校,是美国科学院、美国工程院、美国艺术与科学院三院院士,是人工智能领域唯一一位获此成就的科学家,也是机器学习领域的开创者之一。他桃李满天下,吴恩达、Yoshua Bengio都是他的得意门生。

全球人工智能教父:迈克尔·欧文·乔丹

目前在蚂蚁金服,AI技术已在广泛应用于智能客服、交易风控、贷款模型、智能投顾、图像定损等场景中。

1、智能客服

人工智能技术有一项重要组成被称之为“对话集成”,主要应用在客服部门实现人机对话。例如每年“双十一”,千亿级别的交易额需要数百万次客服咨询,而智能客服承载了其中95%的咨询量,目前人机对话的水平已经不止于实时高频问题回复、相似问题归集,更多探索语义分析和模拟有思考的人机对话,并已投入保险领域的应用。

2017年4月,支付宝推出线下支付送健康险功能,60岁以下的消费者,每进行一次线下支付,就能领取一份健康险保额,保额可以随着支付笔数不断累加,自己额度积满后还可将额度转赠给他人。到目前,主动领取健康险的用户有3000万。

健康险是有专业理解门槛的金融产品,科普的最好方式,可能是让用户人人可感知、体验并完成实时互动。这些用户绝大部分是90后,产品是最好的教育工具,互联网保险的体验,直接决定年轻一代对保险的感知。

目前,平均每天有4万人通过智能客服人机对话了解保险相关知识,“健康险是什么”“怎么提升保障额度”“健康险可以理赔几次、赔多少”“哪些病赔哪些不赔”为提问率最高的问题。

蚂蚁金服保险事业群产品专家许卫杰称,现在每天都需要向蚂蚁保险数据科学实验室输送用户反馈的保险知识和问答素材,供机器深度学习。他认为,赠送的健康险保额虽然不高,但意义在于让数千万人在短时间内就感知到了健康险。未来,人工智能在分析语音语意、跟用户交互上的作用会越来越大。

2、车险分

2017年5月底,蚂蚁金服保险数据科学实验室发布“车险分”技术。以商业车险改革为契机,蚂蚁金服将海量“从人”信息通过人工智能等技术进行挖掘,对车主进行精准画像和风险分析,量化为300-700不等的分数,分数越高,风险越低,从而来帮助提升保险行业的风险识别能力。这在美国等国际市场是已经成熟的技术。

越注重安全、风险低的车主,可以获得越便宜的车险报价;而越便宜的保费,可以激励车主更关注风险,促进社会更安全。这是金融与好的社会良性互动的目标,但之前,保险行业只有与“车”相关的数据,缺少与“人”相关的数据样本和技术分析,较难精准的实现“千人千面”的精准定价。

互联网时代下,越来越多纬度数据可积累、可分析,这让保险业的风控体系更严密。车险分通过利用大数据、人工智能、数据建模等方面的技术,通过与保险公司数据共创,得出针对每家公司不同用户群的科学定价机制。

2016年的数据显示,全国有1.5亿私家车主,涉及54%的家庭。但作为财险公司的主要业务,去年多数公司并没有从车险赚到钱。公开数据显示,2016年只有14家公司车险承保盈利,41家公司共计亏损63亿元,行业亏损比例达到75%,其中,在定价方面没有优势的中小财险公司亏损尤其严重。

近期保险行业商车二次费改政策,进一步扩大了保险公司可自主定价的浮动范围,车险分为尤其是中小保险公司的定价参考提供了更有效的工具。

人保财险总核保师兼车险部总经理方仲友认为,以前车险的定价较为简单甚至“粗暴”,随着不停的改革和复杂数据计算,车险经营的效率又相对降低,而引入车险分后,车险可达到简单之后的高效状态。他相信未来会有更多公司都使用车险分,不是为了竞争,而是为了是给用户最好的体验。

目前,首批参与车险分合作项目的保险公司有人保产险、太保产险、国寿财险、中华联合、太平产险、大地保险、阳光产险、华安产险、安盛天平车险等9家保险公司。

3、图像识别

技术和数据正在保险的产品开发、销售、承保和理赔等全链路当中有很深的应用。

例如,在与电商消费保险的理赔环节,超过九成是依靠后台技术识别和判定,只有一成的案件需要人工干预。以蚂蚁金服保险平台为例,图片识别技术是核赔流程重要应用之一。

图片识别技术首先会对用户报案图片进行清晰度识别,识别图片中理赔标的物的有效信息并实时做出反馈,例如商品标签代码、货品破损程度等。

更重要的环节是对图片相似度的识别,传统保险领域,企图骗保的人,可能会拿着网上下载的图片,在多家保险公司报案理赔。但在生鲜腐烂、化妆品过敏这些消费保险上,技术可以在一个庞大的图片库中,比对识别出报案人上传的是真实拍摄图片,还是重复使用了别人皮肤过敏的图片,亦或是网上下载了腐烂水果的图片。结合对理赔者信用程度的判断,绝大多数理赔都可以在短时间内在线完成,无需任何人工干预。

4、深度学习

图像定损技术体现在最近发布的车险“定损宝”上,此前雷锋网也有详细报道。

在交通事故发生后,传统的车险理赔流程是:用户打电话给保险公司,后者派查勘员现场查勘并拍照,然后定损员根据照片评估损伤情况及赔偿金额。在这样的流程中,保险公司收到事故照片后,需要核赔,核价,往往最快半小时后才能确定理赔金额。

据蚂蚁金服保险事业群总裁尹铭介绍,“定损宝”所做的工作和上面流程中定损员的工作相同,它应用了深度学习图像识别检测技术,通过部署在云端的算法识别事故照片,与保险公司连接后,在几秒钟之内就能给出准确的定损结果,包括受损部件、维修方案及维修价格。

总结

至此,蚂蚁金服在保险领域的布局战略已经非常清晰,它无意利用支付宝入口的优势对保险公司取而代之。正如尹铭所说,蚂蚁金服保险平台不为卖保险,今后将专注于做好技术,和保险公司一起互为生态,通过技术和科技助力保险公司。

雷锋网

深度 | 硅谷是如何推动编程教育的?


Hadi Partovi, Code.org的联合创始人

雷锋网按:教育要面向现代化,面向未来。当我们开始接触儿童编程的概念时,大洋彼岸的硅谷企业,已经致力于推动全国的编程教育了。最近纽约时报的一篇长文就介绍了硅谷是如何推动编程教育的,雷锋网对原文编译如下。从娃娃抓起的计算机科学教育,或许是促进教育公平的初心,但也可能隐藏了企业求贤的私心。不管怎样,相对硅谷我们能做的还有很多。

在上上周的白宫科技巨头聚会上,苹果CEO库克直言不讳,向总统特朗普传达了如何让公立学校更好地服务国家的信息。库克表示,为了帮助填上IT人才缺口,政府应该出力确保学生能学习计算机编程技术。

“每个公立学校都应该要求学生学习编程。”库克对特朗普说。

苹果在推行学校开展编程课程上其实已经迟到了许多。即使没有特朗普的支持,硅谷也老早推动这一议程了,这主要得益于受行业支持的非营利组织——Code.org的营销实力。

苹果CEO,在纽约的一个Apple Store里,和一名参加Code.org课程的三年级学生交谈

Code.org于2012年由Hadi Partovi创办。Hadi是Facebook和Airbnb的早期投资者。他的孪生兄弟Ali Partovi则是Zappos和Dropbox的早期投资者。Code.org以其爆红视频激发了极大的编程课程需求,并因此而出名。现在Code.org的目标是让美国所有的公立学校教授计算机科学。

Hadi Partovi认为,在技术主导的世界里,计算机科学变得与阅读、写作和数学一样重要。他说:“密码学至少与光合作用的原理是同等重要的。”

计算机科学对美国高科技公司来说也是至关重要的,这些公司现在已经非常依赖外国工程师。特朗普的移民限制政策使得Code.org的“教美国人学编程”的计划在业内广受欢迎。

短短几年间,Code.org已经获得了微软、Facebook、谷歌、Salesforce以及个别技术高管和基金会的超过6000万美元的投资。Hadi表示,Code.org在说服24个州政府变更教育政策和法律的同时,创造了一个名为“编程时光”的免费入门编程课程,全球有超过1亿学生试听过。

一路上,Code.org已经演变成硅谷教育改革的新模范:一个深谙社交媒体的实体,推动教育政策变更、开发课程、提供在线编程课程,还培训教师,几乎触及到教育供应链的每一个环节。


2014年计算机科学教育周,时任美国总统奥巴马与参加“编程时光”活动的中学生互动。Hadi Partovi 站在他的身后

Omidyar网络的合伙人Amy Klement表示:“他们有多管齐下的手段,Code.org是独一无二的,我希望这样的模式能够得到复制。”Omidyar是一个慈善投资组织,由ebay创始人Pierre Omidyar和他的妻子Pam发起。该公司向Code.org投资了550万美元。

但是Code.org的高调让人不禁怀疑硅谷是出于自己利益而游说公立学校,也就是满足他们对软件工程师的需求。密西根州立大学政治学助理教授Sarah Reckhow说:“如果我是州立法委员,我一定会怀疑他们的动机。谁都希望公共投资放在自己业务所需的技能上。”

44岁的Hadi则表示,他和他的投资人都是靠这些技能成功的,他只是希望让学生也能有机会发展这些技能。他小时候从伊朗与家人一起移民到美国,后来在哈佛大学学习计算机科学,再后来跟别人创办了一个语音识别公司,最以8亿美元卖给了微软。

Hadi说:“如果你在美国的一所普通学校,没有引导进入这个领域,那么这个梦想就更难实现了。”不过,他也承认的确有一些私心在里面。“经营一家科技公司,聘请和留住工程师都非常困难。”

Code.org提供非常多的免费在线编程课程和全面的计算机科学课程。据Hadi说,它还为57000多名教师提供了培训讲习班。

到2020年,通过计算机和学习应用程序,美国中小学将被重塑成一个价值210亿美元的市场。而Code.org的兴起与则与这一趋势吻合。

去年,苹果推出了一个名为Swift Playgrounds的免费应用程序,它能教人使用Swift编程。Swift是苹果在2014年公布的一种程序语言。

苹果开发的一款学习编程的app——Swift Playgrounds

上个月,苹果为美国高中和社区大学推出了长达一年的Swift应用程序设计课程。苹果还通过在其应用商店中主办“编程时光”的人气活动来支持Code.org。

在Code.org出现之前,多年来,国家科学基金会、业界和教育专家一直致力于开发和在校园中传播计算机科学。例如,2009年,微软的一名工程师开始了一个名为Teals(Technology Education and Literacy in Schools)的项目,让微软公司的员工志愿者走到校园中,帮助学校教授计算机课程。

接着,Hadi想到了使用爆款视频来激发编程课程需求的办法。

Code.org的宣传视频

他说服比尔·盖茨和Facebook CEO马克·扎克伯格在视频中露面。在放上YouTube的第一个星期,这段叫做“大多数学校不会教的东西”的视频带来了大约九百万观看量。在两周之内,就有大约有两万名教师与Hadi联系。

Hadi将Code.org的模式与初创公司Airbnb和Uber进行了比较。他认为“Airbnb改变了旅行方式,但他们并不需要开酒店。我们非常相似,我们变革了教育。但我们不需要建学校,也不用请老师。”

Hadi的精英人脉没有因视频而受到损失。

在2013年初的一天,在华盛顿州贝尔维尤之家的车道外,他拜访了他的邻居,Bradford L. Smith,当时的微软高管。Bradford最近发表了一份微软报告,号召联邦政府为学生在计算机科学和工程学上的就业提前做好准备。

Hadi在视频中表示,编程能够提供学生新的就业方向。Code.org在教一些能在未来获得高薪工作的技能,“这个国家的每个人大概都能明白。”他这么认为。

Hadi很快就邀请Bradford观看他的名人视频。

微软不久就成为Code.org最大的资助者。Bradford现在是微软公司的总裁。Bradford将他们现在对教育变革的努力与上世纪50年代的美国进行了比较。当时,苏联刚刚通过发射人造卫星赢得了太空竞赛,美国为了追赶,发布了一项法律来资助物理学和其他科学的发展。

“我们认为计算机科学之于21世纪就像物理学之于20世纪。”Bradford说。

Hadi表示,与当地团体一道,Code.org和微软帮助说服了24个州政府,允许学校用计算机科学学分抵充数学的学分。除了Black Girls Code、Girl Who Code和Latina Girls Code之外,Code.org还致力于让更多的学生群体接触这一学科。

但这项运动也给一些公司提供了法律上的便利,使他们在公众还没察觉到的时候,对公立学校就产生巨大的影响,甚至是从幼儿园开始。

微软和Code.org去年在爱达荷州推动了一则职业教育法案。教育研究人员对此警告说,这可能导致教育优先考虑行业需求而不是学生兴趣。他还补充道,这可能会导致学校教授某些公司所需的特定的编程语言,而不是学生一生受益的更广泛的解决问题办法。

加州大学洛杉矶分校研究生院资深研究员Jane Margolis说:“让业界参与决定公共教育的内容和方向,这是非常有问题的。”

在爱达荷的相关法案中,这样写道:“大力加强从从幼儿园到职业的计算机科学教育,由行业需求主导,并与业界合作发展,是至关重要的”。


微软总裁Bradford Smith

当记者向他通报了该法案的表述时,微软的Bradford有点吃惊,并表示他对此并不认可。他说:“公共教育不应该将任何一个行业的需求放在第一位,所有行业都没有这样的权利。”

Hadi指出,Code.org对佛罗里达州的“更极端”法案表示反对,这个法案要求学生要获得行业认证。对于允许学校用编程学分抵充外语学分的法案,他们也表示反对。他补充道:“我们还是相信,在这些事情上,科技公司是能发挥作用的。”

爱达荷州的法律在去年生效。其第一个成果是与Oracle开发的新项目,培训公立学校教师教学生Java——Oracle公司的一种受业界欢迎的程序语言。其他公司,包括芯片制造商美光科技,也被邀请协助开发当地学校的计算机科学标准。

爱荷华州STEM行动中心的执行董事Angela Hemingway表示:“有些人认为业界正在推动我们的教育体系向前发展,其实不是这样。他们是合作的关系。”Angela同时负责监督爱荷华州的计算机科学教育计划。

参加Code.org课程的学生

理所当然地,现在全国许多学生和家长都在关注计算机科学。但是,万一出现一些其他科目,比如说数据科学(也涉及计算机),对于学生的生活、职业和圈子而言更为重要和适用,那会怎么样呢?

计算机科学的影响,引发了人们关于是否应该推进学校进行编程教育的讨论,因为毕竟世上还有许多学科。它也让人们来不及考虑如果学校在传统数学课程上增加统计学内容,对学生是不是更好。

Bradford表示,科技公司和慈善家只是试图让被忽视的科目发声。他说:“我们需要举国关注计算机科学和它涉及的其他领域,这是对未来美国学生来说非常重要的基础性学科。这并不只是一门学科,它还包括了其他的学科。”

Hadi表示同意,“我们这个国家有很多关于如何教学的讨论,但是,对于教什么,我们讨论得还不够。”

Via nytimes.com 雷锋网编译

雷锋网

深度 | Y Combinator成长史

雷锋网按:Y Combinator无疑是最成功的孵化器之一,从2005年的8家公司,到如今一年孵化250多家,它俨然成了盛产初创公司的富士康,其中走出了像Dropbox、Airbnb这样的公司。但少有人知道它的发展也经历过几次危机和转折。Wired的一篇长文就介绍了YC成长为一颗超新星的过程,雷锋网对原文编译如下:


如果美剧《硅谷》的导演要拍一个像Y Combinator孵化器申请人一样的典型人物,她可能会想出一个在今年四月天,徜徉在斯坦福大学的一个地下室礼堂前的人。他应该是一个留着山羊胡子的二十来岁年轻人,穿着灰色的套头连帽衫,棕色长袜,渴望分享创业想法——停车领域的Airbnb。他来到盖茨计算机科学大楼,向两位负责人介绍自己的创业方案,在这个过程中,他会受到两位经验丰富人士的教导,鼓励他成为下一个马克·扎克伯格。当两位对话者对自己的想法表示兴趣时,他会感到非常高兴。要知道他们可分别是:YC的负责人Sam Altman,以及2010年完成YC训练营的一位初创公司CEO兼YC合伙人Yuri Sagalov。

但是32岁的Altman,身穿拉链连帽衫,却打断了他的豪言。“这东西什么时候能真正启动?”年轻人告诉他需要6个月。

Altman问道:“六天行不行?”

这位哥们找借口说,技术合伙人还在墨西哥度假。但Altman不为所动,“六个月之内,世界将发生翻天覆地的变化。”接着,他认真地告诉对方正确的答案:“速度和执行力很重要!”

这就是YC“如何建立一家公司”的典型剧本。通常只有有幸被YC接受的申请人,才能上到这宝贵的一课。但这一幕与YC总部的有点不同。这一幕不仅仅发生在观众面前(礼堂里还有几个斯坦福大学选修了CS183F课程的本科生),并且还对在YC的MOOC——Startup School上登记注册的5万人进行了直播。被YC计划选中,与被斯坦福大学录取一样困难:今年夏季的一期中,约7300名申请人只有不到2%的人通过了YC合伙人的10钟答辩。不过,只需要有浏览器就能上YC的慕课。

这是Altman用创业价值重绘世界蓝图的计划的一部分。从与8家有抱负的公司进行的一次松散的夏季实验开始,YC已经发展成为一条每年孵化超过250家初创公司的生产线。所有初创公司都能获得内部专家的指导、免费云服务、用7%的股权换来12万美元投资,即使在许多情况下,这些公司在几个星期前还只有含糊不清的想法。

但是,这些恩惠还比不上因获得YC邀请而来的优质资源。资源有进入YC超过1500家公司的校友网络,以及已经参加过YC项目的3500名创始人,里面有Airbnb、Dropbox和Stripe这样的公司。YC网络虽然不是什么高级秘密组织,却能给初创公司提供最好的建议和现有的庞大的客户群。第二个资源是,参加过这个项目的人都容易获得投资者的信赖。三个月后,公司就能获得种子资金,甚至可能获得均值为142万美元的A轮融资(从近一批数据上看)。

然而上百家未来的独角兽每年两次参加他的创业训练营,只是Altman的起点。他认为YC能支持上千家初创公司,让创业成为除了加入已有企业和当公务员之外的第三中职业选择。在他看来,这个星球有越多初创公司越好。他认为,从气候变化到停车位紧缺的创新解决办法,都将来自初创公司。这是他接受YC重任的原因。现在,YC的目标不仅仅是培育初创公司,更是培育创新精神,以改变这个世界。

这是YC创始人Paul Graham的初心。他曾经写道,他一开始默默地把自己的项目当做让更多的初创公司产生的法门,最终也与他喜欢的创始人一起,改变了世界的想法。除了这种感觉,Graham和他的联合创始人Jessica Livingston,也因为这一目标而感到压力山大。

Altman看起来并没有这种困扰。在2014年接手YC后,他就开始在许多出奇的领域施展身手,比如与Elon Musk合作建立AI实验室,并酝酿建立一个实验城市。他还招募了以登月计划为导向的超音速航空旅行和核聚变方面的初创公司。他还开办了一笔连续性基金,投资数百万给有能力回报的YC校友公司。6月初的最后一次会议之后不久,在YC总部他从会议室走出来告诉我:“我们希望支持每一家进行最大程度创新的公司,因为我们相信,这是对未来的每一个人都有好处。”

MOOC是一个很好的例子。为期十周的课程向50000名注册企业家提供了讲座和咨询,并利用YC的志愿者导师网络,给2820家公司的7746名创业者提供了个性化的建议。“在人类历史上,这个数目是一个组织帮助过的最多的初创企业。”

在我们聊天的房间之外,参与YC核心计划的创始人们在每周聚餐之前涌入会议室。今年的这批有132家,YC最大的一次。有四家无人机初创公司和许多AI公司。YC有一个合作伙伴专门为这些AI公司提供建议。虽然这个数字与YC早年的记录相比算是巨大的进步,但是Altman认为这只是YC所能帮助的沧海一粟。所以现在他正在考虑如何让MOOC走得更远。只是给建议是不够的,他说:“有一件事我想做,但是还没决定,这就是如何给一些初创公司一些钱。”

我觉得这想法很疯狂,这种回应可能使Altman开心。(在YC对初创公司的看法中,疯狂意味着潜力,比如Airbnb)。不过,我还是问他,YC会扩大到资助成千上万家公司吗?

他说:“我想我们将在明年资助一万家公司。”Altman做了一些粗略的计算。他认为,一万美元,对很多这些公司来说,都不容易得到,尤其是在美国以外的地方。这意味着一万家公司只需要1亿美元,理论上,YC是做得到的!“你可以给他们足够的钱,授予一些信用,和一些免费的法律帮助。”

这乐观的前景令他高兴。“这太棒了,对吧?像许多年以前,人们并不认为一年可能有一万个新兴企业,而现在我们却能马上给一万家提供建议!”

我想,这样会不会变得有太多的初创公司了呢?

“我相信会有一个上限,但现在还没到那个时候,”Altman说,“当我们到了那个时候,我们就会知道,但是,现在还不是。”

硅谷是一个分叉的生态系统。首先,有大型和强大的科技公司,许多公司定义了技术革命:苹果、谷歌、Facebook、亚马逊和微软。除此之外,是另一个分支,他们更加灵活,不会固定在地图上的一个点。这就是初创公司。这是一个强大的团体,但传统上它是分散的,因为包括数以千计的小公司,其中大部分将保持默默无闻,直到它们变得足够大,成为了第一个分支的公司。这种由初创公司带来的多姿多彩的活力从来没有一个单一的机构能够代表,初创公司也将硅谷塑造成了一个帮助创业者们聚集力量和发挥影响的地方。

YC却正在改变这种局势。凭借其惊人的校友网络、给予创业者信誉、独角兽和近独角兽的合作伙伴,以及日益增长的地位和权威的实践能力,YC已经成为独树一帜的强大组织,和一个象征——也许是驱动硅谷的创业野心和创造力的象征。YC还有数字支持:尽管宏观经济不景气,通过YC项目的公司的总估值在年底前将超过1000亿美元。超过50家价值超过1亿美元,当然好几十亿都由YC的三大门徒产生:Dropbox、Airbnb和Stripe。

在YC内,有一句话能概括他们的演变:YC开始是一个家族企业,但现在它更像一所大学。YC之父Graham自己说,这是他在开始“家族企业”之后不久的想法。像大学一样,YC的持续资源不是一种产品,而是一个网络。YC是硅谷版本的哈佛,里面出来的人都互相帮助。每年有数百名“毕业生”聚集在“YC营”中,场面壮观。像大学一样,YC向世界提供服务,我们都被告知:对于YC领导和它的合作伙伴,金钱并不是主要动机。

YC之所以这么说,是因为YC已经让很多合作伙伴变得非常非常富有,他们不仅参与投资基金,而且经常在自己的计划中投资最好的公司。

这是真的,YC并不是正儿八经的追求投资回报的公司。在20世纪90年代的互联网热潮中,Graham和一些朋友高额出售了一家初创公司Viaweb,并成为黑客哲学家,发表了关于创办公司的流行理想主义散文。2005年,他决定为自己的兴趣付出行动。他联系初创公司参加在马萨诸塞州剑桥市三个月的“夏季创业者项目”。他说:“这个计划就像一个暑期工,我们没给你薪水,但是给你种子资金,让与你的朋友开始自己的公司。”八家公司的项目做得很好,他决定重复一次。

早期,Graham决定每年开办两次这种项目。在项目开始前几周,四个YC合伙人(Graham、Livingston及Viaweb的死党)将筛选申请,并召集有前景的创业者进行一周的面试,不仅评估他们的创意,还评估这些创业者的精气神。在每个采访日结束时,Graham在电话中给这些创业者正式的offer,并要求他们要求立即回答(他曾经开玩笑说这是一个虚拟的智商测试,大概是因为那些拒绝的人还不够聪明来参加这个项目)。YC对这些初创公司的投资不高于两万美元,这取决于每家公司有多少创始人。

2005年的YC

项目过程是在紧张的三月内,关于打造产品。经验丰富的产品人员,如Paul Buchheit(Gmail之父)、Graham及其合伙人将在办公时间内为他们提供咨询。Graham经常走在路上答疑,就像苏格拉底和他的追随者们那样。每个星期二都有一次聚餐,在饕餮之后,会有一场科技名人的演讲,都是像玛丽莎·梅耶尔和扎克伯格这样级别的人。

项目结束之前,创始人们要为Demo Day做准备,当时每个公司都会在硅谷的精明投资者面前展示一个严密的演讲。在Graham的坚持下,每个初创公司都会在幻灯片上加上YC版本的吸金点,一份展示用户、客户、收入急剧增长图表。他们向投资者展示,如果错过这个产品就会错过另一个Airbnb,这会让他们追悔一生。

随着时间的推移,由于Graham的思想推动,这个小团体“毕业生”越来越多。我研究的第一批,也就是2007年冬季那批,有12家初创公司。当时似乎是一个不功不过的数字。但是后面的数字越来越大。直到我再次审核整个项目时,也就是2011年,这个数字已经涨到了45。

数字不断上涨。随着YC孵化的公司取得越来越多的成功,它也获得了更多的注意力。许多公司失败了,这是因为尽管有很好的建议和仔细的审查,这也是不可避免的,但很多出名的初创公还是被大公司收购了,有的值数百万,有时甚至数亿。其他的公司一直在成长,从萌芽长成了大树。YC谱系成为资助者和创始人的最好的合作途径。“如果一家YC公司向我请求会议,我一定会接受吗?是的。”Google Ventures的风险投资人M.G. Siegler说。


2009年的YC

随着项目的价值越来越出名,YC以自己的建议、对产品的要求,广阔的人脉吸引了大学肄业生、毕业生、经验丰富的工程师和大公司产品经理等有能力为自己筹集资金的人们,向YC申请。谷歌前明星产品经理Dan Siroke放弃了谷歌的职位,于2010年进入了YC的项目。在项目培训的时候,他产生了创办现在的Optimizely的想法(2015年估值为5.5亿美元)。“我们还没到回报YC的时候,现在还欠着YC。”Dan这样说。

随着参与公司数量的增加和更多资金进入,到2010年的时候,YC的压力也在增加。两名外部投资者,Yuri Milner和Ron Conway决定从2011年冬季开始给每个YC公司,投资为15万美元,事情本该因此变得容易。这个想法出现的原因是,可以让每个创业者都可以专注于产品,不用担心筹款。但是,这种高额资助从喜悦变成焦虑,因为对于YC创始人来说,这变太快也太真实了。(在2014年YC最终决定直接给每个初创公司12万美元。)

归根结底,这种压力和高额的资助是为更好的公司准备的。但项目的性质已经改变了。“当我在2007年参加项目时,大家相处三个月之后可能会获得资助。”Harjeet Taggar说,他在2009年成为YC的第一个全职运营合作伙伴。“现在,人们的想法是,我们必须得到300万美元!在每一次项目中,社交活动不再是重点,人们更多地专注于如何在演示日上做得很好。”

如今的YC

在2012年又出现了转机。YC的CFO Kirsty Nathoo说:“那是YC让大家惊醒的一届。”当时她正在和Livingston与Taggar合作处理支持84家初创公司的后勤工作。她回忆说:“我们已经到了谁都不认识谁的地步。每个家公司都希望自己出众。但这是不可能的。对于YC创始人来说,这是一个令人沮丧的事情,为他们提供咨询,但我们的合作伙伴却想不起来他们谁是谁。”

Livingston同意:“我们需要更多的合作伙伴。”

YC在自己的网络中找到了这些合作伙伴,其中有那些公司已经出售或失败的受欢迎的公司创始人。从那时起,每届成员被分成几组,每组由一些合伙人领导。虽然创始人们可以选择任何合伙人进行面谈,但他们一般选择组里的领导。这样三个月的周期中,不用与其他组的创始人有过多交流。有时候,Demo Day时就会知道接下来相处的公司会是怎么样的。YC也扩大到了一栋两层建筑中。Demo Day的场地也从总部迁往更为宽阔的计算机历史博物馆。YC还将展示日从一天变为了两天,并将公司分类,以便投资者可以选择想要了解的公司。

最大的变化是Graham在2014年的离职,并指定Altman作为继任者。他说,“Sam的出现让我觉得可以退休了。”对他来说,Altman是完美的继任者,这可能是因为他们的想法一致,特别是都对大多数人认为是胡言乱语的想法保有热情。但主要是他觉得Altman会把YC带向更远。

在他关于领导层变动的博文中,Graham写道,他认为初创公司会是我们时代的决定性因素。“在十年后会有比现在更多的初创公司,如果YC要资助他们,我们必须按比例增长。”所以Altman的第一项任就是让期数变多。

为了保证运行顺利,他聘请了更多的合伴人和运营人员。YC现在有46名全职员工。另一个维护更多学员的方式是由前Scribd(S06)创始人Jared Friedman领导的定制软件开发小组。他们开发了一个即时可用的APP,它看起来像Facebook,又带有Quora和Wiki的成份,它被称为Bookface。Friedman说,YC网络中大约一半的创始人每周会用一次,还有很多人每天都在邮箱中查看讨论。创始人们可以将问题发布到Bookface,24小时内就会得到其他创始人的回答。换句话说,你可以轻易的得到一家独角兽公司CEO的帮忙。

YC软件团队还使用AI来自动处理一些流程。YC多年来一直仔细对待收到的100000多份申请,利用这些数据,软件团队开发了一个名为HAL的AI,它可以帮助筛选申请。HAL读申请后会像人类一样打分,这节省了大量人力。

YC软件最终是否能像那些合伙人一样提供建议,为创始人制定目标,让他们专注于客户,指导他们做演示呢?Friedman的答案是肯定的,他认为,从长远来看,我们有可能建立一个比自己做的更好的AI。


当他继续按Graham的要求扩大YC的数量时,Altman也做了很多事情之前没做过的事,比如扩大YC可接受的初创公司种类。一开始,一家典型的YC公司会涉及消费级APP,技术工具,或者是某一类商品的交易市场。Altman鼓励初创公司从事有独特技术,且雄心勃勃、资本密集型的任务,包括核聚变,癌症药物和超音速喷气式旅行。他如此喜欢最后一类公司,以至于加入了Boom的董事会。有些人还嘲笑过YC,因为W16那批孵化的企业中有一家自动驾驶公司Cruise。结果这家公司毕业后不久,就被通用汽车以12亿美元的价格收购了,而YC所占的7%股份可以支付其两年以上的创业投资。

Graham说:“招收那些硬科技公司着实让我感到惊讶。”他说自己从没考虑过这个想法,因为“我们人这么少,没法主动做一些事。我们在鼓励申请时就不那么张扬,因为这样能更好工作。”

Altman还开始招收非营利公司,给他们5万美元,并通常由合作伙伴进行配对。去年冬,他特别邀请了ACLU(美国公民自由协会)的一个技术团队进入项目组。但不要以为YC不想赚钱,它有另一个新部门YC Continuity,会对毕业的创始人进行后期阶段的投资,该部门由由前Twitter的高管Ali Rowghani领导。 Rowghani说:“Sam认为支持创新应该是持续的任务。我们不是在寻找下一个照片共享APP,而是更大的技术飞跃,而且其中也存在经济上的机会。”

但Altman最令人吃惊的举动,是成立了一个YC研究部门,而且主要用自己的钱资助。该部门与核心的加速器独立运行。另一个例子是OpenAI,一个致力于研究的AI实验室,想对抗AI企业强大的影响力。Altman在这一实验室的合伙人,是对AI伤害人类充满忧虑的Elon Musk。通过该计划,他资助了一个项目,测试当人们获得普遍基本收入时会发生什么。Altman说:“我想在AI真正普及前,研究那些社会变化。”同样的,还有一个项目是在研究普遍的医疗保健,它被称为“人类进步研究社区”,任务是“确保人类的智慧超越人的力量,通过新技术让所有人类看得更远,了解更多”。这听起来像是一出戏剧,不过还有传奇的计算机专家Alan Kay的参与。

在完成这一切后,Altman去年将自己的职位变成了YC集团总裁,并任命了企业家及项目经理Michael Seibel担任CEO,并主要处理核心的孵化器业务。Seibel说:“Sam不会陷入公司此时的业务中,他正努力找到公司应该是怎么样的。”他敢于梦想。如果三年前问我们,我们说会有一支基金,一个研究部门,一个为数以千计的创始人服务的创业学校。你会说不可能,这是当然的。重要的不是他提出了这些想法,而是他毫不畏惧地推动了这些想法。”

市面上还有数千个加速器,其中一些比YC要大,而且跨越了多个大陆。不过Altman自称,不太明白为什么YC比其他家做得好。它孵化了多个独角兽,而其他对手的独角兽数量几乎为零。“我有预料到会成为市场的领导者,但为什么会表现得这么好呢?”(Techstars的合伙人David Brown表示,他们有些孵化的企业可能是独角兽,但希望对估值保密)不过Graham认为答案很简单,“如果你是第一个做某事的,而且做得很好,那就能保持下去。”

无论什么原因,YC的成功让它可以扩大自己的使命。这对于资助初创公司并让他们毕业,也是是必不可少的。但YC现在真正的热情在于强化初创公司的心态,这是一种改善世界的手段。虽然没有证据表明这真能解决问题,而且一代初创公司也没法让这个世界变得更好。但YC的领导者相信深信这一点,因为他们将组织根植于改变的过程,而不是现在的市场。他们还认为,公司在自己生命结束后还会产生持续的影响。Siebel表示,正是这样的前景让他想全职参与其中。“说服我的是PG和Sam的理论,他们认为YC可以成为一个100年以上的机构。”

这不是第一次听到有关YC会长寿的声明。一个世纪以前,我们几乎没有收音机,更别提计算机了。很难相信任何人能预测100年以后的AI和现实。这是可能吗?Seibel说,“这不仅是一种可能性,而是我们在将它变成现实。”

雷锋网

雷锋网

深度 | 微软AI王者归来

Bengio和Nagraj Kashyap

雷锋网按:以Windows操作系统称霸的微软,有能力成为AI浪潮中的巨头吗?这是很多人想知道答案的问题。微软错过了移动互联网,在云计算上也走过不少弯路,仍处于追赶者的位置。在5月的开发者大会中,微软预见到人工智能会无处不在,未来属于智能云与智能边缘。那这家公司做了什么,是如何将自己转型为一家AI公司的呢?连线Backchannel的一篇长文就描述了微软AI崛起的过程,雷锋网对原文编译如下。

Yoshua Bengio从来没有站过队。作为现在主导人工智能深度学习的三大开山鼻祖之一,他一跃成为明星。这样一个领域只有少数的几个引领者,而从技术创业公司到跨国企业集团再到国防部门的每个人,都想要知道他们的想法。

但是,当他的科学家同伴Yann LeCun和Geoffrey Hinton分别投入Facebook和Google麾下时,53岁的Bengio则选择继续在蒙特利尔大学山顶校区的一个小办公室里工作。“我想要保持中立”,他一边说,一边从一个玻璃瓶里倒出来锈色的甘草水,啜了几口。那玻璃瓶,是他用来压住桌上凌乱的文章的。

像上个世纪的核科学家一样,Bengio明白,他所发明的工具是无可比拟的,必须经过深谋远虑广泛斟酌才能被培育出来。 他说:“我们不希望只有一两家公司成为AI领域的超级玩家,他们是谁我就不明说了。”他说到,还挑起眉毛,表示我们都知道他所指的是哪家公司。“这样的局势对社区来说不是很好。这对大多数人来说来说不是很好。”

这就是Bengio最近选择微软的原因。

没错,就是微软。他认为以Windows操作系统称霸的微软,有能力成为AI的第三个巨头。这是一个拥有资源、数据、人才的公司。最关键的是,这家公司的愿景和文化,不仅要实现科学的应用,还会推动科学的发展。今年1月份,业内都注意到,Bengio同意成为微软的战略顾问。这给微软直接提供了思想、人才和方向的最佳资源。而且这也是微软实际上有机会将AI产业局势扭转成三足鼎立的强有力证明。

请Bengio出山的沈向洋,也是一名计算机科学家,头发灰白,戴着线框眼镜。他磨了Bengio好几个月。“当时就是在这个房间,”沈向洋告诉我,带着微笑,表明他知道对于一个局外人来说,这可能非常奇怪,他是怎么把一个在Google学术上有69616个引用的大牛拿下的。

我们坐在34号楼五楼的一个宽敞的会议室的一个灰色的沙发上,正好在看管微软的行政套房保安的前面。负责微软所有AI和研究的沈向洋刚刚完成了一场开发人员大会的排练,他想向我展示演示。我跟着他走过走廊,健步追上。我真的是长了见识!在一个实验室中,Skype团队的自动翻译程序让我能通过文本与德国人实时聊天。我还看到一个应用程序,可以通过计算机视觉来监控施工现场是否有安全违规或不明访客。除了这些,微软帝国的AI主角Cortana扫描了我的收件箱,并提示我有哪些要做的事。

沈向洋

沈向洋已经花了几年时间帮助他的老板,CEO萨蒂亚·纳德拉,履行用AI重塑微软的承诺。在纳德拉担任CEO后不久,沈向洋就经常同他,以及另一位同事陆奇,一起商讨如何将AI融入微软的产品。去年9月,沈向洋主持了一项重组,将研究人员和产品团队组合在一起,建立一个人工智能与研究事业群。这个事业群跨越了微软的三大类别:Windows、Office和微软云Azure。 沈向洋表示这样有希望加快从研究到产品的周期,使客户能更快享受到AI的成果。

大型科技公司都尝试通过AI产品和服务来竞争。除了Facebook和Google,IBM、亚马逊和苹果都认为他们对深度的学习的掌握程度就是他们手中的筹码。而去年秋天因为自行车事故而离开微软的陆奇,最近恢复得很快,现已加入百度。

讽刺之处在于,人工智能曾经是微软败笔。上90年代初,该公司吸引了许多学者,致力于语音识别和图像识别,但十年来停滞不前。微软的研究人员与市场孤立,没有市场压力,结果是他们的发明很少得到应用。例如,比尔·盖茨在1998年展示了地图绘制技术,但从未上市,而Google在2005年推出了地图。微软在人工智能研究上长期也停滞不前,缺乏计算处理能力也没有数据来源。

微软在AI的回归,比AI的回暖迟了许久。

当Facebook和Google在2013年分别聘请LeCun和Hinton时,微软却还没什么作为。微软错过了手机和云的时代。竞争对手在深度学习上有了更大进展时,微软却一直在坚持用70亿美元买下诺基亚。在决策上,微软也只是不断更新用户并不十分在乎的软件,而没有涉足能给微软带来契机的云领域。与此同时,微软也面临严重的人才流失,机器学习的顶尖人物,都是在微软中成长起来的。

然后在2014年初,微软提拔了一名内向的工程师,也就是纳德拉。他与许多人认为微软所需的人才相反:一个不熟悉微软文化的局外人,更有可能带来转机。不过,他的确带来了转机,也让微软三年后重新获得科技巨头的称号。

微软想要成功,它须要做的不仅仅是在云领域超越亚马逊,或者说服我们所有人尝试其HoloLens AR设备。正如互联网重构了已有商业模式一样,人工智能将需要我们重新定义计算。这也是facebook和Google把AI放在战略第一位的原因。

AI先行的好处将使得少数几个公司得到增长。沈向洋要做的就是确保微软位列其中。他表示,“在这行,如果你错过了上一波浪潮,这没关系,但如果你错过了当前的浪潮,那就相当麻烦了。”

人工智能可以解放人类,而语音助手则是协助解放我们的工具,微软的语音助手是Cortana。

微软的Cortana比起Siri,虽然没那么收欢迎,但是更实用。比起Google助手,它又更有魅力,比起亚马逊的Alexa,技术则少一些。起初它只在Windows phone 上出现,一年后应用于Windows的所有平台。去年,微软推出了Cortana的软件。借助Windows平台,Cortana每月有活跃用户1.45亿,远超亚马逊的Alexa。不同于Alexa的是,Cartana除了对语音作出反应,还能对文本作出反应。这一技术也嵌入到了Windows 的许多产品中。

虽然一些公司正在将Cortana融入类似于亚马逊和Google音箱一类的设备,微软对这些改进的忽略看起来似乎还没跟上时代。 但沈向洋则表示根本不担心。“比赛才刚刚开始”,他说。他提到一个研究曾表明Alex对问题的理解还十分薄弱。“当然,这些事情会不断改善,但总体的理解,AI认知的部分,还处于起步阶段。”他认为,如果在12到24个月内可将这AI产品到将投向市场,使核心产品和服务更加智能化,微软的机会就越多。

此外,微软还表示,我们还不至于告别键盘和屏幕时代,因为在某些情况下打字反而更加合适。

Yoshua Bengio

虽然Siri出现得更早,但是Cortana比较好用,这主要得益于微软的核心产品。Cortana大部数据分来自Bing。微软推出Bing已经有八年多的时间,它并不是最流行的搜索引擎,但是它也比你想象的更加受欢迎。基本上所有Google的大型竞争者都是微软Bing的合作伙伴。苹果的Siri、Spotlight,以及亚马逊的Kindle设备、雅虎、Verizon和AOL的搜索功能都由微软Bing支持。美国约有30%的搜索查询是通过Bing进行的。微软表示, 拥有来自各种设备的海量数据就是Cortana有用和强大的原因, Google是唯一一家可以与之竞争的公司。

微软的一个重要策略是使Cortana成为行业模范,而智能手机成为实现各种操作的的接口。微软认为,Cortana将知晓人们的个人信息并能代表人类和其他的系统进行交互来帮助人们节约时间,完成任务。

如果Cortana是一个引领者,那聊天机机器人就是一个踏实工作的人。聊天机器人是嵌入AI的小型软件,它能完成一些一次性事件比如预定晚餐,完成一笔银行交易等。微软的程莉莉(Lili 程莉莉)表示,“一个聊天机器人就是你能与之对话的软件。”

最近晋升为微软副总裁的程莉莉主管聊天机器人的架构和认知服务团队。这些架构和服务包括向开发人员提供的一套工具和29种服务,如计算机视觉和语音识别。她从苹果到微软后,一直在从事社交技术工作,并创建了一个制作漫画的图形化界面。“它嵌在IE3中”,她记得那是1996年。她在微软有很长的经验,并见证了机器程式的发展。

程莉莉的主要兴趣在于人和机器之间的对话方式。沈向洋已经将AI和研究小组合并到四个领域:产品、早期产品、更早期的产品和研究四个领域。程莉莉在每个领域都有工作过。现在她主要负责早期产品领域。她说:“我们将机器人和Cortana视为产品,但它仍然是一个早期产品。”


微软在2016年春推出了聊天机器人的开发工具包,Facebook等其他公司也是如此。他们被认为是APP的替代品,而且很多人都期望如此。大多数人在手机仅使用差不多相同的一组APP,而利用机器人,开发者和公司可以再次获得新用户,就像在早期在应用商店中那样。

但用户没有买账。深度学习进步的速度比人们适应使用它的速度更快。程莉莉认为,“聊天机器人就像是在文件菜单出现之前的APP。”她解释说,现在还没有一套常用的命令,所以用户对于怎么用会感到困惑。

除了提供机器人开发工具外,程莉莉还率先在微软孵化了自己的聊天机器人。这么做是想通过观察机器人与人类的互动,可以学到人机互动是如何进行的。但这些实验的结果喜忧参半。还记得微软的有种族主义议论的Tay机器人吗?它于2016年3月在Twitter、Kik和GroupMe平台上推出,在24小时内就吸收了一些种族主义的推文,导致它学会了“希特勒是正确的”这样的内容。后来微软取消了这一项目。

六个月后,程莉莉又推出了Zo。如果问Zo对希特勒有什么的看法,她会回答“我不想谈这个 :(.“。你问她几岁,她会回答“差不多22岁”。问她最好的朋友是谁,她会说“我太受欢迎了,好朋友数不过来。开玩笑啦“。

Zo是西方版的小冰。小冰是微软在中国推出的聊天机器人,设定年龄17岁的少女,自2014年推出以来,它已经吸引了4000万用户。在中国,小冰是一个明星(她的日本姐妹Rinna也是如此),有四分之一的用户告诉她,他们爱她。

去年下半年,小冰经常以假名发表诗歌。沈向洋对此感到很兴奋。“没人知道。现在在国内,人们以为是一位年轻的女诗人在发布一些非常有趣的诗。”几个星期之后,机器人的身份才被揭晓,也引发了大量讨论。

语言的亲密度在不同文化中是不同的,程莉莉想弄清楚机器人的对话风格如何转为吸引西方用户。到目前为止,北美的青少年似乎和中国人青少年一样喜欢聊天机器人。平均来说,他们花了10个小时与Zo交谈。由于Zo为其青少年用户带来了建议和同理心,她变得更加友好,这种能力也将融入Cortana和微软的机器人中。

有用户愿意花10个小时与Zo聊天,这表明微软开发出了一个成功的产品。但这并不意味着它是一个好的产品,因为它还没证明对人类有价值。这个由AI驱动的世界也带来了一批新的道德困境,比如,如果你是小冰的设计师,你对一个在北京的用户很了解,然后在凌晨1点,你知道用户明天还要上班,但对方还不想睡觉,你会在2点的时候就禁止小冰所有的功能吗?

微软想成为AI研究和产品领域的领导者,同时它想用AI为社会做贡献。今年5月,纳德拉在开发者大会上的主题演讲中,措辞严厉地说到,技术人员应该为软件的道德方面负起责任。而在以往,主题演讲的内容往往是夸耀公司的新进展。

“我的意思是,只要想想乔治·奥威尔在1984中预言的那种将技术用于监控和控制情景,或者奥尔德斯·赫胥黎想像的不追寻意义或目的的娱乐至死的世界,就会明白这些都不是我们想要的未来。”

Eric Horvitz

为了帮公司思考这些问题,微软组建了一个内部伦理委员会。它由工程师和业务部门负责人组成,讨论与AI及其影响和用途有关的敏感问题。委员会的联合主席有公司的代理顾问和Eric Horvitz等人,后者负责除亚洲以外所有的微软研究院。

Horvitz是AI道德与安全的积极倡导者。在公司之外,他一直致力于建立AI合作伙伴关系(Partnership on AI),一个试图为AI产品的透明度、责任和安全制定行业标准的联盟。他希望微软不仅仅是一个做研究的地方,更是研究技术的社会性和社会影响的地方。

与此同时,Cortana的设计主管Williams正在为微软制定一个人工智能道德设计指南。有趣的是,在某种程度上说,她是一个技术乐观主义者。她认为,AI的真正魔力在于它会使我们更加人性化。她谈到如何为微软开发的工具设计同理心。

她说:“我们想让人类感受到被赋予力量,受到保护,得到支持、协助和关爱,是自己世界的中心。AI的工作是放大社会最好的方面和人类最好的行为,而不是放大那些最坏的。”

AI是否会让人类感觉得到了情感支持?她认为是肯定的。比如,一个孩子在学校度过了糟糕的一天,回家后与宠物分享整个故事后会感觉好一些。她说到:“这种情况给了人分享的感觉,而且我从宠物那得到了温暖的怀抱。对于AI,你也可以有相同的感觉。当Cortana提醒你,‘嘿,你说过今天要给母亲送母亲节礼物的’,你就会感到这就是人性。”

为了把AI向前推进,微软需要人才。像其他大公司一样,微软也忙着重新培训以前写javascript的工程师。它成立了一个AI学院,开设从哲学和伦理学,到设计递归神经网络等一系列课程。最受欢迎的课程“AI-611高级项目”共收到530个申请,但只有10个名额。

微软也在培养更深层次的外部关系。一年半前,Nagraj Kashyap离开高通,加入一家风投,努力与学者和企业家建立更好的关系。去年12月,Kashyap主导了微软对Element AI的投资,这是Bengio成立的孵化器,它主要帮助研究者和企业家建立AI公司。微软本月早些时候还进一步对它投资了1.02亿美元。

更早前,Kashyap将目光放在了Maluuba上。该公司于2011年由几个滑铁卢大学的学生创立,他们在大二的CS课中相识,并很快成了朋友。Maluuba能让计算机精通文字,它可以从文本中推断含义,并据此回答问题。

通过向三星这样的公司授权技术,Maluuba很快就有了收入来源,而且从一开始它就投入有深度学习研究上。2015年,公司创始人找来了Bengio作顾问。CEO Sam Pasupalak是一个很有趣的人。几年前,当他们仍面临向客户交付对话系统的压力时,他就开始对长期目标进行投入,用新的研究来构建可以理解和对话的系统。”

由于从高通时代就对创始人很了解,Kashyap在从事新角色后很快就找到了他们。由于公司准备下一轮融资,他很快提出了一个诱人的选择:收购。Pasupalak接受了来自多个公司的报价,并且将被收购与保持独立作比较。最后微软赢得了垂青。

Maluuba希望有机会使用微软的数据。Pasupalak说,“萨蒂亚提到过,他们拥有世界上最多的文本。多年来,我们都是在处理小数据,用算法从其中得到最多的结果。这就像是黄金一样珍贵。”

不过Maluuba没有搬到微软所在的雷德蒙,在微软和Bengio的协助下,公司的目标是在今年底之前翻一番。公司所在的蒙特利尔正在成为AI人才的集中地,微软也希望扎根于这个城市。

整个项目都是一个整体策略的一部分,这个策略希望确保在未来,当用户需要计算辅助时,微软会成为助手,无论是想得到个性化的医疗,还是乘坐着自驾驾驶汽车,或者是要记住好友生日的时候。

Maluuba的学习能力可以让Zo与她十几岁的朋友进行更直观的对话。这些对话将作为Cortana算法的训练数据,帮助开发者创造新的认知服务。微软希望有AI的帮助,生活可以更容易。

在我离开蒙特利尔之前,我让Bengio评价一下,相比对手微软的竞争地位如何。他提到微软的语言处理能力非常好,但没有正面回答这个问题。“我想,现在各方都按下了相同的按钮,结果取决于那些细节,对吧?”但他确信,微信是一个强劲的对手。

via wired 雷锋网编辑

雷锋网

深度 | 宽客玩转华尔街:谁才是新的“华尔街之王”?

雷锋网AI金融评论按:本文译自《华尔街日报》,作者为Gregory Zuckerman和Biography Hope。

国际数学奥林匹克前金牌得主Alexey Poyarkov,职业生涯早期大部分时间是为微软这样的科技公司设计算法,帮助微软的搜索引擎 Bing 在搜寻色情内容上更智能。

去年,Alexey Poyarkovch成为文艺复兴科技公司、城堡基金和 TGS Management 等重量级对冲基金的争夺对象。最终TGS Managemensh胜出,Alexey Poyarkovch加入了位于加州尔湾的TGS。一位了解内情的人表示,第一年的年薪就高达70万美元。

通过算法而非直觉进行交易,将会成为华尔街之王?

虽然进入了对冲基金,但Alexey Poyarkovch完全没有金融业经验。TGS想要的是他设计算法的能力,和用于计算和解决问题的规则集,以此在投资领域快速地解析数据,并给出是要买入或卖出的决策,通常不需要多少人为的干预。

可以说,整个华尔街上下,算法驱动的交易和使用复杂统计模型来进行交易的宽客们(雷锋网注:指一群靠数学模型分析金融市场的物理学家和数学家)正在接管投资世界。传统的交易策略,例如通过资产负债表筛选公司或与公司客户交谈等手段正在衰落。

在GAM负责量化投资的Anthony Lawler表示:“十年前,最杰出的毕业生都想成为华尔街投资银行的交易员,但现在他们都在相互竞争,希望进入量化投资基金。”GAM去年以至少2.17亿美元收购了英国量化投资公司Cantab Capital Partners,以扩充这些以计算驱动的基金业务。

Guggenheim Partners LLC 的高级董事总经理Marcos Lopez de Prado表示,Guggenheim Partners LLC花费100万美元在加州美国劳伦斯伯克力国家实验室建造了一个“超级计算机集群”,以帮助Guggenheim Partners的量化基金处理大量的数据,这些计算机每年还要花费100万美元的电费。

算法交易已经存在了很长时间,但是规模很小。华尔街日报在1974年的一篇文章介绍了宽客先驱Ed Thorp。1988年,华尔街日报刊登了一家鲜为人知的芝加哥期权交易公司,该公司拥有一个秘密的电脑系统。华尔街日报记者Scott Patterson在2010年写了一本关于宽客兴起畅销书。

预言者认为,数据驱动的交易员通过算法而不是直觉进行交易,将会成为华尔街之王。

这一天已经到来。纽约一家研究咨询公司Tabb Group表示,量化对冲基金的投资人负责所有美国股票交易的27%,高于2013年的14%。

这只是其中一个迹象。宽客几乎赶上了个人投资者,其股票交易量超过了总数的29%。

根据HFR Inc的估计,今年第一季度末,以量化投资为重心的对冲基金持有9320亿美元的投资,或占所有对冲基金资产的30%以上。2009年,量化投资基金持有4080亿美元,占所有对冲基金的25%资产。

第一季度,全球量化投资新增投资额达46亿美元,而整体对冲基金业务则遭遇55亿美元的资金撤回。

计算机在选择投资对象方面表现优于人类。过去五年来,以量化为重点的对冲基金平均每年涨幅约5.1%。 同期对冲基金平均每年上涨4.3%。

第一季度,量化投资基金上涨约3%,而对冲基金平均上涨为2.5%。

两个变革力量帮助了量化投资

监管对传统信息收集手段的制约

一方面,监管审查使得投资者难以通过诸如挖掘公司高管的信息或挖掘上市公司员工等方法获得优势。

更重要的是,投资者现在掌握了关于全球经济和财务信息的庞大数据,例如盈利预测和应收账款变动。

下一个前沿:挖掘来自无人机和其他新来源的数据

宽客与高频交易员不同,这些高频交易者往往专注于可能只持续几毫秒的短期交易。高频交易员正受到市场波动性下降和竞争加剧的压力。

交易所交易基金(ETF)也使用算法,但更适合那些想要接触某些特定行业的投资者。量化驱动的交易可以持续几分钟也可以持续几个月。最大的量化投资公司,包括文艺复兴公司,Two Sigma Investments LLC, D.E. Shaw Group, PDT Partners和TGS进行着数以千计的交易,管理着数百亿美元的投资者资产。

数学家William Byers在2010年撰写了《数学家如何思考》一书,他警告将整个世界数字化能够给投资者一种欺骗性的信念:从计算机众得出的预测比现实的预测更可靠。 一些分析师说,投资者越来越多使用复杂算法模型,这些算法就越有可能相似,这可能会加剧更大的市场破化。

然而,到目前为止,没有任何事情阻止了量化投资的军备竞赛,这正在创造以前在金融业闻所未闻的新工作:

芝加哥的全球著名对冲基金Citadel拥有一名首席科学家负责分析和量化战略。Balyasny资产管理公司在8月份聘请了数据科学家Gilbert Haddad,以便在纽约对冲基金公司进行数据和分析,他此前在 Schlumberger Ltd. 和通用电气公司工作。曾在威斯康星大学研究纳米颗粒,拥有工程学博士学位。

Empiric Capital Ltd.的首席运营官Alexandre Agachi表示:“你参观办公室,每个人都说有宽客在帮助他们进行工作。”伦敦一家对冲基金创业公司Empiric Capital Ltd的首席运营官Alexandru Agachi说。他们自豪地说:“那就是我们的宽客。”

对冲基金通常会重新调整自己以适应最新的流行策略。金融危机爆发后,许多基金都进入抵押贷款领域。有些人因为期待全球经济转型而变成“宏观”投资者。

人们长期以来一直在寻求获得信息优势的方法。传说,金融家罗斯柴尔德爵士在1815年建立了一个现场代理和信鸽网络,以获快速取滑铁卢战役的结果。 今天的人们希望比传统投资者更快地消化经济和企业信息并采取结果。

根据Quandl Inc的数据,采用量化战略的对冲基金一直在对中国和俄罗斯的私人消费者进行调查,黑客网络上的非法药物销售、黑客和其他人使用的网站匿名分享美国旅客的信息和酒店预订。

在20世纪90年代后期,一个算法非常简单,比如以一定的价格买入并在预定的时刻卖出。今天的算法可以基于对过去和现在数据的分析进行持续预测,数百个实时输入的各种信号提供给计算机。

一些投资公司正在推动机器学习,这使得计算机能够分析数据并提出自己的预测算法。 那些机器不再依赖人类来写算法。

对冲基金公司的人才策略转型

对冲基金亿万富豪Steven A. Cohen的投资公司Point72资产管理公司,管理着120亿美元的资产,正将其一半的投资组合经理转向所谓的“人+机器”的方式,使用旧式研究方法的团队与数据科学家一起工作——金融分析师在夜校学习数据科学基础。

以Point72为例,该公司去年大部分传统交易策略都亏损了,这种情况很常见,而该公司的量化投资者赚了5亿美元。Point72正在将数千万美元投入到分析大量的数据中,包括智能手机上的应用程序捕获的信用卡收据和客流量。这些结果转交给康涅狄格州斯Stamford, Conn投资公司的交易员。

Point72的首席市场情报官Matthew Granade最近鼓励伦敦经济学院学生学习基本的编程语言,如R和Python,以提高毕业后的竞争力,他表示,投资人正在将他们的偏好从“工匠”转向工程师。

亿万富翁Paul Tudor Jones是历史上最着名的投资者之一。 这位前棉花交易商预计1987年股市崩盘,从中专区了大量的利润,平均年均涨幅超过17%。他的对冲基金公司Tudor投资公司在2014年和2015年几乎没有赚到任何钱。

据去年的报道,Paul Tudor Jones感受到更多成功的量化交易者交易者带来的压力。十月份,Jones先生选择了雇佣了Dario Villani,这位意大利人拥有理论物理博士学位,以帮助Tudor恢复活力。

在人才争夺战中,以量化为重点的企业往往不愿称自己为对冲基金甚至投资公司。量子投资公司宁愿强调自己与硅谷最前沿的科技公司的相似之处。

位于纽约的Two Sigma公司拥有内部的黑客实验室,机器人比赛和游戏室。 Empiric自称是“在金融市场上运作的科技公司”。

伦敦的量化研究员Saeed Amen表示,他的投资策略在他14年的大部分职业生涯中被认为是“非常小众”。他曾组织了宽客之间的社交活动,包括以古希腊的几何学大师Thalesians命名的小组活动,有时候能吸引十来个人参加。

如今,更多的推动力量来自投资者,如加利福尼亚州Pepperdine大学,去年该学院将其7.5亿美元投资组合中的大约10%的资金投入大型量化投资基金,包括伦敦的Man Group PLC和AQR资本管理有限公司 。

在此之前,Pepperdine基本上没有量化投资。投资总监Michael Nicks表示: “找到一个有前景的公司是很有难的的,因为我们需要在日常生活中寻找低估的东西,但量化策略与我们的生活无关。”

而现在,Michael Nicks认为,“经过多年的自我教育”和与数位量化投资经理的数十次会议之后,Pepperdine已经做好了开展量化投资的准备。“

Source:WSJ,雷锋网编译

雷锋网