标签归档:深度

深度 | 中美贸易战对虚拟货币市场的影响和启示

雷锋网·AI金融评论按:本文作者 MakerDAO经济学者 潘超,来源微信公众号“ CryptoEconomics”,转载已获授权。

“从中美贸易战和近期政治经济事件带来的影响来看,比特币已经失去避险功能,虚拟货币市场进入了一个新的阶段。”

北京时间3月23号凌晨,特朗普签署总统备忘录,宣布对中国价值500亿美元的进口商品征收关税。由于担忧美中贸易战爆发,美股遭受重挫,道琼斯指数下跌 724 点(2.9%),创下历史上第五大下跌幅度。

随后,中国宣布30亿美元的反制裁措施,进一步激化了贸易战的局面。上证A股开盘后最高跌幅达到 5%。全球股市进入恐慌下跌。

同时,作为避险资产,黄金价格大涨 2.7%。

而比特币等虚拟货币并没有成为全球资金的避险选择,反而跟随股市下跌。

这和早期 - 全球政治经济出现恐慌,比特币上涨的趋势完全不同,也反映了关于当前虚拟货币市场的重要特征:比特币已失去避险功能,虚拟货币市场早已进入了一个新的阶段。

早期阶段

2013年初,塞浦路斯政府无力救助本国爆发的银行危机,不得不向国际求助。欧盟、欧洲央行及国际货币基金组织同意给予塞浦路斯100亿欧元的贷款,条件是该国的银行必须向银行储户征收存款税,从中筹集58亿欧元。塞浦路斯的储户人人自危,争先把本国货币换成比特币,比特币短短几天从30多美元一度飙涨到265美元。

2015年6月,希腊陷入债务问题,并很有可能出现债务违约并离开欧元区。希腊当地人民和欧洲群众陷入恐慌情绪,并把比特币作为避险资产和价值储藏。比特币的价格在一个月内攀升 37%。

市场现状

然而从去年以来的几个国际政治经济事件来看,比特币等虚拟货币已经逐渐失去了避险资金功能。

2017年9月4日,朝鲜进行大规模核试验,全球资本市场陷入紧张。尽管美国股票市场处于劳动节休息日,这种紧张局面还是在黄金市场体现出来。黄金价格上涨 1%,达到一年来以来的新高。日本东证指数和韩国综合股价指数分别下跌 1% 和 1.2%。

 

然而,比特币却在当日下跌 5 %。

2018年2月5日,美股经历了自2008年金融危机和11年欧债以来最大跌幅,道琼斯指数单日失掉1175个点,全球资本市场普遍出现超过3%的下跌。而虚拟货币市场受这一影响发生恐慌性抛售,单日蒸发将近 30%市值,比特币跌幅几乎20%。

可见,比特币不但没能成为投资者的避难天堂,反而在全球投资出现恐慌时加剧下跌。

通过对比近几个月的 VIX 指数和比特币价格。(VIX指数又称为恐慌指数,是芝加哥期权期货交易所使用的市场波动性指数。该指数反映市场对未来30天市场波动性的预期)

我们发现 VIX 指数越低,即市场波动越小时,比特币价格越走高,反之当市场波动越大时,比特币价格越走低。这意味着比特币等虚拟货币已经从避险资产成了资本市场恐慌性的晴雨表,甚至更容易受到资本市场恐慌性的影响。

背后原因

那么,是什么原因让比特币等虚拟货币失去了避险资产功能呢?

归结起来主要原因在于比特币等虚拟货币投资者基础已经发生改变,交易市场中主要为机构和专业交易员。与早期主要持有者为科技爱好者和部分自由主义者不同,随着17年底的热潮和泡沫,虚拟货币市场吸引大量投资机构,而普通投资者在震荡后选择退场或观望。对于专业交易员来说,比特币等虚拟货币仅仅是众多资产配置中的高风险资产之一,在全球政治经济出现震荡时,高风险投机资产很自然地得到减仓。同时这也意味着,比特币已经完全成为了投资性资产。

另一个原因是,虽然传统资本进入虚拟货币市场,但虚拟货币仅仅是一个小市场,要知道整个虚拟货币市场的市值不超过一个大型上市公司。因此,虚拟货币价格很容易受监管政策、交易所影响,而这些事件发生的频率远远超过国际政治经济恐慌的出现。以2017年9月4日的朝鲜核试验为例,比特币单日下跌5%主要是因为中国七部委发布禁止ICO文件。

面对中美贸易战,如何配资?

从VIX 指数来看,全球资本市场仍处于恐慌高位。由于在23日签署总统备忘录后,美国将有15天的时间确定关税涉及的具体商品和服务,而美国和中国仍处于商务谈判中。

在具体政策和措施出台之前,并不建议重仓虚拟货币或者将虚拟货币当做避险资产。从保持流动性的角度,USDT 或稳定货币 Dai 将会是默认选择。

雷锋网

深度 | 宣传光纤扫描成像多年,Magic Leap最终投入光波导怀抱(最新专利文件详解)

在近来虚拟现实风投联盟(VRVCA)发布的报告显示,2017年,VR/AR全球投资总额达到30亿美元新高,较过去两年增长超过250%。值得注意的是,少数几家公司获得的融资占据了整体的较大比例。雷锋网曾报道,Magic Leap在2017年获得淡马锡控股领投的5.02亿美元,2018年初获得沙特主权财富基金4亿美元投资。从2014年至今已经累计获得近23亿美元。

在雷锋网看来,Magic Leap屡屡获得巨额融资,有两个主要原因:首先因为其站在AR眼镜的风口上,其次由于其宣称采用空间计算、光学显示等前沿黑科技。

Magic Leap筹备六年,前期看来其全靠视频宣传“骗取”融资,终于在2017年底发布其AR眼镜产品——Magic Leap One创造者版本。滚石记者在体验后称,ML One显示的虚拟物体不透明,能遮挡物体,还没有颗粒感。这可以碾压目前几乎所有AR眼镜。

Magic Leap官方描述称:我们的光场光子产生不同深度的数字光,并与自然光无缝融合,从而将逼真的虚拟物体叠加至真实世界中。Magic Leap一开始宣告他们采用了光纤扫描光场显示技术(FSD)、光子光场(通过聚焦/深度平面解决视觉辐辏调节冲突)、以及被称为“光场芯片”的衍射波导。这些技术Magic Leap一直秘而不宣,业内人士也少有知情者。

3月2日,美国专利商标局公布了多个来自Magic Leap的专利文件,包括Magic Leap的外形结构、系统方法和波导显示器原理。我们终于得以一窥Magic Leap最神秘的光学显示技术。

在看到专利后,雷锋网特意联系国内光学显示相关专业人士来进行全面解读。以下分析来自——灵犀微光高级光学工程师小康,雷锋网做了不改变其原意的编辑。灵犀微光为消费级AR提供关键底层技术,聚焦AR设备的瓶颈技术——光学显示,主攻AR产品中的核心器件光学引擎。去年12月,灵犀微光获红杉中国千万级A轮融资。此前,灵犀微光曾参与雷锋网硬创公开课,讲解《从离轴光学到光波导技术:详解AR显示的过去和未来》)

Magic Leap, 这家做了多年海洋动物视频的神奇公司,在近期还是有不少进展。比如说从“虚拟版”大鲨鱼跳出篮球场地面,进阶到“现实版”驰骋篮球场的“真·大鲨鱼”奥尼尔代言其最新产品Magic Leap One,宣传路径看上去一脉相承。然而在技术层面,Magic Leap多次改变技术方向,Magic Leap最近公布的专利US2018/0052277全部20条权利要求自始至终都围绕着平面光波导来处理近眼显示系统的光学问题,并未使用先前宣称的光纤扫描技术。

 在光波导中切一块蛋糕

专利显示,设备借助三层波导进行光线传播,而波导表面则是包括多层镀膜、超表面或者体全息波导等技术来对不同波段的光线进行处理,让三色的光线分别进入三层波导中。

同时通过光栅来使每一层波导中的光线一部分耦出波导传向人眼,一部分在波导内继续折叠传播。

每层波导包含不同可重叠区域,用于传递光线以及耦出。如下图X所示:

(图X,以下图片均来自Magic Leap专利文件)

再来看这篇专利说明书全文,几乎把Magic Leap的新产品从头到尾讲了一遍,包括图像投影显示、光波导耦入/耦出、出瞳扩展和最终的产品工业设计,甚至连镜腿可以弯曲都写了进来,但其权利要求书却只讲了平面光波导的应用这部分,这说明Magic Leap可能存在有多篇同时申请的专利,共用同样一份专利说明书,更多的权利要求可能还在未公布的专利中。

从专利说明书的细节里不难发现,Magic Leap这篇专利中唯独和先前宣传相照应的是,多层光波导不仅限于颜色分层,还会在不同层中显示不同距离的画面,实现深度感。换句话说,这是一种伪光场效果,是介于平面显示和光场显示之间的一种朴素地实现深度信息的一种方式。如下图所示:

在耦入方面,Magic Leap使用的是传统显示模组。

用三色光源(图中8705)照射的反射式显示器(图中8707,比如LCOS),通过PBS(图中8710)投影到透镜组(图中8715)中,上右图为实际的光路示意。

至此可以明确的是,Magic Leap在新产品中既没有使用先前传言的光纤扫描成像技术,也没有实现真正意义上的光场效果。他们在做了多年视频工作以后,终于投入了光波导的怀抱。

和Microsoft在光波导方案撞车,趋势or巧合?

专利中的描述和图片表达像极了Microsoft对HoloLens的技术专利US9372347中的表述。对比图X和图Y,我们能清晰地发现Magic Leap的光波导镜片和Microsoft的光波导镜片形状几乎都一样:光线都是从一个圆形的耦入区域耦入,而后分配给扇形的扩展出瞳区域,最终由方形的耦出区域耦出到人眼中。

(图Y,来自HoloLens专利文件)

再来说说其中的不同:Magic Leap在其专利的权利要求书侧重于耦入光线的分离和分别传送,即多层光波导片之间的关联部分(膜层或者表面处理)的设计和制造(用于按照需求从耦入的光线中分离出);而Microsoft在其专利的权利要求书中的侧重则在于单层光波导中全息光栅对光线的引导和传递,从而达到扩展出瞳的目的。

从以色列增强现实公司Lumus开始做阵列光波导,到Microsoft继续使用全息光栅将光波导方案发扬光大,再到上个月爆出苹果未来光波导方案的专利,现在看来,Magic Leap也算是用旁敲侧击的方式从平面光波导的专利大集合中切了一块蛋糕。至此,在增强现实阵营中,巨头们都纷纷选择了光波导方案,殊途同归。随着多年技术挖掘,光波导领域的技术和专利局面已经成型。

光场、光纤维扫描、光波导,都是何方神圣?

 1. 光场技术

所谓场,就是将光线以场的形式记录下来,使得最终能够还原场景任意位置的任意光线信息的一种模式。从效果上讲,光场技术实际上是一种记录和重现真实而完备的3D场景的过程。

如何才能记录一个场景下所有的光线信息呢?有一种比较老套的手段就是用许多照相机。

大家应该能想起来《黑客帝国》里Neo后仰躲子弹的场景,有那么一个瞬间,似乎时间暂停,飞翔的子弹和雨滴都停止了运动,镜头在这个时间暂停的场景中转了一个角度。“时间暂停”的这个瞬间的这些帧图片,便是用排成一排的摄影机同时记录同一个时刻的信息,最终把同一时刻的不同角度的画面先后排列而形成的“时间暂停”的瞬时立体光场效果。


在电影术语里,这种方法叫Bullet Time(中文译作“子弹时间”),算是一种朴素的光场拍摄,在动物世界里有很多场景也应用了这种拍摄手段。

这仅仅是增加了一个维度的信息采集,如果变成更完备的光场采集,那就需要下面这样的相机阵列:

想象一下,每一台相机采集的视频都存储并再现出来的时候,观察者便可以挑选任意相机的视角去看所记录的场景,便有了一种3D场景的全再现的效果。

2. 光纤扫描成像

光纤扫描成像其实是光场再现技术的一种。光场再现和光场记录是逆向过程,需要将记录光场的阵列相机模型反过来。再现光场效果所需要的设备就是阵列显示设备,阵列的每一个单元都需要能够显示从某一个角度观察的画面的全部信息,对于不同视角的观察者,还需要显示出不同的像素内容。相比传统2D显示器,再现光场的显示器从信息量来看,相当于在2D显示器的每一个像素点上承载整个画面的分辨率的内容,而这样的显示设备没有办法真正集成在2D显示器一个像素点大的空间内,因此实现起来难度会很大。

Magic Leap的光纤扫描技术便是用光纤来做一个像素点的投影,通过光纤头的微透镜把一幅画面的图像信息投射出来,作为光场再现显示器的一个“像素点”,然后通过光纤头的扫描,就像显像管的电子束扫描一样,扫出光场再现显示器所有的“像素点”。

3. 光波导技术

光波导技术是当前应用最广泛的增强现实显示技术。从投影模块到人眼的过程中,需要光波导进行耦入、传导和耦出,最终呈现在人眼前的是一个透明镜片透射出来的图像,与偏振分光棱镜相比,有其轻量化的优势,同时可以通过多层叠加的方式显示不同深度的信息。

小结

完全还原一个场景中的所有光线信息,是我们所能想到最完美的显示技术,这也是光场技术所许诺的。但我们往往容易低估一项新的技术诞生到成熟的周期,经过一系列实验的光场技术依然不具备产品化的条件。这个行业的先驱Magic Leap选择回归产品,从消费级AR眼镜最基本的需求出发,用多层叠加光波导的技术实现相对轻便、又拥有多深度显示的Magic Leap One。


雷锋网

深度 | 手机AR,谷歌为何起了个大早却赶了个晚集?

就在前几天,谷歌正式发布增强现实软件工具开发包ARCore 1.0,上亿安卓手机将拥有AR功能。在苹果ARKit推出半年之后,谷歌终于与苹果正面开战。

在手机AR上,相比苹果,谷歌似乎成了后来者。

而其实,ARCore的前身——谷歌Tango早已面世几年,谷歌才是智能手机AR的开创者。苹果抢先推出在大量设备上使用的ARKit,使得谷歌迫于压力停止Tango项目,转而推出ARCore。看起来像只是改了个名字,但是也意味着谷歌在Tango上的心血和希冀也大部分付诸东流。

雷锋网特意梳理了Tango项目的前因后果,加入多位业内人士观点,与您一起聊聊:谷歌砸重金的创新项目Tango为何行不通,以至于被苹果抢了先机?谷歌Tango项目还有哪些可能,能给我们哪些启示?

超前的Tango:定义下一代智能设备

谷歌原本是想定义下一代智能设备。

2014年2月,谷歌先进技术和项目团队(ATAP)发布名为”Project Tango“的新项目,以计算机视觉技术为智能手机添加运功追踪、3D感知功能。

项目负责人Johnny Lee表示:“我们的目标是让移动设备拥有和人类一样的空间和运动感知能力,以增强和创造新的用户体验。”“这个手机配置了一些能绘制完整3D的硬件和软件,它可以精确描绘关于周围环境的3D地图。其中的传感器速度可以快到实时更新周围的地理位置,并将这些数据迅速转换成3D模型。”

Tango有三大核心组件:

  • 运动追踪(Motion Tracking):通过移动设备自带的多种传感器,在不通过外界信号的情况下(例如GPS,WiFi,蓝牙Beacon等),实时获取设备的姿态与位置(6Dof)信息。这是Tango的核心功能,其技术实现方式是:tango使用视觉+惯性器件,实现了VIO(visual-inertial odometry)算法。

  • 深度感应(Depth Perception):利用自带的深度传感器扫描外界三维环境,生成点云,构筑三维模型。

  • 环境学习(Area Learning):可以被视作是motion tracking的增强,它可以将之前走过的路径记录下来,自动矫正环境构建与运动追踪中积累的误差,识别重复环境,减小误差。

Tango无疑在软件和硬件上都很有技术含量。

在凌感科技CTO马赓宇看来,“Tango之前,基于视觉的3D运动跟踪和场景建模还只是一个学术研究题目,可以做些demo,但是没有能实际应用的系统。谷歌投入了大量精力,为3D运动跟踪和场景建模专门设计了传感器和移动计算平台,把停留在纸面上的技术变成了能广泛应用的产品,使得移动AR成为可能。”

Tango并不是真正的产品,而是一个品牌名。Tango 是一个在规定的硬件标准下运行的软件程序,其规定了RGB、鱼眼镜头、深度相机、CPU/GPU规格等硬件参考设计,还涉及VIO(运动跟踪),稀疏映射(区域学习)和密集 3D 重建(深度感知)等软件。谷歌还与Movidius合作,为Tango打造了独特的视频处理芯片Myrid VPU,该芯片助力复杂的Tango算法能在手机上流畅运行。

谷歌没有把Tango的技术授权给任何第三方,想使用Tango只能去购买谷歌官方支持的几款硬件。

(The Yellowstone Tablet)

谷歌发布了几款硬件来主导Tango手机,第一款是2014年初的”花生“手机(The Peanut),第二款是”黄石“平板(The Yellowstone Tablet)。Tango平板售价起初为1000美金左右,而后降低至500美金,总共卖出1000台左右,主要面向开发者。

(联想Tango手机)

2016年6月,谷歌与高通合作开发消费级Tango手机,取消了Tango平板上有的视觉处理芯片,也取消了对深度相机的要求。同年,联想发布第一款搭载Tango的智能手机——联想Phab2 Pro,采用高通骁龙652芯片,售价400美金。随后,2017年,华硕与谷歌合作,推出了支持Tango的ZenFone手机。从2014年到2017三年的时间里,我们也仅看到几款支持Tango的手机,而这些手机设备也没有引起市场太大的关注。

Tango催生移动AR,却为何“卖不出去”

“看起来很酷,但是究竟要怎么用呢?“这是不少人对谷歌产品的感觉。

Tango究竟要用来做什么?虽然现在ARCore很明显就是AR开发平台工具,但是Tango一开始其实定位为3D感知手机,谷歌一直介绍Tango是一款——“知道自己在哪儿的手机”。基于运动追踪和空间感知功能,谷歌一开始希望用Tango来解决室内导航的问题,在室内无法使用GPS的时候,不依靠任何外部的设备,就能提供设备的定位。

Tango与AR/VR发生关联的重要信号在于:2016年11月,Tango项目从先进技术和项目团队(ATAP)转移到了Daydream部门。负责人Johnny Lee表示:Tango 团队将会和 Daydream 团队协调合作,两个团队的工作将会由谷歌 VR 部门的负责人 Clay Bavor 统一管理,并且 Clay 则会直接将工作汇报给谷歌CEO Sundar Pichai 。

2016年是VR的元年,HTC、Oculus、PSVR几大高端头显发布,Pokemon Go的火爆也让大家对AR充满期待。Tango技术开始越来越多地应用于AR。

2016年底,在谷歌与联想合作举办的Tango开发者大赛上,谷歌Tango项目的研发工程师郭旭曾说:Tango技术的一个最关键优势就是易于普及,“目前,如果要推广其他的VR/AR平台,开发者一般都需要花费几百美元或者上千美元去购置一套设备。但是Tango不同,它借助一个现有的智能手机平台,如果推广开来,可以很容易地达到一个非常高的市场占有率,而且像安卓一样是免费的。更重要的是,随着用户数和开发者数量的持续增长,Tango将对整个AR/VR行业产生一个积极的推动作用。”

在马赓宇看来,“Tango是第一个能实现AR功能的手持设备。它证明了手机AR可以达到以假乱真的效果。是一个具有跨时代意义的产品。很多用户和开发者,都是通过Tango第一次体验到了AR的神奇。”

然而,在2016年底,联想Phab2 Pro发布时,Google Play商店中有仅有为数不多的几款Tango设计的应用:AR虚拟家居摆设、AR游戏、AR博物馆等。Tango无疑是第一个能在智能手机上支持AR的平台,可惜,却没能早早地普及到大规模设备,也没有火爆的应用诞生。

Tango为什么卖不出去?

马赓宇分析到:“Tango手机的研发成本高。需要特殊的硬件。而且算法需要针对不同的CPU进行优化。同时由于Tango手机少,开发者开发AR内容的热情不高。导致用户没有购买意愿。又进一步降低厂商研发Tango手机的热情。”

硅谷投资人Matt Miesnieks分析到,三年来,仅有屈指可数的几款手机搭载了Tango,其原因可能是:谷歌公司不想为每家 OEM 都进行特定的传感器校准过程,且随着 Android 智能手机硬件商品化,相机和传感器堆栈是 Android 手机最后实现差异化的地方,所以 OEM 厂商无法满足谷歌的要求。谷歌认为,深度相机是手机的一部分,但是深度相机增加了手机成本,这也是 OEM 厂商拒绝 Google 的另一个原因。

苹果抢占先机

Tango发展缓慢,而苹果借助ARKit,抢先在所有iOS设备中上线了AR功能。AR真正变得进入大众用户,以大量的硬件设备持有来支持消费市场的内容开发。

2017年6月,苹果在WWDC上公布了自己迈入 AR 领域的第一步——针对 iOS 11 推出 ARKit,使得上亿设备瞬间拥有AR功能。开发者不需要任何别的工具,就可以轻松利用ARKit开发AR应用。苹果CEO库克认为AR是等同于智能手机一样重大的创新,会给人生活带来巨大的影响,而苹果ARKit将和App Store一样成功。ARKit一推出就备受关注,短短半年时间,App Store中就有超过三千款基于ARKit的AR应用。

2017年9月,谷歌发布ARCore,与苹果分庭抗礼,然而由于晚到一步,谷歌成为了苹果尴尬的追随者。

“12 个月前,Google 本就可以轻松交付能够在 Android 系统上运行的 Tango手机,但 Google 没有这样做。如果 Google 早早将 Tango 发货 ,那么 ARKit  的问世也只是紧跟趋势,而非重大突破。“Matt不由得感叹。

Matt指出,ARKit的基础技术是视觉惯性测量(VIO)系统、简单的2D平面检测。ARKit可以被看成轻便的SLAM系统,可以将3D虚拟物体放置在真实的平面中,使得虚拟物体在平面上运动,还可以追踪用户的相对运动。

ARKit核心的VIO系统和谷歌Tango没有区别,ARKit能实现的功能和Tango也几乎一样。但是,显然,苹果在软件和硬件的整合上,甩了谷歌几条街。Matt认为ARKit的优势在于苹果公司可以负担得起将 VIO 算法紧密耦合到手机传感器上,并花费很多时间来校准 VIO 系统,以减少计算空间位置时产生的误差。

赛格威机器人研发高级总监陈子冲分析到:“单目的VIO都需要每台手机有标定的流程。苹果的手机因为是标准化的,一共只有几个型号,所以他显然做得更容易一些。Google要在android生态中要推广普通相机使用VIO,那就要解决这个标定问题,可能是通过某种自适应方法,使得这个步骤可以免除。但是仍然,他需要一家一家去测试,毕竟每家手机的摄像头和IMU型号和位置都不一样。所以你看他是一批一批的支持Android手机。“

库克在接收英国独立报采访时,更为简洁地指明了ARKit的先发优势:“苹果公司自己打造手机制造软件和硬件,这使得它在AR和其他领域都处于独一无二的优势地位。谷歌也在对它的Pixel手机系列做同样的事情,并整合了良好的虚拟现实功能,但这些手机的销量并不大。”

谷歌的AR技术积累早于苹果,但是由于没有整合好软硬件,被ARKit抢占了先机。此时,谷歌显得十分尴尬,要么推出单目AR SDK,要么强推Tango让安卓手机硬件升级。

Tango推出三年,也仅获得几款手机支持,谷歌现在明显只剩下推出单目AR SDK这条路。2017年8月,谷歌在新品发布会上展示了ARCore开发者预览版,可以支持Samsung S8和 Pixel系列手机,正式与ARKit开战。ARCore被看作是轻量级的Tango,有业内人士认为,谷歌看起来只是注释掉了Tango深度相机部分,换了个名字。

前文介绍到,Tango有三大核心组件——运动追踪、深度感知、环境学习。由于减少了深度相机和一些传感器,ARCore保留了运动追踪和一部分的环境侦测功能,其深度感知,3D建模的能力则不如Tango,而这曾经是Tango最黑科技的一部分。

Tango项目停止,ARCore登场

2017年12月,谷歌停止Tango项目,全力支持ARCore。

谷歌发文解释到:“自 2014 年开始,我们一直在关注 AR 研发,并且推出 Project Tango。从 Tango 中我们积累了不少经验,将其应用于 ARCore 的研发中。遗憾的是,Tango 需要定制硬件,而 ARCore 是一个快速和高性能的,可广泛应用的 SDK 工具,能为数百万台符合要求的移动设备实现高质量的 AR 效果……由于我们将关注点从 AR 技术本身转移到整个以 ARCore 为主的安卓生态系统,所以我们决定将停止支持 Tango。”

也就是说,在长达三年的技术探索之后,谷歌Tango的软硬件参考设计行不通之后,谷歌要将ARCore开放给更多的安卓设备了。

而就在前几天,谷歌宣布正式发布ARCore 1.0,可运行于13种不同型号、超过一亿台的智能手机。这13款手机包括:谷歌Pixel,Pixel XL,Pixel 2,Pixel 2 XL;三星Galaxy S7,S7 Edge,S8,S8+,Note 8;LG V30,V30+;华硕 Zenfone ;One Plus 5。谷歌也正与包括华为、摩托罗拉、华硕、小米、HMD/诺基亚、中兴、索尼和 Vivo 在内的多家智能手机厂商展开合作,在他们将推出的产品中搭载 ARCore。

简化Tango,推出ARCore是谷歌不得已之举,这意味着承认Tango项目的失利,并且承认苹果ARKit抢占了先机,正确地引领了手机AR之路。

但是,谷歌或许也得感谢苹果打开了手机AR的市场,为Tango日后的发展奠定基础。虽然说,谷歌停止了Tango项目,放弃了以Tango为品牌打造智能设备的策略,但是并不等于谷歌会放弃继续发展Tango的核心技术,用于ARCore的升级,以及其他的创新产品。

马赓宇谈到:”苹果突然发布ARKit产品,性能与Tango相近,而且可以在普通手机上实现。使得还需要特别硬件的Tango方案失去了市场竞争力。Tango优于ARkit的一点是它还可以实现场景的3D建模。在一些低纹理区域可以工作的更好。而且在未来的AR应用中可以给用户更多的信息。传闻苹果也在考虑加装后摄的深度摄像头,未来的硬件可能跟tango类似。“

陈子冲认为:“从Tango到ARCore,谷歌全面转向了AR这个业务需求,致力于在所有的Android手机上提供给AR的SDK。在技术上是一个平移,在业务上是一个拓展(从原来少数几款手机推广到整个Android生态。国内相关的手机公司大概率会和谷歌合作,获得ARCore的支持。对于从事VR的公司也是利好,可以通过极少的技术投入,以很低的成本(android+摄像头)实现一个6轴的VR头盔。”

虽说现在苹果ARKit抢先几个月发布,但是这种领先估计也只能说先走了半步。ARKit 1.5 和ARCore 1.0都还是初代产品,不少开发者对雷锋网表示,无法用它们做出很惊艳的产品。而不少开发者心中理想的AR开发工具还需要具备:更强大的环境理解功能、实时3D重建、多人交互、语音识别等,才能达到真正的虚拟与现实融合。目前,我们确实还没有看到爆款的AR应用。

虽然苹果不升级硬件,抢先了半步,但是硬件升级或许是必然的。UCVR CEO胡金晖谈到:“谷歌停止Tango,推出简化版ARCore,策略上可能打算曲线救国。这些手机OEM厂商觉得Tango方案又贵,又要重新设计主板,不想采用,那就干脆先把软件技术集成到现有手机上,等大家适应了也用惯了AR手机,想要更高端的时候,只要在上面加个深度传感器就好了。”技术总是不断更新迭代的。

未来,Tango会复活吗?

从技术史来看,从没有一个凭空冒出来的创新技术,新技术一般是旧技术的组合创新。Tango也是一些技术组合而成,Tango项目的停止,并不会终结这些核心技术的可能性。

这一切,可以从微软Kinect说起。

2010年,微软为Xbox 360特意打造了Kinect。Kinect配有深度摄像头和语音识别麦克风的硬件,可以识别空间、人体动作,且支持语音控制,xBox立马变身体感游戏机,增添了很多创新的玩法。

微软Kinect是人机交互领域跨时代的作品,在此前,人机交互一直是以机器为中心的,人类学习机器的语言去和机器交流。微软Kinect首次让机器学会理解人类,理解人类世界。Kinect是微软为了填补人体和设备界面之间,超越键盘、鼠标、触控屏极限的一次伟大尝试。

在雷锋网此前文章《微软的Kinect停产了,但它为今天的VR/AR做了很多贡献》一文中曾写到:

自 2010 年来,苹果仿效 Kinect 语音控制功能,推出了 Siri 语音助手;谷歌也开始了 3D 追踪系统 Project Tango(该项目的领导者是曾经研发 Kinect 的 Johnny Lee)。视觉和语音系统几乎成了智能手机的标配,也逐渐进入我们的家居领域。亚马逊 Echo 将语音助手带进爷爷奶奶的卧室。新一版的 Echo Show 还在 Alexa 上加装了摄像头。

谷歌Tango项目起源于Kinect,命运也和Kinect相似。作为开创性的产品,Kinect的黑科技难以扩展应用场景,被市场接受。微软停止Kinect项目,但是并没有停止Kinect相关技术的研发。

商询科技CTO邬浩告诉雷锋网:“Kinect二代停产,也仅仅是用于xbox的Kinect硬件设备卖的不好,所以硬件不再生产了,但Kinect技术线是一直持续的。HoloLens自身属于Kinect四代技术,而Kinect五代技术一直在研发中,并且已经就要发布了,而这就是HoloLens二代。“

即便是硅谷消息最灵通的科技记者,也经常不知道几大科技巨头公司都有哪些部门,每个部门实际上在从事着什么样的研究。在雷锋网看来,Tango项目虽然停止了,但是其后续影响力肯定还将持续。

谷歌在Tango的技术积累可以帮助ARCore更新迭代,这自然不必再说,Tango还有其他更多的炫酷应用。

iPhone X人脸识别

(iPhone X原深度摄像头系统)

2017年10月,苹果发布了iPhone X,其最大的特色是增添了一个拥有数十颗传感器的”原深度摄像头“。这个摄像头可以实现人脸识别,使得人脸解锁代替指纹解锁,同时还可以实现人脸3D重建,方面AR贴纸功能。iPhone X的深度摄像头用到是和Kinect、Tango一样的结构光技术。

目前,3D机器视觉获取深度信息的办法主要有三种:结构光、TOF 时间光、双目立体成像。Kinect一代和Tango一代采用结构光的方法,2013年苹果收购了Kinect的开发商PrimeSense,Kinect二代和Tango二代都改为采用TOF感知深度信息。

荣耀V10发布会,华为宣布正在开发“占云深度摄像头”

去年11月,华为在荣耀V10发布会上,推出“点云深度摄像头”散班结构光手机配件,可以感知用户脸部的深度并对脸部建模。据雷锋网了解,华为不仅会做前置的深度摄像头,也会做后置摄像头。另有消息,小米和OPPO将在明年发布的智能新机中,使用3D感应的面部解锁方案。

虽然现在前置的原深度摄像头主要用于人脸识别,相信日后我们会看到更强大的可以理解环境、理解物体的深度摄像头。Tango首先让人们看到了搭载深度摄像头的智能手机的潜力,iPhone X的人脸识别让这个技术先一步普及,未来,深度摄像头将成为智能手机的标配。

工业机器人

2014年,谷歌Tango就曾被用在NASA的空间站机器人SPHERES上,帮助机器人执行通讯、拍照、和处理能力。在装上Tango之前,SPHERE可以做的事情仅仅是在空间站里飞来飞去,借助Tango的运动追踪、环境感知能力,这些机器人可以从事修理、运输、搜寻物品的工作。如果NASA采用定制的深度摄像头将会比Tango贵1000倍,真是节省了不少钱。

Tango的技术可以对机器人领域有所助益。在机器人领域,感知环节是进展缓慢且相对薄弱的环节。传感器和环境感知技术的进步,会使得机器产业有较大的跳跃。

总结

谷歌很多的产品都相当的酷,例如Google Glass,例如Tango。而这些产品似乎都有一个共同的问题:Google还没有想好要怎么用,不过这是大多市场引领者都会面临的问题。谷歌虽然停止了Tango项目,但是我们现在看到了ARKit和ARCore的分庭抗礼。俗话说,走的人多了,自然就有了路。随着更多玩家的加入,AR的发展会越来越清晰,谷歌之前借Tango畅想的新一代智能设备,也变得更加切实。

雷锋网

深度 | AI芯片之智能边缘计算的崛起

雷锋网注:本文是线性资本黄松延对终端智能芯片前沿技术和市场动态的分析,松延是浙江大学机器学习博士,前华为数据科学家,对机器学习及其应用有深入的研究,阅后若有所感,欢迎通过微信号Nikola_629与他交流。本文转载自公众号“线性资本”,雷锋网已获取授权。

基础层、算法层与应用层是人工智能产业链的三个组成部分。人工智能(AI)正在作为基础技术,改变不同的行业,并具有极其广阔的应用市场。考虑到深度学习等AI算法开源的发展趋势,基础层的数据与芯片将在未来竞争中占据越来越重要的地位。作为人工智能发展支柱的AI芯片(特指专门针对AI算法做了特定设计的芯片)更是人工智能行业的核心竞争力。

基于深度神经网络(DNN)在各个应用中表现出的巨大优势,本文的AI仅限于深度学习。下文将从AI计算与AI芯片出发,分析不同种类AI芯片间的区别,探索应用于终端推断(Edge Inference,EI)的AI芯片,即AI-EI芯片,并给出AI-EI芯片硬件架构特性,讨论多家AI-EI芯片公司,最后给出AI-EI芯片发展趋势及投资逻辑。

一、AI计算及AI芯片

近几年,深度神经网络(DNN)在图像识别、自然语言处理等方向上取得了前所未有的成功,并推动相关行业的快速发展。但是,这些应用中使用的深度神经网络的参数量巨大,模型训练(training)与推断(inference)都需要大量的计算,传统计算芯片的算力无法满足DNN计算需求。具有高算力的AI芯片能够满足AI行业计算需求并得到了快速发展。

2016年AI芯片全球市场规模为23.88亿美元,有机构预计到2020年AI芯片全球市场规模将达到146.16亿美元(终端AI芯片的市场规模),发展空间巨大。另外,各国纷纷把AI芯片定为自己的战略发展方向。 

与传统CPU不同的是,AI芯片具有大量的计算单元,能够适合大规模并行计算的需求。基于通用性与计算性能的不同,可以把AI芯片分为GPU、FPGA、ASIC三大类。深度神经网络的基本运算单元是“乘-加”(MAC)操作。每次MAC中存储器读写操作如图1所示。

图1:每个MAC的读写操作

在AI应用中,CPU与AI芯片的计算能力是由芯片所具备的MAC能力及如何发挥芯片的MAC能力两个因素决定。

CPU是通用芯片,CPU的大部分面积都被控制单元与缓存单元所占,只有少量的计算单元。另外,CPU的指令执行过程包括取指令、指令译码与指令执行三部分。只有在指令执行的时候,计算单元才能发挥作用。因而,CPU在发挥芯片的MAC能力方面亦比较一般。为了提高指令执行效率,CPU采用指令流水处理方式。


GPU有大量的计算单元,适合大规模并行计算。但是,GPU也是通用芯片,其指令执行过程也由取指令、指令译码与指令执行三部分组成。该特征是制约GPU计算能力的主要原因之一。


FPGA,即,现场可编程逻辑门阵列,是一种更接近I/O的高性能、低功耗芯片。FPGA是算法即电路,软硬合一的芯片。基于硬件描述语言,可以把算法逻辑直接编译为晶体管电路组合。由于FPGA的硬件电路是由算法定制的,其不需要取指令与指令译码过程,因而,FPGA能够充分发挥芯片的计算能力。另外,FPGA可以重复编程,因而具备一定的灵活性。


ASIC,即,专用集成电路。类似于FPGA,ASIC采用的也是算法即电路的逻辑,亦不需要取指令与指令执行过程。另外,ASIC是为了特定的需求而专门定制的芯片,因而,能够最大程度发挥芯片的计算能力。但是,不同于FPGA的可重复编程,ASIC的设计制造一旦完成,就无法再改变,其灵活性较差。

在评价一个芯片架构性好坏时,有多种指标可供参考。其中,能耗与峰值计算能力(芯片结构中每秒计算操作数的总和,用OPS表示)是两个重要的衡量指标。不同指标间会相互制衡,一个指标的增高可能是以牺牲其它指标为代价而获取的。因而,常采用归一化的指标单位能耗算力(OPS/W),即,能效,来衡量芯片计算性能。实质上看,上述的四种芯片是通用性与能效trade-off的结果。能效方面,ASIC>FPGA>GPU>CPU。通用性则反之。

对于AI芯片,从市场格局来看,NVIDIA是GPU行业的绝对龙头。对于FPGA,XILINX、ALTERA(现并入INTEL)、LATTICE、MICROSEMI四家占据全球99%的市场份额。其中,XILINX、ALTERA两家占据全球90%的市场份额。另外,FPGA四大巨头拥有6000多项行业专利,形成该行业极高的技术壁垒。对于ASIC芯片,目前还未形成巨头垄断的市场格局,但是对于不同垂直领域,其情况不同,我们将在下文中给出详细分析。

图2:AI芯片象限图

深度学习分为两个阶段:模型训练与智能推断,如图2所示。模型训练需要大量的训练样本,基于梯度下降法,模型优化收敛到局部最优点。深度学习的模型训练需要几小时到多天的迭代优化,因而,现阶段,模型训练都在云端完成(我们认为具备持续学习能力是智能终端未来发展的方向,因而这里并不认为训练一定只在云端完成)。模型训练好之后,则能够基于该模型与输入数据,计算得到输出,完成智能推断。相比于模型训练,推断的计算量要小很多,可以在云端与终端完成。

现阶段,由于终端设备的计算力普遍有限,模型训练与推断大都在云端服务器上完成。在云端模型训练中,NVIDIA的GPU占主导地位,多GPU并行架构是云端训练常用的基础架构方案。在云端识别中,基于功耗与运算速度的考量,单独基于GPU的方式并非最优方案,利用CPU、GPU、FPGA、ASIC各自的优势,采用异构计算(CPU+GPU+FPGA/ASIC)是目前主流方案。

在计算机视觉、语音识别等应用中,终端采集数据(特别是图像数据),然后上传到云端处理的云计算对网络带宽与数据中心存储都带来越来越大的挑战。另外,无人驾驶等应用对实时性与安全性要求极高。网络的时延与稳定性所带来的安全隐患是无人驾驶等应用所无法忍受的。在终端采集数据,并完成数据处理,提供智能终端推断的边缘计算(Edge computing),因其能够满足实时性、安全性的需求,且能节约带宽与存储,得到越来越多的关注。我们判断inference将越来越多的在终端设备上完成,即,智能将会下沉到终端设备,智能边缘计算将会崛起。

图3:2017-2020全球AI终端芯片市场规模预测

实时性是选择在终端完成推断最主要的原因之一。但是,由于深度神经网络参数量巨大,推断过程需要完成大量的计算,其对终端硬件的计算力提出了很高的要求。另外,电池供电的终端设备对功耗也有极高的要求,且大多数的终端产品价格敏感。即,执行DNN推断的终端芯片对算力、功耗、价格都有严格的限制。研究用于DNN推断的AI-EI芯片是目前AI芯片行业最热的方向。现阶段,已有大量的初创公司,针对不同领域及应用,提出多种AI-EI芯片硬件设计架构,下文将详细给出AI-EI芯片的架构思路及发展现状。

二、AI-EI芯片及其架构

基于深度神经网络的广泛应用,科技巨头及初创公司都根据DNN的特性进行有针对性的硬件处理器研发。其中包括Google的TPU、寒武纪的DianNao系列、Eyeriss的NPU等AI芯片。本节将总结并给出这些AI-EI芯片如何在不降低准确率的前提下实现运算吞吐量提升,并降低能耗。

由前文可知,深度神经网络的基本运算为MAC操作,且MAC操作很容易被并行化。在DNN硬件设计中,常使用时间架构(temporal architecture)与空间架构(spatial architecture)两种高度并行化的计算架构,来获取高计算性能。

时间架构(Temporalarchitecture)

通用芯片CPU与GPU常采用时间架构,并使用单指令多数据流(SIMD)或者单指令多线程(SIMT)来提高并行化处理性能。时间架构基于中央控制器统一控制所有的ALU。这些ALU只能从层次存储器中取数据,而不能相互通信。

时间架构中,通常使用各种计算变换,特别是对卷积操作的计算变换,来减小计算复杂度,从而提升吞吐量,常用的方法包括:

Toeplitz矩阵方法:把卷积操作转换为矩阵乘操作


FFT方法:经过FFT变换,把卷积运算变成矩阵乘操作


Winograd方法:比较适合较小的滤波器的情况

空间架构(spatial architecture)

基于ASIC或者FPGA的AI-EI芯片常使用空间架构。相对于通用芯片,专用芯片应用在特定场景,其功能有限。简单且规则的硬件架构是降低设计成本的基础,亦是实现低成本专用芯片的先决条件。足够低的芯片成本才能对冲专用芯片功能的局限性。

空间架构采用数据流(Dataflow)处理方式。在空间架构中,ALU形成一条数据处理链,从而能够在ALU间直接地传送数据。该空间架构中,每个ALU都有自己的控制逻辑与本地存储(寄存器堆)。其中,有本地存储的ALU被定义为PE。

对于空间架构,硬件设计基于层次存储器中的低能耗内存,并增加数据重利用率(实质上,卷积是空间重用,这种重用可以获取空间的不变性),来减小能耗。另外,数据流(Dataflow)控制数据读、写及处理。总体上,空间架构基于层次存储器与数据流平衡I/O与运算问题,从而降低能耗并提升运算吞吐量。下文将在分析层次存储器与数据流的基础上,讨论不同的技术路线的AI-EI芯片。

访问内存所需时间要远远大于计算所需时间。由深度神经网络的推断部分运算可知,每个MAC都需要三次内存读与一次内存写操作。其中三次内存读操作分别为读取输入数据、权值数据与部分和数据(partial sum),一次内存写操作为更新部分和数据。层次存储器基于内部寄存器等存储单元来减小对外挂内存访问次数,降低I/O需求。层次存储器如图4所示,该层次存储器包括PE内部的寄存器(RF)、用于ALU间直接传输数据时存储数据的内存单元NoC及连接DRAM的全局缓存器Buffer。由图4可以看到,层次存储器中,不同类别的存储器读写操作所消耗的能量不同,这也是我们能够利用层次存储器及数据复用来降低能耗的原因。

 

图4:层次存储器及各存储器中数据迁移的能耗

Dataflow是一种没有复杂程序指令控制且由操作数,即,数据或者中间结果,激活子计算单元,来实现并行计算的一种计算方式。图5总结出了Dataflow的架构逻辑。

 

图5:数据流架构——来源Shaaban教授的课程

在深度学习的推断中,有大量的计算需求。但是,这些计算是分层顺序执行的。因而,控制流程相对简单、清晰。可以看出,Dataflow处理方式与基于深度神经网络推断部分的计算需求非常吻合。

数据流能够决定哪些数据读入到哪层存储器以及这些数据什么时候被处理。另外,在DNN推断中,没有随机性。因而,可以从最优能耗的角度,设计一个基于Dataflow的固定架构的AI-EI芯片。目前,大多数用于深度学习推断的AI-EI芯片都采用Dataflow。

层次存储器中,存储量大的存储器读写操作所消耗的能量要比小存储的存储器大很多。因而,一旦一块数据从大存储器搬移到小存储器后,要尽可能最大程度复用(reuse)该数据块来最小化能耗。但是低功耗存储器的存储空间有限。如何最大化复用率是设计基于Dataflow加速器时最关注的先前条件。即,通过最大化数据复用率来降低I/O要求,减小数据处理能耗,从而提升吞吐量并降低总体能耗。常见的DNN数据流类型包括:权值固定数据流、输出固定数据流、No local reuse(NLR)及行固定数据流。

权值固定数据流: 从DRAM中读出权值数据,放在PE的RF中并保持不变,之后把输入数据广播(broadcast)到每个PE,最后求取PE阵列的部分和(partialsum)。该处理方式通过最大化从PE的RF中读取权值数据次数,并最小化直接从DRAM中读取权值次数,实现最大化卷积与滤波器对权值的复用率,来减小能耗。NeuFlow即为基于该种数据处理方式的AI-EI芯片。

输出固定(OS)数据流: 通过在PE阵列中stream输入数据,然后把权值数据广播到PE阵列,保持 RF中的部分和的累加不变,从而最小化读写部分和的能耗。寒武纪的ShiDianNao是基于输出固定的AI-EI芯片。另外,根据处理目标的不同,可以把该种数据流分为以卷积层为处理目标的OS_A与以全连接层为处理目标的OS_C,OS_B是介于OS_A与OS_C间的一种OS数据流。 

NLR数据流: PE阵列的RF中并不存储任何固定数据,相反,该情况下,所有数据的读写操作都是在全局buffer中完成。寒武纪的DianNao与DaNiaoNao是基于该数据处理方式的AI-EI芯片。 

行固定数据流: 最大化所有数据复用率并尽可能的使得所有数据的读写操作都在RF中完成,减小对全局buffer的读写操作,来减小功耗。每个PE能够完成1D的卷积运算,多个PE能够完成2D的卷积运算。在二维的PE阵列中,水平轴上的PE单元上,每一行的权值数据被复用,对角线上的PE单元上,每一行的输入数据被复用,垂直轴上的多个PE单元上,每一行的部分和数据被复用,即,行固定的数据流能够最大化所有数据的复用率,从而能够全局最优化功耗。Eyeriss的NPU是基于行固定的AI-EI芯片。

三、AI-EI芯片玩家

本节首先总结三家极具代表性的研发DNN加速器(Google、Wave computing、Graphcore是平台化的计算平台,因而,这里没把他们叫做AI-EI芯片厂家)的公司,后文中结合应用场景总结AI-EI芯片创业公司,其中部分公司的芯片也可以做训练,且不一定应用在终端场景,这里基于行为考虑,把他们称为AI-EI芯片公司。

Google TPU

在2015年就开始部署ASIC张量处理器TPU。TPU采用脉动阵列(systolic array)技术,通过矩阵单元的使用,减小统一缓冲区的读写来降低能耗,即脉动运行。脉动阵列不是严格意义的Dataflow,但也是数据流驱动的设计方式。该技术早在1982年就被提出,但是受限于当时的工艺水平及应用,该技术在当时并没有引起太多关注。脉动阵列在TPU上的应用,让该技术回归大众视野,并得到了极大的关注。

Google在TPU上使用该技术的逻辑在于脉动阵列简单、规则且能够平衡运算与I/O通信。TPU中基本计算单元是功能单一的处理单元PE,每个PE需要先从存储中读取数据,进行处理,然后把处理后的结果再写入到存储中。TPU脉动阵列中的PE与前文中其他DNN加速器的PE基本一样,能够实现MAC操作,有存储能力有限的RF。由前文可知,对数据读写的速度要远远小于数据处理的速度。因而,访问内存的速度决定了处理器的处理能力。TPU的脉动阵列采用数据复用及数据在阵列中的脉动运行的策略来减小访问存储器次数,从而提高TPU的吞吐量。

TPU在实现卷积等运算时,要先调整好数据的形式(即对原始矩阵做好调整),之后才能完成相应的计算。因而,TPU的灵活性一般,只能处理特定的运算,这也是其它基于PE阵列Dataflow DNN加速器共有的问题。但是脉动阵列特别适合卷积运算,TPU有多种实现卷积运算的方式,其中包括:

权值存储在PE中保持不变,广播输入数据到各个PE,部分和的结果在PE阵列中脉动运行


部分和的结果存储在PE中保持不变,广播输入数据到各个PE,权值在PE阵列中脉动运行


部分和的结果存储在PE中保持不变,输入数据与权值在PE阵列中按相反方向脉动运行


部分和的结果存储在PE中保持不变,输入数据与权值在PE阵列中按相同方向但不同速度脉动运行


权值存储在PE中保持不变,输入数据与部分和的结果在PE阵列中按相反方向脉动运行


权值存储在PE中保持不变,输入数据与部分和的结果在PE阵列中按相同方向但不同速度脉动运行

Wave computing

基于Coarse GrainReconfigurable Array (CGRA) 阵列,实现数据流计算。另外,Wave的DNN加速器是clockless,其基于握手信号来实现模块间的同步。因而,不需要时钟树,从而能够减小芯片面积并降低功耗。

Graphcore

打造专门针对graph计算的智能处理器IPU。Graphcore在芯片设计上做出了很大的改变。相比于CPU以scalar为基础表示,GPU以矢量为基础表示,Graphcore的IPU是为了high-dimensional graph workload而设计的。这种表示既适用于神经网络,也适用于贝叶斯网络和马尔科夫场,包括未来可能出现的新的模型和算法。该IPU采用同构多核架构,有k级的独立处理器。另外,该芯片使用大量片上SRAM,不直接连接DRAM。该芯片能够直接做卷积运算,而不需要把转换成矩阵乘法之后使用MAC操作完成。该IPU不仅能够支持推断,也能支持训练。

商业应用是AI的关键因素之一,AI只有解决了实际的问题才具有价值,下文,我们从终端不同的应用,探讨AI-EI芯片。不同的加速器在各个子行业都有应用布局,我们从主要应用领域出发,给出公司产品、最新产品性能及融资情况的终结。

AI-EI芯片+自动驾驶

在汽车行业,安全性是最重要的问题。高速驾驶情况下,实时性是保证安全性的首要前提。由于网络终端机延时的问题,云端计算无法保证实时性。车载终端计算平台是自动驾驶计算发展的未来。另外,随着电动化的发展趋势,对于汽车行业,低功耗变的越来越重要。天然能够满足实时性与低功耗的ASIC芯片将是车载计算平台未来发展趋势。目前地平线机器人与Mobileye是OEM与Tier1的主要合作者。

 

AI-EI芯片+安防、无人机

对于如何解决“虐童”问题,我们认为能够“看得懂”的AI安防视频监控是可行方案之一。相比于传统视频监控,AI+视频监控,最主要的变化是把被动监控变为主动分析与预警,因而,解决了需要人工处理海量监控数据的问题(也绕开了硬盘关键时刻掉链子问题)。安防、无人机等终端设备对算力及成本有很高的要求。随着图像识别与硬件技术的发展,在终端完成智能安防的条件日益成熟。安防行业龙头海康威视、无人机龙头大疆已经在智能摄像头上使用了Movidious的Myriad系列芯片。

AI-EI芯片+消费电子

搭载麒麟970芯片的华为mate10手机与同样嵌入AI芯片的iPhoneX带领手机进入智能时代。另外,亚马逊的Echo引爆了智能家居市场。对于包括手机、家居电子产品在内的消费电子行业,实现智能的前提要解决功耗、安全隐私等问题。据市场调研表明,搭载ASIC芯片的智能家电、智能手机、AR/VR设备等智能消费电子已经处在爆发的前夜。 

其他

随着AI应用的推广,越来越多的公司加入AI-EI芯片行业,其中,既包括Bitmain这样的比特币芯片厂商,也包括从GoogleTPU团队出来的创业公司Groq,还有技术路线极具前瞻性的Vathys。由于这些Startups都还处于非常早期阶段,具体应用方向还未公布,因而放在“其他”中。另外,我们判断终端AI芯片的参与者还会增加,整个终端智能硬件行业还处在快速上升期。

四、AI-EI芯片发展趋势 

上文介绍的AI-EI芯片是在优化硬件架构基础上,实现低功耗、高吞吐量。现有研究中有采用Processing in Memory(PIM)的方式,把处理直接放在存储单元的位置,降低整个系统的复杂度,减少不必要的数据搬移,从而优化功耗和硬件成本。同时,这也需要在电路(模拟信号)的层面重新设计存储器。初创公司Mythic即采用PIM技术来设计AI芯片。另外,通过研究具备高带宽和低功耗特性的存储器来解决I/O与运算不平衡的问题也是当前的研究热点。

类脑芯片是处理Spiking neural network (SNN)而设计的一种AI芯片。IBM的TrueNorth、高通的Zeroth及国内的Westwell是类脑芯片的代表公司。类脑芯片能够实现极低的功耗。但是在图像处理方面,SNN并没有表现的比CNN好,且类脑芯片现在处在研究阶段,离商业应用还有较远的距离。

2017年芯片行业的融资额是2015年的3倍。巨头公司与资本都在积极布局AI芯片,特别是在智能边缘计算有技术积累的公司。我们无法预测未来哪家公司能够最终胜出。

但是,一家AI芯片公司要想持续发展并壮大,需要具备包括硬件及软件生态的全AI服务流程能力。从现阶段的投资动向可以看出,创业公司要想获取资本青睐,需要在硬件设计架构上有足够吸引人的变动。另外,性能指标与技术路线可以靠讲,只要合理既有可能,但是在未来1到2年的时间内再拿不出产品是很难继续讲下去的。

雷锋网

深度 | CMU 邢波教授团队最新成果:利用 AI 自动生成医学影像报告

雷锋网消息,近日,由卡内基梅隆大学机器学习系副主任邢波教授创立的 Petuum 公司近期发表了几篇论文,介绍了如何使用机器学习自动生成医学影像报告,从而更好地辅助医生做治疗与诊断。

医学影像在临床实践中被广泛应用于诊断和治疗。专业医师阅读医学影响并撰写文字报告来描述自己的发现。对于没有经验的医生来说,撰写报告很可能会出错,对于人口众多的国家的医生来说,这样的工作又耗时又枯燥。为了解决这些问题,邢波教授的团队研究了医学影像报告的自动生成,作为人类医生更准确高效地生成报告的辅助工具。

为了应对这些挑战,邢波的团队建立了一个多任务学习框架,共同执行标签的预测和段落的生成;提出一个共同注意机制(co-attention mechanism),将包含异常的区域标注出来;利用一个层次LSTM模型来产生长的段落。

医生不愿撰写“医学影像报告”

放射学和病理学的医学图像被广泛用于医院和诊所,例如肺炎、气胸、间质性肺病、心力衰竭、骨折等等。他们通过撰写文字报告(图1)来描述在影像学检查中所检查的每个身体部位的发现,特别是每个部位是否被发现是正常的,异常的或潜在的异常。

图 1. 一个包含三部分信息的胸部 X 光报告示例。在 impression 部分,放射专家结合 Findings、病人临床历史及影像学研究的指导做出诊断。Findings 部分列出了影像学检查中所检测的身体各部分放射学观察结果。Tags 部分给出了表示 Findings 核心信息的关键词。这些关键词使用医学文本索引器(MTI)进行标识。

对于经验较少的放射科医师和病理科医师,特别是那些在医疗保健条件落后的医生,写医学影像报告是一件困难的事情。要正确读取胸部X线图像,他们需要以下的几项技能:

对胸部正常解剖结构和胸部疾病的基本生理学的全面了解

通过固定模式分析射线照片的技能

评估随时间变化的能力

临床表现和病史知识

与其他诊断结果(实验室结果、心电图、呼吸功能检查)相关的知识

但是,对于有经验的放射科医师和病理学家来说,撰写影像报告又过于繁琐和费时。在中国这样人口众多的国家里,放射科医生每天可能需要阅读数百张放射图像。将每幅图像的分析结果输入计算机大约需要5-10分钟,这占用了他们大部分的工作时间。

邢波的团队认为,自动生成医学影像报告是一件有意义而且有必要的事情,但同时,这项任务也面临几个挑战。

首先,一份完整的诊断报告由多种不同信息形式的内部报告组成,如图1所示,胸部X射线的报告包含 Impression描述,通常是一句话;Findings 是一段描述;Tags 是一列关键词。用一个统一的框架生成这样的不同信息,对技术提出的要求很高。我们通过构建一个多任务框架来解决这个问题,该框架将标签的预测作为一个多标签分类任务来处理,并将长描述(例如生成 Impression 和 Findings)的生成视为文本生成任务。在这个框架中,两个任务共享相同的用于学习视觉特征的CNN并且共同执行。

其次,一个影像报告通常更多地集中于描述异常的结果,因为它们能直接指出疾病并指导治疗。但如何定位图片中的病变区域并附上正确的描述非常困难。我们通过引入共同注意机制(co-attention mechanism)来解决这个问题,同时参与图像和预测到的标签,并探讨视觉和语义信息的协同效应。

最后,成像报告中的描述通常很长,包含多个句子甚至多个段落。生成长文本是非常重要的,我们没有采用单层LSTM(这种LSTM不能模拟长序列),而是利用报告的组成性质,采用分层LSTM来生成长文本。结合共同注意机制,层次型LSTM首先生成高级主题,然后根据主题生成详细的描述。

数据集方面,研究人员使用的是印第安纳大学胸部X射线组(IU X射线),这是一组与相应的诊断报告对应的胸部X射线图像集。该数据集包含7470对图像和报告。每个报告包括以下部分:impression, findings, tags, comparison and indication 。邢波团队将impressionfindings中的内容视为要生成的目标,并将MTI生成的标记作为报告的标记。

相关的工作

为医学影像添加文本报告

为了将文本报告添加到医学影像上,需要几个步骤。在我们的设置中,添加到医学影像上的文本是完全结构化的或半结构化的(例如标签,属性,模板),而不是自然文本。通过建立传递系统来预测医学影像的特征性,其中一些特征性通过文本标签显示。给定一个医学图像,首先运用局部图像分析法进行局部分析,然后提取每个局部图像的视觉特征,最后建立一个分类器,将视觉特征按照预定义的类别分类。

Shin和其他研究人员,建立了运用CNN-RNN框架的系统,可以为胸部X射线影像添加文本标签。他们使用CNN(卷积神经网络)从影像中检测疾病,并使用RNN(循环神经网络)来描述检测到的疾病的详细信息,例如:发病位置,病变程度及受影响的器官等。Zhang及其研究团队的最新研究报告显示,他们可以提供生成医疗报告。他们的目标是生成30-59字的病理报告。然而,他们生成的病理报告是半结构化的,语言不够流畅自然。通过将少量标准报告重新编写生成最后的病理报告,报告内容限于5个预定义的主题。

我们研究的最终目标是:生成的病理报告可以替代医生在自然情况下撰写的病理报告。这些病理报告很长,涵盖了很多方面,相比之前研究给影像添加标签和半结构化段落来说,难度系数更大。

图像说明与深度学习

图像说明技术可以为指定图像自动生成文字描述。最近研究的图像文本模型大多是基于CNN-RNN框架。Vinyals及其研究团队将从CNN的最后隐藏层提取的图像特征提供给LSTM(长短期记忆网络)以生成文本。Fang 及其研究团队首先使用CNN来检测图像中的异常,然后将这些检测到的异常通过语言模型生成一个完整的句子。Karpathy及其研究团队提出使用多模式递归神经网络将视觉和语义特征二者达到一致,然后生成对于图像的描述。

最近,注意机制(attention mechanisms)已被证明对于添加图像文本是有用的。Xu及其研究团队将空间视觉注意机制引入CNN中间层提取的图像特征中。You及其研究团队提出了针对给定图像标签的语义注意机制。为了更好地利用视觉特征并生成语义标签,研究团队提出了共同注意机制。

我们的目标不仅仅是为图像生成一个说明。Johnson及其研究团队正在研究密集型文本,要求模型可以生成对于每个检测图像区域的文字描述。Krause,Liang及其研究团队通过分层LSTM为图像生成段落说明。我们的研究方法也是采用分层次的LSTM来生成段落标题,而与Krause及其研究团队不同的是,我们使用一个共同关注网络来生成主题。

图 2. 整个模型的结构与过程。其中 MLC 代表多标签分类网络,语义特征是预测标签的词向量。粗体标记的「calcified granuloma」和「granuloma」是共同注意网络关注的标签。

定量结果

我们使用以下文本生成评估手段(BLEU 、METEOR 、ROUGE  和 CIDER)度量段落生成(表 1 上半部分)和单语句生成(表 1 下半部分)的结果。

如表1的上半部分所示,对于段落生成来讲,使用单个 LSTM 解码器的模型的表现明显要差于使用层级 LSTM 解码器的模型。表1中的Ours-No-Attention和CNN-RNN 之间的唯一区别在于,Ours-No- Attention采用层级LSTM解码器,而CNN-RNN 仅采用单层LSTM。这两个模型之间的比较直接证明了层级LSTM的有效性。

这个结果并不令人惊讶,众所周知,单层LSTM不能有效地模拟长序列。此外,单独使用语义注意(Ours-Semantic-Only)或单独使用视觉注意(Ours-Visual-Only)来生成主题向量似乎帮助不大。潜在的原因可能是视觉注意力只能捕捉图像分区域的视觉信息,而不能正确描述。虽然语义注意只知道潜在的异常,但不能通过查看图像来确认其发现。最后,我们的完整模型(Ours-CoAttention)在所有的评估指标上都取得了最好的结果,说明了提出的共同注意机制的有效性。

对于单句生成的结果(如表1下半部分所示),我们模型的控制变量版(Ours-Semantic-Only和Ours-Visual-Only)与其他版本相比,要优于所有的基线模型,这表明了所提出的共同注意机制的有效性。

定性结果

段落生成

三个模型生成影像病理报告的示例见图3,分别为Ours-CoAttention模型,Ours-No-Attention模型和Soft Attention模型。值得注意的是,下划线的句子是对异常情况的描述。首先,我们可以观察到三个模型生成的报告所包含的句子比真实报告多。其次,三个模型生成的报告和真实报告大多数的语句都是对于正常区域的描述,而只有几句话是关于异常情况的。这个观察可以解释为什么 Ours-No-Attention模型在一定程度上不能达到非常好的水平。

图 3. 协同注意力 、无注意力、软注意力模型生成的段落图示。划线句子是检测到异常情况的描述。第二个图是胸部侧面 x 光图像。前两个例子的结果是与真实报告相一致的,第三个出现了部分失败,最底下的图像完全失败。这些图像来自测试数据集

当我们深入了解生成文本的内容时,发现不同句子具有不同的主题,这是令人惊讶的。第一个句子通常是对图像的整体描述,而以下的句子分别描述图像的其他区域,例如:肺脏、心脏等。另外值得注意的是,Soft Attention模型和Ours-No-Attention模型只能检测图像中的异常情况,往往检测到的异常情况还是错误的。但是,Ours-CoAttention模型在前三幅图像中均能够正确描述图像中异常情况。结果表明,与Ours-CoAttention 模型及Ours-No-Attention模型相比,层次型LSTM可以更好地生成病理报告。

在第三张X射线图中,Ours-CoAttention模型成功检测到右下叶肺部有异常。然而,它没有准确地描述这种异常。相比于其他X射线图来说,第三张X射线图比较暗,这可能就是Ours-CoAttention模型描述错误的潜在原因,我们的模型对这个变化非常敏感。Ours-CoAttention模型对于第四张X射线图的描述是一个失败案例。虽然模型错误地判断了图像中的主要异常,但是它确实找到了一些不寻常的区域。比如:左下叶肺部异常。此外,发现模型给出的报告中有“这可能表明”的字眼,说明模型试图推断所患疾病,这是十分令人惊讶的。

为了更好地理解模型检测疾病或潜在疾病的能力,我们在表2中,给出了三大模型正态性和异常性的概率。我们认为句子包含“否”、“正常”、“清除”、“稳定”作为句子描述正常。很显然,Ours-CoAttention模型在正态性和异常性的概率上最接近真实情况。

表3中的结果表明,Ours-CoAttention和VGG-19 网络对于标签预测的执行非常相似。尽管多任务学习没有改进,但我们认为,这个模型是一个端到端的模型,避免了管理复杂的流水线模式。

图4显示了共同注意的可视化。图4所示的第一个特性是 Sentence LSTM 能够关注图像的不同区域和语句的不同标签,并在不同的时间步骤生成不同的主题。第二个特性是视觉注意力可以指引模型关注图像的相关区域。例如,第一个例子的第三个句子是关于“有氧”的,视觉注意力集中在心脏附近的区域。类似的行为也可以被发现的语义注意:对于第一个例子中的最后一句话,我们的模型正确地集中在作为句子的主题“退化变化”。

此外,第二个例子中的第一句话的内容与语义注意力的集中矛盾是令人惊讶的。单一关注机制不太可能发生。这种矛盾意味着共同关注机制具有一定的容错性,因此共同注意可能比单一关注更为强大。

最后,最后一个例子的第一句话是由于对标签不正确的注意而导致的错误描述。我们相信通过建立一个更好的标签预测模块可以减少不正确的注意力。

图 4. 协同注意力在三个示例上的可视化。每个示例由四部分组成:(1)图像和视觉注意力;(2)真实标签,预测标签以及预测标签上的语义注意力;(3)生成的描述;(4)真实描述。对于语义注意力而言,注意力分数最高的三个标签被突出显示。加下划线的标签是在真实标签中出现的标签。

图4还提供了标签预测的一些定性结果。结果表明,除了与图像相关的标签之外,该模型还产生许多不相关的标签。尽管共同注意机制可以过滤掉很多干扰标签,但不相关的标签仍然会误导模型,产生很多误报。我们相信一个更好的标签预测模块将有助于建模来关注正确的标签,从而帮助提高生成文本的质量。

结语

雷锋网了解到,近年来,人工智能,尤其是深度学习的成熟使得市场上出现了很多AI辅助诊断产品。人类基因组测序技术的革新、生物医学分析技术的进步、以及大数据分析工具的出现,为病人提供更精准、高效、安全的诊断及治疗。虽然,人工智能+影像领域也是参与企业最多,产品最丰富、涉及疾病种类最多的疾病诊断领域。,但是AI也能够参与疾病的筛查和预测、写结构化的病历、在基层担任全科医生助手的角色,AI在减少医生工作时间、提高诊断治疗效率方面起到非常大的作用。

邢波的研究团队认为,他们工作的主要贡献是:提出了一个多任务学习框架,可以同时预测标签和生成文本描述;引入一个用于定位异常区域的共同注意机制,并生成相应的描述;建立一个分层的LSTM来产生长句和段落;进行大量的定性和定量的实验,以显示实验方法的有效性。

雷锋网认为,邢波教授团队的研究成果不是第一家,相信也不会是最后一家。未来,随着产品迭代的不断升级,算法层面的不断打磨,医学影像结构化报告的生成方面的研究,将陆续有其他玩家进入。

雷锋网

深度 | 以太坊“大都会”终极指南:现在正在发生什么?!

雷锋网AI金融评论按:本文转载自token.im,译者为imToken 郭辉。

译者注:随着以太坊第三阶段 Metropolis ("大都会")临近(区块高度 4370000),imToken 用户非常关注此次硬分叉将带来的影响。简短说明一下:imToken 会处理好所有节点升级和硬分叉带来的变化,用户无需任何操作,本次分叉也没有预期会产生新的币种。为让大家更好理解 Metropolis 技术升级的细节,翻译此文,欢迎指正。

作为以太坊的里程碑事件,大都会终于要来到我们身边了。以太坊开发团队计划于9月18日在测试网络上测试"大都会"(Metropolis),测试至少3周时间。如果测试正常,"大都会"将被部署在主网络。所以,升级到"大都会"阶段的最早时间是10月9日(译者注:实际部署时间已经推迟)。所以,问题来了:

  • 什么是"大都会"?

  • "大都会"会给以太网络带来什么新的特性?

  • "大都会"后会分叉产生新的 Ethereum?

  • 以太币的价格会上涨吗?

这些问题在本指南都可以找到答案。

(一)何谓“大都会”之以太坊的四大阶段

这不是以太坊第一次升级,也不会是最后一次。以太坊不仅仅被设计为一种货币模式,更是一个去中心化的应用平台。在最终达到这个目标之前,它需要经历不同的增长阶段,在每一个阶段,以太坊都会引入不同的特性来使得系统变得更加稳定和强大。 以太坊的完整发展路线分为四个阶段,即"前沿"(Frontier)、"家园"(Homestead)、"大都会"(Metropolis)和"宁静"(Serenity)。"大都会"是以太坊发展的四个阶段里面的第三个,随着它的到来,以太坊将会增加许多有趣的特性,下面介绍一些会对以太坊造成重大影响的特性,即:

  • zk-Snarks

  • PoS(Proof of Stake , 即权益证明)早期实施

  • 智能合约的灵活性和稳定性

  • 抽象账户

(二)"大都会"之四大特性

特性1:zk-Snarks

"大都会"最大和最重要的特性就是执行 zk-Snarks,zk-Snarks 全称 Zero-Knowledge Succinct Non-Interactive Argument of Knowledge,即"简明非交互零知识证明"。zk-Snarks基于"零知识证明"(zero knowledge proof,即ZKP)。

何谓"零知识证明"?

"零知识证明"是由 S.Goldwasser、S.Micali 及 C.Rackoff 在 20 世纪 80 年代初提出的。它指的是证明者能够在不向验证者提供任何有用的信息的情况下,使验证者相信某个论断是正确的。"零知识证明"实质上是一种涉及两方或更多方的协议,即两方或更多方完成一项任务所需采取的一系列步骤。证明者向验证者证明并使其相信自己知道或拥有某一消息,但证明过程不能向验证者泄漏任何关于被证明消息的信息。大量事实证明,"零知识证明"在密码学中非常有用。如果能够将"零知识证明"用于验证,将可以有效解决许多问题。 "零知识证明"能够成立必须具备以下三个要素:

  • 完整性:如果声明为真,那么一个诚实的验证者可以被诚实的证明者相信;

  • 可靠性:如果声明为假,不排除有一定概率欺骗者可以说服诚实的验证者它是真的;

  • 零知识:如果声明为真,那么验证者在证明过程中并不知道任何关于声明的消息;

"零知识证明"并不是数学意义上的证明,因为它存在小概率的误差,欺骗者有可能通过虚假陈述骗过证明者。换句话来说,"零知识证明"是概率证明而不是确定性证明。但是也存在有技术能将误差降低到可以忽略的值。 零知识的形式定义必须使用一些计算模型,最常见的是图灵机的计算模型。

下面举两个例子说明零知识证明: 

1)假设有一个房间只能用钥匙打开锁,其他任何方法都打不开。Alice 要向 Bob 证明自己拥有这个房间的钥匙,这时有2个方法: ① Alice 把钥匙出示给 Bob,Bob 用这把钥匙打开该房间的锁,从而证明 Alice 拥有该房间的正确的钥匙。 ② Bob 确定该房间内有某一物体,Alice 用自己拥有的钥匙打开该房间的门,然后把物体拿出来出示给 Bob,从而证明自己确实拥有该房间的钥匙。 

后面的 ② 方法属于零知识证明。好处在于在整个证明的过程中,Bob 始终不能看到钥匙的样子,从而避免了钥匙的泄露。

2)这是一个很经典的例子:有一个缺口的环形长廊 ,出口和入口距离非常近(在目距之内),但走廊中间某处有一道只能用钥匙打开的门,Alice 要向 Bob 证明自己拥有该门的钥匙。采用零知识证明,则 Bob 看着 Alice 从入口进入走廊,然后又从出口走出走廊,这时Bob没有得到任何关于这个钥匙的信息,但是完全可以证明Alice拥有钥匙。 file 上面这两个例子都是零知识证明在现实世界的"运作",那么我们如何通过 ZK-Snarks 实现零知识证明在区块链中的应用呢?

zk-Snarks如何工作?

zk-Snarks由3种算法组成:G、P、V。 

G是一个密钥生成器,需要通过生成随机变量 L(必须保证任何情况下不能泄露)和程序C。然后生成两个公钥——证明公钥 Pk 和验证公钥 Vk ,这两个公钥都是公开的,任何人都可以查 看。 

P是证明者,需要输入三个参数,即证明公钥 Pk、公开的随机输入散列值 x 以及需要证明的隐私声明 w 。P 算法生成证明 prf ,函数表达为:prf = P ( Pk , x , w ) 

V 作为验证者将会返回一个布尔类型的结果,即 true 或者 false 。V 将验证公钥 Vk 、P 中的随机输入散列值 x 以及证明 prf 作为输入参数进行验证,即 V (Vk , x , prf)。如果证明者正确,返回 true ,否则返回 false 。 

由以上G、P、V三者的关系可以看出,随机变量 L 至关重要,必须保密。因为任何人都可以用它来生成假的证明,这些假的证明也能返回 true ,而不管证明者是否拥有隐私声明 w 的知识。 下面让我们继续回到我们的老朋友 Alice 和 Bob 的身上,Alice 是证明者,Bob 是验证者。 

Bob 作为验证者第一件事就是要使用 G 生成证明公钥 Pk 和验证公钥 Vk ,为此他需要生成随机变量 L,正如上面提到的,Bob对 L 必须非常小心,他不能让 Alice 知道 L 的价值以防 Alice制造假的证明。 

既然Bob生成了两个公钥,Alice 需要生成证明 prf 来证明声明的有效性。她将使用证明算法P生成证明,来证明她知道隐私声明 w 的哈希值为 x 。接下来 Alice 将把这些证明参数交给最终运行ZK-Snarks验证算法的 Bob 。Bob 将会使用验证算法 V (Vk , x , prf)来验证结果,如果返回 true ,则 Alice 很真诚,确实知道隐私声明 w 是什么。如果返回 false ,则 Alice 在说谎她知道 w 是什么。

以太坊 & zk-Snarks

以太坊和 Zcash (Zero Cash,完全基于 zk-Snarks 的一种加密货币)正在紧密合作,如果你问我把 zk-Snarks 和区块链结合最紧密的是谁,那毫无疑问是 Zcash 。就个人而言,我已经迫不及待的想看到大都会和 zk-Snarks 的结合了。

特性2:PoS(Proof of Stake,即权益证明)早期实施

这一部分我们将会详细阐述吵得沸沸扬扬的 PoS 协议,并和 PoW (Proof of Work,工作量证明)作比较。

PoS vs PoW

PoW:包括 ETH 和 BTC 在内的绝大多数主流加密货币采用的就是这种协议,PoW 需要矿工(或者节点)不断消耗算力进行哈希计算,以找到期望的随机数,这就意味着系统需要消耗大量的算力和电力。 

PoS:在这个系统里,我们有验证者而不是矿工,它的原理是,作为验证节点,首先你必须拥有一定数量的以太币,根据以太币的数量和时间会产生用于下注验证区块的权益。只有拥有权益的节点才能有效验证区块,当你验证的区块被打包进链,你将获得和你权益成正比的区块奖励。如果你验证恶意或错误的区块,那么你所下注的权益将被扣除。 

为了实施 PoS,以太坊将采用 Casper 的共识算法,一开始,它将是一个 PoW 和 PoS 共存的系统,区块的绝大多数交易还是采用 PoW 协议,每100个区块有一个采用 PoS 协议挖出,这样做的目的就是为在以太坊平台上创建了一个真实的测试环境,但是这种协议究竟能给以太坊带来什么好处呢?让我们慢慢道来:

  • 降低系统的整体能源成本:全世界的比特币矿工每小时耗资约5万美元,一年耗资约4.5亿美元!通过使用 PoS 协议,你可以将整个过程虚拟化,大幅减少成本;

  • 无 ASIC 优势:由于整个过程是虚拟的,它将不再依赖谁有更好的设备或者 ASICs 。

  • 51%攻击变得更困难:PoW 协议存在算力集中问题,51%攻击风险很大,PoS 则让这一攻击变得更加困难;

  • 无恶意验证者:任何验证者都需要将其权益锁定在区块链中,将确保他们不会向链中添加任何恶意或错误的块,因为这意味着所有权益将被扣除;

  • 创建区块:出块和整个进程都会更快(后面会详细介绍);

  • 可拓展性:通过引入“分片”概念,让区块链变得可拓展;

虽然之前有过各种各样的简单的 PoS 协议部署过,但是真正让 Casper 共识算法从中脱颖而出的是它能激励诚实的矿工并且惩罚不诚实的矿工,如果你试图去验证恶意的区块,那不好意思,你所有的权益将被扣除,它会狠狠地惩罚任何不遵守游戏规则的人。

Vitalik 是这样解释的: 

想象现在有 100 个人围着圆桌,其中有一个人拿着很多张纸,每张纸记录着很多笔历史交易信息。第一个人拿起笔签完后递给第二个人,第二个人也做出了相同的选择,如果大多数人做出了相同的选择,即都签署了同一张纸那么每一个参与者会获得1美元,当你做出和绝大多数人不同的选择时,那么你的房子就会着火! 

然后他补充道,这可能是一个比较正确的激励措施去保证大家都能签署正确的纸张!那么:

  • 什么是时间 "难度炸弹"?

  • 如何激励矿工从 PoW 转向 PoS?

矿工花费了大量的金钱购买设备用于挖矿,然而随着 PoS 的到来,大量的设备变得一文不值;想象一下,花费大量金钱搭建的超级复杂的矿池突然变得毫无用处! 

如果真的不能阻止矿工停留在 PoW 上继续挖矿,那将会创建三种以太坊币:ETC、ETH-PoW、ETH-PoS,这对以太坊绝对是个噩梦!因为那不仅会降低以太坊的可信度和经济价值,还会稀释整个系统的哈希值比例,使得它更容易被黑客攻击! 

为了确保以太坊的矿工能加入到新链条中来,开发团队引入了"难度炸弹"机制。"难度炸弹" 是在2015年9月7日推出的,想要了解"难度炸弹"是如何工作的,首先我们需要了解什么是 "难度" 和挖矿。

什么是 "难度" 以及它是如何工作的?

"难度" 这一概念起源于比特币,比特币在最初的时候,由于挖矿的人比较少,挖矿显得比较简单,任何人只要使用他们的电脑都可以从事挖矿活动。随着比特币越来越受欢迎,矿工的数量也越来越多,为了防止过早的把所有的比特币都挖完,中本聪在比特币中一开始就引入了难度系统。 

难度系统的工作原理大致如下:矿工们使用他们的电脑算力进行解密,解密的过程就是随机地往已经进行过哈希运算的区块上添加一个随机字符串(也叫随机数),然后对整个字符串再进行一次哈希运算。如果结果数小于某个特定的数值,则认为解密正确,并且会将这个新的区块添加到链上。然而找到这个随机数通常是及其困难和随机的,这正是挖矿的核心所在。 

这一过程也可以简明扼要的总结如下:

  • 获取新块内容的哈希值

  • 将随机字符串添加到区块上

  • 对新的字符串再次哈希运算

  • 然后将最终的哈希与难度系数进行比较,是否小于等于难度系数。

  • 如果不是,则改变随机数重新进行运算

  • 如果是,则将新的区块添加到链上并对全网进行广播

  • 相应的矿工将获得新区块的奖励

比特币的难度每 2016 个区块调整一次,难度系数与出块的速度成正比,比特币每 10 分钟产生一个新的区块。如果出块时间低于 10 分钟,则难度系数增加;否则难度系数减少,比特币就是通过调整难度系数来保证出块的时间能始终保持在10分钟左右。 

以上就是比特币挖矿的工作机制,以太坊也采用了相同的协议。

那么以太坊的"难度炸弹"又将如何呢?

难度炸弹将会使难度系数呈指数增加以至于让挖矿变得几乎不可能。就像我们之前说的,难度系数会根据出块的速度进行调整,以太坊的难度调整算法如下:

block_diff = parent_diff + parent_diff // 2048 * max(1 – (block_timestamp – parent_timestamp) // 10, -99) + int(2**((block.number // 100000) – 2))

(In here “//” is the division operator such that 6//2 = 3 and 9//2 = 4.)

下面让我们用更直白的方式来讲清楚上面两行代码的意思:

block_timestamp: 最新一个区块出块时刻;

parent_timestamp:上一个区块出块时刻;

如果  (block_timestamp – parent_timestamp) < 10秒,那么难度系数会增加 parent_diff // 2048 * 1

如果 (block_timestamp – parent_timestamp)在10-19秒之间,则难度系数保持不变。

如果  (block_timestamp – parent_timestamp)> 20 秒,则将parent_diff // 2048 * -1的难度降低到最大值parent_diff // 2048 * -99。

这就是以太坊在"家园"(Homestead)阶段的难度调整算法,它最终的结果就是使出块时间始终稳定在15秒。而"难度炸弹"在于它会使难度系数呈指数增加,从而出块的时间也会显著增加,直到最后几乎挖不出区块,我们把这一状态称为“以太坊冰河期”(Ethereum Ice Age),到那时,矿工除了转向新的PoS协议将别无选择。

难度炸弹会在“大都会”时期引爆吗?

难度炸弹原本计划在2017年年底引爆,现在看来似乎比原计划推迟了一年半,然而,随着大都会的到来,开发团队将通过其它两个措施使其平稳过渡到 PoS。即:

部署之前提到的 Casper 算法,每 100 个区块将有一个采用 PoS 协议挖出

每个区块的奖励由之前的 5 个 ETH 减少为3个

所有的这些措施都是为了在以太坊的最后一个阶段"宁静"(Serenity)到来之前所有的节点都能部署好 PoS 协议并且消除之前遇到的问题。

特性3:智能合约的灵活性和稳定性

可以毫不夸张地说,智能合约就是以太坊的命脉。 智能合约是如何在以太坊中被执行的呢?可以用一个简单的例子来说明,假设 Alice 和 Bob 在没有任何第三方干预的情况下完成某个交易或功能,Alice 要 Bob 完成一个任务,Bob 收取一个 ETH ,Alice 将一个 ETH 放在盒子里,如果Bob 执行任务,那么盒子里的 1 个 ETH 会自动到 Bob 的账户,否则,那 1 个 ETH 自动返回到Alice的账户。在这个例子中,盒子就像智能合约,虽然这个例子比较粗略,但它仍然能帮你了解智能合约是如何工作的。 那么以太坊给智能合约带来了什么创新能使它变得更好呢?

智能合约如何在以太坊中发挥作用?

假设 Alice 让 Bob 执行一个智能合约,该合约中的每个功能需要 Bob 使用某些计算能力。这种计算能力被称为 gas ,支付这种算力的钱叫做 ETH 。通常比特币中为所有的交易支付相同的费用,但以太坊能为每个智能合约设置所花费的算力(即 gas )。每个智能合约都有自己 gas 的限制值,这个限制值由合约创建者设置,显然,这会导致两种情况发生:

所需要的 gas 大于限制值:如果是这种情况,合约执行状态将会回滚到之前的状态,同时 gas 将会全部消耗掉。

所需要的 gas 小于限制值:如果是这种情况,合约成功执行,同时剩余 gas 将会返回给合约创建者。

如果有人想在合约执行期间返回到较早的状态,需要手动触发异常。例如,如果有人想阻止某笔交易,那么他为此不得不付出双倍代价。为了将合约回滚到之前的状态,开发人员可以使用 "throw" 功能,虽然 "throw" 功能确实有助于合约状态回滚,但同时也会耗尽合约中所有的 gas 。 为了解决这个问题,"大都会" 正在加强 "revert" 功能,它能使合约恢复到之前的状态而不用耗光所有的 gas ,合约中未使用的 gas 将会退还给合约创建者。伴随着 "revert" 功能,"大都会" 正在通过引入 "returndata" 指令让合约能恢复到一个任意可变大小 gas 的状态。

特性4:抽象账户

在我们正式了解什么是抽象账户之前,让我们首先来了解一下什么是"抽象"。"抽象"的意思是任何人都可以使用某个系统或者协议而不必完全了解它内部或外部的技术细节。例如当你使用你的 iPhone 时,你不需要是一名程序员或者工程师,你只需要按压或者滑动屏幕就能使用 APP 或者打电话。你也不需要知道这些 APP 是如何激活 iPhone 内部的电路的。总而言之,"抽象"能够极大降低普通民众使用复杂技术的门槛。正因为如此,"抽象"才成为以太坊未来要实现的一部分,想象一下,在一个去中心化的未来,每一个人都在使用 DApps,他们甚至察觉不到这些 DApps 是基于以太坊的,"大都会" 正在通过引入 "抽象账户" 向实现这一宏伟目标迈出了重要的一步。 

众所周知,现在的以太坊有两类账户,即外部账户和合约账户。外部账户由私钥控制,合约账户由创建者编写的代码控制。以太坊正在试图模糊二者的界限,即你可以同时拥有合约账户和外部账户,这种做法本质上就是让用户按照合约账户的格式来定义外部账户。一旦这样做,代码支持密钥将用户特殊的标识加入到交易中,可是这又有什么用呢?因为你可能会说随着量子计算机的发展,它会让加密货币变得不那么安全,假设你想保存一笔被量子计算机攻击过的交易,那又该怎么办呢?随着"抽象账户"的实施,你可以使用签名机制就像哈希梯子一样来定义你的账户,这样你的账户就会具备量子级别的安全性,同时你的账户也会完全变成可定制化, 就像智能合约一样。

(三)"大都会"之番外篇

什么是"拜占庭"和"君士坦丁堡"?

熟悉以太坊的朋友对"拜占庭"和"君士坦丁堡"应该都不会陌生,那么这两个术语究竟是什么意思呢?"大都会"为以太坊带来了大量重要的特性,不可能一次性引入这么多特性,毕竟开发人员精力也有限,这就是为什么以太坊要通过两个阶段发布"大都会"并且这两个阶段都会硬分叉,而这两个阶段就是"拜占庭"和"君士坦丁堡"。 经过几次推迟以后,"拜占庭"将在第4370000区块左右硬分叉。 "拜占庭"将会引入大量新特性,主要包括前面讲的:

  • zk-Snarks

  • "revert"功能和"returndata"指令

  • 抽象账户

"君士坦丁堡"具体什么时候部署还不太清楚,但是应该会在 2018 年部署。它主要的特性就是平滑处理掉所有由于"拜占庭"所引发的问题,并引入 PoW 和 PoS 的混合链模式。

以太坊将会再次硬分叉?会产生第三种以太币吗?

由于之前发生的 ETH-ETC、BTC-BCC 硬分叉,人们开始想当然的认为所有的硬分叉都必然会导致链条分裂,事实上根本不是这样。 之前硬分叉导致链条分裂的主要原因是提出的修改方案在社区有很大的争议,不是所有人都同意。然而,"大都会"的这次升级已经在社区一致同意过了,大家都知道这终将到来,这次硬分叉是升级的结果,不是紧急情况下的临时处理办法。这就是为什么不会有任何社区分裂,不会有新的以太币。可能存在的争论焦点就是 PoS 的实施,当然,争论也没用,矿工不会因为留在旧链上而获得更多的收益,相反,就像前面所说的那样,"难度炸弹"的引爆将会使挖矿变得几乎不太可能。

以太坊"大都会"结论:现在正在发生什么?

那么以太币的价格会上涨吗?我们不知道,我们不是投资顾问,投资任何一个虚拟货币之前,你都需要自己去做一定的研究。拜占庭给以太坊带来如此多的改变,很兴奋它最终会变成怎样。zk-Snarks 的执行也是一项勇敢的改变。当然,"君士坦丁堡"和它的 PoS 将会成为密码世界里每个人都会关注的事情。即将到来的一年在以太坊去中心化的道路上绝对是革命性的!

雷锋网

深度 | 追求0.01%突破 vs 看重临床效果,AI公司与医生合作的“利益点”在哪里?

一个月的时间里,AI医疗影像圈内两个“世界冠军”相继诞生。

7月14日,阿里云ET以89.7%平均召回率打破国际权威肺结节检测大赛LUNA16记录,得世界冠军;8月7日,科大讯飞的重磅喜讯又铺天盖地传来,以92.3%的平均召回率获得LUNA评测第一名,再次刷新世界记录。

LUNA,全称为LUng Nodule Analysis,是肺结节检测领域权威的国际评测,随着国内AI公司蜂拥进入智能肺结节筛查领域,这项评测也成为各大公司算法实力近身肉搏的场合。“这个比赛和高考成绩一样,不能作为一个系统整体水平和应用能力的唯一标准,但是在缺乏更有效的综合评估标准(像himss的电子病历应用评级水平)之前,可以作为一个核心客观评价指标来看。就像高考成绩高的不一定能力强,但是至少有了学习能力的初步评价参考。”科大讯飞医疗影像负责人马文君称。

但细细斟酌,会发现一个问题:算法能力的提升是IT界追求的进步,当AI进军传统的医疗行业,这0.01%级别的提升是否还是值得道贺的突破?

“我根本不关注公司的这些算法,我关注的临床效果。”一位影像科主任告诉雷锋网。一个是日新月异的IT界,一个是传统保守得近乎偏执的医疗界,当AI医疗潮水兴起,什么是两者结合的“点”?

AI医疗:不能当饭吃,还不能打酱油,只是调味品

当下,AI公司与医院以科研合作的形式共同开发AI产品是通用的打法。

所谓“科研合作”,科大讯飞马文君告诉雷锋网,“公司与医院合作之初就签订了合作协议,产品和未来市场是公司的,医院拥有使用权、论文发表等学术上的成就,另外双方共同研究,共同拥有知识产权。”

除此之外,更多是基于发展阶段的定义。

早在2016年,科大讯飞便与安徽省立医院合作,共建医学人工智能联合实验室,探索AI技术在医学领域的应用。马文君表示,AI技术在医疗领域的应用是从2014年或2015年开始的,AI界关注的东西与临床有一定差距,业内都在和医院进行一些科研合作,这是必然的。同时,科研合作不仅是企业和医院之间,还包括企业和企业之间、软件和硬件之间、软件和软件之间、企业和大学之间、大学和大学之间等的交叉合作。

朗通医疗是一家专注于打造智能辅助诊断系统的公司,以全科医学为核心,辅助各个专科临床诊断。此前,公司与浙江大学邵逸夫医院、浙江大学申报成立了一个省级重点实验室——浙江省精准医疗中心,探索智能辅助诊断系统的落地应用。对此,朗通医疗徐哲说道,“我认为一家公司做AI还很难实现的,因为医生是最终使用者,打造过程需要把医生体验和他们的临床思维放进去,如果没有的话,这个系统是失败的。”“要真正有用的系统,而非科研的,就需要找医院,即所谓的产学研合作。”

初创公司宜远智能在这条路上甚至走得更远,“本质上,我们就是画一个圆,团结一切可以团结的力量,与不同医院(医生)进行科研合作。”宜远智能成立于2017年4月,目前与南方医科大、港大医院等多家医院展开科研合作,公司CEO吴博称,先与医生开展科研合作,或者以医学切入进来,是现阶段必须做的,能实打实给医疗行业带来改变,该走的路必须走。

中国科学院自动化研究所研究员田捷表示,如今AI医疗虽然很火,但AI在医学上的应用毕竟处于探索阶段,很难取得效益。这时候,如果AI公司把AI公司把前景看得太好或想借此盈利很难,因为辅助诊断的法律法规和标准还不太清楚,所以这需要长时间的培育和足够的资金支撑其从科研到产品的转换,同时转换时间可能比较长。

“科研作为切入点,两者合作,对于产品成熟也更加有效,如同互联网刚起来时一样,我觉得马云说得很有道理,不能当饭吃,还不能打酱油,只是调味品,如果公司抱有很大盈利希望的话,很难与医院长期合作,不利于真正有效的产品培育和发展。”他告诉雷锋网。

AI公司与医生之间如何求同存异?

世界一定属于少数人,我希望找到真正优秀、聪明的团队跟我一起做这件事。


谁愿意提供给我一台数字病理切片扫描仪,我就愿意提供切片和专业知识配合AI分析。


我本身有清洗后的医疗数据和数据人才,要让我拿数据出来,AI公司能提供我什么?工资吗?至少是我现在工资的双倍我才可能考虑,但一个创业公司又负担不了这个。


……

在问起“想与什么样的AI公司合作?目的是什么?”时,每位医生各执己见,更多是基于自身的情况做出的回答。但若问AI公司相同的问题,答案可能是大同小异:做出牛逼的产品,然后卖出去。

医生与AI公司诉求不同,如何求同存异,一起做事呢?

求同:找契合点

朗通医疗徐哲称,医院希望借由深度学习、精准医疗等项目提升医院的形象;卫生局希望与AI公司合作,未来能真正提升医生的能力;具体到医生,他们的诉求就是做课题、发文章,对职称有帮助,这需要高质量、有价值的数据,“这时,AI公司与医生之间就有了契合点。”一个AI产品的开发少不了的也是高质量、有价值的结构化数据。

“医生并不关系你用了哪个系统,更希望了解系统结构化后的数据,对他的课题有什么价值。”“有的医生跟我们说,‘你们的数据太棒了,以后发表文章,就要把你的数据拿来用’”

除此之外,据徐哲介绍,有的医生并不以课题为目的,而更在意临床效果的提升。“在急诊科,智能辅助系统对防止误诊漏诊的作用很大,医生非常愿意把他们的临床经验灌输进去。”

对此,科大讯飞马文君深表赞同,“医生分为两类:学术型医生和临床类医生,前者对论文有强需求;后者不关注论文,真正的临床疗效、应用验证是强需求。”“发论文和赚钱都是功利,还有很多大专家有更高的追求。”

据马文君介绍,随着肺结节智能筛查的流行,让原先难以操作的一些科研项目变得容易起来,这些大都是IT专家一直不太关注的问题,“机器学习只关注召回率、假阳性多少,而医生关注更多指标,假阴性率、假阳性率等。”

拿肺结节漏诊率为例,在此之前很难统计,需要统计经过病理诊断金标准后确诊为肺癌的肺结节患者的历史病例,才能确定其漏诊,在医疗界没有公认的数值。而如今在SaaS区域平台上,有更客观的样本,可以进行大规模分析统计其漏诊率。除此之外,还涌现出一些新兴的研究方向,比如肺癌预测、区域流行病学分析等。

存异:可以协调

“AI公司是需要收入的,课题意义不大,企业都养不活,要课题干嘛。”徐哲的这番话反映了AI公司与医院的根本分歧,前者为了钱,后者不能碰钱,该怎么好好做朋友?

徐哲称,这也是可协调的,办法就是“都做一点”。

据他介绍,其智能辅助系统能提升基础医院的能力,“国家卫计委已经发了文,专门对此进行研究。”“卫计委和扶贫办已经跟我们签了协议,如果能成功的话,可能获得1200~2000万的项目基金。”

而对于科大讯飞这样的巨擘来说,钱的问题就没那么迫切。据马文君介绍,在双方的合作中,公司负担研发项目、购买设备,医院投入医疗设备、专家、数据等。“我们也不是完全没有收入,我们会申请一些科研扶持项目、基金项目。”

对此,田捷博士表示,做医疗的AI公司,应做好打长期持久战的准备,这个行业需要培育过程,待相关法规和标准逐渐成熟,才能逐渐取得效益。“但短期来说很难实现,所以这是持久战。”

智能医疗创业中,谁是主导?

“谨慎欢迎。”

这句精准的描述与三甲医院信息中心主任悟空(网名)的背景很契合,在雷锋网问起医生对于AI的态度时,他如是回答。“大多数医生对AI还不是很了解,因为工作很忙,忙着看病了。”

华山医院病理科医生祝迎锋也现身说法,他表示,“目前我们都处于观望状态,这种项目太费精力了。医生通常没有这么多时间来做这样的事情。”

南方医科大学副教授刘再毅告诉雷锋网,“我不是创业,我是从研究角度看,临床问题比什么都关键,算法有多好不重要,重点在于临床设计。”“很多公司都在比拼算法,我觉得这也很好,但是你有没有一个实际的原创目的?我为什么要用这样的算法?实际上我们有些时候,也不需要很炫的算法,如果我用常规的方法都能够解决这个问题,算法是不重要的。”

现阶段,他们或其所在的单位都没有参与AI医疗项目中,都处于“谨慎欢迎”的状态,这取决于“跟AI公司合作能不能得到我想要的东西”。

据悟空介绍,其所在医院与AI公司的合作持欢迎态度,除考虑联合科研能减轻医生的工作强度外,医院早期参与,能避免AI公司走弯路。“比如肺结节早期筛查对于有经验的医生来说意义不大,他们更关注诊断完后,临床治疗环节。”而如果真正与AI公司合作,更希望大学牵头。“他们有一定的科研经费,还有资源能用,对于机器学习来说,单个医院的数据量不够,每个医院的治疗方案也不太一样,如果大学牵头搞区域性的,样本量大,广泛程度好。”但医院并不会主动牵头做这样的事情,“医院时间主要用在治病和医疗管理,很少主动做,除非有国家的科研项目。”

而在方向选择上,更希望打造智能辅助诊疗系统,能解决基层很多问题,推动分级诊疗,“让基层知道某个病发展到什么程度基层可以搞定;什么程度需要大医院专家干预。”“我对商业不了解,不知道推广价值怎么样,但对于基层医生诊疗水平的提升,对于分级诊疗的推广是有帮助的。”

对此,田捷博士表示,医院与AI团队的合作时,医生更关注工科团队是否理解其需求,“工科做了所有的事情,对临床的事情不太了解,往往成了盲人摸象。”因为,他认为AI公司与医院合作过程中比较重要的问题是AI团队与医院的沟通,关键在于能不能解决临床需求。AI团队对医疗的医疗需求有基本了解,甚至团队中有医疗背景的人,同时医院也招一些工科背景的人,人员上有一些交叉的话,往往会事半功倍,取得更好效果。“所以我觉得合作的关键在于沟通上,沟通的质量决定合作的成败。”

这让雷锋网想起一个类似的问题:医疗机器人的创业中,医生与技术人员谁是主导?对此,加拿大斯喀彻温大学机械工程系高级工程设计工程实验室主任、加拿大工程院院士Chris  Zhang认为,“医疗机器人行业初期创业时,医生是主导,技术人员是就提出问题来思考,相对被动。”初期创新是发散的,所有的问题来自于医学和医学专家,但是如果有了突破而要创办一个公司时,就应该以企业为核心,去市场分析、包括难点、成本等。

雷锋网

深度 | 没有了手机的诺基亚,现在过得怎么样?

雷锋网按:十几年前,从芬兰走向世界的诺基亚让手机得以普及,但在接下来的时间里,这家曾经爱冒险的公司错过了智能手机的时代,最终落得变卖手机业务的下场。如今的诺基亚手机,已经不再属于诺基亚这家公司。而转向通信设备市场的诺基亚,顽强地度过了寒冬,准备拥抱5G的春天。

没有诺基亚手机的诺基亚,现在怎样了,5G对它有多重要?彭博周刊为我们做了详细报道,雷锋网对原文编译如下。

原文作者体验诺基亚低时延蜂窝设备支持的VR演示

这个芬兰巨头错过了智能手机革命,现在它想拥抱无人驾驶和远程医疗。

诺基亚在通信技术业务中已经神奇地打拼了半个世纪。之所以说神奇,是因为这家公司的最原始的“通讯技术”是纸浆。此外,请读者们注意,“诺基亚集团”目前还在营业。

对于一听到诺基亚就怀旧地想起手机的人来说,可能并不知道诺基亚是靠纸浆起家的。这个科技巨头当了14年世界最大的手机制造商,与此同时,它也是芬兰经济的主要引擎。然而,风光很快就消失了。2012年,它损失了40亿美元。2013年,它的手机业务以及32000名员工都转让给了微软。公司董事长Risto Siilasmaa对此宣布:“很明显,诺基亚没有足够的资金可以投入到加速移动电话和智能设备中。”

诺基亚虽然减小了规模,但仍然是一家大公司,其去年的净销售额达261亿美元。但比起全盛时期,诺基亚已经变了,那时候它简单、耐用、可爱的大块头电话非常受欢迎。总的来说,它的售对象不再是普通消费者了。今天,我们熟悉的大写NOKIA标志,主要出现在网络处理器、路由器、基站无线电接入元件,以及消费者基本接触不到的,移动互联网基础设施的其他组件上。

诺基亚的冒险的精神

满足世界不断增长的数据需求,是诺基亚必须解决的非常复杂的问题。面对爱立信和华为等竞争对手,诺基亚已经重新发明了带有复杂软件的信号塔,旨在收集在全球移动的个人用户的大量信息。

随着通信行业开始推出下一代无线网络,未来两年将成为诺基亚特别重要的两年。所谓的5G将带来更快和更丰富的数据。根据诺基亚及其竞争对手(底层设备的开发商),这些变化将使全新的移动技术成为可能,包括无人驾驶、远程医疗、更全面自动化的工作场所,以及我们尚未想到的其他变化。

诺基亚CEO Rajeev Suri说:“诺基亚想成为一家帮助大型企业实现数字化的公司。”撤离手机业务之后,该公司在5G方面下了大注,如果失败了,它将要再一次从根本上改变自己。

诺基亚的历史比芬兰还长。在当时俄罗斯大公国的西南部,坦佩雷镇附近,诺基亚从一个建于1865年的磨木浆厂起步。虽然芬兰在1917年获得独立,但这一北欧国家的经济仍然处于俄罗斯的阴影下。芬兰在第二次世界大战期间与纳粹德国联合对抗苏联,战争结束之后不得不向斯大林的苏联政府支付巨额的战争赔偿。芬兰人会告诉你,只有他们国家支付了全部的总额,即3亿美元(是1938年的3亿美元)。斯大林对卡车和火车的需求,让让芬兰从一个农业国家变成为一个工业国家。

诺基亚恰好赶上了这个时机。到20世纪初,公司业务已经涉足发电、布线、电话线、橡胶轮胎和靴子制造。到上世纪下半叶,它已成为一个生产从电视到防毒面具的集团公司。在20世纪60年代初,诺基亚开始生产警用和军事无线电设备。在1982年,它发明了一个车用电话,并通过用于通话的数字交换机,开展了网络业务。在20世纪80年代后期,诺基亚投入了更多资源到蓬勃发展的手机业务中。

诺基亚的成功,可以追溯到负责当时北欧移动电话系统(Nordic Mobile Telephone system, NMT)的一部分开发。北欧各国政府机构负责协调合作,设计了一个即使公民到了临近国家,也能使用的公共通信平台。这是一个模拟系统,还不是数字的,但它能够解决定位移动用户的问题,以及将用户的通信从一个信号塔转到下一个的问题。从那时起,包括5G的每一代都是NMT的后代。

起初,摩托罗拉主宰了这个新兴的全球产业,但是诺基亚在1999年超越了他们。部分原因是诺基亚转向了更快更安全的数字系统,而摩托罗拉则坚持使用模拟信号。可以说,几十年来诺基亚一直都有冒险的精神。当它在90年代初将精力集中于移动电话时,很多人都认为诺基亚失去了理智,因为当时它还是个电缆制造商。当在九十年代中期决定从模拟信号转为数字信号时,很多人都认为诺基亚求胜过于心切。

诺基亚对芬兰经济和国家精神的价值,怎么说都不算夸张。由于苏联是芬兰最大的贸易伙伴,苏联解体成了芬兰经济陷入萧条一部分原因。但是诺基亚的崛起挽救了芬兰。根据赫尔辛基智库ETLA的研究,2000年,芬兰GDP的三分之一是诺基亚贡献的。为支持芬兰的高福利政策和全球一流的教育,诺基亚和它的大量本地零部件供应商贡献了大量税收。芬兰全国研发资金的近三分之一,不论是公共的还是私人的,都是诺基亚贡献的。

诺基亚总部

但是,迅速看到数字网络利好的诺基亚,对智能手机的前景反应太慢了。iPhone等所用的触摸屏成本高,于是诺基亚选择做更便宜的触摸屏甚至沿用物理键盘。即使在芬兰,也有人抱怨诺基亚的触摸屏不花大力气都按不动。他们复杂的菜单根本无法与简约的iPhone交互模式相比,更别提之后的应用程序了。苹果、三星和LG等将诺基亚甩在了背后。

诺基亚的麻烦也是芬兰的麻烦。诺基亚是芬兰最大的公司,也是芬兰主要的经济依靠。它的萎缩让一个已经在劳动成本和公共支出都十分高昂的经济体雪上加霜。作为欧元区的一分子,芬兰也无法通过让货币贬值来刺激消费。这个国家的经济陷入了很长的一段停滞时期,现在才开始复苏。

Siilasmaa回忆起在2012年被任命为诺基亚董事会主席时说:“在许多方面,我们都处于非常困难的时期。”

Siilasmaa是芬兰本地网络安全公司F-Secure的创始人。他刚到诺基亚时,公司正风雨飘摇。2012年第二季度设备销售额比上一年下降了26%,只有45亿美元。“员工因为坏消息变得消极,媒体还在猜测我们什么时候破产,而不是会不会。”Siilasmaa主导了将诺基亚手机业务出售给为手机提供操作系统的微软。曾在微软工作的时任诺基亚CEO Stephen Elop,又回到了微软,继续手机业务,Siilasmaa则临时担任诺基亚CEO。

现在使用的诺基亚基站

这笔交易对芬兰来说是一个小打击,但这也是扭转糟糕和快速恶化局势的最好办法。此举让诺基亚专注于销售设备给无线网络服务商。此前,Suri已经与西门子公司合资经营该业务。自从2009年采取控制措施以来,他通过降低成本,把重心放在美国、日本、韩国等更富裕的市场上,让诺基亚扭亏为盈,达到12%的营业利润率。

到2013年中期,诺基亚已经购买了西门子所有的股份。Suri说:“个人设备业务出售后,网络业务成了新诺基亚的核心。”Siilasmaa透露,当时董事会还在衡量是否要购买法国竞争对手阿尔卡特朗讯公司一部分股份。去年,诺基亚已经完全收购了该公司。

不过,诺基亚手机尚未完全消失。去年,微软将他们也搞不定的诺基亚手机业务,卖给了富士康的子公司。富士康与芬兰公司HMD Global Oy合作,正在开发一系列从入门到中等的诺基亚手机和平板电脑。今年年初,运行Android系统的第一款诺基亚手机开始发货。这对诺基亚的实际好处是,它持有手机相关的知识产权,这已无疑能带来相当可观的收入,但也避免不了一些摩擦。诺基亚与苹果多次因这些专利发生冲突,五月才刚结束完一起。这两家公司还宣布,诺基亚将向苹果提供网络服务,而苹果App Store也会支持一些诺基亚产品。

做好准备,等待前程

然而,诺基亚的大部分收入来自无线通信设备的销售。顾客有:Verizon,AT&T,T-Mobile,韩国电信,德国电信等无线服务提供商。诺基亚销售的产品,包括这些网络提供商连接客户所需的一切:无线电发射器、交换机、服务器、天线和协调设备的软件。诺基亚建设好网络、测试通过后收取费用,有时甚至还负责运行这些设备。收购了阿尔卡特朗讯后,诺基亚还销售一些有限电视公司用来将数据带入家庭的、所谓的固定系统。

虽然移动服务提供商必须不断更换和更新部分基础设施,但真正的商机出现在每个人愿意升级到最新一代网络平台的时候。每一“代”通信技术,是在一系列国际会议上提出的一系列技术要求,以确保所有设备,包括服务器、交换机、发射机和电话,都可以通信。

预计在一年内,5G所需的要求可以敲定。5G将在下载速度、可靠性、任何区域可支持的设备数量,以及延迟方面有显着改进。Verizon、AT&T和T-Mobile都在美国各大城市进行了试验。韩国电信承诺在明年二月份举办冬奥会之前,让5G系统落地。

普遍的共识是,5G的障碍是可以解决的。据诺基亚研发部门主管Lauri Oksanen介绍,“真正的瓶颈在空中,如何保证天线和手机之间的通信。”他的研究人员正在开展一些相互关联的技术修补,以解决这种问题。解决方案的一部分,是将信号调到未使用过的更高的频率。诺基亚及其竞争对手正在设计天线,让信号以微波和红外波之间的频率传输,这段频率远高于当今大多数手机使用的频率。

但这也带来了一些问题:频率越高,波长越短,于是这些所谓的毫米波不能穿过墙壁,树木或人。Oksanen说,甚至天线上的塑料壳也可能阻碍信号。这意味着网络服务提供商将不得不在四处设置小天线,例如灯柱和屋顶,以及建筑内部。这个过程将需要与业主商谈,所有这些,都不是阻碍5G普及的技术障碍。

Oksanen团队的关键,将是把此前普通的金属天线,制造成智能、更高效的天线。诺基亚产品的性能,也越来越依赖于能灵活选择路线传输信息和数据的软件。满足5G要求,意味着诺基亚需要改变他们已使用的技术。MIMO(multiple input multiple output,即多输入多输出技术)就是这些技术之一。该技术包括排列大量非常小的天线,使用软件进行协调,令数据的传输能更快也更可靠。

另一种技术,波束形成(beam-forming),就是像聚光灯一样将蜂窝信号聚集起来,甚至可以追踪单个用户,而不是全方位发射信号。这种技术通过操纵从不同天线元件传输来的实时信号来实现。“将信号传输到天线时,可以稍微更改每个信号的相位。从而在没有任何物理实体改变方向的情况下,就可以通过天线之间信号的相位差,来转动无线电波束的方向。”Oksanen举起手来模拟天线阵列,解释道,“我在想如何能解释德更形象些,但可能你还是只能听我来说。”

不放弃消费业务

消费者是否能够注意到诺基亚及其竞争对手所承诺的改进,目前还不清楚。今年春天,巴塞罗那(MWC)世界移动大会的议题是:5G是真正的革命,还是纯属营销炒作。Suri对外界的怀疑表示理解。对于典型的iPhone或Android用户,4G已经够快了。“今天我们的时延是50毫秒。如果它变成1毫秒,行,三秒钟可以下载一部电影,那很好,可是我不认为我们愿意为此掏钱。”

他认为,5G的真正可能用途在其他地方:将时延下降到1毫秒可以更好地协调无人驾驶汽车和卡车;工厂机器人可以摆脱复杂的布线,流水线会更加流畅;家庭网络可以连接到无线互联网,使得家庭网络不再被有限电视供应商垄断;甚至有人提到可以进行机器人远程手术。

但据一些分析师的说法,这样的用途令人着迷,但问题在于,它们不仅仅还只是猜想,而是即使它们成为现实,也不需要跳跃到5G,不需要诺基亚的网络升级。Gartner研究院的总监Bill Ray说:“虽然说,只有当你开始做了,事情才会慢慢发展,但在未知面前表现的有先见之明固然感觉良好,这也需要无线设备公司成百上千万美元的投资。”诺基亚及其竞争对手所谈及的5G应用,他说,全部都可以在现有的无线网络或Wi-Fi上实现。

当然,之前的每一代网络都面临过类似的嘲讽。但是诺基亚的领导层坚信,人们对更快、更丰富、更无处不在的无线数据的需求将会持续增长。诺基亚也需要这种增长。即使在收购了阿尔卡特朗讯之后,网络设备销售上,诺基亚仍然还在华为之后。而近年来,由于运营商在向5G过渡,减少了原来设备的采购,诺基亚的业务也随之放缓。

该公司也试图回到电子消费业务。去年,它购买了一家名为“Withings”的法国公司,它主要制造时尚的健身追踪器、温度计和婴儿监视器。现在他们的名字都归为诺基亚品牌旗下。

诺基亚还刚刚开始销售一款名为Ozo的40000美元的虚拟现实相机,目标群体是专业影视制作人员。VR是一种可以推动大多数用户放弃4G的技术,因为它需要很快的数据传输速度和非常低的时延,以保持用户的沉浸式体验,避免用户感到恶心。

如果诺基亚不断增长的多种工具和玩具能增加用户对数据的更大需求,这对5G的建设者来说是非有利的。如果诺基亚能再一次够创造出普通人想要购买的产品,或许一切都会更好。

via bloomberg 雷锋网编译

雷锋网

深度 | 宣称专注做技术的蚂蚁金服,到底为保险公司输送了哪些“弹药”?

6月27日,《麻省理工科技评论》2017 年度全球 50 大最聪明公司榜单发布,蚂蚁金服作为唯一一家金融科技公司位列49,排在拥有1700名AI专职员工的百度之前。上榜评论为:探索使用AI进行信贷业务,以及通过区块链提高安全性。

说起金融科技,大家会很容易联想到Fintech这个词,但蚂蚁金服CEO井贤栋曾表示,尽管Fintech已经变成一个热门词汇,但我们更愿意用“Techfin”而不是“Fintech”来定义自己。他说:“这不是玩概念,而是从根本上的理念的不同。金融的核心是管理风险,“Techfin”是用技术,数据能力去助力金融,去服务那些普通消费者、普通商户,去提升金融机构的风险管理能力,帮助他们全面升级。

蚂蚁金服保险事业群总裁:尹铭

6月27日的几乎同一时间,蚂蚁金服在北京面向保险行业发布了一款重磅的人工智能产品——“定损宝”。雷锋网对此产品和发布会进行了详细的报道,该产品用 AI 模拟车险定损环节中的定损员作业流程,这也是图像定损技术首次在车险领域实现商业应用。

其实,蚂蚁金服在保险方面战略定位的达成也是一波三折,今年5月,在给员工的内部信中,蚂蚁金服保险事业群总裁尹铭梳理了他赴任蚂蚁至今的完整心路历程:从希望帮保险公司卖保险,到研究保险买卖两难中的沟壑,再到清晰指出蚂蚁金服保险平台今后只做一件事:专心做好技术。

那么宣称专注做tech的蚂蚁金服,到底为保险公司输送了哪些“弹药”呢?今天雷锋网就为大家盘点一二。

基本情况

据雷锋网了解,蚂蚁金服保险服务平台,在公司内部被称为保险事业群,正式成立于2015年,它的定位是“用技术助力保险机构,以此更好服务个人消费者和中小企业(Tech-Insurance)”。 

一方面,它通过人工智能等技术,支持和助力保险行业实现转型升级。目前已经同80余家保险机构深度合作,合作领域包括:区块链技术精准扶贫、数据共创定价参考系统、图像识别技术提效理赔、数据分析反欺诈打黑产等。

另一方面,通过技术助力保险机构,更好服务个人消费者和小微企业,目前参与合作的保险机构通过蚂蚁金服生态体系内各平台服务消费者3.9亿,其中80后90后占比超过80%。2016年全年线上理赔超过1亿笔,智能客服实现千万人次量级的保险教育、为新兴共享经济提供保障、消费保险使中小企业经营成本大幅下降等。

据悉,目前蚂蚁金服保险事业群超过200人的团队中,近70%为技术和数据分析岗位。此外保险数据团队还与蚂蚁金服集团的人工智能、驻美国硅谷数据研究院组成“保险数据科技实验室”,该实验室拥有62项技术专利,汇集蚂蚁金服集团全部技术资源为保险行业服务。

一、区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。是中本聪2008年在比特币白皮书中提出地概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

据维基百科介绍,区块链技术基于去中心化的对等网络,用开源软件把密码学原理、时序数据和共识机制相结合,来保障分布式数据库中各节点的连贯和持续,使信息能即时验证、可追溯、但难以篡改和无法屏蔽,从而创造了一套隐私、高效、安全的共享价值体系。

2016年7月,全球咨询巨头麦肯锡于发布了一份区块链研报,阐述了区块链技术对保险业产生的影响。报告指出当时有20多家区块链创业公司正在专注于研究区块链在保险业的应用。麦肯锡将“最有前途的保险相关用例”分为三类:促进增长、提高效率和通过将关键程序自动化来降低成本,报告称这些都对保险公司有积极的影响。

最后麦肯锡认为区块链技术完全适合保险商进行探索。但是这种技术的推广还有很长一段时间要走,因为区块链是一种分布式系统,它的价值主要取决于与竞争对手、供应商或其他人的合作。

2016年年底,区块链的创新和试验应用被列为「十三五」国家信息化规划的重点。

同年,蚂蚁携手图灵奖唯一华人获得者,清华大学交叉信息研究院院长姚期智,成立数字金融科技实验室,双方在区块链技术、人工智能、智能投顾等领域开展研究。

对于蚂蚁金服而言,有一个区块链应用于公益保险的经典案例:

100元现金捐赠,只能解决贫困家庭几周之需,但100元保险,则可让贫困家庭患难时具备一定经济保障,甚至获得“救命钱”。

2016年7月,苏北贫困县泗洪县政府尝试联合中国人寿、人保公司和蚂蚁金服共同尝试“互联网+保险”精准扶贫计划。为低收入户投保综合型保险,人均保费100元,保障范围涉及疾病、意外伤害、家庭财产和教育。

保费由当地政府和蚂蚁金服公益平台联合筹措,赔付、查询都可在支付宝APP中完成。这样的尝试,提高了扶贫效率,也促进了扶贫行为从粗放向精准转型。截至2017年6月20日,共2224人次获得理赔,理赔总计近759万元。

该平台引入区块链技术,捐赠者可实时查看到捐款金额、理赔额度、运营开销等全部流程数据,而捐赠保险获得者可查询保险保障范围、理赔进度。区块链技术应用在保险扶贫领域,让捐赠更透明,让公益更高效。

该模式很快得到复制。2017年1月,蚂蚁金服上线“益起保”公益保险服务平台,与公益机构合作,为更多人群筹措保险资金。首个项目与“大病医保”公益基金会合作,为湖南贫困县新晃的4万名儿童募集大病保险费用,每份保额20万元,承保公司为中国人寿。

二、人工智能

2016年3月AlphaGo用几盘棋将人工智能推到了媒体和大众面前,而此时蚂蚁金服的人工智能团队早已有大咖坐镇。

2014年,一位专注于机器学习和人工智能的专家加盟阿里巴巴并组建AI团队,他就是蚂蚁金服副总裁、首席数据科学家漆远。

蚂蚁金服首席数据科学家:漆远

漆远是麻省理工媒体实验室博士,普渡大学计算机系终身教授,担任过机器学习权威杂志Journal of Machine Learning Research的执行编辑和全球机器学习顶级会议ICML的领域主席,获得过微软牛顿研究奖和美国科学基金NSF Career奖。他的专业方向是大规模机器学习和贝叶斯推理。

2017年初,蚂蚁成为美国加州伯克利大学RISE实验室合作伙伴,共同致力于为AI提供安全实时智能决策计算平台的研发。

2017年3月,蚂蚁金服在基础科学上的布局成为阿里巴巴NASA计划的一部分。NASA计划旨在动员全球两万多名科学家和工程师投身新技术战略,面向未来20年组建强大的独立研发部分,建立新的机制体制,为服务20亿人储备核心科技。

不久前的5月27日,素有人工智能教父之称的迈克尔·欧文·乔丹加盟蚂蚁金服的科学智囊团并出任首任主席。乔丹执教于加州大学伯克利分校,是美国科学院、美国工程院、美国艺术与科学院三院院士,是人工智能领域唯一一位获此成就的科学家,也是机器学习领域的开创者之一。他桃李满天下,吴恩达、Yoshua Bengio都是他的得意门生。

全球人工智能教父:迈克尔·欧文·乔丹

目前在蚂蚁金服,AI技术已在广泛应用于智能客服、交易风控、贷款模型、智能投顾、图像定损等场景中。

1、智能客服

人工智能技术有一项重要组成被称之为“对话集成”,主要应用在客服部门实现人机对话。例如每年“双十一”,千亿级别的交易额需要数百万次客服咨询,而智能客服承载了其中95%的咨询量,目前人机对话的水平已经不止于实时高频问题回复、相似问题归集,更多探索语义分析和模拟有思考的人机对话,并已投入保险领域的应用。

2017年4月,支付宝推出线下支付送健康险功能,60岁以下的消费者,每进行一次线下支付,就能领取一份健康险保额,保额可以随着支付笔数不断累加,自己额度积满后还可将额度转赠给他人。到目前,主动领取健康险的用户有3000万。

健康险是有专业理解门槛的金融产品,科普的最好方式,可能是让用户人人可感知、体验并完成实时互动。这些用户绝大部分是90后,产品是最好的教育工具,互联网保险的体验,直接决定年轻一代对保险的感知。

目前,平均每天有4万人通过智能客服人机对话了解保险相关知识,“健康险是什么”“怎么提升保障额度”“健康险可以理赔几次、赔多少”“哪些病赔哪些不赔”为提问率最高的问题。

蚂蚁金服保险事业群产品专家许卫杰称,现在每天都需要向蚂蚁保险数据科学实验室输送用户反馈的保险知识和问答素材,供机器深度学习。他认为,赠送的健康险保额虽然不高,但意义在于让数千万人在短时间内就感知到了健康险。未来,人工智能在分析语音语意、跟用户交互上的作用会越来越大。

2、车险分

2017年5月底,蚂蚁金服保险数据科学实验室发布“车险分”技术。以商业车险改革为契机,蚂蚁金服将海量“从人”信息通过人工智能等技术进行挖掘,对车主进行精准画像和风险分析,量化为300-700不等的分数,分数越高,风险越低,从而来帮助提升保险行业的风险识别能力。这在美国等国际市场是已经成熟的技术。

越注重安全、风险低的车主,可以获得越便宜的车险报价;而越便宜的保费,可以激励车主更关注风险,促进社会更安全。这是金融与好的社会良性互动的目标,但之前,保险行业只有与“车”相关的数据,缺少与“人”相关的数据样本和技术分析,较难精准的实现“千人千面”的精准定价。

互联网时代下,越来越多纬度数据可积累、可分析,这让保险业的风控体系更严密。车险分通过利用大数据、人工智能、数据建模等方面的技术,通过与保险公司数据共创,得出针对每家公司不同用户群的科学定价机制。

2016年的数据显示,全国有1.5亿私家车主,涉及54%的家庭。但作为财险公司的主要业务,去年多数公司并没有从车险赚到钱。公开数据显示,2016年只有14家公司车险承保盈利,41家公司共计亏损63亿元,行业亏损比例达到75%,其中,在定价方面没有优势的中小财险公司亏损尤其严重。

近期保险行业商车二次费改政策,进一步扩大了保险公司可自主定价的浮动范围,车险分为尤其是中小保险公司的定价参考提供了更有效的工具。

人保财险总核保师兼车险部总经理方仲友认为,以前车险的定价较为简单甚至“粗暴”,随着不停的改革和复杂数据计算,车险经营的效率又相对降低,而引入车险分后,车险可达到简单之后的高效状态。他相信未来会有更多公司都使用车险分,不是为了竞争,而是为了是给用户最好的体验。

目前,首批参与车险分合作项目的保险公司有人保产险、太保产险、国寿财险、中华联合、太平产险、大地保险、阳光产险、华安产险、安盛天平车险等9家保险公司。

3、图像识别

技术和数据正在保险的产品开发、销售、承保和理赔等全链路当中有很深的应用。

例如,在与电商消费保险的理赔环节,超过九成是依靠后台技术识别和判定,只有一成的案件需要人工干预。以蚂蚁金服保险平台为例,图片识别技术是核赔流程重要应用之一。

图片识别技术首先会对用户报案图片进行清晰度识别,识别图片中理赔标的物的有效信息并实时做出反馈,例如商品标签代码、货品破损程度等。

更重要的环节是对图片相似度的识别,传统保险领域,企图骗保的人,可能会拿着网上下载的图片,在多家保险公司报案理赔。但在生鲜腐烂、化妆品过敏这些消费保险上,技术可以在一个庞大的图片库中,比对识别出报案人上传的是真实拍摄图片,还是重复使用了别人皮肤过敏的图片,亦或是网上下载了腐烂水果的图片。结合对理赔者信用程度的判断,绝大多数理赔都可以在短时间内在线完成,无需任何人工干预。

4、深度学习

图像定损技术体现在最近发布的车险“定损宝”上,此前雷锋网也有详细报道。

在交通事故发生后,传统的车险理赔流程是:用户打电话给保险公司,后者派查勘员现场查勘并拍照,然后定损员根据照片评估损伤情况及赔偿金额。在这样的流程中,保险公司收到事故照片后,需要核赔,核价,往往最快半小时后才能确定理赔金额。

据蚂蚁金服保险事业群总裁尹铭介绍,“定损宝”所做的工作和上面流程中定损员的工作相同,它应用了深度学习图像识别检测技术,通过部署在云端的算法识别事故照片,与保险公司连接后,在几秒钟之内就能给出准确的定损结果,包括受损部件、维修方案及维修价格。

总结

至此,蚂蚁金服在保险领域的布局战略已经非常清晰,它无意利用支付宝入口的优势对保险公司取而代之。正如尹铭所说,蚂蚁金服保险平台不为卖保险,今后将专注于做好技术,和保险公司一起互为生态,通过技术和科技助力保险公司。

雷锋网

深度 | 硅谷是如何推动编程教育的?


Hadi Partovi, Code.org的联合创始人

雷锋网按:教育要面向现代化,面向未来。当我们开始接触儿童编程的概念时,大洋彼岸的硅谷企业,已经致力于推动全国的编程教育了。最近纽约时报的一篇长文就介绍了硅谷是如何推动编程教育的,雷锋网对原文编译如下。从娃娃抓起的计算机科学教育,或许是促进教育公平的初心,但也可能隐藏了企业求贤的私心。不管怎样,相对硅谷我们能做的还有很多。

在上上周的白宫科技巨头聚会上,苹果CEO库克直言不讳,向总统特朗普传达了如何让公立学校更好地服务国家的信息。库克表示,为了帮助填上IT人才缺口,政府应该出力确保学生能学习计算机编程技术。

“每个公立学校都应该要求学生学习编程。”库克对特朗普说。

苹果在推行学校开展编程课程上其实已经迟到了许多。即使没有特朗普的支持,硅谷也老早推动这一议程了,这主要得益于受行业支持的非营利组织——Code.org的营销实力。

苹果CEO,在纽约的一个Apple Store里,和一名参加Code.org课程的三年级学生交谈

Code.org于2012年由Hadi Partovi创办。Hadi是Facebook和Airbnb的早期投资者。他的孪生兄弟Ali Partovi则是Zappos和Dropbox的早期投资者。Code.org以其爆红视频激发了极大的编程课程需求,并因此而出名。现在Code.org的目标是让美国所有的公立学校教授计算机科学。

Hadi Partovi认为,在技术主导的世界里,计算机科学变得与阅读、写作和数学一样重要。他说:“密码学至少与光合作用的原理是同等重要的。”

计算机科学对美国高科技公司来说也是至关重要的,这些公司现在已经非常依赖外国工程师。特朗普的移民限制政策使得Code.org的“教美国人学编程”的计划在业内广受欢迎。

短短几年间,Code.org已经获得了微软、Facebook、谷歌、Salesforce以及个别技术高管和基金会的超过6000万美元的投资。Hadi表示,Code.org在说服24个州政府变更教育政策和法律的同时,创造了一个名为“编程时光”的免费入门编程课程,全球有超过1亿学生试听过。

一路上,Code.org已经演变成硅谷教育改革的新模范:一个深谙社交媒体的实体,推动教育政策变更、开发课程、提供在线编程课程,还培训教师,几乎触及到教育供应链的每一个环节。


2014年计算机科学教育周,时任美国总统奥巴马与参加“编程时光”活动的中学生互动。Hadi Partovi 站在他的身后

Omidyar网络的合伙人Amy Klement表示:“他们有多管齐下的手段,Code.org是独一无二的,我希望这样的模式能够得到复制。”Omidyar是一个慈善投资组织,由ebay创始人Pierre Omidyar和他的妻子Pam发起。该公司向Code.org投资了550万美元。

但是Code.org的高调让人不禁怀疑硅谷是出于自己利益而游说公立学校,也就是满足他们对软件工程师的需求。密西根州立大学政治学助理教授Sarah Reckhow说:“如果我是州立法委员,我一定会怀疑他们的动机。谁都希望公共投资放在自己业务所需的技能上。”

44岁的Hadi则表示,他和他的投资人都是靠这些技能成功的,他只是希望让学生也能有机会发展这些技能。他小时候从伊朗与家人一起移民到美国,后来在哈佛大学学习计算机科学,再后来跟别人创办了一个语音识别公司,最以8亿美元卖给了微软。

Hadi说:“如果你在美国的一所普通学校,没有引导进入这个领域,那么这个梦想就更难实现了。”不过,他也承认的确有一些私心在里面。“经营一家科技公司,聘请和留住工程师都非常困难。”

Code.org提供非常多的免费在线编程课程和全面的计算机科学课程。据Hadi说,它还为57000多名教师提供了培训讲习班。

到2020年,通过计算机和学习应用程序,美国中小学将被重塑成一个价值210亿美元的市场。而Code.org的兴起与则与这一趋势吻合。

去年,苹果推出了一个名为Swift Playgrounds的免费应用程序,它能教人使用Swift编程。Swift是苹果在2014年公布的一种程序语言。

苹果开发的一款学习编程的app——Swift Playgrounds

上个月,苹果为美国高中和社区大学推出了长达一年的Swift应用程序设计课程。苹果还通过在其应用商店中主办“编程时光”的人气活动来支持Code.org。

在Code.org出现之前,多年来,国家科学基金会、业界和教育专家一直致力于开发和在校园中传播计算机科学。例如,2009年,微软的一名工程师开始了一个名为Teals(Technology Education and Literacy in Schools)的项目,让微软公司的员工志愿者走到校园中,帮助学校教授计算机课程。

接着,Hadi想到了使用爆款视频来激发编程课程需求的办法。

Code.org的宣传视频

他说服比尔·盖茨和Facebook CEO马克·扎克伯格在视频中露面。在放上YouTube的第一个星期,这段叫做“大多数学校不会教的东西”的视频带来了大约九百万观看量。在两周之内,就有大约有两万名教师与Hadi联系。

Hadi将Code.org的模式与初创公司Airbnb和Uber进行了比较。他认为“Airbnb改变了旅行方式,但他们并不需要开酒店。我们非常相似,我们变革了教育。但我们不需要建学校,也不用请老师。”

Hadi的精英人脉没有因视频而受到损失。

在2013年初的一天,在华盛顿州贝尔维尤之家的车道外,他拜访了他的邻居,Bradford L. Smith,当时的微软高管。Bradford最近发表了一份微软报告,号召联邦政府为学生在计算机科学和工程学上的就业提前做好准备。

Hadi在视频中表示,编程能够提供学生新的就业方向。Code.org在教一些能在未来获得高薪工作的技能,“这个国家的每个人大概都能明白。”他这么认为。

Hadi很快就邀请Bradford观看他的名人视频。

微软不久就成为Code.org最大的资助者。Bradford现在是微软公司的总裁。Bradford将他们现在对教育变革的努力与上世纪50年代的美国进行了比较。当时,苏联刚刚通过发射人造卫星赢得了太空竞赛,美国为了追赶,发布了一项法律来资助物理学和其他科学的发展。

“我们认为计算机科学之于21世纪就像物理学之于20世纪。”Bradford说。

Hadi表示,与当地团体一道,Code.org和微软帮助说服了24个州政府,允许学校用计算机科学学分抵充数学的学分。除了Black Girls Code、Girl Who Code和Latina Girls Code之外,Code.org还致力于让更多的学生群体接触这一学科。

但这项运动也给一些公司提供了法律上的便利,使他们在公众还没察觉到的时候,对公立学校就产生巨大的影响,甚至是从幼儿园开始。

微软和Code.org去年在爱达荷州推动了一则职业教育法案。教育研究人员对此警告说,这可能导致教育优先考虑行业需求而不是学生兴趣。他还补充道,这可能会导致学校教授某些公司所需的特定的编程语言,而不是学生一生受益的更广泛的解决问题办法。

加州大学洛杉矶分校研究生院资深研究员Jane Margolis说:“让业界参与决定公共教育的内容和方向,这是非常有问题的。”

在爱达荷的相关法案中,这样写道:“大力加强从从幼儿园到职业的计算机科学教育,由行业需求主导,并与业界合作发展,是至关重要的”。


微软总裁Bradford Smith

当记者向他通报了该法案的表述时,微软的Bradford有点吃惊,并表示他对此并不认可。他说:“公共教育不应该将任何一个行业的需求放在第一位,所有行业都没有这样的权利。”

Hadi指出,Code.org对佛罗里达州的“更极端”法案表示反对,这个法案要求学生要获得行业认证。对于允许学校用编程学分抵充外语学分的法案,他们也表示反对。他补充道:“我们还是相信,在这些事情上,科技公司是能发挥作用的。”

爱达荷州的法律在去年生效。其第一个成果是与Oracle开发的新项目,培训公立学校教师教学生Java——Oracle公司的一种受业界欢迎的程序语言。其他公司,包括芯片制造商美光科技,也被邀请协助开发当地学校的计算机科学标准。

爱荷华州STEM行动中心的执行董事Angela Hemingway表示:“有些人认为业界正在推动我们的教育体系向前发展,其实不是这样。他们是合作的关系。”Angela同时负责监督爱荷华州的计算机科学教育计划。

参加Code.org课程的学生

理所当然地,现在全国许多学生和家长都在关注计算机科学。但是,万一出现一些其他科目,比如说数据科学(也涉及计算机),对于学生的生活、职业和圈子而言更为重要和适用,那会怎么样呢?

计算机科学的影响,引发了人们关于是否应该推进学校进行编程教育的讨论,因为毕竟世上还有许多学科。它也让人们来不及考虑如果学校在传统数学课程上增加统计学内容,对学生是不是更好。

Bradford表示,科技公司和慈善家只是试图让被忽视的科目发声。他说:“我们需要举国关注计算机科学和它涉及的其他领域,这是对未来美国学生来说非常重要的基础性学科。这并不只是一门学科,它还包括了其他的学科。”

Hadi表示同意,“我们这个国家有很多关于如何教学的讨论,但是,对于教什么,我们讨论得还不够。”

Via nytimes.com 雷锋网编译

雷锋网