蔡澈阐述戴姆勒“CASE”战略,同时宣布将联合博世推出自动驾驶出租车服务 | BCW 2018

雷锋网新智驾按:2018 年 2 月 21 日-2 月 22 日,第五届博世物联网大会(Bosch ConnectedWorld 2018)在柏林进行。全球顶级供应商博世将诸多产业链的合作伙伴请到了现场共同交流与分享。德系老牌车企戴姆勒集团董事局主席 Dieter Zetsche(下称蔡澈)受邀在开幕演讲中进行了分享。谈到了与博世合作的自主泊车系统,也谈到了戴姆勒集团为出行变革所准备的“CASE”战略。雷锋网新智驾在现场进行了报道。

实际上,大会一开场,蔡澈便和博世全球 CEO Volkmar Denner 一同实车演示了双方共同开发的自主泊车系统。

演示过程中,二人将一辆奔驰轿车驾驶至 Drop Off 区域,这辆车上有雷达系统充当车辆的眼睛。下车后,博世 CEO Volkmar Denner 通过手机 APP 操作了车辆的自主泊车指令,用时 1 分多钟便完成了自主泊车,整个过程非常流畅。

而在演讲分享环节,蔡澈表示,他非常认同现在很多行业都在致力于互联化(Connection)的实践,旨在创造一个综合生态系统为客户创造利益,为其带来便利。戴姆勒本身也投入了很多的精力在互联化方面。

蔡澈以开场所展示的自主泊车技术开始了其分享。

他表示,驾驶汽车有时候是非常美妙的事情,但是停车却经常没法让人感到愉悦,所以这个领域还有很多事情可以去做。

戴姆勒和博世的工作人员一直在为其自主泊车系统工作着。蔡澈称博世是非常棒的合作伙伴,未来还会有更多自主泊车的特性会出来。不远的将来,停车将不再是人们的困扰。

而且,自主泊车系统的推行也让人们对于自动驾驶技术的信心更加充足,为更多自动驾驶方面的先进技术的推行开辟了道路。

蔡澈在演讲中表示,自动驾驶是戴姆勒的“CASE”战略(Connected、Autonomous、Share&Services、Electric)的重要组成部分。

Autonomous

在他看来,自动驾驶技术已经取得了长足进步,主要是因为传感器技术的发展以及计算能力的提升。同时,在自动驾驶领域,无论是资本还是人才,大家都舍得投入。

而且,博世作为强大的汽车零部件供应商,在车辆控制技术方面有很强的技术实力,这也是为什么二者一起合作研发针对城市环境的 L4、L5 级别的自动驾驶汽车。

在地图方面,戴姆勒和博世也共同开发了高精度的地图系统,其中还包含着诸多交通状况的数据。

同时,戴姆勒的自动驾驶原型车已经在全球多地进行测试,不断提升自动驾驶软件系统的能力。此外,戴姆勒也在使用自动驾驶模拟器训练整个自动驾驶系统,让其通过不断的学习变得更加稳定可靠。

这些准备工作让戴姆勒能够在全球范围内启动“Intelligent World Drive”计划,这项计划让戴姆勒的自动驾驶汽车在全球五大洲进行道路测试。其中包括德国、中国、澳大利亚、南非以及美国。

这些路测收集并且产生了大量的数据,包括各地的交通状况的数据。这些数据成为了自动驾驶系统不断进行深度学习的养料,让整个系统更加聪明。

而且,通过全球测试,戴姆勒也全盘掌握了各个国家和地区的道路状况以及交通行为的情况。测试过程中,自动驾驶汽车需要不断去适应当地的交通规则和状况。自动驾驶系统的软件和硬件在这个过程中经受了不一样的考验。

Connected

在未来,所有的自动驾驶汽车将会互相连接,分享相关的数据和信息,包括各自的驾驶经验。

因此,自动驾驶的实现依然离不开互联技术的进步,无论是车辆与车辆之间的互联,还是车辆与交通设施(交通灯、指示牌等)之间的沟通。

而在车内,车载娱乐系统也要实施无缝与人们互联。蔡澈提到了前不久奔驰在 CES 2018 上发布的全新的 MBUX(Mercedes-Benz User Experience)人机交互系统,其中还包含了全新的车载导航系统。不久之后,MBUX 系统将会在奔驰的量产车型(雷锋网新智驾注:新一代奔驰 A 级车型)中进行搭载。

当然,除了在乘用车上进行互联技术的搭载,戴姆勒也将在其商用卡车上不断实践互联化的技术。

所以,将人、车、基础设施进行无缝连接也是博世物联网大会所倡导的互联化的要义,这也是促进一个全面互联的世界到来的重要举措。

Share & Services

当然,互联化也让共享化更上一个台阶。

这也是戴姆勒“CASE”战略中的“S”所代表的共享出行服务。

大约 10 年前,戴姆勒推出了 Car2Go 共享汽车服务,一开始只有 50 台的数量,而现在使用共享出行服务的用户不计其数。戴姆勒还有 Mytaxi 的业务,几乎是欧洲用户量最大的出租车 App,用户量超过 1100 万;此外,戴姆勒在 2017 年 9 月还向共享出行初创公司 Via 注资 5000 万美元,推共享出行服务。

所有的这些动作都将产生更具前景的未来。想象一下当自动驾驶、互联化和共享出行结合在一起的时候,出行将会是何种盛况。

蔡澈表示,事实上,戴姆勒正在与博世一起开发下一代全自动驾驶汽车,不久将在加州桑尼韦尔的道路上开跑。后续将推出自动驾驶出租车服务。

Electric

而戴姆勒“CASE”战略的最后一项是“E”,代表的是电动化的战略。除了互联、自动以及共享,戴姆勒的愿景还有零排放,为此,这家公司已经投入了超过千万欧元的资金在电动汽车的研发上,在 2022 年,将有超过 10 款的全电动车型推出。

“CASE”战略作为戴姆勒接下来的发展核心,将有可能引领未来移动出行的革命。戴姆勒想要打造一个庞大的移动出行生态系统。

当然,单凭戴姆勒一家公司之力,这样的愿景实现起来还是困难重重,所以我们拥有像博世这样的合作伙伴,一起实现梦想。

期待未来有更多意想不到的变革发生。

雷锋网

MIT评出全球十大突破性技术,阿里巴巴正研究其中4项

昨日,美国权威科学杂志《麻省理工科技评论》(MIT Technology Review)正式揭晓 2018 年“全球十大突破性技术”。中国科技巨头阿里巴巴成为给所有人的人工智能(云端 AI)、对抗性神经网络、传感城市、材料的量子飞跃四项技术主要研究者。
“全球十大突破性技术”是科技领域的权威榜单,至今已经有 17 年历史。2018 年完整榜单为:给所有人的人工智能(云端 AI)、对抗性神经网络、人造胚胎、“基因占卜”、传感城市、巴别鱼耳塞、完美的网络隐私、材料的量子飞跃、实用型 3D 金属打印机、零碳排放天然气发电。


评委认为,中国的科技研发能力已经成为全球最重要的势力之一,在某些领域已经可以与全球顶尖科技公司一决高下。在入选的四项突破技术中,阿里巴巴是都在做些什么?

传感城市:阿里云ET城市大脑

《麻省理工科技评论》提到多伦多的一个叫 Quayside 的项目。他们希望从头开始重新设计一个社区,用最新的数字技术将其重建,会让都市地区变得更加可负担、宜居、环保。


而在中国,阿里云正在和多地政府进行一项更为大胆的尝试——构建城市人工智能中枢ET城市大脑。在杭州,ET城市大脑接管了128个信号灯路口,试点区域通行时间减少15.3%,120救护车到达现场时间缩短一半。

对抗性神经网络:车辆识别与AI设计师

利用对抗性神经网络技术,两个 AI 系统可以通过相互对抗来创造超级真实的原创图像或声音,而在此之前,机器从未有这种能力。这给机器带来一种类似想象力的能力,因此可能让它们变得不再那么依赖人类。
在ET城市大脑项目中,阿里巴巴达摩院的科学家使用对抗性神经网络训练ET城市大脑更好的识别客车、火车、卡车的车牌,将识别精准度提高了10%。此外,科学家还将对抗性神经网络用于双11中,完成了数亿张海报的设计。

给所有人的人工智能:阿里云机器学习平台PAI

《麻省理工科技评论》认为,人工智能的应用不应受到少数几家公司统治。其一旦与云技术相结合,那它将可以对许多人变得触手可及,从而实现经济的爆发式增长。在这方面,阿里巴巴已经将很多机器学习工具搬上云端,推动了人工智能革命的到来。
阿里云机器学习平台PAI可以让开发者像做PPT一样开发AI应用。目前提供了回归、分类、聚类、文本分析等100余种算法组件,并支持主流的深度学习框架,包含tensorflow、caffe、MXNET。PAI可以通过托拉拽的方式,实现算法组件的拼接,并提供完整的数据挖掘链路,背靠的阿里云分布式计算引擎可支持百亿特征千亿样本的数据并行化计算。

材料的量子飞跃:阿里云量子计算

在更为前沿的量子研究方面,《麻省理工科技评论》指出,新型量子计算机的研究依然笼罩着一层迷雾,但一个前景无限的应用方向正在向量子计算机招手:精确分子设计。而中国在量子计算方面也有相当明显的成长,正一步步追赶上领先者的脚步。
2017年5月,由中科大、中科院-阿里巴巴量子计算实验、浙江大学共同研制完成的世界首台光量子计算机诞生。另外,同年 10 月 11 日,由中科院与阿里云合作发佈量子计算云平台,量子计算的商业化已经近在咫尺。同时,世界知名量子计算科学家施尧耘、两次理论计算机最高奖德尔奖得主马里奥·塞格先后加盟阿里云量子实验室。

雷锋网

乐视网回应“重整方案”传言:尚未形成任何实质性意向

2月22日雷锋网消息,今日,乐视网(300104)强势涨停,其后发布公告,称截至目前,公司未形成任何涉及“重组方案”的实质性意向,后续相关信息请以上市公司公告为准。

据雷锋网了解,事情起因于近期媒体报道《乐视网研究新重整方案 未来股权或较分散》等文章,报道称,“乐视网内部正在研究制定重整方案。但重整方案也存在很大的不确定性, 接近融创集团高层的人士称,‘至少需要三个月,乐视网才能落定。’此前,融创在乐视网持股 8.56%,仅次于乐视系创始人贾跃亭,不过后者已经将全部 25%的股权尽数质押,且早已跌破了平仓线。这也意味着未来乐视网的股份可能比较分散。” 

乐视网澄清:关于媒体所提到的“重整方案”,截至目前,公司未形成任何实质性的方案及意向,后续相关信息请以上市公司公告为准。

同时表示,截止目前,贾跃亭持有公司 102,426.66 万股股份,占总股本的 25.67%, 其中 101,953.98 万股已质押给金融机构,102,426.66 万股被北京市第三中级人民法院等司法机关冻结。天津嘉睿汇鑫企业管理有限公司持有公司 34,142.22 万股, 占总股本的 8.56%。 

贾跃亭股权质押存在因无法及时追加担保而被相关机构处置的风险, 从而可能导致公司实际控制人发生变更。 

公司已邮件发送并提醒信息披露义务人贾跃亭先生按照《深圳证券交易所上 市公司股东及董事、监事、高级管理人员减持股份实施细则》等相关规定,如若 贾跃亭先生股份涉及到司法强制执行和执行股权质押协议触发减持行为,需按照相关规定要求提前通知上市公司减持计划,上市公司向交易所备案并予以公告。 

此外,乐视网公司于 2018 年 1 月 30 日披露了《2017 年度业绩预告》(公告编号: 2018-025),预计公司 2017 年度亏损 1,160,495.34 万元至 1,160,995.34 万元;2018 年 2 月 8 日公司披露了《关于股票交易异常波动及风险提示的公告》(公告编号: 2018-032),公司董事会、监事会及管理层基于公司目前面临的实际控制人可能 发生变更、关联方应收款回收难度大、现金流紧张、现有业务业绩存在重大不确定性等实际运营情况,提请投资者注意投资风险。 

同时,乐视网表示目前公司一直在积极推进并努力解决面临的各项困难和问题,以期恢复上市公司的正常经营。 

雷锋网

美国逮捕加密货币交易所BitFunder创始人

雷锋网AI金融评论报道,据路透社消息,美国当局于当地时间2月21日逮捕了加密货币交易平台BitFunder创始人Jon Montroll。官方信息显示,Montroll涉嫌提供虚假证词以及向美国证监会(SEC)相关工作人员提供虚假文件;同时交易所未经注册运营,并欺骗其用户。

BitFunder成立于2012年12月,2013年10月便关门大吉。除BitFunder以外,Montroll此前还经营着比特币存托和交易服务平台WeExchange Australia Pty Ltd。根据一项刑事诉讼的记录,曾有黑客在2013年利用系统漏洞窃取了超过6,000个比特币,交易平台因此而缺乏足够的比特币来支付给用户。

但Montroll在随后的SEC调查中否认黑客攻击一事,并向当局提交了伪证。其提供的资产负债表显示了截至2013年10月13日,BitFunder用户存在WeExchange钱包的比特币约为6700枚,但事实上Montroll将个人部分持币转入了WeExchange试图弥补部分损失。检察官指出,Montroll在遭到黑客攻击三天后,曾在网上寻求其他比特币交易所的帮助。

SEC在诉讼中称,黑客窃取的比特币当时市值约为775,075美元,目前该笔比特币的价值约为6960万美元。

纽约南区联邦检察官办公室也对Montroll提起刑事诉讼,指控其在SEC调查期间做伪证和妨碍司法公正。

SEC纽约地区办公室主任Marc Berger表示,从事国家证券交易所活动的平台,不论其活动是否涉及数字资产、代币等,都必须向SEC登记或依据豁免条款运作。

雷锋网

苹果供应链受电动汽车威胁,欲直接购买原材料

雷锋网消息,据彭博社报道,苹果计划直接从矿商手中购买钴矿。钴是电池的关键组成之一,苹果这么做是确想保在电动车辆热潮导致的钴紧缺中,仍然有足够的供应。

苹果是全球最大的钴电池终端用户之一,但迄今为止,它都将买矿业务交给其电池供应商。据报道,苹果希望能确保钴的供应,以给iPhone提供充足的电池,而随着电动汽车电池的需求迅速增长,原材料可能出现短缺的情况。目前,全球约四分之一的钴用于智能手机。

报道称,苹果希望能与矿厂达成协议,在接下来的五年或更长时间内,每年获得数千公吨的钴。还有报道称,苹果早在一年多前就与矿商进行了讨论,而且最终可能不进行交易。

这也意味着苹果可能在钴供应上,与汽车制造商和电池生产商相竞争。宝马与大众,还有三星,都在竞相签署钴矿相关的合同,确保有足够的原材料供应,以实现电动汽车生产上的目标。

宝马的采购主管曾向媒体表示,宝马也将与一家公司达成为期10年的钴供应协议。

钴是锂电池的重要成分之一。手机电池往往需要使用8克左右的精练钴,而电动汽车电池的需求量则是1000倍以上。苹果现在有13亿台移动设备,而且有趣的是,苹果的CEO库克也对电动汽车的前景持乐观态度。

另外值得注意的是,钴供应不仅关乎经济与电子产品。

全球三分之二的钴来自刚果共和国,那里政权不稳,部分矿场会雇佣童工。在2016年的一份报告中,国际特赦组织称,苹果和三星等公司的中国供应商有从依赖童工的矿场购买钴。去年,苹果首次公布了其供应商中供应钴的公司,并表示,在有适当的保护之前,不会让一些雇佣童工的小型矿商进入其供应链。


雷锋网

前Google、Apple、Stanford的顶级地图专家加盟,DeepMap公布了一个超豪华的技术顾问委员会阵容

雷锋网 · 新智驾  2018年2月22日消息,硅谷高精地图与定位技术提供商DeepMap近日对外公布其技术顾问委员会阵容,其技术委员会成员包括美国顶尖的技术专家Brian McClendon,Jaron Waldman和Leonidas Guibas。

DeepMap最早于2016年由吴夏青、罗维和Mark Wheeler等人创办,三人分别担任公司的CEO、COO和CTO。在此次创业前,DeepMap的核心成员在Google Earth、Google Maps、Apple Maps、莱卡地理信息系统、百度无人车等团队都有多年的地图技术和定位系统领域的经验。

在过去一年里,DeepMap对外宣布完成A轮融资,投资者包括Accel、A16z和金沙江创投等。同时,根据官方透露的信息,DeepMap已经在北美、亚洲和欧洲拥有多家客户和合作伙伴。目前,其公开合作的车企包括上汽硅谷创新中心、福特汽车以及本田旗下的加速器Honda Xcelerator。

对外,DeepMap希望提供能够高效处理大规模数据的地图运行架构,进而提供高精度(厘米级)、低成本的地图和定位解决方案。在加州的Concord和San Jose等地,目前上汽的自动驾驶测试车辆已经搭载了DeepMap的软件。去年,创业公司Voyage在San Jose试运行的自动驾驶车辆上也使用了DeepMap的服务服务。

针对此次公布的技术顾问委员会阵容,Brian McClendon此前是数字地图公司Keyhole的创始人,2004年Keyhole被Google收购,这也是Google Earth的前身。在Google任职的10年间,他晋升为负责Google Earth、Google Maps和Google Street View的副总裁。此后,Brian在2015年加入Uber,负责Uber的自动驾驶和地图项目。他目前是堪萨斯大学的研究教授,正在竞选堪萨斯州州务卿一职。

Jaron Waldman此前创办了定位技术公司PlaceBase,该公司于2009年被苹果公司收购。Jaron在苹果公司带领团队继续在苹果生态系统中开发基于位置的服务。2013年,Jaron离开苹果联合创立了初创公司Curbside。

Leonidas Guibas是斯坦福大学计算机科学和电子工程系教授,他担任斯坦福计算几何实验室主任和人工智能实验室的代理主任,同时也是计算机图形学实验室的成员。Dr. Guibas在斯坦福大学读博士期间师从著名计算机科学专家唐纳德克努特教授。他曾在多个工业研究实验室工作并于1984年开始在斯坦福大学教书。Dr.Guibas因在几何算法、几何处理和计算机视觉方面的研究和其在地图中的应用而闻名,是美国国家工程院院士,ACM和IEEE院士。

雷锋网

丹华MD Dovey Wan:当下区块链投资的四个方向和三个属性

图片来源:influencive.com

雷锋网AI金融评论报道,哪类商业模式适合区块链来改造?VC进入新兴区块链行业有哪些投资策略?目前行业各界已经意识到区块链技术具有颠覆性价值,然而如何清晰定义区块链的价值边界,即区块链的革命意义,仍然是行业推动区块链落地的重要问题。

讨论清楚这些问题,区块链技术本身、行业的需求以及区块链赋能的方向才能准确匹配,有价值的模式和技术才能因此诞生和完善。

据雷锋网AI金融评论了解,作为区块链投资领域的先锋,在近日的行业「3点钟区块链」群内讨论中,丹华资本董事总经理Dovey Wan对这些问题发表了看法。

对于区块链如何对现有商业产生影响,Dovey Wan指出,可以划分成“一端是blockchain native(原生区块链),另外一端的是blockchain enable(区块链赋能)”组成的行业图谱来匹配分析。她指出:

  • 原生区块链有四个方向:可扩展性(scalability), 可编程性(programmability), 生态友好的(eco friendly), 和匿名性( anonymity)。

  • 区块链赋能需要寻找符合三种属性:1) 需要产生一定范围的共识 ;2)需要花费高成本进行信息真实性验证; 3)有大范围数据网络效应

具体来说,Dovey Wan还做了进一步的总结阐述,雷锋网AI金融评论对其分享实录编辑整理如下:

链技术圈对可扩展性的解决方案已经很多,包括Plasma、分片技术等,在此不赘述。

而关于可编程性(programmability),其基本定义是“如何让智能合约开发者更加高效地编写代码”,包括语言友好、各种中间件等(在以太上写了一个合约能不能直接在其他公链上跑?)比如业内出现的主打实现跨链逻辑转换的项目,就具有关注的价值(注:现在跨链都是token的价值转换,没有逻辑转化)。

此外,

生态友好的(eco friendly):就是看除了浪费电,我们还能浪费什么不那么浪费地来达到共识。分布式共识不浪费些东西是不可能的,所以肯定需要一定的消耗。


POS其实浪费的是资金的机会成本,但是现在POS的设计,特别是Casper协议,还存在许多问题有待解决。例如很直接的问题就是当全部切换成POS之后,验证器(validator)的投票会非常分散,无法有效达到结果。所以各种新的、靠谱的共识机制——不是随便在Proof of 后面加一个新词就能成为新的共识机制,譬如Cosmos的TenderMint,BitTorrent协议的发明人Bram Cohen最近的新项目Chia Network、做PoST,都值得关注。


anonymity匿名性,各种ZKsnarks,Zero Knowledge Proofs, ZKstark,同态加密,分布式密钥管理等等,包括ZCash的两个发明人最近有个新项目,主要研发抗量子的ZKStark,同样值得关注。

关于适合区块链赋能或者改造的三种属性:

  • 需要产生一定范围的共识:譬如预测市场,譬如任何基于投票的监管/决定,以及任何基于同行评审的意见。

现在所有投票上币的机制都是正向投票,票数多的可以上。但是这里会产生一个逆向选择的问题,就是垃圾币会穷其所有来获得上市,但价值币会理性地消费他们所筹集的资金。长期来说这个可能会导致类似投票平台上全是垃圾项目,这是个博弈设计的问题。所以我们讨论了另外一个反向投票机制:不是得票高者上,而且是得票高者不上。

  • 需要花费高成本进行信息真实性验证:这个有很多使用场景,譬如ID、结婚证、金融产品、保险产品等等,只要涉及到多方信息真实性验证,都能改造或者赋能。

  • 有大范围数据网络效应:区块链最终解决的是数据民主自治的问题,所以类似的模式可以被改造,而且区块链上的合理的经济模型设计可以更好地进行数据交互和交换。

网络效应和数据网络效应不太一样。传统意义上的网络效应是——某个网络A有100个节点,每一个新的节点加入都会对这个网络带来边际效用,而且是指数增长。而数据网络效应指的是——越多用户用,贡献更多数据,基于数据本身的质量和数量网络变得更加智能,并从用户那里获得更多数据。

过去四天,「3点钟区块链」群一众还就区块链项目规划、加密货币价值投资、原生区块链技术横向对比等问题展开激烈辩论,有兴趣获得其中96小时2万字精华实录整理内容的可扫码↓或搜索ID:aijinrongpinglun,关注公号@AI金融评论,回复关键词“3点钟”即可获得。

雷锋网

虚拟币残酷青春物语:为什么最初希望改写金融秩序的比特币,越来越像割韭菜的金融工具

村庄边的深山里有一条恶龙。春天的时候,这条恶龙都会要求村庄献祭一个处女,年年如此。总会有勇敢的少年走进山林深处去与恶龙搏斗,但从未见到这些少年返回。这一年又有一个英雄出发,有人暗暗跟随。在遍地珠宝的龙穴中,少年与恶龙大战若干回合,终于抓住一个破绽,将剑刺入恶龙要害杀死恶龙。尾随之人刚要现身,却见瘫坐在恶龙尸身旁的少年,喘着粗气举起手边的的珠宝,眼睛里闪烁出贪婪的光芒,慢慢地长出鳞片、尾巴和角,变成恶龙。

历史总是在重复着过去。


密集监管前最后的疯狂

2018年2月5日,黑色星期一。

道琼斯指数(DJI)一度大跌1600点,到收盘时下跌1175.21点,跌幅为4.6%,首次出现千点以上跌幅。而股票市场的暴跌似乎也传染到了虚拟货币市场,包括比特币在内的主要虚拟币价格继续走低,其中比特币价格破 7000 美元,逼近6000美元大关。与去年12月17日达到的高点19666美元相比,比特币在一个半月内最大跌幅达到69%,已经跌回了三个月前急速拉升前的水平。

频频出台的监管政策是这一波大跌的导火索——1月,中国互联网金融协会多次发布防范ICO风险提示的文件,进入2月后,中国将对虚拟货币境外交易平台网站采取监管措施;在美国,加大监管力度,对虚拟币交易征税几成定局,数字货币交易所Coinbase公司表示将向2017年内超过200笔虚拟货币交易、或是交易金额超过2万美元的客户寄出1009-K税表,而美国三大银行花旗、摩根大通、美国银行也在近日表示将禁止用其信用卡购买虚拟货币;韩国也在近一年内宣布了多项监管措施,作为全球第三大比特币交易市场,韩国之前比特币价格一直高于其他市场,但监管不仅导致了比特币溢价的消失,甚至出现了折价的情况。此外,德国、日本等国家都开始加强对比特币等虚拟货币的监管。

(三个月一个轮回,比特币价格回到出发点)

再回头看这三个月,正是世界各国对虚拟币监管趋严的三个月。以2017年9月4日央行等七部委叫停ICO为分界线,比特币等虚拟币价格曾出现短暂下挫,随即更多的ICO项目涌入,如货币、币安等主要虚拟币交易平台积累了数千个ICO项目,为让项目在时间窗口关闭前上市发行,项目上平台的手续费用也水涨船高到了1000-2000ETH(约100-200万美元),在“最后一张船票”效应下,币市不降反升;而随着世界各国政府越来越多监管措施的出台,比特币在12月17日逼近2万美元后开始急转直下。

对于监管,币圈也开始分化出两种意见:对于短期炒家来说,监管绝对是个坏消息。然而,在一部分坚信虚拟货币价值、愿意长期投资的人士看来,监管能有望推动虚拟货币的合法化,也是让更多人能够有机会接触虚拟币的重要一步,虽然牺牲了短期利益,但随着蛋糕的做大,虚拟货币的价值在长期会得到体现。

但更深层次的问题是,未来能在我们的日常生活中创造价值的数字货币,还是今天接受监管的虚拟货币吗?


数字货币:草根与精英的对决

任何“屠龙者”的故事,都是草根革命者与精英执政者的对决。

在数字货币的故事里,比特币等虚拟币毫无疑问是以革命者的姿态出现的:在比特币诞生的2009年初,金融危机正在全球蔓延,甚至在比特币的创世区块中,我们可以看到对解决金融危机所做努力的描述(“The Times 03/Jan/2009 Chancellor on brink of second bailout for banks”);在这一背景下诞生的比特币及其背后的区块链技术,也因其去中心化的特质被认为是解决导致金融危机的弊端、改革金融体系问题一种尝试。但随着区块链和虚拟货币的火热,越来越多模仿者蹭热点加入,虚拟币开始出现“泥沙俱下”的趋势,尤其在近期发行的不少草根虚拟货币白皮书中,我们可以看到不少类似“人类已经进入信息时代,但我们的货币和金融体系仍停留在马车时代”燃到爆的话语,但除此之外内容却乏善可陈,而这种行为也在“PPT造车”后被称为“PPT金融创新”。

而另一方面,被这些“革命者”称为“停留在马车时代”的群体并不像这些PPT中想象的那样落后于时代。无论是虚拟货币的监管者、金融政策的制定者还是华尔街的精英们,他们对这一波虚拟货币背后的区块链技术保持敏感,与希望用建立新规则的虚拟货币新贵们不同,他们希望用技术手段来解决传统金融中的问题;尽管他们与“革命者”在一些问题上存在相似的结论,但实现的路径却是南辕北辙——例如他们承认数字货币是未来发展的趋势,但这种数字货币并不是目前市面上在跑的这些虚拟币——像中国互联网金融协会区块链工作组组长李礼辉就曾经表示:“我们需要分清法定数字货币和数字代币。各国的态度不完全一致,总体上说比较谨慎,一般将代币定义为虚拟商品或资产。”

虚拟币社区希望确定虚拟币未来的数字货币地位,传统金融社区倾向将虚拟币定义为资产而非货币。这当中有什么不同?

稍有了解虚拟币的人可以判断出,出块间隔长达十分钟、并发处理能力仅 6.67 TPS、自带通缩特性的比特币并不适合做为在未来世界中使用的货币。为此,后来者们对虚拟币进行了许多改进:从出块间隔更短、发行量更大、挖矿算法优化但与比特币属性基本相同的莱特币,到提出“智能合约”概念、改革POW算力浪费改用POW+POS混用的以太坊,以及应用“石墨烯”技术,号称能达到十万甚至百万级别TPS的新一代的虚拟币们……但这仍然远远不够。

有一点必须明确:世界各国监管政策几乎都将虚拟币定义成资产而非货币,并不仅仅是为了从火爆的虚拟币市场中分一点资产利得税那么简单。一套完善的货币金融体系远比一套商品或者证券交易体系复杂,一旦发生失误就将对整个社会经济产生毁灭性的后果,如果以“去中心化”作为未来数字货币和金融体系的唯一准绳,这种人人负责最后的结果只能是人人不负责,在“黑天鹅事件”面前毫无抵抗力。

继续深究下去,问题可能更多:为维持现代货币稳定和基本功能的一套货币发行准备金机制,虚拟币能做到甚至做得更好吗?“通货紧缩的危害,远比温和的通货膨胀要大得多”这一写在经济学学生教科书里的内容,与多少比特币信徒去了解和思考过?你能想象连扩容都要吵上几年,有了协议又被Core团队反悔推翻,一言不合就分叉的比特币社区能制订及时、有效的金融政策么?

比特币不行,其他修修补补的虚拟币同样不行。

相比之下,将虚拟币定位为资产相对简单一些。但既然是资产,就要遵从资产的规则,虚拟币“革命者”们仍然毫无优势。

现在再回到这一轮过山车行情的最初启动阶段,从基本面消息看,比特币大幅上涨主要是受到了比特币期货合约启动计划的驱动:12月10日,芝加哥期权交易所(CBOE)上线比特币期货交易;12月17日,芝加哥商品交易所(CME)推出比特币期货产品(18日交易),在币圈对这两条消息的解读是一边倒的看好,摩拳擦掌准备大干一场时,比特币价格却在12月17日短暂达到峰值后急转直下,开始了一个多月的下跌。

对于华尔街来说,比特币的期货与其他他们熟悉的期货一样,只是多了一个可以做空的平台;有传言也称:在这一波比特币上涨中,华尔街是重要的推手:他们在4000-5000美元点位开始建仓,借比特币期货合约推高比特币的价格,而在这一波上攻至20000美元的上涨中,比特币交易量并不大;当比特币期货产品开始交易时,华尔街开始转手做空,一进一出之间,如果再加上杠杆交易,华尔街可以获得十几倍的收益。

这一波韭菜还是太嫩。


寄希望变革金融的比特币,还是变成了金融工具

我们再来回顾2月5日的“黑色星期一”,股市和币市的波动情况。

自从2013年,比特币按收盘价计算的单日价格下跌超过15%(按Coinbase收盘价计算)的日子共有20天(如下图)。雷锋网注意到,在很多时候,当比特币大跌时,股市往往是波澜不惊甚至微涨;而在这一次的下跌中,金融市场的波动第一次与比特币比价紧密相关:在道琼斯指数开盘跳水后,币市也随之大幅下跌;在道琼斯大跌收盘后,币市表现低迷,大多数虚拟币跌幅超过20%;在星期二市场信心开始恢复,虚拟货币也在开盘前三个小时左右开始酝酿反攻;随着股市开市低开高走,币市也随股市的上扬收复了失地。虽然之前比特币也曾经有过多次过山车般的剧烈波动,但与道琼斯指数的“神同步”还是第一回。

数据来源:Google Finance、Coinbase,雷锋网整理

奇怪,比特币什么时候需要看金融市场眼色了?

按中本聪信徒的设想,如果比特币是思考如何解决金融危机问题的产物和变革现有金融体制的弊病的良药,那比特币的一些特质应该是与现行的金融机制能互补甚至是能起到避险作用的:影响比特币价格变动的,是和影响股市价格变动完全不同的东西,当货币机制崩溃、股市下跌的时候,正是虚拟货币横空出世,力挽狂澜的时候。可惜的是,虚拟货币仍未被广泛接受,这种“力挽狂澜”的场景也迟迟没有到来,反而是此前涨跌自成体系的比特币,在越来越多的监管措施出台后,如同被套马索套住的野马,开始体现出越来越多的受金融市场影响的痕迹。

据雷锋网对比特币价格波动与道琼斯指数的对比分析,从整个比特币历史价格的波动看与股市在统计学上并不相关,但近三个月来,比特币的价格波动与道琼斯指数间开始呈现出一种弱的正相关性(见下图,R=0.3244,在统计学上,相关系数R在0.3-0.5之间被认为弱相关)。

数据来源:Google Finance、Coinbase,雷锋网整理

这或许是某种巧合,或许是因为股票投资者和股票投资者逐步重合的结果,但也或许是华尔街影响比特币市场的传言的一个佐证:当一个新兴市场与传统市场的相似性越大,华尔街精英们越有可能忽视技术因素发起降维攻击,将你拉到和他们同一水平线上,在他们熟悉的领域用丰富的知识和经验击败你(非贬义)。

就像NBA球迷们熟悉的那句话 ——

“未来是你的,但现在是我的。”


区块链3.0的故事,仍在继续

并不是说虚拟币一无是处,或者将全军覆没。

作为虚拟币1.0时代的代表,比特币是有价值的:虽然不能像货币一样普遍使用,但币圈已经普遍认同了比特币的保值的作用。在未来比特币将成为类似黄金一样的投资品,而比特币背后所吸引的全世界绝大多数POW挖矿算力的成本投入,也可以给比特币的保值功能加多了一份心理安慰。

虚拟币2.0时代的代表以太币也是有价值的:以太坊“智能合约”概念的提出和相关的生态建设,实现了将区块链的商业应用场景从货币扩展到数字化应用,为虚拟币背后的区块链技术指明了价值变现的道路。虽然目前基于以太坊的智能合约应用仍存在不少问题,但随着技术以及生态系统的完善,作为价值交换中间物的以太币,也能从中找到自己的位置。

再往后则从虚拟币2.0时代过渡到区块链3.0时代:这一时代的重要特征将是货币支付手段及金融功能的淡化和与实际应用场景捆绑的进一步延伸。目前对于区块链3.0仍未有一个统一的定义,对区块链3.0的未来应用也还在探索之中,代表则是EOS、Telegram等新一代的区块链基础建设者;但这一波的革命者如果想取得成功,唯一的出路是提高自己的技术含量,杜绝不切合实际的空想和口号,踏踏实实去改良某个场景应用中的实际问题,而不是试图一下子去颠覆某个行业,否则就会像在金融领域一样,让华尔街分分钟教你做人。

从这样的评判标准看,目前市面上的上千种虚拟货币,能有多少能够存活到3.0时代的繁荣仍然为未可知。据某区块链基础技术平台公司创始人向AI金融评论爆料,他们分析了目前市面上的上百种虚拟币的代码,发现很多虚拟货币代码是无法运行的。尽管如此,许多虚拟币只要定期发布技术更新公告,就能跟随比特币和以太坊享受虚拟币高速增长的红利。

从科技发展的历史看,一项新技术在发展之初总是在短期内被高估,但是在长期又被低估。区块链技术也是如此,从某种意义说,正是在1.0时代我们对作为区块链应用的唯一场景即数字货币影响的高估,以及有心无意之下对人们对财富渴求心理的利用,使得行业对虚拟币产生了诸多不切实际的想象,也造成了现在“千币竞流”的疯狂。而随着时间的推移,目前世界各国采取手段限制ICO、促进区块链技术,正是希望引导人们对新技术本质的正确认识,将捞一把就走的投机分子清理出场,才能给专注于技术者以更好的发展空间和环境。

回到开头的故事。这个故事的另一个版本是,第一代的屠龙勇士化为恶龙,但也许是他的良知尚存,也许是他害怕无意中的吐息会将财宝付之一炬……总之,他不再喷吐火焰,但不喷火的龙依然暴虐的飞翔在天空。接下来,第二代勇士杀了龙变作无翼的龙。无翼的龙依然撕咬无辜的人。于是第三代勇士杀了龙,变作无翼无牙的龙。接着是爪子,鳞片、尾巴……这与虚拟币和区块链技术的一代代演变又何其相似。

但问题来了:为什么那些屠龙的勇士总会变成恶龙呢?

答案或许很残酷:在任何一个充满革命气息故事的开端,人们需要的是恶龙,并不需要真正的屠龙者。

雷锋网

以德跑路、被攻击?一文详解去中心化交易所以德的底层运作协议

雷锋网AI金融评论按:加密货币市场的繁荣离不开蓬勃发展的交易所的支撑,Poloniex、Bittrex、Bitfinex、Yunbi、Okcoin、Kraken、Liqui等等,它们为区块链市场的资产代币化发展提供了全球化全天候的充足流动性。然而这些中心化交易所存在一些显著的风险和问题。因此基于区块链去中心的特性在区块链网络上来搭建去中心化交易所的尝试,看起来就顺理成章了。

然而去中心化交易所目前还属于比较年轻的技术,对很多人来说都有些陌生。日前hackernoon知名博主Dominiek Ter Heide发布博文,简单探讨了去中心化交易所的内部运作。雷锋网为您做如下编译:

世界上大多数的加密货币交易都是通过Coinbase / GDax,Binance,Bittrex等中心化交易所完成的。这些交易所管理着人们的资本(和私人密钥)并帮助交易。在过去的几年乃至几周中,发生过一些高调的黑客事件,窃取了大量的资金。我认为,在短期内这个问题不太可能得到解决,且只会变得更糟。软件和硬件越来越复杂,这将导致更严重的安全漏洞,例如英特尔CPU固件中最近发生的熔断和幽灵漏洞。

去中心化交易所也被称为DEX,是一种促使在分布式账本上进行加密货币交易的新技术。这些交易所将资金和交易的控制权交还给用户,消除了单个故障点。其次,政府征税或资金没收几乎不可能再发生。这对宏观经济和地缘政治格局可以说具有深远的长期影响。

然而,DEX技术仍然年轻,仍然有相当多不足之处,包括某些攻击途经。在这篇文章中,我们将研究去中心化交易所的内部运作。

EtherDelta和0x

有一个叫做0x(Zero X)的流行项目。该项目的目标是为基于以太坊的去中心化交易所提供开放协议。该项目还出售$ ZRX代币,目前交易市值 5.42亿美元。(顺便说一句,我持有其中一些)。该代币的目的是为智能合约和协议提供治理机制。

0x有一些很好的想法,开源代码应用现象和文件记录。然而,我不确定0x要如何通过去中心化交易来盈利,以及如何维持5.42亿美元的市值。 

基本上来说,0x白皮书很好的描述了EtherDelta去中心化交易所。EtherDelta是首批具备吸引力的去中心化交易所之一。它主要基于以太坊运行,其最近的智能合约价值约为1.4亿美元。即使是最懂技术的用户,也觉得它们的用户界面很难使用,因此这个数额可以说是相当惊人的。 

EtherDelta UI

了解EtherDelta交易所如何工作,就能让我们透彻的了解去中心化交易所的当前状态,以及0x将如何运行。0x的本质是具有更好的代码和附加功能的EtherDelta。

下面我们将分析合同中最重要的两个方面:资金管理和交易逻辑。 

EtherDelta智能合约

以太坊智能合约是能够以分布式和不可变的方式在以太坊区块链上执行的代码块。EtherDelta和基于以太坊的交易所的核心逻辑就在于这些智能合约。与传统的编程相比,实施这些智能合约就像是发射火箭。需要超级安全和强大,因为任何错误都可能导致巨额的资金损失。

智能合同通常是用人类可读的语言(称为Solidity)编写的,被编译成以太坊虚拟计算机指令(Ethereum Virtual Machine instructions,简称EVM指令)。这些EVM指令实际上是人类无法读取的。有些项目选择永远不共享智能合约的“Solidity”代码,通过隐匿实现安全性。例如,Crypto Kitties(加密猫咪)遗传多样性智能合约就是“闭源”的。即便如此,从理论上讲,我们通常都能够把智能合约的原始结构拼凑起来,所以闭源智能合约总让人感到厌倦。

EtherDelta合同的Solidity代码可以在Etherscan这里免费获得:https://etherscan.io/address/0x8d12a197cb00d4747a1fe03395095ce2a5cc6819

资金管理

EtherDelta将资金控制权完全给了用户。即便如此,要使用EtherDelta资金,需要将其转移到智能合约中。资金基本上集中在智能合约中,但全部在分布式账本上完成。我知道这令人困惑。归根到底,在任何时候用户都可以在没有任何第三方介入的情况下提取或存入资金。 

EtherDelta资金管理Solidity代码

正如你在上面的摘要中所看到的,有两种移动资金的机制。一个是针对移动ETH——也就是以太坊的本币。另一个是移动代币ERC20。事实上,现在大多数ICO和可交易代币实际上就是基于太坊区块链的ERC20代币。以太坊提供了处理这些标准代币的特殊机制。

您可能会注意到,在上面的代码中,只有一种方法被标记为“应付”。这是Solidity的一个安全机制,明确允许将ETH资金发给该调用。任何客户要存储代币都需要执行额外的步骤,来授权ERC20代币的转移。

EtherDelta的资金管理看起来非常稳固。一些智能合同有管理员用户吸取资金的机制。IDEX分散交易智能合约就是这种情况。人们对这样的机制应该是很不耐烦的。 

交易逻辑

在EtherDelta中,新的市场订单可以“链上”或“链下”存储。链上存储意味着它们被存储在智能合约中,链下则意味着存储在第三方如中央服务器中。在实践中,由于成本和速度的影响,EtherDelta没有链上存储订单。相反,它们使用以下机制。

人们可以为给定的ERC20代币提交一个公开的买入或卖出定单——用交换术语来说,这个人就是Maker。另一个交易者可以浏览这些订单,并选择执行它们——这个人被称为Taker。 

接下来,使链下订单开始运转的关键因素来自区块链的核心——椭圆曲线数字签名算法 ,也可以简称为ECDSA。这是不对称密码的一个特殊变体,它允许公钥和私钥加密以及签名验证——所有这些都以有利于计算的方式进行。

在较高层面来说,这是它在EtherDelta中的工作原理:

  • Maker创建一个新的订单:ERC20代币,它的数额,它的ETH金额,以及是买入还是卖出订单。

  • Maker创建该订单的密码散列(使用SHA3)

  • 然后Maker使用以太坊私钥为订单散列签名(使用ECDSA,还有特别是在比特币中也使用的Secp256k1来实现)

  • Maker在链下发送订单以及签名(在EtherDelta中,这一个步骤通过一组服务器用WebSockets传递JSON消息来完成)

  • 当Taker想要与该订单进行交易时,签名和订单信息被发送到智能合约的交易功能。

  • 智能合约验证签名来源于Maker

  • 智能合约确认订单没有过期或已经履行

  • 资金转移并收取费用。

步骤5到7发生在合同代码的以下关键位置:

代码的第5行中,订单的金额、价格、到期日期和被称为nonce的一次随机数,一起生成一个散列。这个散列是一个32字节的序列,代表一个独一无二的市场订单。

第7行首先检查链上订单簿(是未使用过的订单簿),如果没有链上订单,则对签名进行验证。

此签名验证采用由Maker签署的订单——并验证是否源自Maker的帐户地址。如果订单参数有任何更改,该散列将需要不同的签名。 

一旦验证完成,tradeBalances功能将围绕金钱并收费。

必须指出的是,首先是从(活跃的)Taker处收钱,最后只记入Taker借方。我认为这对合同的安全至关重要,因为有可能会发送(并验证)一个错误的用户地址。如果这是有意为之,会很容易让Taker赔钱。可见,保护这样的软件安全是多么棘手和具有挑战性。

结论

我们现在已经简单的回顾了基于以太坊的DEX的本质。0x项目还有很多的内容,比如链下订单管理的开放标准,经过充分测试和记录的智能合约,更多类型的交易机制等等。但是在DEX的核心,都使用了相同的基本流程和密码原则。

但据目前以德的表现来说,在安全、可信方面,协议仍有许多待完善之处。

在以后的文章中,雷锋网将继续为您编译一些关于DEX以及以太坊智能合约的内容,敬请期待。

雷锋网

新手必看的十种机器学习算法

雷锋网 AI 科技评论按:在神经网络的成功的带动下,越来越多的研究人员和开发人员都开始重新审视机器学习,开始尝试用某些机器学习方法自动解决可以轻松采集数据的问题。然而,在众多的机器学习算法中,哪些是又上手快捷又功能强大、适合新手学习的呢?Towards Data Science 上一篇文章就介绍了十种新手必看的机器学习算法,雷锋网 AI 科技评论全文编译如下。

机器学习领域有一条“没有免费的午餐”定理。简单解释下的话,它是说没有任何一种算法能够适用于所有问题,特别是在监督学习中。

例如,你不能说神经网络就一定比决策树好,反之亦然。要判断算法优劣,数据集的大小和结构等众多因素都至关重要。所以,你应该针对你的问题尝试不同的算法。然后使用保留的测试集对性能进行评估,选出较好的算法。

当然,算法必须适合于你的问题。就比如说,如果你想清扫你的房子,你需要吸尘器,扫帚,拖把。而不是拿起铲子去开始挖地。

大的原则

不过,对于预测建模来说,有一条通用的原则适用于所有监督学习算法。

机器学习算法可以描述为学习一个目标函数 f,它能够最好地映射出输入变量 X 到输出变量 Y。有一类普遍的学习任务。我们要根据输入变量 X 来预测出 Y。我们不知道目标函数 f 是什么样的。如果早就知道,我们就可以直接使用它,而不需要再通过机器学习算法从数据中进行学习了。

最常见的机器学习就是学习 Y=f(X) 的映射,针对新的 X 预测 Y。这叫做预测建模或预测分析。我们的目标就是让预测更加精确。

针对希望对机器学习有个基本了解的新人来说,下面将介绍数据科学家们最常使用的 10 种机器学习算法。

1. 线性回归

线性回归可能是统计和机器学习领域最广为人知的算法之一。

以牺牲可解释性为代价,预测建模的首要目标是减小模型误差或将预测精度做到最佳。我们从统计等不同领域借鉴了多种算法,来达到这个目标。

线性回归通过找到一组特定的权值,称为系数 B。通过最能符合输入变量 x 到输出变量 y 关系的等式所代表的线表达出来。


线性回归

例如:y = B0 + B1 * x 。我们针对给出的输入 x 来预测 y。线性回归学习算法的目标是找到 B0 和 B1 的值。

不同的技巧可以用于线性回归模型。比如线性代数的普通最小二乘法,以及梯度下降优化算法。线性回归已经有超过 200 年的历史,已经被广泛地研究。根据经验,这种算法可以很好地消除相似的数据,以及去除数据中的噪声。它是快速且简便的首选算法。

2. 逻辑回归

逻辑回归是另一种从统计领域借鉴而来的机器学习算法。

与线性回归相同。它的目的是找出每个输入变量的对应参数值。不同的是,预测输出所用的变换是一个被称作 logistic 函数的非线性函数。

logistic 函数像一个大 S。它将所有值转换为 0 到 1 之间的数。这很有用,我们可以根据一些规则将 logistic 函数的输出转换为 0 或 1(比如,当小于 0.5 时则为 1)。然后以此进行分类。

逻辑回归

正是因为模型学习的这种方式,逻辑回归做出的预测可以被当做输入为 0 和 1 两个分类数据的概率值。这在一些需要给出预测合理性的问题中非常有用。

就像线性回归,在需要移除与输出变量无关的特征以及相似特征方面,逻辑回归可以表现得很好。在处理二分类问题上,它是一个快速高效的模型。

3. 线性判别分析

逻辑回归是一个二分类问题的传统分类算法。如果需要进行更多的分类,线性判别分析算法(LDA)是一个更好的线性分类方法。

对 LDA 的解释非常直接。它包括针对每一个类的输入数据的统计特性。对于单一输入变量来说包括:

  1. 类内样本均值

  2. 总体样本变量


线性判别分析

通过计算每个类的判别值,并根据最大值来进行预测。这种方法假设数据服从高斯分布(钟形曲线)。所以它可以较好地提前去除离群值。它是针对分类模型预测问题的一种简单有效的方法。

4. 分类与回归树分析

决策树是机器学习预测建模的一类重要算法。

可以用二叉树来解释决策树模型。这是根据算法和数据结构建立的二叉树,这并不难理解。每个节点代表一个输入变量以及变量的分叉点(假设是数值变量)

决策树

树的叶节点包括用于预测的输出变量 y。通过树的各分支到达叶节点,并输出对应叶节点的分类值。

树可以进行快速的学习和预测。通常并不需要对数据做特殊的处理,就可以使用这个方法对多种问题得到准确的结果。

5. 朴素贝叶斯

朴素贝叶斯(Naive Bayes)是一个简单,但是异常强大的预测建模算法。

这个模型包括两种概率。它们可以通过训练数据直接计算得到:1)每个类的概率;2)给定 x 值情况下每个类的条件概率。根据贝叶斯定理,一旦完成计算,就可以使用概率模型针对新的数据进行预测。当你的数据为实数时,通常假设服从高斯分布(钟形曲线)。这样你可以很容易地预测这些概率。

贝叶斯定理

之所以被称作朴素贝叶斯,是因为我们假设每个输入变量都是独立的。这是一个强假设,在真实数据中几乎是不可能的。但对于很多复杂问题,这种方法非常有效。

6. K 最近邻算法

K 最近邻算法(KNN)是一个非常简单有效的算法。KNN 的模型表示就是整个训练数据集。很简单吧?

对于新数据点的预测则是,寻找整个训练集中 K 个最相似的样本(邻居),并把这些样本的输出变量进行总结。对于回归问题可能意味着平均输出变量。对于分类问题则可能意味着类值的众数(最常出现的那个值)。

诀窍是如何在数据样本中找出相似性。最简单的方法就是,如果你的特征都是以相同的尺度(比如说都是英寸)度量的,你就可以直接计算它们互相之间的欧式距离。

K 最近邻算法

KNN 需要大量空间来存储所有的数据。但只是在需要进行预测的时候才开始计算(学习)。你可以随时更新并组织训练样本以保证预测的准确性。

在维数很高(很多输入变量)的情况下,这种通过距离或相近程度进行判断的方法可能失败。这会对算法的性能产生负面的影响。这被称作维度灾难。我建议你只有当输入变量与输出预测变量最具有关联性的时候使用这种算法。

7. 学习矢量量化

K 最近邻算法的缺点是你需要存储所有训练数据集。而学习矢量量化(缩写为 LVQ)是一个人工神经网络算法。它允许你选择需要保留的训练样本个数,并且学习这些样本看起来应该具有何种模式。


学习矢量量化

LVQ 可以表示为一组码本向量的集合。在开始的时候进行随机选择。通过多轮学习算法的迭代,最后得到与训练数据集最相配的结果。通过学习,码本向量可以像 K 最近邻算法那样进行预测。通过计算新数据样本与码本向量之间的距离找到最相似的邻居(最符合码本向量)。将最佳的分类值(或回归问题中的实数值)返回作为预测值。如果你将数据调整到相同的尺度,比如 0 和 1,则可以得到最好的结果。

如果你发现对于你的数据集,KNN 有较好的效果,可以尝试一下 LVQ 来减少存储整个数据集对存储空间的依赖。

8. 支持向量机

支持向量机(SVM)可能是最常用并且最常被谈到的机器学习算法。

超平面是一条划分输入变量空间的线。在 SVM 中,选择一个超平面,它能最好地将输入变量空间划分为不同的类,要么是 0,要么是 1。在 2 维情况下,可以将它看做一根线,并假设所有输入点都被这根线完全分开。SVM 通过学习算法,找到最能完成类划分的超平面的一组参数。

支持向量机

超平面和最接近的数据点的距离看做一个差值。最好的超平面可以把所有数据划分为两个类,并且这个差值最大。只有这些点与超平面的定义和分类器的构造有关。这些点被称作支持向量。是它们定义了超平面。在实际使用中,优化算法被用于找到一组参数值使差值达到最大。

SVM 可能是一种最为强大的分类器,它值得你一试。

9. Bagging 和随机森林

随机森林是一个常用并且最为强大的机器学习算法。它是一种集成机器学习算法,称作自举汇聚或 bagging。

bootstrap 是一种强大的统计方法,用于数据样本的估算。比如均值。你从数据中采集很多样本,计算均值,然后将所有均值再求平均。最终得到一个真实均值的较好的估计值。

在 bagging 中用了相似的方法。但是通常用决策树来代替对整个统计模型的估计。从训练集中采集多个样本,针对每个样本构造模型。当你需要对新的数据进行预测,每个模型做一次预测,然后把预测值做平均得到真实输出的较好的预测值。

随机森林

这里的不同在于在什么地方创建树,与决策树选择最优分叉点不同,随机森林通过加入随机性从而产生次优的分叉点。

每个数据样本所创建的模型与其他的都不相同。但在唯一性和不同性方面仍然准确。结合这些预测结果可以更好地得到真实的输出估计值。

如果在高方差的算法(比如决策树)中得到较好的结果,你通常也可以通过袋装这种算法得到更好的结果。

10. Boosting 和 AdaBoost

Boosting 是一种集成方法,通过多种弱分类器创建一种强分类器。它首先通过训练数据建立一个模型,然后再建立第二个模型来修正前一个模型的误差。在完成对训练集完美预测之前,模型和模型的最大数量都会不断添加。

AdaBoost 是第一种成功的针对二分类的 boosting 算法。它是理解 boosting 的最好的起点。现代的 boosting 方法是建立在 AdaBoost 之上。多数都是随机梯度 boosting 机器。

AdaBoost

AdaBoost 与短决策树一起使用。当第一棵树创建之后,每个训练样本的树的性能将用于决定,针对这个训练样本下一棵树将给与多少关注。难于预测的训练数据给予较大的权值,反之容易预测的样本给予较小的权值。模型按顺序被建立,每个训练样本权值的更新都会影响下一棵树的学习效果。完成决策树的建立之后,进行对新数据的预测,训练数据的精确性决定了每棵树的性能。

因为重点关注修正算法的错误,所以移除数据中的离群值非常重要。

结语

当面对各种机器学习算法,一个新手最常问的问题是「我该使用哪个算法」。要回答这个问题需要考虑很多因素:(1)数据的大小,质量和类型;(2)完成计算所需要的时间;(3)任务的紧迫程度;(4)你需要对数据做什么处理。

在尝试不同算法之前,就算一个经验丰富的数据科学家也不可能告诉你哪种算法性能最好。虽然还有很多其他的机器学习算法,但这里列举的是最常用的几种。如果你是一个机器学习的新手,这几种是最好的学习起点。

via towardsdatascience.com,雷锋网 AI 科技评论编译

雷锋网