月度归档:2017年11月

不必再为基础设施烦恼,亚马逊新的云服务 SageMaker 让从业人员只需关注模型就好

雷锋网 AI 科技评论按:2017年11月27日至12月1日,亚马逊在拉斯维加斯举办年度的“re:INVENT”大会,发布许多新服务、硬件,也带来许多开发者和AWS的专家们之间交流的机会。在人工智能、机器学习如此火热的年代,亚马逊AWS也发布了以 SageMaker 为重点的多个机器学习服务。雷锋网 AI 科技评论把相关情况简单介绍如下。

一个新的机器学习云服务

云服务的意义是把传统来讲非常复杂的软件管理流程以及IT硬件管理流程一股脑丢掉,让企业只需要关注于自己真正的业务,而且还能方便地随时扩大规模。如今,机器学习受到了开发者们越来越多的关注,而它也同样也会遇到软硬件环境的配置的问题。AWS看到了这种需求,也就打算站出来摆平这其中的种种困难。

在这次“re:INVENT 2017”大会上,亚马逊就正式宣布了自己的机器学习云服务 SageMaker,它会给开发人员和数据科学家们提供一个新的框架,让他们方便地管理机器学习模型相关的整个过程,很多以往躲不掉的基础性工作现在都可以交给AWS完成。

AWS的高级技术人员 Randall Hunt 同步发出一篇博客介绍了一些技术细节。他也介绍道,SageMaker的目的就是建立一个开发框架,在它的帮助下可以让企业更快地把机器学习集成到自己的新应用中。“Amazon SageMaker 是一个带有完全的管理能力的端到端机器学习服务,它可以让数据科学家、开发者、机器学习专家们快速地建立、训练、运行大规模的机器学习模型”。

在发布会上,AWS CEO Andy Jassy 的介绍是“让每天都需要和机器学习打交道的开发者们方便地训练和部署机器学习模型”。

认识一下新工具

AWS的这个新服务可以分成三个主要部分。

第一部分,授权。无需配置就可以把标准的 Jupyter 编辑器作为集成开发环境(IDE),执行数据查看、数据清洗、预处理等等任务。这些任务可以在通用型的服务器上运行,当然也可以用带有GPU的服务器。

第二部分,模型训练。在这里,亚马逊提供了分布式的模型构建、训练和验证服务。SegeMaker里会自带一些常用的监督学习和无监督学习算法以及框架,用户也可以借助Docker容器创建自己的训练算法。训练过程可以在几十台服务器上分布式运行,以提供更快的训练速度。训练数据会从S3云存储服务器读取,模型产生的数据同样也会存在S3服务器上;这些数据主要是独立于训练数据的模型参数,而不是可以执行的、能够直接用于推理任务的代码。这种仔细思考之后的设计选择,使得在 SegeMaker 中训练的模型可以很方便地部署到其它平台上去(比如物联网设备中)

第三部分,模型承载。带有HTTPs接口的模型承载服务可以调用设定好的模型,得到实时的推理结果。这些承载接口支持拓展,可以扩大规模、支持更密集的访问,也可以设置为A/B对比,同时测试多个不同模型的结果。和前面一样,这些接入点可以用内嵌的SDK构建,也可以通过Docker写入自己的配置。

延续的一站式体验

在发布会的演讲中,Jassy重点强调了 SageMaker 的高灵活性。既可以用现成的工具,也可以构建自己的新工具。不管哪种情况下,SageMaker 都能够处理热门的算法,不受来源的限制。

在 Constellation Research的副总裁、高级分析师 Holger Mueller 看来,这种灵活性是一柄双刃剑。“SageMaker大幅度减少了企业构建机器学习应用所需的工作量、知识水平以及花费的精力。但同时这也意味着AWS是背后的那个搞定一切的人,而且在想方设法把它的云服务用户留下来、把计算和数据负载留下来。”他觉得AWS要是野心足够大,可能还会发布一个自己的神经网络开发平台(像TensorFlow那样的)。不过目前还没有任何迹象。

不管怎么说,亚马逊已经打算接手运行模型所需的所有基础设施,以及帮用户自动处理节点掉线、扩容以及安全补丁等等问题。

Jassy说,一旦模型准备好了,就可以在SageMaker上把它用在任意别的服务中。“对数据科学家和开发者来说这事意义重大”。

另外,发布会上同时还发布了机器学习可编程摄像头DeepLens、轻量机器学习运行环境Greengrass ML Inference、视频内容识别Rekognition Video、音频转文字Transcribe、语言翻译Translate、语言识别Comprehend等多个机器学习服务,与已有的图像识别Rekognition Image、聊天机器人Lex、文字转语音Polly一同构成了强大完善的可用服务。

今天开始AWS就会开始免费提供SageMaker,作为免费服务策略的一部分。在达到一定程度之后,SageMaker也就会开始根据用量和地区开始收费了。

SageMaker主页:https://aws.amazon.com/sagemaker/ 

SageMaker使用介绍:https://aws.amazon.com/cn/blogs/aws/sagemaker/ 

via TechCrunch,雷锋网 AI 科技评论编译

雷锋网

Tesla半挂卡车的细节几何?特斯拉卡车副总裁做了一个多视角盘点

雷锋网·新智驾消息,11月初,特斯拉 CEO Elon Musk 公开发布了最新产品全电动重型半挂卡车Tesla Semi。

近期在欧洲的一次会议中,Tesla Semi项目副总裁Jerome Guillen 发表了自己对电动卡车的看法。

据雷锋网·新智驾了解,Guillen 是名一法国工程师,同时也是一名经验丰富的汽车行业高管,他曾在特斯拉汽车研发的关键时期(2010年-2013年)领导特斯拉Model S项目的研发。加入特斯拉之前,Guillen 曾在戴姆勒工作了很长时间,并领导了 Cascadia 卡车项目的研发。

除此之外,他还曾担任特斯拉的“车辆工程副总裁”一职,并在2013年至2015年的零售重要增长期,担任特斯拉全球销售和服务副总裁,负责特斯拉的整个销售和服务业务。

2015年底,短暂修整之后,Guillen又回到特斯拉开始执行卡车计划,这项计划直到今年本月初才揭晓。当时,Guillen介绍了Musk之后,就很快转移话题开始揭幕 Tesla Roadster 跑车。

而在昨天荷兰举行的运输与物流年会活动中,Guillen终于有机会将重点完全放在卡车这一款产品上,雷锋网·新智驾了解,据他透露,特斯拉即将在Fremont和Gigafactory 1之间建 立货运航线。

以下先列举一些值得一提的演讲要点:

  • Guillen证实,特斯拉打算研制能与柴油卡车相媲美的电动卡车,这意味着将来的电动卡车重量应该和柴油卡车差不多。

  • Guillen比较了Tesla Semi与子弹头列车的气动设计。

  • 他还介绍了如何让Tesla Semi的设计符合欧洲货运规定,但听起来好像还没有完整的解决方案。

  • 由于美国柴油成本较高,预测欧洲的Tesla Semi运营成本优势将超过美国。

  • 为了让电动卡车在现有充电桩Megacharger的基础上能行驶得更远,特斯拉还计划建设目的地充电站。

  • Guillen还证实,Tesla Semi完全采用了为乘用车开发的自动驾驶硬件套件,以便增强自动驾驶能力。

  • 为了消除视觉盲区,Tesla Semi配备了360度全方位相机。

  • 类似Tesla Model 3,Tesla Semi将使用移动应用程序开启车门。

雷锋网

微信悄然上线直接转账银行卡功能,超1000元收取0.1%手续费

雷锋网11月30日消息  据一部分网友爆料,微信近日悄悄上线了直接向银行卡转账的功能。与零线提现相似,超过1000元以上的部分将按照0.1%的比例收取手续费。

图为网友爆料

据网友爆料表示,打开微信——钱包——收付款,在其最下方出现了“转账到银行卡”的选项。点击该功能选项,可出现转账页面。用户输入转账对象的姓名、卡号和归属银行,就能直接进行转账。

这样一来的结果,是便于大额的微信转账可直接进入银行卡,而不必先进入零钱再进行一次提现操作。

据网友反映,该项新功能与零钱提现到银行卡非常相似,转账金额超过1000元的部分,将按照0.1%的比例收取转账手续费。

据悉,该功能目前仅在小范围测试中,并非所有用户均可使用。 

根据已体验过该功能的网友爆料,转账时可以选择“2小时内到账”、“明天24点前到账”两种,还有“转账成功提醒”、“转账记录(按月份查看)”和“历史卡号”等功能。如果转账失败,资金也会按原路返回。

雷锋网

献给农药玩家最美的情书,vivo X20王者荣耀周年庆限量版正式发布

vivo作为全球领先的手机厂商,一向以追求极致,致力于为年轻用户带来更多乐趣、创造更多惊喜作为品牌口号。而《王者荣耀》作为当下年轻群体热爱的MOBA手游,自诞生以来一直为广大玩家带来欢乐和乐趣。为了让玩家从内而外沉浸在王者荣耀的游戏世界,vivo决定联合王者荣耀共同推出vivo X20王者荣耀周年庆限量版。继昨日透露了vivo X20王者荣耀周年庆限量版的局部图之后,今天vivo官方再次放出消息,vivo X20王者荣耀周年庆限量版的造型全面曝光。

 

·     极致外观,打造“王者”专属印记

vivo X20王者荣耀周年庆限量版在已经非常极致的全面屏外观上进行了全面的升级,加入了大量的王者荣耀定制化元素,手机背盖采用了红黑撞色设计,机身上半部分为热情的红色,下半部分为内敛的黑色,犹如披上了一件红黑配色的“铠甲”,透露着一股“战神”气息,助你在王者荣耀的战场上所向披靡!

机身背面的中部的红黑交界处用金线勾勒出了一个“V”形,形成了X20王者荣耀周年庆限量版特有的MVP金V腰线。金色V腰线从视觉上大幅度地增强了手机的冲击感,字母“V”的设计也同时对应着胜利的英文“Victory”,金V+ Victory的双寓意设计让MVP金腰线成为《王者荣耀》玩家胜利和上分的专属印记。而这条“V”线在工艺上的实现也非常复杂,在其他手机上普遍只采用一次的阳极氧化工艺,vivo居然在“V”线上使用了三次来保证“MVP金”的效果。如此大的投入和对细节的把控,就是为了让拥有X20王者荣耀周年庆限量版《王者荣耀》玩家带来最强的实机体验。

此外,在vivo X20 王者荣耀周年限量版的机身背部,还印有一枚专门定制的王者荣耀金色徽章,打造出了王者荣耀的专属印记。这同时也是象征着荣誉的“王者之印”,有了“王者之印”的超级Buff玩王者的时候上分会不会更容易一些呢?

·     有颜值,更有内涵:KPL职业选手认证游戏手机

vivo X20王者荣耀周年庆限量版是一款从内而外都适合玩《王者荣耀》的手机,除开定制元素,vivo X20也是目前玩《王者荣耀》体验最出色的手机之一。

作为国内第一款AMOLED屏幕的全面屏手机,本身精细的屏幕素质加之18:9比例的屏幕让vivo X20在游戏中多出了13%的视野,在游戏过程中具备天然的优势。同时85.3%的高屏占比带来了更好的沉浸式体验,配合上HiFi音质,不管是玩游戏还是看剧都仿佛身临其境。

在前段时间,vivo X20经《王者荣耀》KPL官方认证,通过严苛的赛事用机测试标准成为KPL官方赛事用机,同时vivo X20也成为安卓阵营第一款通过该项测试的手机!想要通过这项标准,必需通过长时间,在职业赛场环境下测试,针对游戏中的帧率波动控制,精准操作,续航,温度控制,设备稳定性,网络稳定性六大指标进行多局测试,最终得出结果,vivo X20能通过层层测试,成为玩王者荣耀的“神器”,可见其实力之深厚。

无论是外在还是内在,vivo X20王者荣耀周年庆限量版都是一款真正意义上的《王者荣耀》的专属用机,对于喜欢《王者荣耀》这款游戏的朋友来说极具收藏意义,据说这款王者荣耀的专属用机将会在12月1日正式开启预售,作为召唤师的你,准备把它收入囊中了吗?

雷锋网

除了无需密码即可解锁电脑,macOS 又出了文件共享问题

苹果工程师最近很忙。

美国时间 11 月 28 日上午,来自土耳其的开发者 Lemi Orhan Ergin 在 macOS High Sierra 发现了一个严重漏洞并通过 Twitter 曝光出来,还随手@了AppleSupport。

这一漏洞被外界嘲笑为世上最低级的 bug,毕竟用户绕过验证,解锁一台安装了 High Siarra 的苹果电脑只需要两步:

第一,在 macOS 的系统用户登陆界面上,用户名使用“root”,密码留空就能够成功登陆或解锁系统;

第二,一次不行的话就多来几次。

这意味只要接触到你的电脑的任何人都能轻松进入你的电脑系统,而不需要密码。雷锋网了解到,macOS High Sierra 10.13.1,以及正在测试中的 macOS 10.13.2 都受到这一安全漏洞的影响。 

苹果方面表示已迅速发布 macOS 紧急安全补丁 Security Update 2017-001,且这一补丁会自动安装到所有运行最新 macOS High Sierra 系统(10.13.1)的设备上修补漏洞。

然而刚对 Mac 用户道了一波歉的苹果,又被用户发现安装了苹果推送的安全更新 2017-001 Security Update for macOS High Sierra 10.13.1 后,多台 Mac 间文件共享认证失败。

对于这一问题,苹果紧急也给出了解决方案:

首先打开终端,在应用程序文件夹下的实用工具文件夹;

其次输入 sudo /usr/libexec/configureLocalKDC 并回车;

然后输入管理员密码并回车;

最后,退出终端。


经过用户测试,此方法可行。

雷锋网

宅客福利 | 10 张和黑客大佬见面的门票

曾经有好多场与黑客大牛们的见面会放在我面前,我没有珍惜,等失去的时候才……没关系,宅客这里有 10 张带你见偶像的门票。

怎么获得这些门票?要不你先关注一波二维码。

为了满足大家的好奇心,宅客稍稍透露几位白帽黑客。

仅仅和他聊天,你都感觉自己在和一个核弹头对话。因为你可以感觉到他和核武器的共同点:

认为这个世界极度不安全;

相信自己与生俱来就有拯救世界的使命;

为了世界和平,随时准备粉身碎骨。

总之,“和生活讲和”这个选项,已经被他从人生的字典里扯掉了。

见到他之前,人们通常会被警告:他是个轻度妄想症患者。见到他之后你才发现并不是这样,他比想象中“严重”多了。

                                                                                                                        ——知道创宇CEO 赵伟

不久前苹果手机又双叒叕推出了新一代产品,其中最吸引人的莫过于人脸解锁,甚至这一功能成为朋友圈段子,各路人马纷纷脑洞大开想象被害场景。

实际上,除了用在手机上,不少公司也开始给门禁加上这项高科技,只有自己公司的人才能刷脸进入。但是这真的能高枕无忧了吗?

当然不,攻破某一体式嵌入设备(刷脸机器)仅需要20分钟。

                                                                                                   ——GeekPwn优胜选手,女黑客 TYY

黑客远程操控汽车早就不是新鲜事了。不论是被无数黑客拿来开刀的特斯拉,还是被黑上瘾的宝马、奔驰,只不过这次有了新花样。

黑掉一辆带有智能 OBD 盒子的汽车只需两步:

第一,制作一个与车进行通信的小装置,将这一装置藏在车身任何地方,比如,将磁铁片粘在车外,或扔在后备箱以及手套箱中,即可实现对车的操控。

第二,车子启动,用短信或者其他方式发送攻击指令,车子执行指令。

如果行驶在路上的汽车被黑客通过这种方式攻击,简直是一击必中,任你是老司机也会翻车。还不赶快买保险?

                                                                               ——安恒海特实验室研究员,GeekPwn名人堂选手

除此之外还有哪些白帽子?互联网安全创新大会(FIT)将于 2017 年 12 月 14 日-15 日在上海举行,关于这场神秘大会中的白帽黑客有条链接给你,请自由查看吧(高冷不做作的宅客):http://fit.freebuf.com

不得不提的是,宅客频道(微信公众号:letshome)又双叒叕送票了,这次送的是 10 张 FIT 2018 互联网安全创新大会门票。就是下图中低调奢华有内涵的黑金邀请函⇊

欢迎留言点赞打电话,截止 12月5日点赞前十位童靴将得到这次的门票,快来留言吧~另外,此次送票宅客贴心的采用了优惠码方式,中奖观众可以加宅妹微信号获得。

最后,打一波很走心的广告,雷锋网宅客频道专注先锋科技领域,讲述黑客背后的故事,加入宅客大家庭,会有不定期福利送出。

雷锋网

深度 | CMU 邢波教授团队最新成果:利用 AI 自动生成医学影像报告

雷锋网消息,近日,由卡内基梅隆大学机器学习系副主任邢波教授创立的 Petuum 公司近期发表了几篇论文,介绍了如何使用机器学习自动生成医学影像报告,从而更好地辅助医生做治疗与诊断。

医学影像在临床实践中被广泛应用于诊断和治疗。专业医师阅读医学影响并撰写文字报告来描述自己的发现。对于没有经验的医生来说,撰写报告很可能会出错,对于人口众多的国家的医生来说,这样的工作又耗时又枯燥。为了解决这些问题,邢波教授的团队研究了医学影像报告的自动生成,作为人类医生更准确高效地生成报告的辅助工具。

为了应对这些挑战,邢波的团队建立了一个多任务学习框架,共同执行标签的预测和段落的生成;提出一个共同注意机制(co-attention mechanism),将包含异常的区域标注出来;利用一个层次LSTM模型来产生长的段落。

医生不愿撰写“医学影像报告”

放射学和病理学的医学图像被广泛用于医院和诊所,例如肺炎、气胸、间质性肺病、心力衰竭、骨折等等。他们通过撰写文字报告(图1)来描述在影像学检查中所检查的每个身体部位的发现,特别是每个部位是否被发现是正常的,异常的或潜在的异常。

图 1. 一个包含三部分信息的胸部 X 光报告示例。在 impression 部分,放射专家结合 Findings、病人临床历史及影像学研究的指导做出诊断。Findings 部分列出了影像学检查中所检测的身体各部分放射学观察结果。Tags 部分给出了表示 Findings 核心信息的关键词。这些关键词使用医学文本索引器(MTI)进行标识。

对于经验较少的放射科医师和病理科医师,特别是那些在医疗保健条件落后的医生,写医学影像报告是一件困难的事情。要正确读取胸部X线图像,他们需要以下的几项技能:

对胸部正常解剖结构和胸部疾病的基本生理学的全面了解

通过固定模式分析射线照片的技能

评估随时间变化的能力

临床表现和病史知识

与其他诊断结果(实验室结果、心电图、呼吸功能检查)相关的知识

但是,对于有经验的放射科医师和病理学家来说,撰写影像报告又过于繁琐和费时。在中国这样人口众多的国家里,放射科医生每天可能需要阅读数百张放射图像。将每幅图像的分析结果输入计算机大约需要5-10分钟,这占用了他们大部分的工作时间。

邢波的团队认为,自动生成医学影像报告是一件有意义而且有必要的事情,但同时,这项任务也面临几个挑战。

首先,一份完整的诊断报告由多种不同信息形式的内部报告组成,如图1所示,胸部X射线的报告包含 Impression描述,通常是一句话;Findings 是一段描述;Tags 是一列关键词。用一个统一的框架生成这样的不同信息,对技术提出的要求很高。我们通过构建一个多任务框架来解决这个问题,该框架将标签的预测作为一个多标签分类任务来处理,并将长描述(例如生成 Impression 和 Findings)的生成视为文本生成任务。在这个框架中,两个任务共享相同的用于学习视觉特征的CNN并且共同执行。

其次,一个影像报告通常更多地集中于描述异常的结果,因为它们能直接指出疾病并指导治疗。但如何定位图片中的病变区域并附上正确的描述非常困难。我们通过引入共同注意机制(co-attention mechanism)来解决这个问题,同时参与图像和预测到的标签,并探讨视觉和语义信息的协同效应。

最后,成像报告中的描述通常很长,包含多个句子甚至多个段落。生成长文本是非常重要的,我们没有采用单层LSTM(这种LSTM不能模拟长序列),而是利用报告的组成性质,采用分层LSTM来生成长文本。结合共同注意机制,层次型LSTM首先生成高级主题,然后根据主题生成详细的描述。

数据集方面,研究人员使用的是印第安纳大学胸部X射线组(IU X射线),这是一组与相应的诊断报告对应的胸部X射线图像集。该数据集包含7470对图像和报告。每个报告包括以下部分:impression, findings, tags, comparison and indication 。邢波团队将impressionfindings中的内容视为要生成的目标,并将MTI生成的标记作为报告的标记。

相关的工作

为医学影像添加文本报告

为了将文本报告添加到医学影像上,需要几个步骤。在我们的设置中,添加到医学影像上的文本是完全结构化的或半结构化的(例如标签,属性,模板),而不是自然文本。通过建立传递系统来预测医学影像的特征性,其中一些特征性通过文本标签显示。给定一个医学图像,首先运用局部图像分析法进行局部分析,然后提取每个局部图像的视觉特征,最后建立一个分类器,将视觉特征按照预定义的类别分类。

Shin和其他研究人员,建立了运用CNN-RNN框架的系统,可以为胸部X射线影像添加文本标签。他们使用CNN(卷积神经网络)从影像中检测疾病,并使用RNN(循环神经网络)来描述检测到的疾病的详细信息,例如:发病位置,病变程度及受影响的器官等。Zhang及其研究团队的最新研究报告显示,他们可以提供生成医疗报告。他们的目标是生成30-59字的病理报告。然而,他们生成的病理报告是半结构化的,语言不够流畅自然。通过将少量标准报告重新编写生成最后的病理报告,报告内容限于5个预定义的主题。

我们研究的最终目标是:生成的病理报告可以替代医生在自然情况下撰写的病理报告。这些病理报告很长,涵盖了很多方面,相比之前研究给影像添加标签和半结构化段落来说,难度系数更大。

图像说明与深度学习

图像说明技术可以为指定图像自动生成文字描述。最近研究的图像文本模型大多是基于CNN-RNN框架。Vinyals及其研究团队将从CNN的最后隐藏层提取的图像特征提供给LSTM(长短期记忆网络)以生成文本。Fang 及其研究团队首先使用CNN来检测图像中的异常,然后将这些检测到的异常通过语言模型生成一个完整的句子。Karpathy及其研究团队提出使用多模式递归神经网络将视觉和语义特征二者达到一致,然后生成对于图像的描述。

最近,注意机制(attention mechanisms)已被证明对于添加图像文本是有用的。Xu及其研究团队将空间视觉注意机制引入CNN中间层提取的图像特征中。You及其研究团队提出了针对给定图像标签的语义注意机制。为了更好地利用视觉特征并生成语义标签,研究团队提出了共同注意机制。

我们的目标不仅仅是为图像生成一个说明。Johnson及其研究团队正在研究密集型文本,要求模型可以生成对于每个检测图像区域的文字描述。Krause,Liang及其研究团队通过分层LSTM为图像生成段落说明。我们的研究方法也是采用分层次的LSTM来生成段落标题,而与Krause及其研究团队不同的是,我们使用一个共同关注网络来生成主题。

图 2. 整个模型的结构与过程。其中 MLC 代表多标签分类网络,语义特征是预测标签的词向量。粗体标记的「calcified granuloma」和「granuloma」是共同注意网络关注的标签。

定量结果

我们使用以下文本生成评估手段(BLEU 、METEOR 、ROUGE  和 CIDER)度量段落生成(表 1 上半部分)和单语句生成(表 1 下半部分)的结果。

如表1的上半部分所示,对于段落生成来讲,使用单个 LSTM 解码器的模型的表现明显要差于使用层级 LSTM 解码器的模型。表1中的Ours-No-Attention和CNN-RNN 之间的唯一区别在于,Ours-No- Attention采用层级LSTM解码器,而CNN-RNN 仅采用单层LSTM。这两个模型之间的比较直接证明了层级LSTM的有效性。

这个结果并不令人惊讶,众所周知,单层LSTM不能有效地模拟长序列。此外,单独使用语义注意(Ours-Semantic-Only)或单独使用视觉注意(Ours-Visual-Only)来生成主题向量似乎帮助不大。潜在的原因可能是视觉注意力只能捕捉图像分区域的视觉信息,而不能正确描述。虽然语义注意只知道潜在的异常,但不能通过查看图像来确认其发现。最后,我们的完整模型(Ours-CoAttention)在所有的评估指标上都取得了最好的结果,说明了提出的共同注意机制的有效性。

对于单句生成的结果(如表1下半部分所示),我们模型的控制变量版(Ours-Semantic-Only和Ours-Visual-Only)与其他版本相比,要优于所有的基线模型,这表明了所提出的共同注意机制的有效性。

定性结果

段落生成

三个模型生成影像病理报告的示例见图3,分别为Ours-CoAttention模型,Ours-No-Attention模型和Soft Attention模型。值得注意的是,下划线的句子是对异常情况的描述。首先,我们可以观察到三个模型生成的报告所包含的句子比真实报告多。其次,三个模型生成的报告和真实报告大多数的语句都是对于正常区域的描述,而只有几句话是关于异常情况的。这个观察可以解释为什么 Ours-No-Attention模型在一定程度上不能达到非常好的水平。

图 3. 协同注意力 、无注意力、软注意力模型生成的段落图示。划线句子是检测到异常情况的描述。第二个图是胸部侧面 x 光图像。前两个例子的结果是与真实报告相一致的,第三个出现了部分失败,最底下的图像完全失败。这些图像来自测试数据集

当我们深入了解生成文本的内容时,发现不同句子具有不同的主题,这是令人惊讶的。第一个句子通常是对图像的整体描述,而以下的句子分别描述图像的其他区域,例如:肺脏、心脏等。另外值得注意的是,Soft Attention模型和Ours-No-Attention模型只能检测图像中的异常情况,往往检测到的异常情况还是错误的。但是,Ours-CoAttention模型在前三幅图像中均能够正确描述图像中异常情况。结果表明,与Ours-CoAttention 模型及Ours-No-Attention模型相比,层次型LSTM可以更好地生成病理报告。

在第三张X射线图中,Ours-CoAttention模型成功检测到右下叶肺部有异常。然而,它没有准确地描述这种异常。相比于其他X射线图来说,第三张X射线图比较暗,这可能就是Ours-CoAttention模型描述错误的潜在原因,我们的模型对这个变化非常敏感。Ours-CoAttention模型对于第四张X射线图的描述是一个失败案例。虽然模型错误地判断了图像中的主要异常,但是它确实找到了一些不寻常的区域。比如:左下叶肺部异常。此外,发现模型给出的报告中有“这可能表明”的字眼,说明模型试图推断所患疾病,这是十分令人惊讶的。

为了更好地理解模型检测疾病或潜在疾病的能力,我们在表2中,给出了三大模型正态性和异常性的概率。我们认为句子包含“否”、“正常”、“清除”、“稳定”作为句子描述正常。很显然,Ours-CoAttention模型在正态性和异常性的概率上最接近真实情况。

表3中的结果表明,Ours-CoAttention和VGG-19 网络对于标签预测的执行非常相似。尽管多任务学习没有改进,但我们认为,这个模型是一个端到端的模型,避免了管理复杂的流水线模式。

图4显示了共同注意的可视化。图4所示的第一个特性是 Sentence LSTM 能够关注图像的不同区域和语句的不同标签,并在不同的时间步骤生成不同的主题。第二个特性是视觉注意力可以指引模型关注图像的相关区域。例如,第一个例子的第三个句子是关于“有氧”的,视觉注意力集中在心脏附近的区域。类似的行为也可以被发现的语义注意:对于第一个例子中的最后一句话,我们的模型正确地集中在作为句子的主题“退化变化”。

此外,第二个例子中的第一句话的内容与语义注意力的集中矛盾是令人惊讶的。单一关注机制不太可能发生。这种矛盾意味着共同关注机制具有一定的容错性,因此共同注意可能比单一关注更为强大。

最后,最后一个例子的第一句话是由于对标签不正确的注意而导致的错误描述。我们相信通过建立一个更好的标签预测模块可以减少不正确的注意力。

图 4. 协同注意力在三个示例上的可视化。每个示例由四部分组成:(1)图像和视觉注意力;(2)真实标签,预测标签以及预测标签上的语义注意力;(3)生成的描述;(4)真实描述。对于语义注意力而言,注意力分数最高的三个标签被突出显示。加下划线的标签是在真实标签中出现的标签。

图4还提供了标签预测的一些定性结果。结果表明,除了与图像相关的标签之外,该模型还产生许多不相关的标签。尽管共同注意机制可以过滤掉很多干扰标签,但不相关的标签仍然会误导模型,产生很多误报。我们相信一个更好的标签预测模块将有助于建模来关注正确的标签,从而帮助提高生成文本的质量。

结语

雷锋网了解到,近年来,人工智能,尤其是深度学习的成熟使得市场上出现了很多AI辅助诊断产品。人类基因组测序技术的革新、生物医学分析技术的进步、以及大数据分析工具的出现,为病人提供更精准、高效、安全的诊断及治疗。虽然,人工智能+影像领域也是参与企业最多,产品最丰富、涉及疾病种类最多的疾病诊断领域。,但是AI也能够参与疾病的筛查和预测、写结构化的病历、在基层担任全科医生助手的角色,AI在减少医生工作时间、提高诊断治疗效率方面起到非常大的作用。

邢波的研究团队认为,他们工作的主要贡献是:提出了一个多任务学习框架,可以同时预测标签和生成文本描述;引入一个用于定位异常区域的共同注意机制,并生成相应的描述;建立一个分层的LSTM来产生长句和段落;进行大量的定性和定量的实验,以显示实验方法的有效性。

雷锋网认为,邢波教授团队的研究成果不是第一家,相信也不会是最后一家。未来,随着产品迭代的不断升级,算法层面的不断打磨,医学影像结构化报告的生成方面的研究,将陆续有其他玩家进入。

雷锋网

如何找到最优学习率?

雷锋网按:本文作者Sherlock,本文首发于作者的知乎专栏《深度炼丹》, 雷锋网获其授权发布。

经过了大量炼丹的同学都知道,超参数是一个非常玄乎的东西,比如batch size,学习率等,这些东西的设定并没有什么规律和原因,论文中设定的超参数一般都是靠经验决定的。但是超参数往往又特别重要,比如学习率,如果设置了一个太大的学习率,那么loss就爆了,设置的学习率太小,需要等待的时间就特别长,那么我们是否有一个科学的办法来决定我们的初始学习率呢?

在这篇文章中,我会讲一种非常简单却有效的方法来确定合理的初始学习率。

学习率的重要性

目前深度学习使用的都是非常简单的一阶收敛算法,梯度下降法,不管有多少自适应的优化算法,本质上都是对梯度下降法的各种变形,所以初始学习率对深层网络的收敛起着决定性的作用,下面就是梯度下降法的公式

这里就是学习率,如果学习率太小,会导致网络loss下降非常慢,如果学习率太大,那么参数更新的幅度就非常大,就会导致网络收敛到局部最优点,或者loss直接开始增加,如下图所示。

学习率的选择策略在网络的训练过程中是不断在变化的,在刚开始的时候,参数比较随机,所以我们应该选择相对较大的学习率,这样loss下降更快;当训练一段时间之后,参数的更新就应该有更小的幅度,所以学习率一般会做衰减,衰减的方式也非常多,比如到一定的步数将学习率乘上0.1,也有指数衰减等。

这里我们关心的一个问题是初始学习率如何确定,当然有很多办法,一个比较笨的方法就是从0.0001开始尝试,然后用0.001,每个量级的学习率都去跑一下网络,然后观察一下loss的情况,选择一个相对合理的学习率,但是这种方法太耗时间了,能不能有一个更简单有效的办法呢?

一个简单的办法

Leslie N. Smith 在2015年的一篇论文“Cyclical Learning Rates for Training Neural Networks”中的3.3节描述了一个非常棒的方法来找初始学习率,同时推荐大家去看看这篇论文,有一些非常启发性的学习率设置想法。

这个方法在论文中是用来估计网络允许的最小学习率和最大学习率,我们也可以用来找我们的最优初始学习率,方法非常简单。首先我们设置一个非常小的初始学习率,比如1e-5,然后在每个batch之后都更新网络,同时增加学习率,统计每个batch计算出的loss。最后我们可以描绘出学习的变化曲线和loss的变化曲线,从中就能够发现最好的学习率。

下面就是随着迭代次数的增加,学习率不断增加的曲线,以及不同的学习率对应的loss的曲线。

从上面的图片可以看到,随着学习率由小不断变大的过程,网络的loss也会从一个相对大的位置变到一个较小的位置,同时又会增大,这也就对应于我们说的学习率太小,loss下降太慢,学习率太大,loss有可能反而增大的情况。从上面的图中我们就能够找到一个相对合理的初始学习率,0.1。

之所以上面的方法可以work,因为小的学习率对参数更新的影响相对于大的学习率来讲是非常小的,比如第一次迭代的时候学习率是1e-5,参数进行了更新,然后进入第二次迭代,学习率变成了5e-5,参数又进行了更新,那么这一次参数的更新可以看作是在最原始的参数上进行的,而之后的学习率更大,参数的更新幅度相对于前面来讲会更大,所以都可以看作是在原始的参数上进行更新的。正是因为这个原因,学习率设置要从小变到大,而如果学习率设置反过来,从大变到小,那么loss曲线就完全没有意义了。

实现

上面已经说明了算法的思想,说白了其实是非常简单的,就是不断地迭代,每次迭代学习率都不同,同时记录下来所有的loss,绘制成曲线就可以了。下面就是使用PyTorch实现的代码,因为在网络的迭代过程中学习率会不断地变化,而PyTorch的optim里面并没有把learning rate的接口暴露出来,导致显示修改学习率非常麻烦,所以我重新写了一个更加高层的包mxtorch,借鉴了gluon的一些优点,在定义层的时候暴露初始化方法,支持tensorboard,同时增加了大量的model zoo,包括inceptionresnetv2,resnext等等,提供预训练权重,model zoo参考于Cadene的repo。目前这个repo刚刚开始,欢迎有兴趣的小伙伴加入我。

下面就是部分代码,近期会把找学习率的代码合并到mxtorch中。这里使用的数据集是kaggle上的dog breed,使用预训练的resnet50,ScheduledOptim的源码点这里

criterion = torch.nn.CrossEntropyLoss()net = model_zoo.resnet50(pretrained=True)net.fc = nn.Linear(2048, 120)with torch.cuda.device(0):
  net = net.cuda()basic_optim = torch.optim.SGD(net.parameters(), lr=1e-5)optimizer = ScheduledOptim(basic_optim)lr_mult = (1 / 1e-5) ** (1 / 100)lr = []losses = []best_loss = 1e9for data, label in train_data:
   with torch.cuda.device(0):
       data = Variable(data.cuda())
       label = Variable(label.cuda())
   # forward
   out = net(data)
   loss = criterion(out, label)
   # backward
   optimizer.zero_grad()
   loss.backward()
   optimizer.step()
   lr.append(optimizer.learning_rate)
   losses.append(loss.data[0])
   optimizer.set_learning_rate(optimizer.learning_rate * lr_mult)
   if loss.data[0] < best_loss:
       best_loss = loss.data[0]
   if loss.data[0] > 4 * best_loss or optimizer.learning_rate > 1.:
       breakplt.figure()plt.xticks(np.log([1e-5, 1e-4, 1e-3, 1e-2, 1e-1, 1]), (1e-5, 1e-4, 1e-3, 1e-2, 1e-1, 1))plt.xlabel('learning rate')plt.ylabel('loss')plt.plot(np.log(lr), losses)plt.show()plt.figure()plt.xlabel('num iterations')plt.ylabel('learning rate')plt.plot(lr)

one more thing

通过上面的例子我们能够有一个非常有效的方法寻找初始学习率,同时在我们的认知中,学习率的策略都是不断地做decay,而上面的论文别出心裁,提出了一种循环变化学习率的思想,能够更快的达到最优解,非常具有启发性,推荐大家去阅读阅读。

雷锋网

於菲公开信回应:内讧与我无关 小心迅雷成快播第二

雷锋网报道,11月30日上午,原迅雷高级副总裁於菲针对其涉嫌利益输送一事作出回应,称陈磊团队对其谣言中伤,蓄意抹黑,并表示:

  1. 迅雷金融公司与迅雷集团之间的投资协议和业务合作条款,严格按照迅雷内部合同审核签订流程操作,不存在任何瑕疵;

  2. 於菲本人从未成为迅雷金融公司的实际控制人,后辞去金融业务相关公司所有职务,不再在迅雷金融公司持有任何股份,迅雷金融不再受其协调;

  3. 陈磊团队一是触碰监管红线,诱导炒币,二是宣称使用区块链技术,三是放任非法内容泛滥;

  4. 於菲本人并未卷入目前迅雷金融和迅雷集团之间的事件中,所有争论与其无关。


以下是回应全文:

於菲的第一封公开信

亲爱的迅雷用户、亲密的迅雷同仁和尊敬的迅雷股东董事们:

本人於菲,于2006年加入迅雷,做许多岗位和项目,成功解决过公司许多重大危机。今天之前,行业和公司贴在我身上的标签是迅雷创业元老,几次拯救过迅雷,对迅雷平台最有贡献的几个人之一。一朝蒙冤,黑白颠倒,我最初不愿外界看自家平台笑话,一忍再忍。今日被迫发声,只为关心爱护我的家人,朋友,还有那些不愿抹黑我,而被迫哭泣着离开迅雷的小伙伴们。

简而言之,我被蓄意抹黑根源于我在玩客币风险和非法内容过滤两个问题上,与陈磊的新管理团队从价值观到公司运营风险控制等诸多层面分歧严重。具体来说,一是,我认为如果玩客币定位只是像Q币一样是迅雷体系内服务的支付的话,玩客币钱包就不应提供用户间币到币转账功能,即不应在系统机制上为黑市炒币提供账户间转账服务并获利,而触碰监管红线; 但陈磊团队需要利用玩客币炒家的投机心理销售玩客云硬件,并且迟迟不提供迅雷体系内服务的兑换场景,也不推行实名制,是在功能上支持、诱导炒币并妨碍监管;二是,公司目前没有掌握完整的区块链技术并应用于玩客币中,而是采取中央发币的方式进行,我认为至少这一事实必须向用户和投资人明确披露,否则会有严重的诚信和法律风险,但是陈磊团队拒绝披露技术实质,向公众宣称其使用的是区块链技术;第三是,在迅雷下载的非法内容控制方面,我认为应该以“快播”公司为前车之鉴,并顺应中国互联网内容版权保护趋势,遵守法律和国家有关部门的规定,维护版权保护新秩序,主动采取技术保护措施,过滤黄色淫秽和盗版内容,所以我一直在迅雷平台推行非法内容过滤器,而陈磊团队为追求业绩,阻挠过滤项目推进,放任其玩客云硬件和迅雷P2P下载网络非法和盗版泛滥,引起用户投诉和国内主要版权人的集体批量诉讼,仍倒行逆施。

鉴于上述风险,除了我本人淡出管理层外,公司公关、法务、业务等关键部门岗位均有大量离职人员,而最近股价应声下跌,也是市场对玩客币前期积聚的巨大风险和下载内容的法律风险进行理智判断的结果,应该引起迅雷的董事会和管理层的高度重视。

对于陈磊团队在公司公告,媒体软文和朋友圈的各种造谣中伤,诽谤抹黑,我已保全证据,将采取法律措施维护自己名誉和尊严。对于这些荒谬之极的抹黑,我不屑一一反驳,只对一些关键事实澄清如下:

1. 迅雷金融公司与迅雷集团之间的投资协议和业务合作条款,严格按照迅雷内部合同审核签订流程操作,不存在任何瑕疵。经过上市后几年的公司治理合规改进,内部管理流程制度已经相当完善,一份合同,尤其是重要投资的合同,至少需要经过迅雷内部业务部门,法务部门,财务部门,行政部门各个环节审核,最后经有股东董事授权的CEO和CFO共同批准,才可能签字,盖章,任何人不可能控制所有环节,做到违反公司意志的利益输送。关于利益输送的相关污蔑,是对公司上市几年来的合规机制的污蔑,是对历任董事们,前任CEO,前任CFO,合规部门和内审内控部门同事们工作的集体否定。

2.我当初受命于时任董事长兼CEO的邹胜龙先生,负责新业务拓展,其中一个项目就是顺应行业潮流,学习BAT行业先进经验、打造互联网金融业务团队,负责协调运营该业务的迅雷金融公司配合集团战略开展业务。迅雷金融公司的团队招募,业务板块增加都是逐步完成的,注册和股权登记工作是也是逐步变化的,一切都经过了迅雷集团和迅雷金融两级公司治理的严格流程。我本人从未成为迅雷金融公司的实际控制人,只是在金融公司设立之初,作为金融业务开展的协调人,代理过一段时间董事长职务,代持过一段时间为招募团队预留的股份,如今已变更给实际运营团队。

3.在团队招募齐备后,我按照董事长邹胜龙先生的指示,辞去金融业务相关公司所有职务,不再在迅雷金融公司持有任何股份,迅雷金融公司在其董事会和CEO胡捷教授的带领下独立开展业务,不再受我的协调。相关事实,我多次以管理层内部邮件,其他书面和口头等多种方式向公司通报,然而陈磊团队蓄意视而不见,揣着明白装糊涂,铁了心抹黑我。树欲静而风不止,因为黑锅早已设计好,一定要给我背上。

4.由于离开迅雷金融和淡出迅雷集团的核心层的原因,我本人并未卷入目前迅雷金融和迅雷集团之间的事件中,所有争论与我无关。

我永远记得,刚进迅雷时,我们所有人还挤在一间小办公室里,心怀着用技术改变世界,拿用户体验创造价值的愿景,踏实做事,低调做人。如今诚恳地希望,迅雷的股东董事及管理人员们,不忘初心,不要被来路不正的一时股价泡沫绑架了良知,道德和正义感,放纵执行团队,迫害平台十年的忠诚守护者。也恳请迅雷的小米公司,金山公司等知名互联网公司股东,约束被其投资的迅雷公司的管理层,不要颠倒黑白,蓄意抹黑迅雷公司的前管理层,更不要坑害用户、欺骗投资者,做违法乱纪,有损公司和股东利益的事情。

无论将来我个人何去何从,永远祝福曾经备受用户喜爱的迅雷公司基业长青,堂堂正正地为用户,行业和投资人创造价值!

我在此衷心感谢一路以来帮助我、支持我的人们,谢谢!

此致

敬礼

於菲

2017年11月30日

雷锋网

腾讯《绝地求生》官方手游不止一款?《光荣使命》不限号开测

雷锋网 11 月 30 日消息,据快科技报道,随着《绝地求生》的爆火,腾讯入局丝毫不会意外,但除了代理《绝地求生》国服外,还一口气推出四款“吃鸡”手游。

截止目前,《CF》手游大逃杀模式、《光荣使命》、《绝地求生》官方手游(天美工作室)这三款手游已经确定。

其中《CF》手游大逃杀模式已经上线。《光荣使命》已于 11 月 29 日 17:00 正式开放测试。《光荣使命》全网预约超过4000万,已经可以在官网下载 Android 端游戏,iOS 版还在审核中,也即将上线。而《绝地求生》官方手游(天美工作室)则于 12 月 1 日正式发布。

与此同时,腾讯刚刚又宣布,光子工作室群也将承担《绝地求生》正版手游的开发任务,目前官网也已上线(pg.qq.com),其中的地图与《绝地求生》一模一样,而倒计时指向 12 月 1 日中午 12:30。

四款手游同时竞争,这也能看出腾讯拿下“吃鸡”的决心,这就像当初微信的诞生一样,就是腾讯内部 QQ的 PC 团队、QQ 移动团队、QQ邮箱团队的三个队伍同时开发的,而最后 QQ 邮箱团队以时间上的略微优势在内部胜出。

那这次胜出的会是哪款游戏呢?很大程度上取决于在玩家中的受欢迎程度,那你会选择什么?

雷锋网