所有由admin发布的文章

Xbox One X 天蝎座限量版预售开启,和素版有什么不同?

号称“地球上性能最强主机”的微软 Xbox One X,计划于今年 11 月 7 日发布。

雷锋网消息:今日,其“天蝎座”版的预售活动今日已在美国开启。定价与同样有 1TB 硬盘空间的素版一致,都是 499 美元;发货日期也一样,都是  11 月 7 日。

Xbox One X 还在概念阶段时,名称便是 “Project Scopio 天蝎座”。当时流出各种可怕的流言——什么是 PC、主机混合体,是最后一代 Xbox 主机、性能秒天秒地秒主流 PC。现在,去年为“天蝎座”几个字幻想连连、高潮不已的 Xbox 粉丝们,终于可以继续满足了:

要知道,天蝎座预售版和素版有什么不同?

  • 不一样的外壳样式,主机和手柄都印上了“天蝎座版”( “Project Scopio Edition”)几个字!

  • 包装盒不一样——有一个大大的 “X”,而且也印上了 “Project Scopio Edition” !

  • 包含一个官方出版的竖置支架!

天蝎座预售版

天蝎座预售版的手柄

素版 Xbox One X

没错,区别就是这些,其硬件配置和素版一致。对于粉丝而言,花同样的价格就能拿到一个印着“天蝎座”字样的机器。

更多关于 Xbox One X

一起来回顾下“地球最强主机”。

Xbox One X 为 4K 主机游戏而设计,目标用户是买了 4K 电视且还没买 Play Station Pro 的主机玩家。微软一直单方面宣称,Xbox One X 的竞品是 Play Station Pro,并且拿出了很漂亮的数据:Xbox One X 的图形性能达到 6 teraflops,相比 PS Pro 的 4.2 teraflops 简直吊打。索尼方面则一直否认,坚称 PS Pro 的竞品是 Xbox One S。

Xbox One X 用的是 AMD 的定制 Jaguar 八核 CPU 处理器(2.3GHz),以及 Polaris GPU。具体配置表如下:


雷锋网

金融科技巨头BATJ高管讨论:中国“监管沙盒”应该怎么做?

雷锋网AI金融评论报道,近日,随着央行文件的下发——明确要求非银支付机构网络支付业务由直连模式迁移至网联平台处理,并要求2018年6月30日前所有网络支付业务全部通过网联平台处理,网联一时间又成为业界的焦点。

因为如此,近来对于网联、银联与第三方支付的业界分析铺天盖地,那作为政策执行的当事人,互联网巨头是怎样的回应呢?

此外,据雷锋网AI金融评论了解,监管规范的话题中,沙盒模式同样受到各界的关注。随着英国、新加坡等地相继推出各自的“沙盒”监管政策,中国金融监管层同样在酝酿这一种模式,但基于市场、国情的不同,中国金融科技的“沙盒”怎么做呢?

在8月19日举行的“聚焦金融风险防范与财富管理—中国财富管理50人论坛”上,百度集团副总裁张旭阳、蚂蚁金融副总裁徐浩、京东金融副总裁许凌、腾讯支付金融业务副总裁洪丹毅、浙商银行首席经济学家殷剑峰就网联的运行、金融科技的监管和风险防范展开了讨论。中央财经大学金融学院院长李建军教授为主持人。

雷锋网AI金融评论对讨论实录编辑如下:

李建军:这个政策出来以后,大家在思考对第三方平台的发展会产生什么影响,就这个问题先请百度张总发表您的看法。

张旭阳:这个问题应该问徐总和洪总,因为这两个是支付巨头。央行的政策还是希望规范直连模式,使得整个电商支付通过中心平台更规范的发展,现在第三方支付的格局还会长期存在。

徐浩:所谓网联,监管部门更主要的是考虑从监管的角度对支付领域的信息和资金透明方面的监管要求,在金融领域这两个也是一个基本的要求。有关部门在网联建设当中提出的原则是共建共有共享,只要是坚持领导提出的这些原则,各参与方基于公平的合作,真正的共建共有,大家共享网联平台所能带来的更加便捷性、更加便利的,对行业也好、用户也好都是有利的事情。

李建军:前两位的观点基本一致,对未来应该是有助于整个第三方支付的规范和发展。在座的前面BATJ都有支付牌照,大家看法应该都一致。下面我们讨论第二个问题,围绕金融科技,现在金融科技领域的创新也比较多,特别像去年以来,区块链金融、人工智能,围绕智能金融的创新发展。在这个领域的监管,有人就主张应该给它一些特殊的政策,比如国际上提出来“监管沙盒”的模式。近一年多来,我们国内的学者还有一些业界的实践者,也主张我们中国是不是也搞“监管沙盒”?先请京东金融的许总谈一谈观点,接下来请洪总,最后请殷博士再从理论角度解释一下这个问题。

许凌:关于沙盒监管近期应该是一个比较火的话题,核心理念是说怎样在既有的建制化的市场下能有效规范地鼓励创新,将创新放在一定的范畴和红线范围内,特别像对于像金融行业是特别有价值的。规范、合规,但是不压抑创新,让整个技术对于金融的扩张性、对用户的服务性能进一步扩张。如果适时推出中国制度下的沙盒监管,我觉得是在监管上一个好的创新范例。

我本人也提一个小的建议,未来沙盒监管一定要注意的是是把盒子放在沙上还是把沙放在盒子里,都叫沙盒监管,千万不要走偏,真正是把盒子设计好,范围设计好,把创新的沙子放在里面去看,一旦成型可塑化,非常坚固,拿出来变成一个大楼去建设它,沙子一定是在盒子里,但盒子架构和设计要充分讨论。中国在全世界做监管创新是有机会的。

洪丹毅:监管沙盒也是最近谈得比较火的一个话题,新加坡、澳大利亚也都在跟进这样制度上的设立,究其原因是因为从过去很多金融的产品和服务来说,都是通过创新最后变成今天市场的样子出来,一切没有创新就不会有今天金融领域的现状,但凡金融创新,后面会跟上金融的监管。沙盒这样的机制已经把双方放在一个角度看问题,使得在监管底下还能容忍创新,能够在红线范围内去持续验证价值有效性,通过验证之后再走出盒子,实现市场化更大的推广,这是它本质的概念。

我们也非常期待在中国不久将来能推出一个比较规范的比较统一的监管沙盒的制度,现在我们看到各地都有在推广这样的一些做法,我们对这样的做法也存有两点思考:

  • 第一块是中国真的是地大物博,它跟英国或者新加坡不一样,中国这么大,这么多省份,怎么样治理监管法是比较合适的,是需要思考的。

  • 其次,监管沙盒的设计对整个监管资源的要求非常高,对整个监管的耗费也非常重,如果真的有这样的机制出来,相信中国瞬间会爆发几千个甚至上万个项目进到盒子里去,到底有没有这么多资源、有这么多监管的人才,对这样的项目进行充分的测试认证和最后的审批,这也是我们亟待需要去了解和解决的问题。

我们非常期待从监管这边尽快出台这些规范,让整个市场把真正的创新放到盒子里做充分的认证,使得我们在重监管的环境下依然能够在互联网金融这领域做出一些创新的空间出来。

殷剑峰:我比较同意刚才洪总讲的,有很多国家值得我们学习,但是像监管沙盒这个东西主要来自英国,英国还是一个小国,他的人口主要集中在伦敦,伦敦金融层构成了他GDP的主要部分,对中国这种大国来说恐怕不太适合这种例外的尝试,而且金融的溢出效应是非常大的。

对中国的金融监管来说,现在最重要的是解决三件事情,第一,去除不必要的管制,第二,迅速覆盖那些没有覆盖的监管空白,第三,对同样的金融业务实施同样标准的金融监管。这个是目前最需要的,这次在金融工作会上也说得很清楚,监管沙盒这种东西,讨论讨论可以,但永远摆不上议事日程。

李建军:谢谢殷博士,关于未来对互联网金融或金融科技的监管,虽然说呼声上要求有一些容错机制,但实际上对我们这个大国而言,这样的机制设计,如果设计不好,可能产生的负效应会更大一些。这个问题我们可以讨论,假如能有比较好的顶层设计,也是可以推广去做一些试点试验。

雷锋网

MSRA获ACM TOMM 2017最佳论文:让AI接手繁杂专业的图文排版设计工作

雷锋网AI科技评论按:本文转载于“微软研究院AI头条”,雷锋网AI科技评论获授权转载,并做了不改动愿意的编辑。

你是否曾经为如何创作和编辑一篇图文并茂、排版精美的文章而烦恼?或是为缺乏艺术灵感和设计思路而痛苦?AI技术能否在艺术设计中帮助到我们?今天我们为大家介绍的这篇论文,“Automatic Generation of Visual-Textual Presentation Layout”(图文排版的自动生成算法研究),刚刚被美国计算机学会会刊ACM Transactions on Multimedia Computing, Communications and Applications (TOMM)授予2017 Nicolas D. Georganas 最佳论文奖,希望为大家在进行富媒体内容创作和分享时提供一个独到的思路和方法。

论文的联合作者是杨绪勇(微软亚洲研究院和中国科技大学联合培养博士生,喂车车联合创始人)、梅涛(微软亚洲研究院资深研究员,美国计算机协会杰出科学家,国际模式识别学会会士)、徐迎庆(前微软亚洲研究院主管研究员,清华大学美术学院信息艺术设计系主任)、芮勇(前微软亚洲研究院副院长,联想CTO)、李世鹏(前微软亚洲研究院副院长,硬蛋CTO)。祝贺研究院的各位研究员和院友们!

当今富媒体的内容之多是前所未有的,人们每时每刻都在创造和分享着海量信息,特别是内容繁杂的图像和文字信息,其中图文混排的内容模式已经成为主流。而在内容创作过程中,人们面临的一个巨大的挑战就是如何针对内容多样的图像和文字信息来设计吸引眼球的版面(例如,杂志封面、海报、或者PPT演讲稿等)。这个问题无论是对于商业印刷、在线期刊与杂志,还是用户生成的内容表达,都极为重要。图文内容的排版涉及到大量的专业知识,包括视觉传达、信息艺术设计、色彩与美学、平面规划、几何构图等等。以往的图文排版设计工作,不仅需要具有丰富专业知识的设计师,而且还耗费大量的人工。如何让计算机根据图文内容来自动进行排版是一个非常困难的问题。

从2013年底开始,来自微软亚洲研究院的研究员与来自清华大学美术学院的艺术设计专家,在这个科学与艺术相融合的领域开展了深入地合作。他们把设计学中的审美原则与可计算的图像特征相结合,创造性地提出了一个可计算的自动排版框架原型。该原型通过对一系列关键问题的优化(例如,嵌入在照片中的文字的视觉权重、视觉空间的配重、心理学中的色彩和谐因子、信息在视觉认知和语义理解上的重要性等),把视觉呈现、文字语义、设计原则、认知理解等领域专家的先验知识自然地集成到同一个多媒体计算框架之内,并且开创了“视觉文本版面自动设计”这一新的研究方向。

图1 利用算法自动产生的图文排版效果。注:原始输入是一张纯图片(即没有任何文字)和一段纯文本(如主标题和副标题等),输出是图文混排的结果(文字嵌入图片之中)。

这项研究将通用的美学感知进行了体系的数学表达,构建了一套和主题相关的图文排版设计模版库,并提出一套可计算的图文合成框架原型,既融合了宏观层面自上而下的美学感知,又包含了微观层面自下而上的图文特征。通过融合人脸、文字检测以及视觉显著性检测算法,率先提出了视觉注意力检测算法,构成了整幅图像的重要性图和注意力图;在针对文字布局的算法中,这篇论文将文字块的形状和图像中的重要性图交互过程量化为一个能量最优化问题:

是图1中文本侵入显著视觉对象的成本,即尽量减少文本和重要视觉对象的交叉;表示空闲视觉空间的浪费,即充分利用图像中的可用视觉空间,以最大化文字的突出效应;而则代表文本块的语义重要性i 和视觉感知重要性之间的不匹配,即将最重要的文字内容匹配到图像中最重要的视觉区域,以便于阅读时快速获得关键信息。能量最优化的求解过程,在设计模版的美学感知原则的监督下,使得最后的求解结果能符合视觉审美需求,而不仅仅是计算机的最优求解结果。

在文本空间布局后,通过对图像前后景显著颜色的分析,在色彩和谐最优化框架中,保持色彩整体和谐,并最大化文字和背景色彩的差异以使得最后的图文混排能在全局尊重原图的色彩和谐性,又能在局部保证文字的可阅读性。全局色彩的和谐计算采用了著名的“Color Harmonization”中提出的心理学色彩模型,并结合了这篇论文中提出的图像前后景主题色在不同主题下的模型偏好,从而找到最适合的全局主题色。针对局部的视觉对比度最大化,论文提出了最远色调角黄金取样法,即找到文本覆盖背景下图像的显著颜色映射到tone和hue空间,在二维色调空间(tone, hue)求最远点,并取显著颜色点到最远点的黄金分割点。通过整个框架,能完成整个图文设计在美学感知监督下的自动化。

图2 系统框图

这篇论文提出的系统允许用户上传具体主题的视觉背景图像以及一些文本语句。并在第二阶段对原始图像进行了处理,通过结合显著值、脸部、文本以及目光注意力图以获取视觉感知图,进而重新调整图像的大小,使之符合目标布局尺寸,并根据视觉感知图保留重要的区域。重新调整过的图像就能用来排列空间分布的布局模板。当图像调整后,已有的语句、空间布局以及文本就通过第三阶段中的能源优化工艺重叠在背景图像上了。在第四阶段的文本着色上,首先分析经过剪裁的图像的调色板,同时根据主题属性挑选主题色彩。应用特定色相/色调模型、调色板、语义色彩以及内容特点,就可以通过保持局部色彩和谐以及局部可读性对文本进行重新着色。

图3 布局算法(a)带有目光注意力(黄色)的视觉重要性图(灰色);(b)从前5个模板中挑选出的模板;(c)输入文本;(d)排印程序的细节,这里能源定义为E(L),通过迭代控制字体高度,在局部优化解决方案中会被最小化,;(e)受到下向上的图像特点和自上向下的空间布局限制的排印结果。

图4 色彩分析与优化的示意图

这篇论文发表之后,得到学术界的广泛关注,从2016年至今在ACM数据库中已有超过260次下载。此外,该项研究不仅具有重要的理论意义,而且具有广泛的应用价值。例如,论文提出的基于图像内容的颜色检测算法已经在实际产品Office Sway中得到应用。目前每个月有来自全球60多个国家的超过40多万用户在使用Office Sway这一新产品开展设计。

这篇论文展现了多媒体与艺术设计以及颜色心理学几个不同学科的深度融合,将人工智能的方法用于艺术设计中。可以说,颜色心理学的模型为多媒体设计打开了”心灵“的窗口,而美学设计思维则为多媒体分析展开了想象的翅膀!

论文下载地址:https://www.microsoft.com/en-us/research/publication/automatic-generation-of-visual-textual-presentation-layout/

论文作者

  • 杨绪勇,微软亚洲研究院和中国科技大学联合培养博士生,喂车车联合创始人

  • 梅涛,微软亚洲研究院资深研究员,美国计算机协会杰出科学家,国际模式识别学会会士

  • 徐迎庆,前微软亚洲研究院主管研究员,清华大学美术学院信息艺术设计系主任

  • 芮勇,前微软亚洲研究院副院长,联想CTO

  • 李世鹏,前微软亚洲研究院副院长,硬蛋CTO

另外,还特别感谢这篇论文的合作者——来自中国科技大学的博士生吴岳和来自清华美术学院的研究生于俊杰。

雷锋网

马斯克等 26 国 AI 技术领袖公车上书,要求联合国禁止“杀人机器人”的研发与使用

“杀人机器人”,似乎已被公认是下一轮军用技术的制高点。全球中美俄英法韩等主要军事大国,纷纷加大研发投入,争相打造无需人类驾驶员、操纵者的“钢铁雄师”。但同时,这引发的伦理争议与安全担忧日渐升温。一批机器人和 AI 领域的专家、企业家以及技术领袖,正呼吁联合国禁止“杀人机器人”的开发和使用。

雷锋网消息,今日,来自 26 个国家的 116 名专家,由马斯克和 DeepMind 联合创始人 Mustafa Suleyman 领头,发布公开信正号召全面禁止自主武器。

Elon Musk

Mustafa Suleyman 

联合国最近已投票通过开启对此类军用武器的正式讨论,这包括自主化的无人机、坦克、机关枪。马斯克等这批人已向联合国提交一份公开信——希望在此时,即正式讨论开始前进行呼吁,推动联合国制定决议制止这波全球已经开启的“杀人机器人”军备竞赛。

在公开信中,这批技术领袖们对将主持该讨论的联合国常规武器会议警告称,这轮军备竞赛极有可能导致“人类战争形式发生第三次革命”,前两次分别由火药和核武器引发。他们写道:

“一旦研发出来,致命自主武器将使未来战争扩大到前所未有的规模,战争进展的速度也将超过人类对时间的理解。这类武器很有可能成为恐怖的代名词,独裁者、恐怖分子能把它们用到无辜平民上,也有可能被黑客利用,让自主武器做出我们不希望看到的行为。

留给我们做出行动的时间并不多。一旦这个潘多拉魔盒开启,关上就难了。”

此前,AI 专家曾警告,以现在的人工智能技术和发展速度,部署全自主武器将在几年内变得可行。虽然,AI 武器能让战场对军队服役人员来说变得更安全——更多人不需要上前线;但专家们担心能自主行动的进攻性武器,将极大降低战争的门槛,导致更大量的人类伤亡。

该公开信在今天 IJCAI 的开幕致辞上公布,得到了机器人以及 AI 领袖不少知名专家学者的支持。公开信全文以及署名者名单见此。他们强调做出紧急行动的重要性,尤其联合国把讨论该问题的会议时间推迟到了今年 11 月,原计划是今天。

雷锋网了解到,这批联合署名公开信的专家,呼吁把“在道德伦理上站不住脚”的致命自主武器系统,加入联合国自 1983 年生效的特殊常规武器大会 (CCW) 武器禁用名录。后者包括化学武器以及蓄意以致盲为目的的激光武器。

新南威尔士大学人工智能教授 Toby Walsh 对此表示:

“几乎所有技术都有两面性,AI 同样如此。

它能帮助我们解决许多当前面临的社会问题:不平等、贫困、气候变化带来的挑战以及仍未消退的全球金融危机。但是,同样的技术也能用到自主武器上,让战争(进一步)工业化。

我们需要在今天做出决定,到底什么样的未来才是我们想要的。”

大家很熟悉的马斯克是该领域的活跃人物。他很早就对前瞻性的 AI 政策立法进行了多次呼吁,把人工智能说成是人类的头号生存威胁。马斯克的说法造成很大争议,不少顶级学者以及意见领袖表达了不同观点,包括 Ray Kurzweil 与扎克伯格。不少公众可能认可 AI 对人类社会有很大破坏潜力这一说法,但同时认为真正造成“破坏”还离得远。

Clearpath Robotics 创始人 Ryan Gariepy 表示:

“与其它科幻小说里的 AI 潜在应用不一样,自主武器系统研发正处在一个拐点,它对无辜平民造成杀伤的威胁非常现实,也有可能造成全球不稳定。”

AI 顶会 IJCAI 被专家们用作讨论致命自主武器系统的论坛,已经不是第一次了。 雷锋网曾报道,两年前,包括马斯克和霍金在内的数千名 AI、机器人专家以及行业领袖在该大会上签署了另一封公开信,呼吁与今天相似的武器禁令。这推动了联合国对致命自主武器开启正式讨论。

核武器的威胁还未解决,人类又将面临另一个自己制造出来的生存威胁。

via the Guardian

雷锋网

如此逼真的高清图像居然是端到端网络生成的?GANs 自叹不如 | ICCV 2017

雷锋网 AI 科技评论按:生成式对抗性网络 GANs 是近几年最热门的机器学习范式之一,它“图像生成效果好”和“训练困难、效果不稳定”的特点吸引了许许多多研究者付出精力进行 GANs 的研究。虽然它在大尺寸图像和图像逼真程度方面的表现仍然有限,但仍然是目前最好的图像生成范式。

所以当看到如此逼真的高分辨率生成图像的时候,我们几乎要以为这是 GANs 的新突破。虽然图中还有一些扭曲和不自然,但是细节和物体的结构已经比较完善。然而定睛一看,这样的效果居然是一个单向的端到端网络完成的!

介绍这项成果的论文「Photographic Image Synthesis with Cascaded Refinement Networks」(用级联优化网络生成照片级图像)已被 ICCV 2017 收录,这篇论文是斯坦福大学博士陈启峰(第一作者)和英特尔实验室视觉组主管 Vladlen Koltun 共同完成的;两人此前也有合作。陈启峰初中时就开始学习信息学,不仅2008年全奖就读香港科技大学,2012年时更同时被斯坦福大学、哈佛大学、MIT、普林斯顿大学、UC 伯克利、UCLA等9所高校全奖录取硕士博士学位,最终选择了斯坦福大学,并于今年6月获得计算机博士学位。

以下雷锋网 AI 科技评论就对这篇论文做详细的介绍。

想法提出

作者们的目标是生成大尺寸的、质量接近照片的图像。这个目标有足够的难度,现有的基于 GANs 的方法生成的图像在尺寸和逼真程度上都有各种问题,而 GANs 本身训练困难的特点更是雪上加霜。所以 GANs 的方法不适用。

作者们想到了这样一个点子,假如给定一个街道布局,比如左图这样,不同的物体也做出了语意级别的区分,一个熟练的画手可以很快根据这样的布局画出一幅画,专业的艺术家甚至可以可以据此创造出像照片一样真实的画作。那么,能否把这样的能力赋予一个计算模型呢?就是给定一个带有语意物体布局的场景(左图),能否让一个人工智能系统生成一张这个场景对应的照片级的图像(右图)呢?

另一方面,这个任务也有现有的成果可以类比,那就是图像的语意分割。“从一张真实世界的图像生成语义分割布局图像”,就和作者们的想法“从语义布局图像生成照片级图像”互为逆任务。既然图像分割可以用端到端卷积网络来做,那么从“分割结果”生成图像也就可以用端到端卷积网络来做。

图像生成任务有哪些特点

不过端到端网络的总体结构还不足以保证图像的质量。所以作者们在根据其它现有的网络结构做了很多实验以后,列举出了三项他们认为非常重要的特点,模型要满足这三点才能有足够好的表现。

全局的协调性: 照片中物体的结构要正确,许多物体的结构都不是在局部独立存在的,它们可能有对称性。比如如果一辆车左侧的刹车灯亮了,那右侧的刹车灯也要亮。

高分辨率:为了达到足够高的分辨率,模型需要具有专门的分辨率倍增模块。

记忆力 (Memory):网络需要有足够大的容量才能复现出图像中物体足够多的细节。一个好的模型不仅在训练集中要有好的表现,也要有足够的泛化能力,都需要网络容量足够大。

巧妙的网络结构设计

为了同时达到以上的三个特点,作者们设计了一个由多个分辨率倍增模块组成的级联优化网络 CRN。

模型一开始生成的图像分辨率只有 4×8,通过串接的多个分辨率倍增前馈网络模块,分辨率逐步翻番,最终达到很高的图像分辨率(比如最后一个模块把512×1024的图像变成1024×2048)。这就是论文标题的“Cascaded Refinement Networks”的体现。这样做的好处是,

1. 覆盖大范围的物体特征一开始的时候都是在很小的临近范围内表示的,它们的总体特征在一开始就是协调的,在分辨率逐步升高的过程中也能够保持下来,就达到了“全局的协调性”。

2. 在提高分辨率的过程中,使用串接的多个前馈网络模块就可以对整个模型做端到端的训练,如果这部分用 GANs 就没办法端到端训练,而且分辨率选择的灵活性也变差了。这样就保证了“高分辨率”。

3. 增加更多的分辨率倍增模块可以提高网络容量,作者们表示只要硬件能够支持就可以增加更多的模块,现在他们实验中用到的网络有超过1亿个参数,已经用尽了GPU的显存空间,但是有明确的证据表明继续增大网络容量可以继续提高图像质量。这样模块化的网络也就非常方便在硬件资源充足的情况下拓展网络容量。

每个分辨率增倍模块都在各自的分辨率下工作,它们的输入有两部分,一部分是降采样到当前模块分辨率的输入语义布局图像 L,另一部分是上一级模块的输出特征层 Fi-1 (最初的模块没有这一项输入),其中包含若干个 feature map。输出的 Fi 分辨率在输入 Fi-1 的基础上长宽都为2倍。

单个模块的示意图,L 和 Fi-1 为模块输入;语义布局图像 L 需要降采样,来自上一个模块的 Fi-1 需要升采样。

每个模块都由输入、中间、输出三个特征层组成,其中在输入层直接翻倍分辨率,并且没有使用升倍卷积,因为那样会带来特征的瑕疵。除了最后一个模块要输出最终结果外,每个模块的每个层后都跟着一个 3×3 卷积层、正则化层和LReLU非线性层。

对于论文中测试的输出分辨率为 1024 x 2048 的模型,一共用到了9个分辨率增倍模块。在每个模块的特征层中包含 feature map 数目的选择上,第一个到第五个模块为1024,第六到第七为512,第八个为128,最后一个为32。

训练损失和训练过程

“从语义布局图像生成照片级图像”其实是一个约束不完全的问题,同一个布局图像对应的足够真实的照片级图像可以有许多种。所以即便在训练时,作者们也是把布局对象对应的照片称为“参考图像”而已。

损失函数设计

对于约束不完全的训练问题,作者们希望找到一个最适合的损失函数。若直接对训练输出和参考图像做像素对像素的对比,会对足够真实的内容也造成很大的惩罚,比如生成的车颜色不同的时候就会有很大惩罚,但这其实是不必要的。所以作者们选择了内容表征的方法,或者说是感知损失、特征匹配的方法,跟视觉网络中的特征匹配激活对应,这样就与参考图像的低级特征保持了足够的距离。

具体的做法上作者们另辟蹊径,借助一个 VGG-19 图像感知模型,提取它识别的图像特征中高低不同的某几层作为计算训练损失的依据,从而同时涵盖了图像特征中边缘、颜色等低级细粒度特征和物体、类别等高级总体布局特征,从而构建了全面、强力的损失函数。

生成多样化的图像

作者们认为,既然“从语义布局图像生成照片级图像”本身就会带来多种结果,所以他们应当让模型也生成多种不同的结果。他们首先尝试了让网络生成多张不同的图像然后从中选出最好的一张;然后最终更换为了一个更强大的损失函数,它起到的作用类似于在所有生成图像中分别选择每个语义类别对应的图像中最真实的那部分, 然后把它们全部拼在一起,从而让最终的输出图像得到了非常高的真实度。下图即为加入多样性损失之后,让模型从同一个输入生成的9张不同图像。

效果测试

作者们把所提的CRN网络与在同样的测试条件下与其它网络做了对比,包括 GANs(修改了鉴别器加入了语意分割损失)、全分辨率网络(中间层也是全分辨率,与 CRN 相同损失函数)、自动编解码器、只使用低级图像空间损失的CRN、以及 图到图转换GAN(论文中以Isola et al.指代)。

另一组对比

图中可以看到,基于 Cityscapes 和 NYU 两个数据集的测试中,论文中提出的 CRN 都取得了非常好的观感,与其它的相比,简直就像是真实的照片;所用到的训练样本数目也仅仅分别为 3000 张和 1200张而已。

作者们也通过 Amazon MTurk 众包平台平台进行了量化对比测试:每次给被试者提供两张图像,一张来自 CRN,一张来自其它网络,看看他们有多高的比例认为 CRN 的图像更真实。

结果非常有说服力,只有采用了相同的损失函数的全分辨率网络取得了与 CRN 接近的成绩。这首先说明了作者们选择的损失函数效果非常好,准确地训练出了网络构建重要特征的能力;而另一方面因为全分辨率网络的中间层特征太多,导致足够 CRN 训练 1024×2048 分辨率的显存只够全分辨率网络训练 256×512,这也体现了级联优化模块结构的优点。CRN 同时在分辨率和真实度上取胜。

泛化能力

我们可以看到,对于高质量的语义布局输入,CRN表现出了很高的水平。那么模型的泛化能力如何呢?在与论文作者陈启峰博士取得联系并表达了我们的疑问后,陈启峰博士介绍了两项模型泛化的结果。

粗粒度语义布局输入

可以看到,对于粗粒度的语义布局图像输入,模型也维持了相当的表现,并没有因此造成严重的细节损失;物体结构的完整和清晰程度有所下降的。

从GTA5游戏生成图像

作者们的另一个想法是把这项技术用来给游戏生成真实的画面,成为一种新的渲染逼真游戏画面的方式。他们尝试的游戏是 GTA5,用 Cityscapes 数据集训练模型以后,从 GTA5 抓取语义布局作为模型输入,得到的结果同样充实、逼真,单独看画面根本想不到和 GTA5 有任何联系。陈启峰博士表示,“语义布局图很容易在游戏里抓取,这对未来游戏或电影画面生产可能会有深刻影响”。

总结

作者们也剪辑了一个视频,集中展示了生成的画面效果。

这篇论文用精彩的方法生成了高分辨率、高真实度的图像,其中衡量真实度和提高生成图像丰富性的方法有很高的借鉴价值。所提的方法很好地完成了“从语义布局图像生成照片级图像”的任务,而且具有一定的泛化能力。我们期待论文中的技术在未来的研究中进一步得到发扬光大。

雷锋网 AI 科技评论编译。感谢陈启峰博士对本文的补充!

论文地址:https://arxiv.org/abs/1707.09405v1 

陈启峰个人主页:https://web.stanford.edu/~cqf/ 

项目地址:https://github.com/CQFIO/PhotographicImageSynthesis 

雷锋网

Hinton近日做报告,讲解其研究多年至今未发表的工作

雷锋网AI科技评论消息:近日,在加拿大多伦多大学由Vector研究所发起的“2017 – 2018年机器学习进展与应用”研讨会上,神经网络之父Geoffrey Hinton做了一场报告《What is wrong with convolutional neural nets?》,在报告中Hinton讲解了他多年来一直在做的研究工作,他称之为“胶囊理论”(capsules theory)。

在报告中,他认为“标准神经网络”与真实的大脑神经网络相比有以下四个问题:

1、池化过程并没有很好地模仿大脑中形状知觉的心理过程——它不能解释为什么我们人类能将内在的坐标系映射到物体上,以及为什么这些坐标系这么重要;

2、池化解决的问题是错的——我们想要的是信息的同变性而不是不变性,是理清信息而不是丢弃信息;

3、池化没有利用底层线性结构——它没有利用在图形中能很好地处理方差最大来源的自然线形流形。

4、池化在处理动态路由时很差劲——我们需要将输入信息的每一部分路由到知道如何处理它的神经元中,找到最佳的路径就是在解析图像。

Hinton提出了他“胶囊”(capsules)的概念。简单地说,这些“胶囊”就是在神经网络中构建和抽象出的子网络。什么意思呢?一个标准的神经网络,层与层之间是全链接的(也就是说,层1中的每个神经元都可以访问层0中的每个神经元,并且其本身 也可以被层2中每个神经元所访问),但这些连接并不一定都是有用的。“胶囊理论”的方案是,神经网络由n个子网络(胶囊)构成,每个胶囊都专注于做一些单独的任务,胶囊本身可能需要多个层网络来实现。其输出包括物体所属类型的概率以及物体的状态信息(比如位置、方向、大小、形变、速率、颜色等)。低层次胶囊输出的参数会被转换成高层级胶囊对实体状态的预测,如果预测一致,则输出这一层次的参数。

一个典型的胶囊将从多个低层次的胶囊中获得信息(多维预测向量),然后寻找一个预测的紧致束(tight cluster of predication)。如果它能够找到这个紧致束,那么它就会输出实体在这个域内类型存在的较高的概率,以及生成状态的重心(状态平均值)。这种方式可以很好地过滤掉噪声,因为较高维度的巧合发生的概率很小,所以胶囊的方法要比“标准的神经网络”好很多。Hinton说,他这种“胶囊”的想法是受到脑科学中对“迷你列组织”(mini-column organization)研究的很大的启发。

此外,据雷锋网了解,关于“胶囊理论”的研究Hinton已在多个场合做过类似的报告,不过目前Hinton好想并没有打算把他的研究成果发表出去,因为他觉得现在的研究还没有让他满意——那么,当他对这项研究满意的时候,会不会再次成为“the Father of ……”  ?

雷锋网注:资源链接——

1、What's wrong with convolutional nets? @MIT TechTV(2014年在“脑与认知科学”研讨会上的报告视频,内容类似)

2、Hinton未发表工作:Transforming Auto-encoders(PDF)




雷锋网

BATJ金融业务副总裁聚首讨论互金的寒冬和未来,他们都说了什么?

雷锋网AI金融评论报道,互联网金融从诞生到现在,短短几年时间就经历了翻天覆地的发展变化,包括P2P网贷、股权众筹、互联网保险、第三方支付、互联网资产交易等各子行业,都经历了从“野蛮生长”到“集中整治”,从“趋之若鹜”到“门庭冷落”的骤起骤落变化。变革的时代里,还孕育起了金融科技这样的新业态,被互联网金融视为新的出路。

那具体来说,互联网金融遭受了巨大挫折,行业的春天和远方在哪里?据雷锋网现场了解,在8月19日举行的“聚焦金融风险防范与财富管理—中国财富管理50人论坛”上,百度集团副总裁张旭阳、蚂蚁金融副总裁徐浩、京东金融副总裁许凌、腾讯支付金融业务副总裁洪丹毅等就互联网金融寒冬后的诗与远方展开了讨论,谈及金融科技的监管、创新和风险管理等。中央财经大学金融学院院长李建军教授为主持人。雷锋网对谈话实录编辑如下:

李建军:先请百度集团副总裁张旭阳博士来发表演讲。

张旭阳:今天的话题是寒冬过后的诗和远方,但我个人觉得我并没有看到互联网金融的寒冬。从2012年开始,互联网是有些泡沫或者说有些不是正规的互联网金融机构。但比方在台上的两位支付巨头,支付宝和微信支付,过去这几年的发展,获得90%以上市场份额。在资产端,可以看到现在很多贷款,并不是传统金融机构在做,而是很多互联网的很多场景在做。我们最近也可以看到资产证券化的繁荣,比如上周百度金融的小贷资产证券化,获得了3.6倍的认购。可以看到在资产方,互联网金融资产也在不断形成,包括传统金融机构的互联网金融化,种种数据表明,互联网金融从2012年正在以一个更加坚定的步伐在发展,这就是数字化的存在。

8月4号中国互联网信息中心发布了一个数据,到今年上半年,我们的网民人数达到7.5亿,手机网民人数达到7.2亿,网购人数5.12亿,网上支付人群5.1亿,即时通讯软件使用者6.9亿,搜索用户6.09亿,商业银行的互联网网上银行的客户数达到3.8亿,在互联网上购买理财产品的人数达到1.42亿。随着移动互联的发展,每个人变成数字化存在,这是互联网金融发展场景革命背后的背景。

不仅是场景发生变化,随着随着下一步人工智能技术的推进,相信互联网金融为代表的新金融还会以更好的脚步发展。移动互联网阶段是场景革命,是商业模式的革命,移动互联网使得我们世界变平了,在人工智能阶段,把平的世界变成垂直、变成立体。在机构端To B端我们会发现,以往的互联网阶段是通用的平台,大家借助互联网、手机、移动设备、PC,但在人工智能阶段,每个行业有每个行业不同的进入方式,前端是以传感器加上与行业逻辑、智能软件和智能芯片相适合的。在互联网阶段可以是通用平台通吃,但在移动互联网时代是垂直的。同时在C端,用户画像能力提升,我们把每个人从数字化人变成一个活生生的立体的人,这种情况下我们可以看到,新的技术对金融本质会发生影响。

金融的本质就是跨期的资源配置,使得我们解放人、释放人,一个有思想的创业者,通过吸收风投资金能提前实现一些愿景。一个年轻人通过借贷,提前去买房,金融的本质就是因为资源的跨期配置来释放人的潜能。但因为资源的跨期配置有风险,金融机构最关键是怎么解决风险问题。我们解决风险有两类,一类是直接融资,一类是间接融资。资管是直接融资,是通过分散的原则去解决风险,银行是间接融资,是通过管理解决风险。随着我们对人的理解更客观的情况下,我们能更有效率地做风险定价,我们可以更好地了解一个人的还款能力以及还款意愿。通过新的技术,比如大数据风控等等的能力,可以提升我们在借贷领域对风险的定价和风险识别能力。

随着我们对数据的处理能力提升,这种能力会从对个人的定价进入到小微企业,从消费金融到融资,比如农村金融,从解决个人贷款难到解决小微企业贷款难,技术可以做帮助。第二,金融产品也会从标准化向差异化做转变。随着风险处理能力,个性化定制化产品能力提升,下一步到智能投顾的发展,借助互联网的发展,我们解决了信息的一次不对称形成问题。随着互联网的发展,我们会发现我们的信息太多了,从中怎么去取经?人工智能可以帮助解决信息二次不对称的问题。通过自然语义理解,OCR技术,我们可以做智能文本筛选;通过更多算法,可以把一些线性的描述变成非线性的描述。……诗与远方还在前面,我相信时间的力量,相信科技的力量,互联网金融也好,金融科技也好,它没有经历寒冬,它是以自己坚定不移的脚步继续为金融行业赋能加持,这是我的基本观点,谢谢!

李建军:这意思是说,互联网金融没有寒冬,随着科学技术,比如大数据挖掘处理能力的提升,互联网金融的内涵在不断拓宽加深,应用也越来越广,给我们带来的便利程度也越来越高。接下来有请蚂蚁金服副总裁徐浩演讲。

徐浩:今天分论坛的主题是寒冬后的诗与远方,作为互联网机构的一个成员,既感到一份沉重,也更充满了一种希望。在我个人来说,我更愿意把这个行业目前的状态理解为是一种处在一种整理和规范的阶段,还有待与后续的蓄势再发。

从市场的情况看,前期确实有一些不法的机构,假借互联网金融的名义,将线下的一些骗局搬到了线上,损害了用户的利益。另外一个,还有部分不具有必要的资质或者技术能力经验等等方面的机构,仓促地赶热潮参与互联网金融行业。正是因为这种技术能力或者经验的不足、风控能力的不足,商业上不可持续,最后匆匆倒闭之后会给用户带来实际的损失。种种这些是导致互联网金融中央和国务院下决心整治的重要原因。可是我们知道这一类的并不是真正意义上的互联网金融,它是一种欺诈。欺诈本来就有,只是搬到了线上,是一种劣的互联网金融,是能力不够的所谓的互联网金融。

前期中央布置的互联网金融整治,到目前看已经取得了非常重要的成果,一个是非法机构得到了打击,另外是规范了伪劣的互联网金融金融,P2P等等监管规则也在不断健全,监管部门的职责在进一步明确。应该说经过前期的有效整治,使得行业发展的基础得到了进一步的夯实,市场秩序好转。对于规范行业的进一步发展是一种有利的局面。

近期的金融工作会议给我们整个行业下一步的发展指明了方向。从具体业务上来源讲,比如我们运用大数据的风控为小微企业进行授信,在线提供贷款服务,运用技术的手段来探索信用服务,促进共享经济和信用经济的发展,或者是通过开放图像识别的技术,来支持保险公司提升车险理赔的能力,再比如互联网公益+保险这种模式来推进精准扶贫。还有蚂蚁的绿色森林,实际上是对绿色金融的一种探索。种种这些方面取得了一些初步的成效。

从后台能力来讲,我们通过开放平台的渠道,通过技术风险这方面能力与金融机构的共建共享,我们已经与200多家银行类金融机构100家金融公司和90多家保险公司开展合作,来共同提升服务实体经济的能力。

同时我们也要看到,虽然互联网金融业务刚刚起步,总量占比很小,其实并不是我们目前整个金融风险的主要矛盾,但是互联网行业具有其独特的影响,它的影响面广,传递快,各业务之间的联系也相对复杂,所以从整体行业来说依然需要加强风险管理。

李建军:这是介绍了蚂蚁金服的金融创新。下面演讲的嘉宾是京东金融副总裁许凌先生。

许凌:今天这个论坛的话题挺有挑战的,最热的最难回答的词都在这,互联网金融、寒冬、诗与远方。围绕今天的主题讲讲京东金融在当前、过去以及未来我们的一些想法。

刚刚这几个词里,首先“诗”这个字可能在京东或者京东金融内部就不存在,我们没有一天是过得有诗意的,从京东做电商开始我们就老老实实的每一个包裹、每一个快递,每一个工作都是扎扎实实做起来,天马行空的事可能在京东金融从来不会去做。

今天最有挑战的是寒冬这个话题,刚刚开完了全国金融工作会议,提出了互联网金融加强监管。如果大家觉得监管或者合规就是寒冬的话,那我们认为就应该欢迎这样的寒冬,至少京东金融认为监管合规不等于寒冬,我们认为无序的市场、恶劣的竞争、大量的风险意味着寒冬。当这种监管的意识、合规的意识在整个行业变成更大的共识的时候,这是春天而不是寒冬。

从京东金融开始做金融相关的技术业务、服务业务的时候,我们就认为风险和合规是企业的生命线,这是原则性的底线,这是做所有一切的底线。在做这件事的时候,合规和风控在我们每一项产品每一个服务的背后是第一时间讨论的。而且我们都认为风控这种意识,首先是战略上的风控,其次是战术上的风控。所谓战略上的风控是当企业决定做这件事的时候,一定知道自己是有所不为的,什么样的市场、什么样的产品、什么样的服务是坚决不碰的,比如像过去四年,京东金融从一开始坚定我们不去做P2P的业务,我们觉得没有一个明确的法规法律的指导。第二,我们不去做任何涉及到高利贷,高过了社会道德容忍底线的高利贷的业务。战术上怎么做好风控,刚才张总和徐总都提到了,怎么让我们更有能力的团队在风险环节设计好更好的风控,运用更好的数据建立更多用户的识别、产品风控流程的设计。对于寒冬这个话题,我们认为监管和合规不意味着寒冬,我们希望这样更有效的市场能更快的建立起来。

“远方”,我们觉得远方是一定存在的,这个远方一是说在座的所有人我们对这个行业的期待和定义,认为金融或者大的数字金融、科技金融,这是不是有未来,这个未来无论是放在当前的社会还是这个国家还是这个世界上来看,我们始终认为数字化的便捷化的高科技化的金融一定是远方和未来。

其次是怎么样到达这个远方和未来,过去四年谈了很多的互联网金融,也有很多人在谈金融科技,这两个词有什么区别。在京东金融我们认为互联网金融只是一个场景的拓展,很多所谓的互联网金融只是把互联网当成一个销售的渠道。如果是这样,你是没有价值的。而真正连接远方的我们认为是技术的变革。京东金融定义的金融科技更多是技术的变革,只有通过技术的变革,才能让我们所谓的金融的远方有更多的暖意或更多创新的点。

互联网企业,我们认为我们在数字、技术、用户感知、用户体验这些领域有更强的经验和优势,怎么样把这个连接起来,通过这样的连接起到三个目的,其实核心的一个目的是应该充分消除信息的不对称。第一个是对用户客户端的信息不对称,第二是跟我们的合作机构、金融伙伴的信息不对称,第三是跟监管机构、行业法规的信息不对称,下一步通过技术革新、开放合作来消除这样的信息不对称,通过这样的模式,我们认为远方是始终存在的。

对京东金融来说,我们认为在未来整个数字金融科技市场上不断建立自己的三种能力,都是在数据驱动下的能力,第一个是用户匹配能力,第二个是需求的匹配能力,第三个是定价的匹配能力。

李建军: 接下来有请腾讯支付金融业务副总裁洪丹毅发表演讲。

洪丹毅:实际上整个互联网在谈寒冬,更多是监管趋势,监管也不是在今天突然而来的降温或者监管,从2015年开始陆陆续续有一些政策上的调整,大家也看到趋势越来越清楚。在刚刚结束的全国金融工作会议上更进一步明确基调,对于什么叫监管的失责,什么叫监管的渎职,什么叫终身的问责,都有很明确的说法。

互联网金融的板块非常多,单一说就是寒冬可能不是特别准确。如果大家展开来看,在座的各位看到BATJ的业务发展,在支付上不能算寒冬,每天无数的交易笔数在移动平台上发生,很多商家都接入了支付平台,甚至一些小的商户最喜闻乐见的是路边商户也挂出了二维码,这是支付在慢慢普及的大的趋势。

其他一些金融领域,比如P2P网贷或者互联网保险可能是大家看到寒冬的方面。我分享几个数字,比如P2P网贷,在2017年上半年截止到6月底的时候,已经关停的网贷平台大概有3900多家,现在还存在的网贷平台大概2000多家,对这样一个领域来说可以算是寒冬。对于互联网保险也是类似的情况,相比今年上半年的整个互联网保险的保费收入和去年同期相比,互联网产险下降了20%的保费,从去年的297亿下降到今年的237亿,互联网的人身险的收入也出现了第一次的下跌,从去年的1100多亿,今年估计会下跌10%,这个趋势随着政策往下推会进一步下滑。对个别的互联网金融领域来说,的确是寒冬已经到来。这些寒冬跟监管的关系紧密相关的,也体现整个监管在加强管控同时在脱虚入实的整个监管理念。

在这样一个大的背景下,怎么看待这样一个寒冬?我们是这么想的,实际上互联网金融在中国相对来讲还是比较年轻的产业,回推五年前,很多资本的注入,也包括中国互联网人口红利注入到了互联网金融。如果反思整个互联网金融现在的情况,有些互联网的特征被一些不合法不合规的机构利用了,假冒伪劣的互联网金融,以前用旁氏骗局来骗,用互联网技术更广的触达,这些机构使得真心实意在做互联网金融产业的一些公司背锅躺枪,这点是非常遗憾的。

除此以外,互联网推崇的所谓的普惠金融,普惠金融的确带来一些潜在的隐患,因为我们很多的中小投资者实际上对于互联网金融、互联网理财上的风险是不完全被告知和揭示的,这些就出现了我们常说的投资者适当性管理的问题。互联网金融企业要谨慎管理好,要投资者真正知道他买入什么产品,他买入什么资产,附带什么风险。

互联网金融还有另外一个风险,一点体量非常大,可能会产生系统性风险。第一类风险是要严打的,第二类风险是要引导的,第三类风险是要防范的,确实有一个寒冬的迹象存在,但是这个寒冬更像是一场瑞雪,瑞雪之后有一个丰收的年,我们期待寒冬过后很快会有瑞雪的年份可以出现。

什么是诗,讲诗更多是腾讯在做互联网金融的一个坚守,腾讯这几年做互联网金融无非三大坚守,第一个是踏踏实实用好我们的社交体系,我们在微信平台上最新财报有6.3亿的月活用户,不管做什么金融,支付、理财、证券投资或者信贷,我们希望用好这个平台。第二个坚守叫合作共赢,我们作为一家互联网公司,互联网金融实际上是互联网+金融,所以我们希望能够跟金融机构携手做互联网金融。

讲到远方,未来作为互联网公司,只能继续布局我们金融科技这块的领域,现在最核心的两个领域,人工智能和区块链,人工智能相信在互联网金融领域里未来会发挥越来越大的作用,简单来说,它将来能真正做好对用户来说的信息的个性化推荐。其次我们也希望用AI的技术做好很多风控,同时用AI的技术把以前在线下银行给人提供到的人对人的客户服务搬到线上来,我们根据客户大数据去识别真正适合他的金融产品和服务。

总的来说,几位嘉宾讨论出了一个共识,就是目前处在寒冬的是一些不规范的一些网贷平台,这些其实不是标准意义上的互联网金融,并提出了各自走向春天的路径。对此,中国财富管理50人论坛理事、星石投资总经理杨玲认为,监管就时互联网金融的“春天”。互联网金融的发展路径,可能会遵循私募的发展路径——先监管而后强大。预计监管将强化,传统金融力量和新生金融力量将良性共生合作共赢。

雷锋网

国内首家“AI+医疗”医院正式挂牌运行,科大讯飞称其AI已达三甲医院医生水平

雷锋网8月20日消息,今日,由科大讯飞、安徽省立医院联手打造的“安徽省立智慧医院(人工智能辅助诊疗中心)”(下简称“智慧医院”)在合肥挂牌运行,这也是我国首家AI+医疗实体医院正式落地!

据了解,该AI系统学习了近百万张医学影像资料、53本专业医学教材、200万去标识化真实电子病历、40万医疗文献及病历报告,还将一直学习。科大讯飞董事长刘庆峰介绍,目前人工智能辅助诊疗中心已与安徽省医学影像云平台、安徽省立医院医联体远程会诊平台完成对接,并已正式接入41家县级医院,未来将服务安徽省全省105个县。“这标志着人工智能全面赋能中国医疗的时代正式开启。”

安徽省立医院院长许戈良表示,在已接入的41家县级医院,人工智能辅助诊断系统将为它们提供胸部CT和乳腺钼靶影像的智能辅助诊断及质检服务。此外,该医院对口帮扶的西藏山南地区人民医院也已接入该系统。

据了解,2016年,科大讯飞与安徽省立医院成立“医学人工智能联合实验室”以来,科大讯飞智能导诊导医机器人“晓医”、人工智能医学影像辅助诊断系统、门诊语音电子病历、口腔/超声语音助理、云医声移动医护工作站等产品已陆续在安徽省立智慧医院落地应用,这构成了“安徽省立智慧医院”的基础。

“目前AI在肺癌和乳腺癌的医学影像辅助诊断方面已经达到了三甲医院医生的水平,未来,讯飞不仅要让AI辅助医生阅片,还要让AI辅助医生开出诊疗处方。”刘庆峰称。

雷锋网

除了新闻事件识别,GiveMeSport还要利用AI管理Facebook的内容分发

图片来源:YouTube

雷锋网按:英国著名体育媒体GiveMeSport算是新兴技术的应用先行者。其创立于2011年,主要基于Facebook专业发布与体育相关的新闻、专栏文章等。目前,其成功借助专有技术在Facebook上吸纳了2500万以上的订阅用户。2016年10月,GiveMeSport 被 Breaking Data Corp.(国外一家人工智能技术提供商)收购,利用该公司的AI技术,其成功立于一众竞争者之前列。

雷锋网了解到,GiveMeSport已在新闻频道的两个终端应用了AI技术,包括分析和反应片段以及重大新闻的报道。在此之前,该新闻机构每个月产出的2000篇文章,绝大多数来自14位全职以及50位自由撰稿人的工作成果,他们撰写的文章就是反应片段。

据报道,这一新项目大大释放了作者们的时间,使其有更多的精力专注于1500字以上的文章的撰写当中,同时这类文章也能争取到更多的广告投放空间。

“全球有很多有潜力的AI团队”,Breaking Data的CEO Nick Thain如此表示,其在2016年底收购了GiveMeSport,“现在Breaking Data正在尝试从理解社交媒体语言,本土语言及其缩写,以及语言在适应过程中是如何改变的等等来分离公司重点。”

以下就是该新闻机构利用AI在新闻报道中的具体应用:

新闻采集和事件识别

通过自然语言处理(NLP),Breaking Data的AI技术能够实现对Twitter的秒级扫描,并通过预定关键词,如足球队、球员名字、球队名称、俱乐部、联赛、比赛场地等等,来筛选相关内容。这些内容在经过过滤和验证之后,会被分类为“重大事件”、“相关新闻”或者“夸张新闻”,然后在BreakingSports Slack频道里会被作为警报发送给记者,再由通知里的编辑团队首要处理。

在这个过程中,GiveMeSport使用了Breaking Data的AI技术,可将各个公开的数据源,如Facebook、Reddit、维基百科等等,汇集在一起。

图片来源:Digiday

尽管已有大量可用的社交工具, 但是Thain 解释到,该平台还能通过识别可靠、可信的信源来突出有可能不太准确和真实的推文。举个例子,假如有消息称,足球队员Neymar 将以2.22亿欧元(约合2.61亿美元)的高价加盟巴黎圣日耳曼队,GiveMeSport的AI平台会即时追踪该新闻首次出现在Twitter上的时间,并将该账户标记为可信权限。

随着该AI平台对语言的了解逐渐深入,它还能识别出特定领域的规范偏差。Thain表示,该平台可以捕捉住一个足球场半径范围在一英里的所有推文。假如跟踪一位发推频次非常规律的物理治疗师(其很有可能是为运动员提供诊疗服务的),在经过一天繁重的工作之后,该诊疗师可能会连续发出几条抱怨工作负载的推文。发推频次和内容主题的变化,将被机器捕捉并予以标记,从而将其作为警报发送给该新闻机构Slack频道的记者。记者们即可联系相关俱乐部,调查是否有运动员受伤等事宜。

管理Facebook平台的内容分发

Facebook是GiveMeSport 最大的推送平台。该新闻发行商的记者也会在Facebook上发布帖子,并为其文章取标题等。雷锋网了解到,GiveMeSport还将该AI技术嵌入到内容管理系统中,并根据文章帖子对点击率和参与度的贡献来为每位作者打分。

此外,该技术还分析了文章的词语组合、句子结构和形象,从而和受众产生共鸣。

“(事实上)它和识别标题里的大写字母一样简单,可识别出Facebook用户可能会厌倦的内容。或者,它还能确定曼联球迷不喜欢被称作「MU 」或者「红魔」。”Thain表示,“该技术支持作者以其熟练的技法来写作。”

“内容分发应该是科学的,我们不想错过这个机会。AI给了我们超越其他竞争对手的优势。”Thain补充道。

为内容赋予感情

据了解,现阶段GiveMeSport的作者在处理每个故事的「感情」标签时,仍依赖于手动操作。这些情绪会有一个预定的数据库,如快乐、悲伤等30种以上的情感,作者们根据自身满足的情感奖励组织内容,标记每个故事。后续借助AI技术,该平台可对历史数据集进行类似分析。这一过程运行的理论为,通过理解更深层次的情感,从而可以预测内容的表现,来链接用户。

“体育一定是关乎情感的,”Thain说,“它归结于你对某件事的感觉,或者归结于你想告诉其他人你刚读过的文章的感觉。吸引用户想读的内容,无非就是不可错过的,或者就是和你相关经历有关的。”

Via Digiday

雷锋网

Uber 新掌门人近期内敲定 通用电气前 CEO 伊梅尔特成热门人选

命名一个新的Uber CEO的漫长而戏剧化的过程可能会更接近尾声。

雷锋网消息,据多个消息源称,通用电气前首席执行官杰夫-伊梅尔特(Jeff Immelt)在Uber新掌门人角逐中处于领先地位。

伊梅尔特目前处于领先地位

消息人士透露,伊梅尔特受到 Uber 董事会青睐的部分原因是,他适合与公司前首席执行官特拉维斯·卡兰尼克(Travis Kalanick)共事。

雷锋网了解到,完成对公司文化的调查后,联合创始人兼首席执行官卡兰尼克就被要求辞职。和 Waymo 的侵权诉讼和 Uber 内部性别歧视的文化是导致卡兰尼克离职的重要原因。尽管卡兰尼克已经离职,但他仍然担任Uber董事,并且控制着另两个董事会席位。这也是近期 Uber 股东 Benchmark 对卡兰尼克诉讼的焦点。

消息人士称,虽然情况可能发生变化,但另外两位被考察的候选人也均为男性,这与一些分析人士此前预期一致。 Uber 董事会可能在未来两周内进行投票,虽然候选人不必获得一致同意,但大部分董事还是希望候选人最好全票通过。

不管怎样,伊梅尔特目前处于领先位置。

在 Uber 董事会里,Arianna Huffington 是伊梅尔特最早、最坚定的支持者之一。此外,伊梅尔特还是数位董事的首选。其他董事尚未做出决定,这其中就包括Benchmark,其地位因起诉卡兰尼克以及随后的相关报道而被弱化。不过,这些未表态的董事也认为,Uber新掌门人能够快速处理一些棘手的问题,他们认为伊梅尔特完全具备这个能力。

继任者要解决的问题还有很多

卡兰尼克给继任者留下一个烂摊子:公司高管层需要补强,员工士气持续低迷、董事会需要多元化并进行扩大,企业文化需要净化以及无数法律纠纷和监管方面的麻烦事。

 Benchmark 指责卡兰尼克被驱逐后依然存在不少不良行为,这其中就包括干涉公司的日常运营。卡兰尼克虽然否认了多数指控,但这件事却是不争的事实。

 Benchmark 的马特-科勒( Matt Cohler )和卡兰尼克均为董事会成员,他们之间的争吵必将继续下去。 Benchmark 希望卡兰尼克离开 Uber 董事会。不过,卡兰尼克及其盟友谢尔文·皮谢瓦(Shervin Pishevar)则认为,应该离开董事会的是 Benchmark 的马特·科勒(Matt Cohler)。

面对这种局面,老道的伊梅尔特肯定是不错的选择。一位消息人士称:“伊梅尔特不是那种被轻易摆布的人,这可能是其最出色品质。我们都知道伊梅尔特不像卡兰尼克那样充满激情,但他肯定能稳定局面。”

另一位消息人士表示,伊梅尔特与华尔街、投资者以及科技圈都很熟,这对于未来几年准备上市的Uber大有帮助,即使 Uber 打算出售,伊梅尔特也有办法。

伊梅尔特出任 CEO 也存在质疑之声

据悉,伊梅尔特被广泛认为有助于 Uber 度过当前的危机,解决与竞争对手之间的法律纠纷,平息领导层的混乱。

当然,伊梅尔特出任 Uber 首席执行官也面临反对声音。他领导通用电气时间超过15年,整个职业生涯都在通用电气度过,而通用电气与 Uber 具有很大不同之处。通用电气是一家跨国巨头,业务涉及从金融到飞机发动机在内的众多领域;Uber是一家有颠覆性的创业公司,其最终的成功仍然有赖于快速增长和尝试的意愿。

雷锋网了解到,在伊梅尔特主政期间,通用电气发展不尽如人意,股价累计下跌30%。伊梅尔特还有竞争对手, Uber 董事会还在考虑另外两名不具名人士。虽然早些时候外界希望Uber考虑任命一名女性首席执行官——有助于平息一系列性骚扰丑闻,所有3名首席执行官候选人都是男性。

雷锋网