月度归档:2017年03月

百度IDL最新成果:从自然语言入手,教AI智能体像人类一样学习

尽管人工智能取得了巨大的进步,但在许多方面仍然存在局限。例如,在电脑游戏中,如果AI智能体未预先编程游戏规则,则必须尝试数百万次才能确定正确的选择。人类可以在更短的时间内完成相同的壮举,因为我们擅长通过使用语言将过去的知识转移到新的任务中。

在一个屠龙游戏中,AI智能体需要尝试许多其他的动作(对着墙或是花丛喷火),才能理解它必须杀死龙。然而,如果AI智能体理解语言,人类可以简单地使用语言来指示它:“杀死龙才能使游戏获胜”。

在人类如何概括技能并将其应用于新任务方面上,基于视觉的语言发挥着重要作用,这对于机器仍然是一个重大挑战。开发复杂的语言系统对于机器变得真正智能,并获得像人类一样学习的能力至关重要。

作为实现这一目标的第一步,百度IDL实验室开发了一个使用监督学习和强化学习的组合系统,允许虚拟教师向虚拟AI智能体教授语言,通过将语言与感知和动作连接起来,就像父母教他们的宝宝一样。

IDL实验室的结果表明,在训练结束后,AI智能体能够以自然的语言正确地解读老师的指令,并采取相应的行动。更重要的是,AI智能体开发了“zero-shot学习能力”,这意味着智能体能够理解潜在的语句,研究院发现,“这项研究使我们向教机器像人类一样学习迈进一步。”

论文链接:http://arxiv.org/abs/1703.09831

学习概况

雷锋网了解到,该研究在称为XWORLD的2D迷宫般的环境中进行,百度的虚拟智能体需要根据虚拟教师发出的自然语言命令进行导航。一开始,智能体对这种语言一无所知,每一个字都同等的没有任何意义。 然而,当它探索环境时,如果执行命令成功(或失败),老师会给出积极的(或消极的)回应。

为了帮助智能体学习得更快,老师还会在智能体导航时询问有关环境的简单问题。智能体需要正确的回答问题。通过鼓励正确的行动/答案,惩罚不正确的行动/回答,经过多次试验和错误,老师得以训练智能体去了解自然语言。

一些示例命令包括:

  • 请移动到苹果处。

  • 你可以移动到苹果和香蕉之间的网格吗?

  • 你能移动到红苹果处吗?

一些Q&A的例子:

  • 问:北方的物体是什么?答:一根香蕉。

  • 问:香蕉在哪里?答:北边。

  • 问:苹果西边物体的颜色是多少? 答:黄色

结果

最后,智能体能够正确地解释教师的命令并导航到正确的地方。更重要的是,智能体开发了研究团队的所谓的“zero-shot learning ability”,这意味着即使是以前没有看到的全新命令,如果有足够的以前看过的相似形式的句子,仍然能够正确的执行任务。换句话说,智能体能够以已知的方式(语法)理解用已知单词组合的新句子。

例如,一个学习如何用刀切一个苹果的人将会知道如何用刀切火龙果。将过去的知识应用于新任务对于人来说非常容易,但是对于目前的端到端学习机器来说仍然是困难的。

虽然机器可能知道“火龙果”的样子,但是除非它已经使用包含该命令的数据集进行了明确的训练,否则它无法执行“用刀切割火龙果”的任务。相比之下,我们的智能体表现出能够转移它所知道的关于火龙果的视觉外观,以及“用刀切”的任务,即使没有经过确切的的训练,仍然可以成功进行用“用刀切割龙果”的任务 。

下图展现了我们的智能体成功执行导航任务测试。

导航语句

请移动到卷心菜的西边。

请移动到无花果的东边。

识别语句

Q:东南边是什么?

A:西瓜。

导航测试

请移动到无花果的西边。

导航语句

你可以移动到椰子处吗?

你可以移动到苹果处吗?

导航测试

你可以移动到西瓜处吗?

雷锋网了解到,百度研究院的后续研究有两个方向:

  • 一个是在当前2D环境中用自然语言命令教授智能体更多的能力,

  • 另一个是将其迁移到虚拟3D环境。虚拟3D环境带来更多的挑战,而且更像是我们现实生活的环境。

而百度的最终目标,是让人类在现实环境中,采用自然语言来训练一个真正意义上的机器人。

via research.baidu ,雷锋网编译

雷锋网

自称中国的Zano,安果无人机在美国遭遇集体诉讼

安果无人机宣传片

雷锋网按:如果有人在2015年底的时候告诉你,他们研发出了一款掌上无人机,不仅可以一键起飞、降落,而且具备智能跟随和避障功能,更妙的是,通过手机端的App,还能像玩极品飞车那样,通过重力传感器,倾斜手机就可控制飞行方向。当然,价格只要988元人民币,请问你会支持吗?

2015年11月,创造了Kickstarter欧洲筹款记录的Zano无人机宣布倒闭。当时的Zano凭借着“掌上无人机”的概念,在2015年1月成功众筹了约360万美元,并承诺在夏季发货。但是到了10月份,不仅大部分人没有收到货,而且所有无人机都缺少宣传中提及的关键功能。

然而,就在1个月之后,一家位于深圳的中国公司又扛起了掌上无人机的大旗。这家名为盛祥科技的公司在2015年12月份的时候,推出了一款名为安果的掌飞自拍无人机,重125克,在功能上基本保持一致,并同时上线国内的京东众筹以及美国的Indiegogo。

雷锋网查询当时的众筹界面发现,安果无人机在京东和Indiegogo两大平台上众筹价分别为988元和259美元(按照当时的汇率,大约为1658元人民币),并分别募集到3,508,853元和3,516,801美元。

当时,盛祥科技的CTO Sam曾对雷锋网表示,Zano无人机失败的原因除了生产问题之外,其设计从一开始就是错的。如今,盛祥科技却因为Zano无人机,遭遇了大洋彼岸的集体诉讼。

本周一(3月27日),4名消费者在洛杉矶的联邦法院提起诉讼,指控盛祥科技以及加州的Acumen Robot Intelligence of Brea公司涉嫌欺诈,并准备联合其他有相同遭遇的消费者发起集体诉讼。

雷锋网翻看诉讼文件发现,这些消费者声称安果无人机并未具备此前宣传材料中承诺的功能,而且有些众筹者甚至并未收到最终的产品,并要求被告赔偿损失,并负担律师费用等。

  • 尽管被告接受了消费者的付款,但是安果无人机并不具备此前承诺的功能,而且有的消费者甚至没收到产品。

  • 被告的客服部门实际上不存在,针对安果F115的上百条投诉都无人回应。

  • 被告表示安果无人机搭载的是索尼1500像素的摄像头,但是其实际像素要低得多。而且宣传视频也并不是像声称的那样,是由安果无人机拍摄,而是利用其它搭载更高像素摄像头的无人机拍摄的。

  • 被告表示安果无人机的电池容量为800mAh,甚至1000mAh,但是实际并不是如此,其电池续航并未达到承诺的水平,而且不能充满电。

  • 安果无人机飞行的稳定性没有达到承诺的水平,而且螺旋桨的质量很差,非常容易折断。

  • 安果无人机宣传的GPS应用并不能正常工作,无人机不仅定位失败,而且不能像承诺的那样具备跟随功能。

让我们来看看安果无人机在Indiegogo上的介绍页面:

  • 1500万像素摄像头,可拍摄1080p@30FPS高清视频,可与iPhone 6S媲美

  • 第一款实现GPS导航的微型无人机

  • 利用内置红外传感器实现实时避障功能

  •  重量只有140克

  • 一键起飞,一键降落

  • 可配合安果App使用

  •  视频实时传输

  • 飞行时间长达15分钟

然而,安国无人机在京东众筹上介绍却不尽相同。首先,安果无人机在京东上称自己搭载的是iPhone同款1500万像素的摄像头,但是目前并没有一款iPhone手机搭载的是1500万像素的摄像头。其次,京东上 给出的参数显示,安果无人机的电池续航只有10分钟,并不是Indiegogo上的15分钟,但是电池容量都是1000mAh。这到底是文案的锅,还是翻译的锅?

据雷锋网了解,盛祥科技并不是一家初创公司,而是一家有着10年生产制造经验的生产研发一体化的深圳典型企业,虽然工厂不大,但出货量并不小,而且是沃尔沃、百思买等企业的直接供货商,包括行车记录仪、DV以及摄像机等。

Sam曾表示,盛祥科技从2013年就开始研发无人机,Zano的倒闭对公司影响很大,为了重新获取用户的信任,他们在登陆Indiegogo众筹之前,先在Facebook、Twitter等社交媒体上做好预热,通过发布测试图片和视频,向用户报道最新的进展,让用户相信他们是可以按时交货的。

然而如今来看,虽然有Zano的前车之鉴,但是安果却依然重蹈覆辙。不过,不同的地方在于,安果无人机的出货量要更多,也就是更多的众筹支持者最终收到了成品,当然,这可能要归功于盛祥可以以往的制造经验,以及深圳完善的无人机产业链优势。

然而,虽然盛祥科技在制造方面做的比Zano好,但是生产出来就算完成任务了吗?雷锋网在京东众筹界面发现了很多的众多投诉,其中一名用户@付***牛在留言区写道:

安果1代产品从拿到手开始,一共试飞过3次,平行距离都没有超过3米,高度没有超过1米,压根就没有飞起来,撞碎了附带的6支桨。现在充电器无法充电,如何解决?

据雷锋网了解,安果1代发布没多久,便收到大量的用户投诉,甚至这些用户还建立了一个名为“安果垃圾产品维权”的QQ群,群用户多达上百人。

Sam曾对雷锋网表示,Zano无人机提供的技术参数与它能实现的功能是不可能达到的,那么安果无人机呢?我们可以做一下对比,看看其他公司的小型无人机产品处在怎样一个水平:

可以发现,在无人机领域拥有技术积累的零度科技和大疆科技到目前为止发布的还只是可折叠无人机, 与安果掌飞无人机相比,零度的Dobby和大疆的Mavic Pro无论是体积,还是重量,都不占优势,而且售价也高得多。

当然,掌上无人机这个概念确实很吸引人,但是对于在无人机领域没有技术积累的盛祥科技来说,要想将这么多酷炫的功能装进如此小的机身里,困难从一开始就是注定了的。

安果无人机并不是孤例,比如此前雷锋网曾报道过的Lily无人机。这个昔日的明星初创公司,如今却正在接受刑事调查。

雷锋网联系到盛祥科技,其创始人徐攀表示自己早已于去年9月离开公司,而其销售人员则表示对此事不太清楚,其美国市场由美国分公司处理。

雷锋网

Google I/O 2017大会时间表出炉:安卓8.0时代来临

IT之家3月31日消息 虽然距离谷歌I/O 2017大会开幕还有一个多月的时间,但谷歌在今天已经悄悄放出大会时间表,首场会议将在美国时间5月17日上午十点在加州举办,所有会议议程将在谷歌I/O官网上公布。

在本次会议当中,Android O操作系统应该为最大的亮点,除此之外谷歌新款开发者手机Pixel 2也有望出现在会议当中,从行程表上的分类我们也能看到此次I/O 主题共会有Accessibility、Ads、Android 、Assistant、Design、Firebase、IoT、机器学习、Mobile Web、Play、Search 与VR这些主题,让许多对Google服务与功能有兴趣的朋友,能够依照自己关心的主题来挑选关注。

对于Android O预览版系统,IT之家已经发布了多篇上手体验,谷歌本次着重优化了系统背景后台限制功能,安卓O将自动智能限制后台应用活动,改善了后台的APP驻留机制,索尼LDAC音质标准的加入使得无线音乐音质也有所提升。

关于谷歌Pixel2,目前尚未有太多消息,不过对于高配版本应该会搭载骁龙835,在价格方面也是高端水准。

相关阅读:

Android O(安卓8.0)预览版详尽体验:优化尚未完全,谷歌仍需努力

谷歌Android O(安卓8.0)预览版体验:索法加持,音质赞

IT之家

未经许可传播韩寒作品,豌豆荚被诉侵犯著作权

3月31日下午消息,海淀法院官网发布案件快报称,日前,海淀法院受理了原告杭州果麦文化传媒有限公司诉北京卓易讯畅科技有限公司侵犯作品信息网络传播权纠纷共14案。

原告果麦公司诉称,其经韩寒授权,享有韩寒多部作品的信息网络传播权。其发现,在未经其许可的情况下,卓易讯畅公司运营的“豌豆荚”软件向用户提供涉案韩寒作品的手机应用下载服务,用户在下载应用软件并在手机安装后就可阅读相应的韩寒作品。其认为卓易讯畅公司的行为侵害了其对涉案韩寒作品依法享有的信息网络传播权,给其造成了经济损失,故诉至法院,请求判令卓易讯畅公司停止侵权行为、每案赔偿经济损失及合理支出5万元。

目前,此批案件正在进一步审理中。

IT之家

补天白帽大会:无处不在的无线电攻击

3月30日,首个面向全球白帽和技术精英开放的、专注于漏洞响应和防护的全球性安全行业大会——补天白帽大会在深圳举行,360无线电安全研究部负责人杨卿发表主题演讲,并分享了在无线攻防领域的主要研究成果。

360无线电安全研究部负责人杨卿

杨卿表示,“一张门禁卡、一把无线钥匙、一个无线遥控器、一部手机、一辆汽车、一台无线呼吸监测仪、一架飞机、甚至一辆坦克、一颗卫星。只要我们的攻击对象使用了无线介质进行数据交互,那么这条无线链路就有可能被监听、解密、重放、欺骗、劫持甚至被入侵被控制。看似不可能直接接触的目标,往往在无线通信层,攻击会变得如此直接。”

2015年的315晚会上的WiFi绵阳墙安全演示系统,告诉我们在公共场所使用公共WiFi会面临很多的安全风险,个人的照片、短信、电话等会被黑客窃取。杨卿谈到,由于当时315晚会是现场直播,我们会做一些技术处理,但在我们的实际的产品研发中,这个钓鱼网络是可以分析手机在运行过程中的所有应用程序。

这是个人用户面临的WiFi风险,现在很多的小型企业在日常办公也会用到WiFi,但是由于密码设置过于简单,这对于企业来说是很大的安全威胁。现在很多利用无线发动网络攻击的黑客在攻击企业时往往不会通过企业网站再转到内网,而是黑客很可能到企业办公室周边通过笔记本或是手机在企业内部扫描一些安全程度不高的WiFi,如果连接成功就等于是处在企业的内容了。如果企业内网的管控不严格,那这个时候企业的内部是很脆弱的。

在今年的315晚会上,有手机加油站被黑客植入恶意程序,如果用户在这些公共场所使用了这些公共充电器,那就会被恶意软件盯上,轻者可能是会给用户推荐一些广告的APP,严重的很可能会直接被植入恶意代码。因此,建议大家最好是用自己的充电器、充电宝。

杨卿接着又介绍了RFID、NFC、GPS、LTE这些无线技术,并通过具体的案例分析了这些无线技术存在的安全风险。在传统的无线安全之外,更多的“无线”安全进入人们的视野和生活,我们已无法视而不见。

杨卿表示,无外不在的无线电攻击,这需要安全从业者必须要具备在该领域安全的架构设计及风险评估的能力,更是需要更加全面的知识能力储备,希望有更多的安全爱好者能够加入这个行业,一起在这一领域耕耘。

雷锋网

揭开Faiss的面纱 探究Facebook相似性搜索工具的原理

本月初雷锋网报道,Facebook 开源了 AI 相似性搜索工具 Faiss。而在一个月之后的今天,Facebook 发布了对 Faiss 的官方原理介绍。

它是一个能使开发者快速搜索相似多媒体文件的算法库。而该领域一直是传统的搜索引擎的短板。借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search),比此前的最前沿技术快 8.5 倍,并创造出迄今为止学术圈所见最快的、运行于 GPU 的 k-selection 算法。Facebook 人工智能实验室(FAIR) 借此创造了数个世界纪录,包括在十亿高维矢量上的构建的、世界最快的 k-nearest-neighbor 图。

相似性搜索的本质

传统数据库由包含符号信息的结构表组成。比方说,一个图像集,会用每行放一张索引照片的列表来表示。每一行都包含诸如图像标识和描述语句等信息。每一行也可与其他表格的条目关联,比如照片与人名列表相关联。

雷锋网获知,很多AI 工具都会产生高维矢量,比如像 word2vec 这样的文本嵌入工具,以及用深度学习训练的 CNN 描述符(descriptors)。这些表示比固定的符号表示更加强大灵活,至于原因,本文将为大家解释。但是,用 SQL 来检索的传统数据库并没有适配这些新型表示。首先,海量的新多媒体流创造了数十亿的矢量。其次,而且更重要的是,找到相似的相似的条目意味着找到相近的高维矢量。而对于当下的标准检索语言,这是极度低效、甚至无法实现的。

如何使用矢量表示?

让我们假设你有一张某建筑的影像,比方说某城市的礼堂照片,但你忘记这是哪一个城市的了。然后,你希望找到图片库中该建筑的所有照片。该情况下,SQL 中常用的 key/value 检索并没有帮助——因为你已经忘了这是哪个城市。

这就轮到相似性搜索派上用场。由于设计,图像的矢量表示会对相似图像生成相近的矢量。在这里,相近矢量被定义为在欧几里得空间相邻的矢量。

另一项矢量表示的应用是分类。想象下你需要一个分类器,来判别图片库中哪一个图片代表了菊花。分类器的训练是一个开发者们都比较熟悉的过程:算法把菊花和非菊花的图像作为输入。若果分类器是线性的,它会输出一个分类矢量,后者带有一项重要属性:它的向量点积(Dot Product)和图像矢量在一起,能反映出该图像包含菊花的概率。然后对向量点积和图片库中的所有条目进行计算。最后 return 有最高概率值的图像。这种检索是一种“最大内积”搜索。

所以,对于相似性搜索和分类,我们需要以下操作:

  • 给定检索矢量,return 在欧几里得距离上最接近这个矢量的数据库对象列表。

  • 给定检索矢量,return 有最高向量点积的数据库对象列表。

一个额外的挑战,是 Facebook 想要在一个大尺度上执行这些操作。这里,“大尺度”指的是数十亿的矢量。

软件包

现有的软件工具,不足以完成上述数据库搜索操作。传统的 SQL 数据库系统可用性不高,因为它们是为 hash-based searches 或 1D interval searches 而优化。OpenCV 等工具包里包含的相似性搜索功能,在扩展性上的限制非常大。针对“小”数据集的相似性搜索算法库也是这么个情况(比如,一百万个矢量)。其他工具包大多是学术研究的产物,为发表的论文而开发,用来在特定设定下展示效果。

Faiss 是一个打破上述限制的算法库。它的优点有:

  • 提供数个相似性搜索方法。这些方法针对不同使用情况,提供了跨度很大的功能取舍。

  • 为内存的使用和速度而优化。

  • 为相关索引方法提供了最前沿的 GPU 执行方案。

相似性搜索评估

一旦这些矢量被学习机提取出来(从图像、视频、文本文件或其他渠道),它们就已经可以被输入进相似性搜索库。

Facebook 有一个作为参照的“暴力”算法——它会完整地照章计算所有的相似性,然后 return 最相似元素的列表。这提供了一个黄金结果参照列表。值得注意的是,高效得执行该暴力算法不容易实现,而且经常影响系统其它部分的效果。

如果我们愿意牺牲一部分精确度,相似性搜索的速度可以有数个数量级的提升。当然,这会导致相对参照结果的一点偏移。举个例子,对图像相似性搜索的第一和第二个结果进行交换,或许不会有什么区别,因为它们很可能都是某个给定检索的正确答案。加速搜索意味着要对数据集进行一些预处理,Facebook 把这成为索引。

这使 Facebook 确定了三大研究方向:

  • 速度。找到十个最相似的矢量需要多久?希望花费的时间比暴力算法要少。不然的话,索引就没有任何意义。

  • 内存使用。该方法需要多少 RAM?比原始矢量多还是少? Faiss 只支持在 RAM 上搜索,因为其他磁盘数据库的速度要慢数个数量级。即便是 SSD 也太慢。

  • 精确度。返回的结果列表与暴力搜索结果差多少?精确度能通过计算检索数量,在结果列表中先返回最邻近单位评估;或是衡量 10 个最先返回的最邻近单位的平均 fraction (该方法被称之为 10-intersection)。

Facebook 一般会衡量在给定内存使用情况下,速度和精确度之间的权衡。Faiss 专注于压缩原始矢量的方法,因为它们是扩展到十亿级矢量数据集的唯一途径。当需要索引的矢量有十亿个之多,每一个会占用 32 左右的字节,这些矢量会占用极大的内存空间。

许多索引算法库针对的是百万左右的矢量,Facebook 的工程师们把这成为小规模。举个例子,nmslib 就包含这方面极其高效的算法,它比 Faiss 更快但是会占用远远更多的内存空间。

十亿个矢量的评估

工程世界中,并没有针对这个大小数据集的基准。因此,Facebook 基于研究结果进行评估。

精确度在 Deep1B 上进行评估,它是包含十亿张图片的图像库。每一个图像都已经被 CNN 处理过,CNN 中的其中一个 activation map,会被作为图像 描述符(descriptor)。这些矢量可以与欧几里得距离进行比较,来量化这些图像之间的相似度。

Deep1B 包含一个比较小的检索图像库。真实的相似性搜索结果,由处理了这些图像的暴力算法提供。因此,如果我们运行一个搜索算法,我们就可以评估结果中的 1-recall@1。

选择索引

由于评估,我们把内存使用限制在 30 GB。该内存限制指导我们进行索引方法和参数的选择。在 FAISS,索引方法用字符串来表示;在这个例子中是OPQ20_80,IMI2x14,PQ20。

该字符串代表了应用于矢量的预处理步骤 (OPQ20_80) 。一个 selection mechanism (IMI2x14) 来指示数据库应该如何被分割,以及一个编码部分(encoding component PQ20)来指示用 product quantizer (PQ) 编码的矢量,生成 20 字节的代码。因此,内存的占用(包括了 overheads)在 30GB 以下。

这听起来太技术流,因此 Faiss 的文件会向开发者提供指导:如何根据需要选择最恰当的索引类型。

索引类型确定之后,就可以开始索引。FAISS 算法库对这十亿个矢量进行处理,并把他们放入索引。索引能够存在硬盘,或者立即使用,对索引的搜索、additions/removals 可被交错插入。

在索引中搜索

当索引就绪后,一系列 search-time 的参数可设为针对此方法进行调整。由于评估需要,我们用单线程进行搜索。由于内存占用已经被限制住,我们需要在精确度和搜索时间之间进行权衡、优化。举个例子,这意味着能对 1-recall@1 40% 的最不可能搜索时间设置参数。

幸运的是,Faiss 配有自动调参机制,能扫描参数空间,并对提供了最佳操作点(operating points)的那些进行。这意味着给定精确度情况下的最优潜在搜索时间,或者反过来,给定搜索时间的最优精确度。在 Deep1B 上,操作点可用折线图的形式进行可视化。

这幅图上,我们可读出,获取 40% 的 1-recall@1,有少于每矢量 2 ms的检索时间。如果把检索时间放宽到 0.5 ms,我们可以达到 30%。2 ms 的检索时间,意味着单核的 500 QPS(queries per second )。

若把该结果与圈内最先进的研究相比,即 Babenko 和 Lempitsky 在 CVPR 2016 上发表的论文:“Efficient Indexing of Billion-Scale Datasets of Deep Descriptors”。该论文介绍了 Deep1B 数据集。但他们需要 20 ms 来获取 45% 的 1-recall@1。

用 GPU 处理十亿级数据集

当前,许多研究努力集中于 GPU 的执行上。在原生多 GPU 支持下,这能够产生相当不错的单机性能。GPU 执行可被看做是对应 CPU 的替代,你其实不需要理解 CUDA API 来挖掘 GPU 的性能。 Faiss 支持所有 2012 年之后发布的英伟达显卡(开普勒,计算能力 3.5+)。

我们希望把 roofline model 作为指南,它指出开发者应尽量使内存带宽或者浮点单位饱和。Faiss 单 GPU 的速度一般比 CPU 快五到十倍。新的帕斯卡架构 GPU 硬件,比如英伟达 P100,使之快了 20 倍有余。

一些展示性能的数字:

  • 合适的索引,一个简单暴力的 k-nearest-neighbor 图(k = 10),基于 YFCC100M 数据集中 9500 万图像的128D CNN 描述符,0.8 的 10-intersection,用四路上代泰坦(Maxwell  Titan X)只需要 35 分钟即可建成,包含索引创建时间。

  • 十亿矢量的 k-nearest-neighbor 图已经即将成为现实。开发者可以在 Deep1B 数据集上创建强力的 k-nearest-neighbor 图(k = 10),0.65 的 10-intersection,在四路 Maxwell 泰坦支援下需要 12 个小时。若是 0.8 的 10-intersection,八路帕斯卡 P100-PCIe GPU,也是 12 个小时。更低质量的图可在五小时内用泰坦创建完成。

  • 其他部分也达到了惊人性能。比方说,创建上述 Deep1B 索引需要 6710 万 120-dim 矢量,用 k-means 聚类生成 262,144 个几何中心。这在 25 E-M 次迭代下,需要四路泰坦 (12.6 tflop/s of compute) 花 139 分钟进行处理。注意聚类的训练集不需要与 GPU 显存匹配,因为数据是按需即时导入 GPU 的,而不会影响性能。

底层技术

雷锋网获知,FAIR(Facebook 人工智能实验室) 自 2015 年着手开发 Faiss。这是建立在过去的许多研究结论和大量技术攻关的基础上。对于 Faiss,Facebook 选择专注于对几项基础技术进行优化。尤其在 CPU 方面,Facebook 大量利用了:

  • 多线程以充分利用多核性能并在多路 GPU 上进行并行搜索。

  • BLAS 算法库通过 matrix/matrix 乘法进行高效、精确的距离计算。没有 BLAS,高效的强力执行很难达到最优状态。 BLAS/LAPACK 是唯一一个 Faiss 必须的前提软件。

  • 机器 SIMD 矢量化和 popcount 被用于加速孤立矢量的距离计算。

在 GPU 方面

对于从前的相似性搜索 GPU 执行,k-selection(寻找 k-minimum 或 maximum 因子)一直存在性能问题。这是因为普通的 CPU 算法(比如 heap selection)并不适用于 GPU。对于 Faiss GPU,Facebook 设计了学术圈迄今为止最快的小型 k-selection 算法(k <= 1024)。所有中间状态都完全保存在寄存器中,进一步提升了速度。它能够将输入数据以 single pass 进行  k-select,运行于潜在峰值性能的 55%,取决于峰值 GPU 显存带宽。由于其状态只存储在注册表中,并可与其他 kernels 融合,使它成为超级快的 exact 和 approximate 搜索引擎。

研究领域的许多注意力被放到了高效的 tiling 策略,和面向 approximate 搜索的 kernels 执行。多 GPU 支持用过粉碎或复制数据来提供。开发者并不会受单 GPU 显存大小的限制。半精度浮点支持  (float16) 也有提供,可在支持的 GPU 上进行完整 float16 运算,或者更早 GPU 架构所提供的的中级 float16 存储。我们发现 float16  这样的编码矢量能在几乎不损失精度的前提下进行加速。

简而言之,持续的 overhead 因素会在执行中起到作用。Faiss 做了许多关注工程细节的痛苦工作。

上手 Faiss

Faiss 用 C++ 实现,支持 Python。想要上手的各位,请到 GitHub 获取 Faiss,进行编译,然后把 Faiss 模块导入到 Python。Faiss 与 numpy 能做到完美的整合,包括需借助 numpy 阵列来实现的所有功能 (in float32)。

GitHub 地址:https://github.com/facebookresearch/faiss

详情请访问:https://code.facebook.com/posts/1373769912645926/faiss-a-library-for-efficient-similarity-search/

via facebook

雷锋网

Verizon宣布商用LTE Cat-M1网络,每月只要2美元

雷锋网最新消息,今日早上美国第一大运营商Verizon宣布将推出第一个大规模商用的LTE Cat-M1网络,而该网络将主要用于物联网企业的无线接入解决方案。

据了解,Verizon的Cat-M1网络建立在一个虚拟化的云环境,能帮助开发人员和物联网企业实现快速和灵活地部署物联网解决方案。在此之前,Verizon还部署了全球第一个4G LTE、LTE Cat1网络,现在推出的LTE Cat-M1将主打低功耗,可以应用于水表以及消费类电子产品等产品当中。

该消息宣布后,Verizon网络副总裁Mike Haberman表示,“现在物联网解决方案已经从CDMA演进到了基于云的LTE技术,我们必须满足客户的需求。”

Cat-M1芯片组拥有低带宽、低速率以及低功耗等特性。据介绍,一款Cat-M1设备连接到Verizon的无线网络上成本也可以大幅降低,预计每台设备每月低至2美元。

这是物联网两大窄带物联网通信技术的对比,来源网络

雷锋网还了解到,目前,Verizon Cat-M1网络的合作伙伴包括Sequans,Telit,U-Blox,Sierra Wireless,金雅拓,高通和Altair等。而且,Verizon已经联手这些厂商推出了基于Cat-M1网络的认证芯片组、模块和设备。

Verizon业务产品和IoT高级副总裁Mike Lanman对此表示,“基于Cat-M1网络的物联网解决方案比当前方案具有更高的功效和更长的时间电池寿命,而Verizon的Cat-M1网络将覆盖全美地区。”

据公开资料显示,Verizon团队目前拥有160900人,2016年营收近1,260亿美元。 

雷锋网

华为2016年报 :营收5216亿元,运营商业务收入占比过半

雷锋网消息,华为今日公布了2016年年报,报告显示,华为全球销售收入达到了5216亿元,同比增长32%,净利润371亿元,同比增长0.4%。其中运营商业务收入2906亿元,占全球收入的55.7%,同比增长24%;企业业务领域收入407亿元,同比增长47%;智能手机收入1798亿元,同比增长44%。

据报道,华为运营商、企业、终端三大业务在2015年的基础上稳健增长,实现全球销售收入5216亿元,同比增长32%,净利润371亿元,同比增长0.4%。

据年报显示,2016年,华为研发投入达763.91亿元(110亿美元),占到整体收入的14.6%;过去十年,累计投入3130亿元(450.7亿美元)进行研发创新,18万员工中研发人员占比高达45%;通过全球15个研究院/所、36个联合创新中心,在全球范围内开展创新合作,共同推动技术的进步。

年报发布后,华为轮值CEO徐直军表示:

2016年华为聚焦战略,实现了稳健增长。随着人类对数字世界的探索不断取得突破,数字化和智能化进程为各行业带来了巨大的商业机遇,也为ICT行业开辟了新增长之路。华为将继续坚持以客户为中心,使能行业数字化转型,为客户创造价值,实现有质量的增长。

在2016年全球销售收入中,华为在运营商业务、企业业务和消费者业务三大板块均实现了较大步伐的增长:

在运营商业务领域,华为2016年收入占全球销售收入的55.7%。华为围绕数字化转型,抓住云、视频、物联网、运营转型等机会,实现销售收入2906亿元人民币,同比增长24%;

在企业业务领域,华为聚焦ICT基础设施,与合作伙伴一起助力公共安全与政务、金融、能源等重点行业数字化转型,实现销售收入407亿元人民币,同比增长47%;

消费者业务全年智能手机发货量达到1.39亿台,销售收入1798亿元人民币,同比增长44%。

华为首席财务官孟晚舟指出:“2017年,华为将不断提升公司运营效率,提升经营质量,实现稳健发展。”

雷锋网

王永利:劣币驱逐良币对智能投顾行业产生破坏性风险

雷锋网消息,日前全球共享金融100人论坛•湘湖峰会于杭州举行,峰会聚焦于“共享视角下的金融科技与智能投顾”。原中国银行副行长、乐视金融CEO王永利围绕大会主题,分享了其一些思考。他认为智能投顾正日益成为金融科技领域的重要亮点,但是智能投顾的风险依然不可忽视,需要监管的力量护航。

以下是演讲实录,雷锋网作了不改变原意的编辑。

智能投顾的风险不可忽视

我们可以预见的是,智能投顾将引领资产管理的数字化时代。但作为一个新兴领域,也会带来一些风险。

第一,技术风险。算法和模型是智能投顾产品的核心。模型给出的投资策略是否与客户风险偏好相匹配,这是衡量智能投顾产品的重要条件。模型需要训练和验证,需要对样本数据的模拟不断地学习、记忆,并修正算法。

但智能投顾技术至少还存在以下两个方面的潜在风险:

  • 第一是由于样本是历史数据,当出现“黑天鹅”事件时,机器学习和自然语言处理可能会失效。人工系统中并未载入类似的事件和后果,也无法从历史中学习到相关模式的处理方案。

  • 第二是样本也会“说谎”。机器学习擅长发现数据间的相互关系,而并非因果关系。这将造成误判,从而给投资者带来损失。

因此,目前人工智能处于初级阶段,在投资顾问领域的应用更是一个新兴事物。智能投顾要达到预期的效果,还需要不断地积累数据,提升数据分析能力,算法和模型的效果也需要在较长周期内进行检验。

第二,劣币驱逐良币机制可能对整个行业带来一些破坏性的风险。

当前,智能投顾的概念和业务正在兴起,但缺乏足够的历史数据,对其算法的效果进行验证的情况下,也难免有一些不具备技术能力的理财平台以智能投顾为噱头,仅对用户进行简单的风险偏好测试。根据用户偏好推荐相应的理财产品,这样的行为更多地属于一些分散式投资,并未实现用数据算法优化投资模型。最终可能会使用户受损。

此外,智能投顾平台的从业人员的从业收入既来自于咨询费用,也来自于基金等销售的佣金,这就混淆了投资咨询与产品销售之间的界限。也为部分平台以投资顾问为幌子吸引用户,以销售自身产品为目的,提供了激励的动机。投资建议的独立性和客观性难以保证。

智能投顾的发展需要监管护航

由于我国智能投顾目前还处于初级发展阶段,监管上还尚未明确出台针对智能投顾的监管条例,形成监管的空白。主要表现在以下两个方面:

第一个方面,智能投顾的业务范围尚不明确。一般而言,智能投顾本质上还是投资顾问,所以,应受到《证券投资顾问业务暂行条例》以及《中华人民共和国证券法》的约束。根据规定,投资顾问仅能提供投资建议,不得代客交易,因此智能投顾的服务将仅限于基于算法的资产配置建议,公司不能以机构为主体在二级市场上直接交易,智能以门槛较低的公募基金等作为资产配置的主要标的,这些方面还需要明确。

第二个方面,智能投顾的牌照资质要求不清晰。智能投顾的投资建议一般都是涉及到股票、基金、保险等各种金融产品的分散化投资组合,这就涉及到各类产品的销售资质。目前我国尚未有法律对智能投顾的牌照和资质提出明确的规定。

未来智能投顾平台可能涉及到证券投资咨询牌照、公募基金牌照、基金销售牌照、私募基金备案等等。根据《账户管理业务规则征求意见稿》,取得证券投资咨询业务资格的证券投资咨询公司需要取得账户管理资质,接受客户的委托,才能就证券、基金、期货及相关金融产品的投资或交易作出价值分析和投资判断。代理客户执行账户投资或交易管理,账户管理资质的取得目前是要求公司注册资本不低于5000万人民币,这将成为智能投顾公司竞争的一个重要的影响因素。

由于监管层对智能投顾这类数字化资产配置业务的监管还比较模糊,使得部分企业打着“数字化资产配置”的旗号,突破了原有监管体系,也带来了一些经营风险和道德风险,并会对智能投顾业务的发展带来破坏性的声誉风险。因此,建议监管层加强智能投顾的研究,尽快出台有效地管理规范,实施有效的监管。同时,也呼吁行业加强自律,尽快形成智能投顾方面的一些标准。

总之,对智能投顾既要积极探索,认真研究,又要理性对待,健康发展,这需要实务工作者、理论工作者和监管部门的共同参与。

雷锋网将持续报道全球共享金融100人论坛精华内容,敬请关注!

雷锋网

Oculus 联合创始人 Palmer Luckey 离开 Facebook

雷锋网消息,Oculus 联合创始人 Palmer Luckey(人称帕胖),Rift VR 头盔最初原型的开发者,在把公司卖给 Facebook 后选择离开。

根据 Oculus 的声明,本周就将是他在 Facebook 工作的最后一周。声明中这样写道:

Palmer 将被大家记住。他的遗产远远超越了 Oculus。他的发明精神推动帮助开启了这场现代 VR 的革命,并推动了这个产业的建立。我们对他为 Oculus 和VR 所做的一切非常感激,并附以最美好的祝愿。

对于帕胖是否是自愿离开的,外媒 UploadVR 询问了Facebook,但后者不愿置评。

最近,Oculus 刚刚庆祝了 Rift 上市一周年,推出大量内容优惠。而开启这个一周年的,正是去年的这个时候,帕胖亲自为阿拉斯加的一位用户送出 Oculus Rift。

仅仅一年时间,胖帕从一个 VR 行业的鼻祖的外界形象,四处露面站台,社交媒体也很活跃,到去年美国大选期间,选择在公众面前消失,后面只在法庭上出现过一次。

这个转变都是从去年 9 月的一次事件开始的。根据雷锋网当时的报道,当时,美国新闻网站The Daily Beast报道,Palmer Luckey 原来在秘密投钱给一个非官方的特朗普支持团体,后者在互联网上制作传播损希拉里的帖子和流行图片(memes)。该团体名为Nimble America,是特朗普(Donald Trump)的拥趸。团体在 Reddit 上贴出过一些白人至上的种族主义帖子。

当时这件事引发了巨大的争议,配合之前 Oculus 封杀 Revive,以及一些游戏独占策略,引发许多VR粉丝对 Oculus 的不满(主要是在美国)。

后来帕胖在 Facebook 上发表声明,对这件事进行了解释,表示自己是一个自由意志主义者(Libertarian),Reddit 上 NimbleRichMan 发的帖子不是我写的,自己也不是 Nimble America 的成员,这项捐赠不代表 Oculus。

他在 Twitter 上转发了Facebook的这条链接后就一直没有露面或是更新 Twitter 了,直到今年1月,Facebook 和 ZeniMax 打官司时,才再次出现在法庭上做证。

ZeniMax 与 Oculus 间的技术专利纠纷从2014年起一直未能尘埃落定。今年年初,这起诉讼终于进入庭审阶段。

雷锋网报道,2月1日,达拉斯法院公布了 ZeniMax 状告 Oculus 知识产权剽窃的判决结果,法院认为 Oculus 并未在Rift 头盔上盗用 ZeniMax 的知识产权,但前者包括 Palmer Luckey 在内的多名高管涉嫌违反保密协议,因此总共被判处5亿美金的赔偿。

VR 人都会记住他

2012年,通过一次非常成功的 Kickstarter 众筹,Oculus 重新激发了大众对虚拟现实的热情,并在后来促使 Facebook 用 30亿美元(后曝出还有 10 亿美元的额外花费)收购了这家公司,开启了这波VR浪潮。

“我们做的很多东西都不由我们发明的,”帕胖有次说道。“它们是由其他人发明的,而我们恰好有幸处在一个正确的时间点将其实现。”

关于帕胖离开 Facebook,也许从他被曝支持 Nimble America 那一刻起就已经埋下种子。但政治上的立场之外,怕胖以及其他联合创始人在推动这一波 VR 浪潮方面起的作用没有人会否认。

雷锋网