月度归档:2018年05月

Google-CH上线国内搜索功能?谷歌:这谁?

5月21日上午,有微博网友爆料Google-CH(www.google-ch.com)在中国上线搜索功能。一票媒体纷纷跟帖:谷歌回来了,谷歌或正筹备重返中国战略……

不过随后就被打脸,Google-CH不是谷歌官方的。

点击页面上关于Google-CH的条款可以清楚看到:

Google-CH项目是一个由Google Fans建立的,旨在帮助中国用户可以在大陆使用的Google项目。
和美国Google没有关系。
Google-ch根据中国大陆国情,会进行关键字过滤,以适应当地法律法规。

雷锋网编辑尝试打开www.google-ch.com,但未能打开页面。不少网友也出现了这种状况,表示今早还能访问,但现在已打不开了。

有业界人士表示,“Google-CH搜索功能开放后,访问量过大导致搜索挂掉了。Google-CH项目做起来需要太多的服务器资源,不是google fans能承担得起的。”

所谓的谷歌回归不过是一场乌龙,吃瓜群众:散了散了。

雷锋网

重推AR导航应用,斑马说要做一家虚实融合的公司

“一直有很多人问,施老师(施雪松)不做 CEO 是不是就离开斑马了,技术委员会主席是不是只是一个挂名,要再说一遍,我们真的是有技术委员会的。”这周,斑马网络媒体沟通会开始前的间隙,赶在媒体发问之前,市场负责人率先完成了铺垫。

随后,从 CEO 职位转向斑马技术委员会主席兼首席科学家的施雪松与斑马网络副总裁周平先后出现,向媒体解释了他们的最新成果。

4 月 23 日,上汽发布了荣威纯电动 SUV Marvel X,除了一系列常规车辆参数之外,这款将于今年 9 月交付的新车被官方重点推介的一项功能便是 AR 导航应用 AR-Driving,这是斑马过去两年半时间内规划的核心产品,也是此次两位技术负责人介绍的重点。

AR 导航当然不止斑马一家在做,据雷锋网了解,日本 Pioneer 公司 2012 年便开始推介自己的 AR-HUD 后装产品,百度地图在 2016 年上线了 AR 导航功能,2017 年年底,英国公司 Blippar 也发布了由苹果地图支持的 AR 导航应用,但在汽车前装量产交付上,斑马和上汽还是开了先例。

这里不得不提到另一家参与其中的重要公司——WayRay。WayRay 主要有全息 AR 汽车导航仪 Navion 和行车习惯记录仪 Element 两款产品,其中,Navion 便是一款可将导航信息、行驶速度、安全提示等信息以全息影像形式投射在挡风玻璃上的 HUD。

2015 年,施雪松“发现” WayRay 之后,便希望将其技术与斑马的业务结合,在 AR 导航领域深入布局。之后,其向阿里推荐了这家瑞士 AR 汽车导航公司,2017 年 3 月,阿里领投了后者 1800 万美元的 B 轮融资,信息发布的同时,斑马与 WayRay 在车载导航和信息娱乐系统方面的研发合作也随之披露,AR-Driving 便是两家合作后兑现的首款应用。

Marvel X 里 AR-Driving 的载体是一个 AR 仪表,并不额外增加车辆硬件成本,它是用摄像机摄取识别车道线、红绿灯、转向标识等交通实景,并进行标注强化后形成的实景导航,这需要可靠的投影技术,也需要涵盖地图、高精定位、车辆本身数据的 AR 算法支持。

   

AR-Driving 导航功能演示

具体来说,WayRay 主要负责激光投射全息技术,而在斑马一边,则是通过“自主研发的虚实融合算法,将定位、地图、机器视觉等数据进行融合计算,还原道路真实场景,从而实现车道级导航、高精度定位、相对坐标实时校正等自动驾驶所必须具备的高环境感知能力。”所以,虽说是斑马与 WayRay 扛起了重任,其产品功能的实现也离不开高德地图、AliOS 等阿里底层技术和数据的支撑。而 AR 导航在完成车辆数据、云端数据与真实场景的叠加、比对,完成真实数据沉淀之后,也可实现对自动驾驶算法和高精地图的反哺。

据施雪松介绍,AR-Driving 在不久后也将完成到 AR-HUD 的产品迭代,其将尽可能将包括停车场、电影院、餐厅等在内的出行服务信息集约投射在屏幕上,帮助驾驶员完成更高效率的安全驾驶。而在 AR-HUD 的后方,斑马也在构建一个从车到云端的一体化框架,进行动态交通信息的实时共享。

AR 导航是斑马下一步的重点战略,而聚焦这款产品的研发团队也已经扩张到 100 多人,内部人员甚至将其称之为“第一辆互联网汽车之后的又一个新开始”。而在周平的口中,斑马的定位也变成了“一家数据驱动、虚实融合的公司”。

从斑马来说,上汽是其投资方,也是其产品落地的最大载体,目前,上汽的互联网汽车用户已经超过 60 万。另外,从近期业务进程来说,斑马也在更多开拓上汽之外的出行市场,2017 年 12 月,阿里与福特达成智能网联方面的合作,上个月的北京车展上,斑马和东风雪铁龙还展出了首款搭载斑马智行的合资车型东风雪铁龙云逸 SUV。

如施雪松所说,无人驾驶需要的是人、车、路的协同,通过车辆视觉系统捕捉交通环境,“把整个交通网的节点汇聚起来”,实现云端协同。其也承认,AR-HUD 本身并不具备绝对技术壁垒,更多是依赖大量传感器数据、消费数据构建的出行体系,“如果没有大的数据资源在后面,就什么都没有,最后的竞争还是体系和数据。” 而对斑马来说,早跨出一步,就赢得一步的先机。

雷锋网注:6 项会员专享特权,全年 100 期精华内容,带你深入浅出看懂自动驾驶。如果想加入雷锋网「新智驾会员计划」,欢迎点击链接 :https://www.leiphone.com/aidrive/vip 或扫描海报下方二维码了解详情。

雷锋网

CVPR 2018 中国论文分享会之 「GAN 与合成」

雷锋网 AI 科技评论按:2018 年 5 月 11 日,由微软亚洲研究院、清华大学媒体与网络技术教育部-微软重点实验室、商汤科技、中国计算机学会计算机视觉专委会、中国图象图形学会视觉大数据专委会合作举办了 CVPR 2018 中国论文宣讲研讨会,数十位 CVPR 2018 收录论文的作者在此论坛中分享其最新研究和技术观点。研讨会共包含了 6 个 session(共 22 个报告),1 个论坛,以及 20 多个 posters,AI 科技评论将为您详细报道。

雷锋网注:全球计算机视觉顶级会议 IEEE CVPR 2018 将于 6 月 18 – 22 日在美国盐湖城召开。据 CVPR 官网显示,今年大会有超过 3300 篇论文投稿,其中录取 979 篇;相比去年 783 篇论文,今年增长了近 25%。

更多报道请参看雷锋网更多报道:

Session 1:GAN and Synthesis

Session 2: Deep Learning

Session 3: Person Re-Identification and Tracking

Session 4: Vision and Language

Session 5: Segmentation, Detection

Session 6: Human, Face and 3D Shape

本文为 Session 1,报告论文主要以使用 GAN 方法和生成方法为主,共有四场论文报道。

在第一个报告中,北京大学刘家瑛副教授介绍他们团队使用 Attentive GAN 从单幅图像中去除雨滴的工作;第二个报告由来自中科院自动化所的胡一博博士介绍他们通过 CAPG-GAN 算法实现人脸旋转任意角度的工作;随后是由北京大学连宙辉副教授介绍了他们提出的交互式纹理变换的通用框架;最后由来自微软亚洲研究院的傅建龙研究员介绍了他们提出的基于instance-level的 DA-GAN(深度注意生成对抗网络),该网络在图像到图像翻译中能够实现更精细的生成结果。

1、如何从单张图片中去除雨滴?

论文:Attentive Generative Adversarial Network for Raindrop Removal from A Single Image

报告人:刘家瑛,北京大学

论文下载地址:https://arxiv.org/abs/1711.10098

去除图片中的雨痕,一般有四种情景,如下图所示,分别为:落下的雨滴(Rain Drop 1),落在镜头上的雨滴(Rain Drop 2),雨线(Rain Streak),以及雨雾(Mist)。

刘家瑛团队在去年 CVPR 中曾发表过一篇关于去除雨痕的文章《Deep Joint Rain Detection and Removal From A Singal Image》,在这篇论文中他们主要研究如何去除图片中的雨线。但在无人驾驶或相关研究中,更具挑战性的一个任务是如何去除落在玻璃或者镜头上的雨滴。刘家瑛在本次分享会上介绍了她所指导的北大大二学生 Rui Qian 所做的该方面工作,也即去除单张图片上随机散布的雨滴(Rain Drop 2)。

在此之前仅有的一篇类似研究,是由 David Eigen 等人发表在 ICCV 2013 的一篇文章,在这篇文章中由于作者只使用了 3 层卷积网络,所以只能处理很少的 case,同时能够处理的图片上的雨滴也非常小,基本上可以视为灰尘。

在刘家瑛所分享的这篇文章中,其思路仍然延续去年文章的方法,即生成数据集,然后用生成的数据集来训练模型。

1、数据集生成

数据集的生成方式是,本文作者 Rui Qian 使用单反+一个 3 毫米厚的玻璃片(或者直接把水喷在镜头上)收集了 1000 多对(有雨和无雨)在不同户外环境、不同背景、不同尺寸和形状的雨滴图像,以模拟真实环境中雨滴的多样性。使用一个数学公式来表达带有雨滴图像的话,如图中公式所示:

2、模型框架

在该论文中作者选择使用 GAN 的方法,整个模型的框架如下图所示:

共包含三个部分,分别为:Generator(Attention-recurrent Network),Context Autoencoder 和 Dicriminator Network。

第一部分主要的工作是做检测(即检测雨滴在图片中的位置),然后生成 attention map。首先使用 Residual block 从雨滴图片中抽取 feature,渐进式地使用 Convs 来检测 attentive 的区域。训练数据集中图片都是成对的,所以可以很容易计算出相应的 mask(M),由此可以构建出 Loss 函数;由于不同的 attention 网络刻画 feature 的准确度不同,所以给每个 loss 一个指数的衰减。相应的 loss 函数如下:

随后将 attention map 和雨滴图像一起送给 autoencoder,生成去雨滴图像。autoencoder 的结构用了 16 个 Conv 和 Relu。为了避免网络本身造成的 blur,作者使用了 skip connection,因为在低级层次这会带来很好的效果。在构建 loss 方面,除了多尺度的考虑,还加上了一个高精度的 loss,即:Multi-scale loss + perceptual loss。

最后一个是 discriminator。这个步骤有两种方式,一种是只使用 autoencoder 生成的无雨滴图像,进行判断;另一种则是加入 attention map 作为指导。如图所示:

3、实验结果

作者使用两个数据集(PSNR 和 SSIM)进行了验证,其中 PSNR 是他们自己收集的数据集。作者选用 Eigen 等人 2013 年发表的工作以及 Pix2Pix 的方法作为对比。结果如下:

其中 A 表示只有 Autoencoder,A+D 表示 Autoencoder+Discriminator,A+AD 表示 Autoencoder + Attention Discriminator,AA + AD 表示 Attention Autoencoder + Attention Discriminator。

实际去雨效果如图所示:


2、如何旋转图像中的人脸?

论文:Pose-Guided Photorealistic Face Rotation

报告人:胡一博,中科院自动化所

论文下载地址:暂无

对于如何将图像中的人脸旋转任意角度,例如从一张正脸图像生成侧脸图像,或反之从侧脸恢复其正脸图像,无论是学术界还是工业界都给予了很大的关注,因为这可以用于人脸编辑、姿态变换、数据增强、表示学习等当中。

视角旋转有 x、y、z 三个方向,目前研究中主要考虑左右偏转。如果从单张图像进行旋转的话,这其实是一种「无中生有」、一对多的病态问题。因此目前人脸旋转存在真实性不高、分辨率较低、身份信息保持较差的问题。

胡一博在介绍他们的工作之前,简单介绍了人脸旋转研究的历程,如下图所示:


1、启发

从 2015 年的 CVPR 论文开始,人脸识别逐渐引起广泛的关注。目前人脸识别主要分成两个部分,一个是人脸正面化,一个是水平方向的任意角度旋转。之所以将人脸正面化作为一个单独的部分,是因为人脸正面化的过程中可以引入「对称性」的强约束,从而降低一对多问题的困难。

其中的 TP-GAN 是人脸正面化中一个里程碑式的工作,这种方法出现之后使得人脸转正能够达到以假乱真的效果。TP-GAN 之所以能够这么有效是因为,它通过一条全局通路和 4 个局部通路(分别对应人的五官),最终让局部和全局的通路进行融合。但是这种方法有两点不足:1)它受限于最慢通路的约束存在一定的性能瓶颈;2)只适用于人脸正面化的问题中,而不能应用于更广泛的人脸旋转中。针对这两个问题,胡一博认为我们需要提升其网咯性能以及实现任意姿态的人脸旋转。

另一方面,全局优先拓扑感知理论指出生物视觉系统对全局拓扑结构非常敏感。人脸五官包含着很丰富的全局拓扑信息,因此以人脸全局拓扑信息作为一个条件指导整个人脸的过程。

2、模型

基于上面两方面的启发,胡一博等人提出了 CAPG-GAN 的方法,该方法能够进行二维空间中任意角度的人脸旋转。选择人脸全局拓扑信息作为条件有两个优势,首先它可以提供人脸的结构信息促使生成的图像更加的逼真,其次在判别器中它可以作为先验知识,可以提高判别器对于人脸结构的判别性,进而促使生成器生成分辨率较高的图像。CAPG-GAN 的结构图如下:

输入包括原始图像 I^a,原始图像的五个关键点 P^a,以及目标姿态的关键点 P^b,通过生成器 G 输出目标图像。判别器采用的是 couple-agent 的结构,本质上就是两个独立的判别器,agent 1 判别旋转角度的真实性,agent 2 判断的是拓扑结构的真实性。

针对两个 agent,对应的损失函数如下图所示:

3、实验对比

胡一博团队针对人脸正面化以及旋转任意角度的任务在多种数据集上进行实验验证,其结果表现优异。效果如下:

相关文章:

[1]中科院自动化所赫然:大规模人脸图像编辑理论、方法及应用

[2] 中科院自动化所智能感知与计算研究中心11篇论文被CVPR接收 | CVPR 2018


3、如何给字体添加多样风格?

论文:A Common Framework for Interactive Texture Transfer

报告人:连宙辉,北京大学

论文下载地址:http://www.icst.pku.edu.cn/F/zLian/papers/CVPR18-Men.pdf

研究来源于需求。连宙辉副教授来自北京大学计算机科学技术研究所(该研究所是由)的字形计算技术实验室。传统上,字形设计需要人工对每个字进行手写或者设计,然后输入系统才能够被利用。但是由于中文有大量的汉字,且很多汉字的结构非常复杂,所以这项工作艰难且费时。一种解决方法就是,设计一个特定风格的字,然后通过变换迁移到别的字上。

那么是否可以将任意纹理的图像风格通过变换迁移到一个目标汉字上呢?更广义一点,是否可以将任意纹理风格迁移到任意图像上呢?基于这些思考,连宙辉团队在其论文中提出一种交互式的纹理迁移通用框架。

如上图所示,该通用框架能够:(a)将涂鸦转换为艺术品,(b)编辑装饰模式,(c)生成特殊效果的文本,(d)控制文本中的效果分布图像,(e)交换纹理。

1、方法

纹理迁移的问题其实就是,如何输入原始纹理图像、原始图像的语义图以及目标图像的语义图后,从而输出目标纹理图像。

其中较为关键的问题是,如何将两张语义图进行匹配。例如上图中,对于边缘由于有丰富的语义信息指引,因此可以较为容易地进行匹配;但是对于内部大面积的区域(d、e),同一个点有很多地方可以去匹配,作者选择利用从边缘传过来的信息(纹理一致和结构引导)可以实现很好的匹配效果。

整个流程如上图所示,共分为三大部分 7 个步骤。需要说明的是,基于交互式结构的图像合成是由语义映射和结构信息来指导的,其中用户可以对语义通道进行注释来控制目标图像中风格化纹理的空间分布。在结构提取环节,通过内容感知显着性检测自动提取结构通道,并将其从源样式图像传递到目标。具体而言,传播步骤通过在源图像和目标图像之间的关键轮廓点的配准来获取内部结构对应关系。结合语义和结构信息进行动态指导,可以使转换过程产生具有内容意识和低级细节的高质量纹理。

2、实验结果

3、结论

本文提出了一个结构指导的交互式纹理传递的一般框架。该方法可以自动将样式从给定的源图像迁移到用户控制的目标图像,同时保持结构的完整性和视觉丰富性。更具体地说,作者引入了通过自动提取显著区域和传播结构信息获得的结构指导。通过将结构通道与语义和纹理一致性结合起来,可以实现指导纹理转移。实验结果表明,所提出的框架广泛适用于许多纹理转移挑战。尽管目前大多数模型都倾向于使用基于神经的方法进行样式转换,但本文的结果表明,简单的传统的纹理合成框架仍然可以表现出优异的性能。

4、如何进行更细致的图像到图像翻译?

论文:DA-GAN: Instance-level Image Translation by Deep Attention Generative Adversarial Network

报告人:傅建龙,微软亚洲研究院

论文下载地址:https://arxiv.org/abs/1802.06454

本文是另外一篇将 Attention 机制与 GAN 相结合,以生成更高质量目标的工作。

1、启发

傅建龙在报告中认为,CV 中的图像到图像的翻译任务(Image2Image Translation)是一个比较广泛的概念,即根据 source domain 中的图像生成 target domain 中的对偶图像,同时在翻译过程中约束生成的样本和 source 中的样本有尽量一致的分布。事实上有许多基本的 CV 问题都属于图像到图像的翻译问题,例如白天到黑夜的图像转换、黑白照到彩色照的转换、低像素到高像素的转换、去除水印、图像分割、2D 到 3D、梵高风格化、木炭风格、缺失部分复原等。

更高级的如下图这些:

在这所有的任务中,根据是否是一对一的学习对,将这些任务划分为 pair data 任务和 unpair data 任务。(如下图所示)

其中前者在训练数据集中具有一对一的数据对,x 作为输入,y 用来计算输出的 loss 函数,目前效果最好的网络是 Pix2Pix 网络;而后者则是两个独立的数据集之间的训练,模型应该能够从两个集合中自动地发现集合之间的关联,从而来学习出映射函数,其中目前效果最好的网络是 CycleGAN 模型。

但是以上这些都是基于图像级的特征学习,若想完成更高质量要求的生成任务(例如要求改变图像区域的风格)则较为困难。于是有人便提出了基于 instance-level 的图像到图像的翻译方法——PatchGAN:

如傅建龙所说,做研究就是要找到前人所没有填补的空缺。通过画出上图,可以很明白地看出,对应的也应该有基于 unpaired instance-level 的图像到图像的翻译方法。这正是本文的工作,即能否自动地发现 source domain 和 target domain 的 instance 之间的关联,同时这是一种 unpair 的方法,不需要任何人类标注。

2、模型

既然是基于 instance-level 的方法,那么首先就要问:什么是 instance?

事实上,这是一个比较宽泛的概念,在不同的任务中可以有不同的定义。例如在生成鸟的任务中,鸟本身是一个 instance,鸟的嘴、腿、翅膀、尾巴等也都可以是 instance;如果想要建立更细致的生成模型,也可更加细致地去定义更多种 instance。

介绍了以上的思路后,模型本身的构建就很清晰了。如上图所示,首先通过一个深度 Attention 编码器(DAE)来自动地学习各个 instance,然后将不同的部分分别投射到一个「隐空间」,最后通过 GAN 网络进行生成。

3、实验结果

定量的比较可以看出,DA-GAN 相比于其他方法有较大的提升。

在定性比较方面,有下面三种:

Text to Image

object configuration

pose morphing

从左到右分别为 source bird、target bird 和 DA-GAN 生成的鸟。一个疑问是:鸟腿缺失是因为什么呢?

4、结论

本文提出了一种无监督的图像翻译的方法,即通过更细致化的 instance-level 的 GAN 生成来获得更高质量的翻译图像。通过实验结果可以很明显地看出 DA-GAN 相较于其他网络在性能上的提升。但是需要注意的是,在生成结果中仍然存在一些失败的地方(例如前面提到的「缺失的鸟腿」),这可能由于模型中的 instance 是通过弱监督 Attention 机制学到的,这与完全监督下的学习还是有一定的差距。如何弥补,或许要静等傅建龙团队接下来的工作了。

相关文章:

[1] DA-GAN技术:计算机帮你创造奇妙“新物种”

雷锋网

百度 DuerOS 赋能智能家居落地实体体验馆

5月21日雷锋网消息,今日,百度DuerOS、宜华生活、小葱智能共同打造的宜华智能家居体验馆落正式落地,囊括智能家居生态全景,包含客厅、卧室、洗漱间三大场景,集中展示了智能家居系列产品。

此外,已建成落地的北京、上海、郑州等8家宜华智能家居体验馆也宣布启动,开放线下体验预约和 AI 智能家居套装销售,以及同步开启 AI 智能家居京东众筹上线。

三者之间关系方面,据雷锋网了解,百度DuerOS与小葱智能达成基于产品技术层面的深度合作,DuerOS将对话式人工智能能力赋予小葱智能。而宜华生活作为双方的战略合作伙伴,为三方合作的产品提供落地支持。简单来说,就是小度在家智能视频音箱成为了整个智能家庭的控制中枢,能够根据不同指令控制灯、窗帘等物品的状态。

以三方合作形式为基础的智能家居今年将会在全国落地18家智能家居体验馆,DuerOS 也会在地产、养老、社区生活馆展开深度合作,开展300个线下渠道,30000个精装公寓的智能体验。

百度智能生活事业群组(SLG)总经理景鲲表示,百度一直希望对话式 AI 技术能与产品和场景相结合。宜华生活董事长刘壮超介绍,宜华智能家居体验馆是宜华新零售战略的重要组成部分,完美体现了“前端优化体验,后端提升效率”的新零售概念,为宜华生活的大战略方向—“提供品质生活一站式服务”输送重要的决策依据。

实际上,据雷锋网了解,此次三方系实体体验馆落地,而具体合作早在2017年10月就有过尝试,彼时,百度DuerOS与宜华生活、小葱智能达成合作意向,由小葱智能提供智能家居解决方案,连接包括灯光、插座、魔镜、净化器等数十个品类的智能设备,通过小葱智能的服务器以云云对接的方式连接 DuerOS Smart Home。2017年11月,百度 DuerOS 携手宜华生活、小葱智能发布基于 AI 技术的全屋智能家居体验馆计划。

5月18日,原百度集团总裁、COO 陆奇宣布将不再担任原职当日,百度宣布度秘事业部总经理景鲲将担任智能生活事业群组(SLG)总经理一职,未来一段时间里直接向李彦宏汇报。

雷锋网

蚂蚁金服投资者被限制投资腾讯、京东;微众用区块链建分布式商业丨AI金融评论日报

蚂蚁金服的投资者须同意不投资由腾讯、京东等控制的公司

5月21日消息  关于蚂蚁金服近日遭透露的100亿美元的融资一事,华尔街日报援引知情人士报道称,融资协议显示,投资蚂蚁金服的投资者需同意,对于腾讯、京东等主要竞争对手所控股的公司,不投资或不增持股份。据此前消息报道,该公司在本轮融资的估值约为1500亿美元。

有投资者和律师表示,如此严苛的投资限制实属罕见,因为通常来说投资者才是在出资前为公司设置条件的一方。

互联网“宝宝”收益创新低,今年首次“破4”

据北京商报报道,受市场资金面宽松的影响,互联网“宝宝”产品收益率节节败退。据融360最新监测数据显示,5月11日-17日,74支互联网“宝宝”的平均七日年化收益率为3.89%,较上周下降了0.18个百分点,今年以来首次“破4”,并创去年6月以来的最低水平。

从不同销售平台来看,上周第三方支付系“宝宝”平均七日年化收益率为4.09%,收益率排名位居第一,其他“宝宝”均跌破4%,其中,银行系“宝宝”平均七日年化收益率为3.94%,排名第二,代销系、基金系“宝宝”平均七日年化收益率分别为3.79%、3.78%。

微众银行:用区块链构建分布式商业

据证券时报报道,近日,在中国北京国际科技产业博览会(简称“科博会”)上,微众银行科技创新产品部副总经理范瑞彬表示,微众银行已研发了两大开源底层平台。其一是联合万向控股、矩阵元推出BCOS,该平台在2017年7月完全开源。随后,微众银行又联合金链盟开源工作组的多家机构共同研发并完全开源了BCOS的金融分支版本——FISCO BCOS。

据了解,FISCO BCOS平台在性能上采用拜占庭容错共识机制,结合多链架构和跨链交互方案,可满足金融级高频交易场景需求;在安全性上,通过节点准入控制、可靠的密钥管理、灵活的权限控制,在应用、存储、网络、主机层实现全面的安全保障;在可用性方面,FISCO BCOS设计为7×24小时运行,达到金融级高可用性;在监管支持方面,可支持监管和审计机构作为观察节点加入联盟链,获取实时数据进行监管审计。此外,还提供各种开发接口,方便开发者编写和调用智能合约。

余额宝进一步开放 华安基金宣布接入

5月20日,华安基金官网发布公告,宣布旗下华安日日鑫货币A接入余额宝,这也成为了5月余额宝与基金公司合作“开闸”以来,新接入的第三只货币基金。

据了解,该基金将承袭天弘基金版余额宝的全部功能,包括收益天天结算、即存即用、打通消费理财等功能均保持不变。据Wind数据显示,该基金截至2018年一季末规模117亿,近一年、两年、三年业绩回报均高于货币基金同类中位数收益水平(截至2018年5月14日)。

润和软件:或与蚂蚁金融云在金融科技领域展开合作

雷锋网AI金融评论消息   润和软件今日发布公告称,根据与蚂蚁金融云(金融云为浙江蚂蚁小微金融服务集团股份有限公司的全资子公司)的洽谈沟通成果,双方拟在金融科技领域展开深度、全面的合作,并进一步推动双方战略合作升级,实现金融和科技的深度聚合,打造金融科技服务的新模式,对金融机构开放,共建金融科技新生态。

目前具体结算方式、合作方式、合作期限等还需要双方进一步磋商,对公司当期业绩的影响需在双方确定上述内容后方可评估。此外,公司个别股东正在与蚂蚁金融云相关公司商议资本合作事宜,但该资本合作事宜不涉及公司控制权变更。

4月末支付机构交存央行备付金存款近5000亿

雷锋网AI金融评论消息  根据央行5月18日更新的“货币当局资产负债表”数据,4月支付机构交存央行客户备付金近5000亿元,环比增长58%。今年前3个月,备付金交存规模已分别跨过了1000亿元-3000亿元大关。业内人士认为,曾经以“运作”备付金作为一大营业手段的小型支付机构会受到一定影响,交存备付金也倒逼这些机构拓展更多收入来源。

监管正对券商金融科技给出新框定

近几天,一份名为“促进行业金融科技和合规科技发展的指导意见(草案)”在业界讨论声渐起。行业人士透露,这一政策拟以正面清单的方式明确属于鼓励支持开展的业务,以负面清单的方式明确严禁开展的业务。此外,中国证券业协会近期也召开互联网证券相关会议,提出互联网和金融科技不仅仅是经纪业务领域的服务手段,更是证券公司提高内部治理能力和提升风控能力的必要技术条件。

雷锋网注:题图Via福布斯

雷锋网

一口气看完微软人工智能布局和产品落地 | 微软2018人工智能大会

目前,微软、Google、亚马逊、苹果、Facebook都巨头都在布局人工智能,将人工智能作为公司全面发展战略,涉及方方面面,不花费一通功夫,很难一下子了解各大公司的技术、布局和产品落地。

今天,在北京召开的微软2018人工智能大会上,微软把自家做的事一股脑全说了。

在雷锋看来,发布会的两点主要有:微软着重强调了其新的“世界观”:智能云和智能边缘;展示了微软在语音语义、视觉、机器翻译的多项技术;微软发布ONNX项目及ML.NET打造开源跨平台人工智能开发框架;搭载着全新的“全双工语音技术”的微软小冰带来了原创诗歌、歌曲和儿童故事;中国移动、大疆、唯品会、小米生态链分别展示了与微软人工智能的合作成果。

微软新世界观:智能云和智能边缘

云计算、物联网、大数据、人工智能正在将我们的世界将变成一台巨大的计算机。

微软全球执行副总裁、人工智能及微软研究事业部负责人沈向洋博士介绍到,在这样的新时代,微软有了全新的世界观:智能云和智能边缘。

智能云指的是微软Azure,是微软专为人工智能打造的云平台。Azure汇聚了微软在人工智能领域的全部投入与技术积累,是开发、部署、运行人工智能的云平台,同时也是将智能云与智能边缘融会贯通的关键环节。

微软一直在拓展Azure的功能,Azure目前有四个方面:公有云Azure、混合云Azure Stack、物联网Azure IoT Edge和Azure Sphere,以这四个方面打造出完整的计算环境,支持全新应用场景。

Azure Stack是Azure公有云在本地数据中心的扩展,可以在边缘和离线环境运行、满足多种监管要求。例如石油开发公司同时使用Azure公有云和Azure Stack可以按照办公地点灵活分配计算资源。

Azure IoT Edge是微软在2017年Build大会推出的针对智能边缘计算的产品,可以在Linux和Windows上运行,而2018年Build大会上,微软宣布将 Azure IoT Edge 开源,允许开发者进行扩展、添加功能,并部署到任何环境中。

Azure 上的认知服务也可以扩展到Azure IoT Edge,目前微软已经推出了定制视觉服务,可以让无人机或其它工业装备无需连接到云,就能做出快速的响应和处理。会上,大疆展示了与微软的合作,利用Azure IoT Edge和微软人工智能服务,大疆开发出适用于农业、建筑行业、公共安全及更多应用场景的解决方案。

Azure Sphere主要用于保护和驱动智能云上的设备。2020年,全球智能边缘设备的总数将超过200亿台,世界会成为一台超级计算机,但是我们也会担忧安全问题。Azure Sphere方案将提供经过特殊设计的安全芯片、安全操作系统和能够守护每台设备的云端安全。

在介绍完Azure云平台的四个方面后,沈向洋介绍了微软将Azure与AI结合,打造最佳人工智能云平台的四个方向:认知服务、对话式人工智能、开放平台与工具、实时人工智能基础设施。

Azure 认知服务

在两年前的Build 2016微软全球开发者大会上,微软首次公布了运行于Azure的认知服务,以API的形式为开发者提供易用的人工智能技术能力。目前微软在全球推出包括语音、视觉、语言、机器翻译等功能的24项服务,超过100万开发者使用。

CaptionBot能像人一样理解和描述一张图片,例如,你上传一张照片,CaptionBot能够给出一段文字描述:比尔盖茨正拿着一副网球拍,他看起来很高兴。

此外,还介绍了微软OCR((Optical Character Recognition光学字符识别),将为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,可以识别图像内的文字,例如识别车牌号、海报甚至是手写的笔记。

CaptionBot和OCR都是Azure预制的人工智能服务,微软也针对变化的场景推出了定制视觉服务,可以让不具备深度学习、机器视觉背景的开发者定制图像标签模型、物件认知模型。

微软技术院士黄学东介绍了微软在人工智能语音语义方面的进展。在计算机视觉方面,2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%,胜过人类;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。

5月初,雷锋网曾报道,谷歌在I/O大会上展示了Google语音助手的Duplex(双工)技术,能主动给餐馆、理发店打电话,帮助用户预约时间。由于其声音和音调与人类几乎没有差别,能实现连续对话还能理解上下文快速反应,在朋友圈大火了一把。这时,微软坐不住了,赶紧发出了技术声明,表明微软小冰在两年前就实现了AI与人类通电话,并且在谷歌之前就公布了实现AI与人双向交流的全双工语音技术。

在现场,黄学东忍不住Diss了一下,说Google动不动就吹牛, ”微软不仅有全双工,微软更实现了全三工、全四工、全五工……”

现场展示了一款“全多工”的产品——微软与Roobo合作的AI会议系统。微软特意在现场准备了四个人的现场会议演示,可以看到,这款AI会议系统能识别不同人的声音,实时以文字记录下大家的发言内容,同时识别出涉及工作安排的内容生成代办事项。这个产品,可以说是每个团队中会议记录员的救星。

黄学东还展示了语音定制技术,根据上传的录音,可以生成和用户一样声音的AI助手。上传30分钟的录音,得到的AI说话与用户相似度不高,但是以10小时的录音进行训练后,就能得到较为逼真的模仿效果。想一想,你会想要把家人或者朋友的声音放进AI里,让它随时陪伴你吗?

黄学东称今年微软达到中文英文翻译超过专业人士的水平。大会上,小米生态链企业香蕉出行展示了魔芋AI翻译机,借助微软认知服务中的微软翻译打造,能够提供14种语言的实时语音翻译。虽然由于现场混音效果,魔芋AI有几次识别不出语音指令,但翻译的效果还是不错的,可以说是出游利器。

对话式人工智能

亚马逊Echo智能音箱带动了对话式人工智能的产品落地,现在对话式人工智能已经进入音箱、电视、车载等多个设备中,是新一代智能应用的核心。对话式人工智能也在不断升级其对话能力,追求越来越自然、流畅的人机交流。

微软有小娜和小冰两个对话式人工智能助手,小娜更倾向于发展智商,而小冰则是面向情商维度发展的人工智能系统。

微软小冰诞生已经三年,一直以逗贫、插科打诨的聊天风格著称。最近,微软将最新的全双工语音交互技术(Full Duplex)应用在了微软小冰上,同时提升了小冰的智商和情商,具备了以下能力: 一次唤醒之后的连续对话、预测用户接下来的对话内容、 帮助用户轻松完成多重任务、内容创造(写诗、写歌、讲故事)。小冰不只是能够执行用户的任务,还能主动提供聊天语聊,陪伴和关心用户。

这次大会上,微软展示了一段小冰在一次电话聊天结束后,由于判断出用户情绪低落,认为需要再一次电话沟通,于是又拨打了一通电话,去询问用户情绪是否变好、提醒用户早点休息、告知用户明天天气情况。

据了解,2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流。

在内容创作方面,微软展示了小冰写的诗、原创歌曲、有声读物。在有声读物领域,微软已拥有接近4万集有声童话内容。这些有声读物全部由人工智能技术生成,在与人类主播质量相当的前提下,数量足以陪伴一个孩子从2岁到9岁的全部时光。6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。

今年四月,微软已经在中国和美国宣布了全双工语音技术,并且有多项产品落地,微软(亚洲)互联网工程院副院长李笛宣布,今年秋天,微软还将向合作伙伴和开发者开放“全双工语音技术(Full Duplex)”开发者可以使用这项技术打造自己的对话应用。

雷锋网好奇,微软的全双工语音技术开源,这会不会对现在的智能音箱里的“傻萌”的语音助手进行一次洗牌呢?(延伸阅读:微软发大招:要做智商和情商兼具的语音助手

开放平台+基础设施

要促进人工智能的普及,技术开放是必经之路,微软也推出了开放人工智能平台(Open AI)战略及开发工具。

微软可以支持TensorFlow、CNTK等业界主流的深度学习平台,同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。目前,已经有15家公司支持ONNX,并且还有更多公司正在加入进来。现在已经有PyTorch等六种顶级框架支持ONNX,其它框架则可以通过转换器获得支持。

在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。这一框架最初由微软研究院开发,并且在Windows、Bing、Azure等微软产品上都得到了成功的应用。通过将这一技术框架开源,微软希望能够为每一位开发者赋予驾驭机器学习的能力。

微软Project Brainwave能利用Azure上最先进的FPGA基础架构完成实时的人工智能处理。用户只需通过实时的单一批数据,就能得到以往需要多得多的批数据处理才能得到的性能,真正实现人工智能的实时计算。而且,FPGA运算不仅仅只在云端提供——通过合作伙伴,也可以通过Azure Stack混合云在本地提供FPGA。如此强大的实时计算能力不仅存在于云端,同时也适用于边缘计算,这将让更多创新成为可能。

AI赋能Office 365

虽然今天我们看到的都是全新的AI技术,但是微软也没有忘记其桌面时代的核心业务Windows和Office。

AI功能已经成功与Office 365、Dynamics 365、Linkedin等产品和功能融为一体。例如,在发邮件时,微软提供了多种语言的一键翻译。在用Excel时,Excel能更好地猜测用户的行为,提前生成用户可能需要的内容。

在前些天的锤子手机发布会上,罗永浩推出了自己的坚果 TNT 工作站,用人工智能的语音和语义技术升级Office办公软件,例如,可以用语音指令来做PPT和Excel,用语音指令制作幻灯片,包括调节字体大小、颜色、样式等。

雷锋网发现,很多人评论这些需求或许都是伪需求,我们看到微软也在用人工智能升级桌面办公系统,更能直接对比,究竟什么样的智能操作才是我们所需要的。

免费AI课程上线

最会,为了推动全民AI,让每个人都有机会学习人工智能,微软推出在线人工智能学院,目标是一年内培养出10 万余名人工智能人才,将免费提供包括AI基础、核心技术和高阶应用在内的总共250课时的12门人工智能学分课程,覆盖10项应用技能。完成课程学习的用户,还可申请微软专业学位课程(MPP,Microsoft Professional Program)作为职业技能认证。 感兴趣的朋友可以敲:(https://school.azure.cn/



雷锋网

2018清华五道口全球金融论坛 · 金融科技观点集锦

雷锋网AI金融评论消息,5月19日至20日,由清华大学主办、清华大学五道口金融学院承办、清华大学国家金融研究院和清华大学金融科技研究院协办的2018清华五道口全球金融论坛在清华大学新清华学堂举办,论坛以“新时代金融改革开放与稳定发展”为主题,探讨中国金融的当下与未来。

金融科技作为金融领域当下热点和未来发展趋势,成为会议焦点之一,在“强监管下金融科技行业的发展前景”主题论坛及相关分论坛,与会者从不同角度发表了对金融科技的看法。

科技冲击金融

当前金融业主要面临两大冲击,首要之一便是科技带来的冲击。国家外汇管理局副局长陆磊认为,金融科技在提高融资效率、实现范围经济的同时,也形成了对传统融资模式的创造性解构以及金融市场中的不稳定因素。

互联网金融的数字科技化将成为显著特征。随着互联网新经济的深化发展,创新金融场景不断涌现,高榕资本创始合伙人张震认为,相较传统金融机构,金融科技更加能够提供不断创新的技术支持。而在普惠金融方面,百融金融信息服务股份有限公司董事长张韶峰认为,数据智能科技是普惠金融实现路径唯一的选择。

他认为,普惠金融面对的是数量巨大的小客户,很低的额度、受限的利率,使得传统金融机构的人工作业方式力不从心,因此它们需要转变方式,在获客渠道与服务渠道上互联网化,风控手段需要AI化与大数据化。

新变化带来新风险

随着金融科技发展,互联网金融等金融新业态不断出现,而金融新业态也催生了新的风险,从监管者角度来讲,原中国保险监督管理委员会副主席周延礼认为,平台方面,存在交易平台多种风险并存的现象;金融产品方面,呈现风险多样隐蔽的特点;而在受众群体方面,普惠的同时也扩大了风险的波及范围。

从从业者角度来讲,宜人贷首席执行官方以涵认为,互联网金融公司隐藏的门槛其实很高,但是一些打着互金旗号的假金融、野金融公司的庞氏骗局、吸金等非法行为,使得这个行业笼罩了一层阴影。

玖富集团创始人孙雷认为,要”先合规而后创新”,针对互联网金融中存在的政策风险、经济周期风险、流动性与刚兑风险、信用欺诈与催收风险、IT技术安全风险和人员与道德等风险,互联网金融机构应打造一个开放式的生态链,多家企业应共同形成一个合规健康的生态圈联合发展。

三方面防范风险

据雷锋网了解,在防范金融科技带来的风险方面,与会者主要从企业、行业、监管科技等方面提出各自建议。

在企业方面,道口贷董事长罗川主张用科技助力信用,他认为,为中小企业提供创新的金融服务应该基于商业信用,包括用数据驱动的尽职调查、基于供应链的授信模式和基于六维度的风险定价。具体来说,比如供应链融资应该基于供应链和社交网络的信息披露。因为基于供应链和社交网络的信息披露,能够把信息予以充分地披露,极大提高了违约成本,使得整个诚信体系容易建立。

在行业方面,玖富集团创始人孙雷建议,行业联合建立客户权益保护中心,建立行业风险缓释与互助机制,同时推动数据互联,共建行业征信联盟体系,从而提高违约成本。

在监管科技方面,网联清算有限公司总裁董俊峰认为,监管科技有助于降低监管者与被监管者的合规成本,提高双方的效率,并最终提升行业发展健康程度,让普罗大众受益。

雷锋网了解到,金融基础设施作为专业监管科技公司,不但可以解决隐私保护、恶意竞争、利益冲突等问题,而且能够通过复用现有基础设施降低实施成本,充分利用其技术和行业经验,具有独特的优势。

基于此,董俊峰认为从实现路径上讲,可以尝试依托中心化平台服务监管和市场机构,同时构建防止系统性金融风险的防火墙,并且在防火墙内进行监管沙盒的探索和应用。

而瑞士再保险集团首席数字化转型官Luca P. Marighetti认为,当下全球在金融科技方面主要有两个主流监管思想:实用主义和绝对正确主义。他认为,不同国家的监管应当因地制宜,既要确保金融科技可以提升生产效率,也要发挥其民主化、普惠化的功效,特别注意要防止和打破特殊利益集团的勾结,另外还要关注数据隐私问题,由监管方决定商家使用用户数据的权利和范围,在经济效率、金融普惠和民主多方面充分权衡。

未来金融变革方向

面对科技的冲击,陆磊认为,伴随互联网金融产业从野蛮生长走向成熟,标准的一致性将会是市场主体和市场本身变革的基本趋势。相对应,行为监管工具箱的创新将是管理体制改革的基本方略。而在去中心化方面,陆磊保持谨慎态度,认为去中心化的方式将导致预期的不稳定性并且极易形成的单边性和流动性浩劫。他主张,越是技术进步,越需要中央对手方清算机制。

雷锋网

微信无感支付机场深圳亮相,支付巨头纷纷跑马圈地

雷锋网AI金融评论消息,5月21日,深圳市宝安国际机场携手微信支付正式推出“微信无感支付”停车场,基于“微信车主服务”和停车场的车牌识别系统两方面能力的结合,将车辆进出停车场的时间缩短了80%,实现了入场无需领卡、离场无需扫码的体验。

据悉,目前深圳宝安国际机场P1、P2、P3三个社会停车场已全面开通微信“无感支付”,车辆通过时间从原来的10秒缩短到2秒,解决车主停车缴费难、缴费时间长等问题,提升了停车场通行效率,节约了旅客时间。

据雷锋网了解,无感支付是基于免息免密小额支付+车牌识别技术的融合应用。与“扫码付”不同,无感支付更进一步,采用的是“车牌付”形式,需要事先将线上资金账户与车牌绑定,车辆经过收费站时摄像头识别出车牌号,自动从对应账户中扣除费用,全程不需要现金找零,也不需要掏出手机扫码。

事实上,基于停车场、高速公路等场景中的无感支付正在成为支付巨头们新的争夺场。雷锋网了解到,2017年6月,支付宝宣布上海虹桥机场停车场即日升级为“黑科技”版的无现金停车场,成为国内首个启用无感支付的智慧停车场。

不久之后,支付宝又联合捷顺科技在上海浦东机场推出 “无感支付”停车场。据悉,目前捷顺科技旗下的捷停车“无感支付”已经在华南开通500多家停车场,并计划于2018年底前新开通8000-10000家。

此外除了支付宝、微信等玩家,传统支付巨头也在加速入局。2017年9月,银联、民生银行携手捷顺科技,”无感支付”停车场落地深圳宝安国际机场。2018年4月,中国银联携手建设银行、小猫智慧停车达成无感支付智慧停车合作,开通银联无感支付。据悉,中国银联后续将在深圳等地超过500家停车场陆续开通支持银联无感停车。

在高速收费站场景里,今年3月,微信、支付宝同时宣布启动高速收费站无感支付。信用分达到550分的支付宝用户可以在支付宝中搜索“高速纵横”,将支付宝账号和车牌号绑定,实现“车牌付”功能。据悉,目前支付宝仅在河南、陕西、山东省内的高速试点了“车牌付”模式。

而与支付宝相对应,微信支付推出了“高速e行”功能。用户可以搜索“高速e行”微信公众号或小程序,按照指引输入相关信息进行车牌绑定。据雷锋网了解,从2017年11月23日起,山东省开通的“高速e行”体验收费站已经达到了215个。

虽然巨头们你争我夺加速布局,但事实上,“无感支付”的落地还处于起步阶段,没有形成完整的产业链,各个厂商之间的数据也没能互通。不难想到,随着应用规模的扩大,场内玩家将会经历又一轮的跑马圈地和行业洗牌,从长远战略来看,必然要寻找融合共存之道。

此外,无感支付为用户带来通行体验升级的同时,也将推动智慧停车、通车商业模式的变革,以前一卡通主打线下,现在无感支付又打通了线上运营的机会,打通了线上线下一体的架构,实现人、车、服务的连接,也迎合了“智能硬件+互联网化应用”出行场景全覆盖这一产业的主流趋势。

雷锋网

大秘密!国际警方利用社交平台上的音频来破案

众所周知,警方会通过网络上的文字信息来协助破案,比如之前雷锋网就曾报道过,为了揪出色情黑产从业者,鹅厂会同警方合作,通过对一些 QQ 群名称和简介来进行识别。

放眼国外,无论是 Facebook 还是 Twitter,也都曾出于“反恐”的目的出台过对策,比如禁止有关“支持”恐怖组织和“赞美”恐怖主义组织领导人的言辞,或者“纵容”暴力恐怖行为的表达内容。

不过,这些更多的还是来自文字信息。你有没有想过,可能你的音频甚至是视频等多媒体信息,也会成为被监控的目标?例如,机器可能会通过语音录音与存储在海量数据库中的语音样本进行匹配,来锁定异常人群,即以声识人。

不是小打小闹,可能被大规模应用

我们都有过打客服电话的经历,在接通人工客服后,会有一句“为保证服务质量,本次通话将会被录音”的提示。

那在众多的录音素材中,如何能通过一些音频标签来识别出关键信息?一家名为“Verint”的以色列的公司,正是瞅准了音频识别和监控的生意,从商业通话录音识别起家,慢慢将触角延伸到警务领域,这意味着,普通人的声音信息未来也可能处于被监控的范围。

雷锋网发现,这家以色列公司也在。。。天chao(你懂的)。。。也开展业务。

最近,Verint与来自奥地利、瑞士、荷兰、英国等非盈利研究组织,公开了他们的扬声器识别集成项目平台(SIIP),并发表了一篇极具争议性的论文↓↓↓

参与这篇论文的研究者来源庞杂,除了Verint,还有 SingularLogic 和 Nuance 等商业公司,并联合了一些非盈利性的研究机构做关键字识别研究和伦理道德道德的研究,更为重要的是,论文中还征集了多个执法机构的意见,包括国际刑警组织、意大利警察局、英国大都会警察局、德国联邦刑事调查局和葡萄牙刑事警察局。

换句话说,这不单单只是一个简单的研究或者小范围的试验,未来SIIP平台可能被多个国家的警务系统大规模使用。

根据论文中的介绍,SIIP(扬声器识别集成项目)是运行在大型语音样本数据库上的扬声器识别(SID)解决方案,它将采用几种语音分析算法,按性别、年龄、语言和口音来过滤语音样本,通过将来自电话通话或社交媒体帖子的语音样本,与存储在诸执法机构共享的海量数据库中的犯罪分子的语音录音相匹配,来找出嫌疑人。

论文指出,未来它将由国际刑警组织在法国里昂的总部加以管理,目的是提高语音数据的准确性,并提高语音数据的可靠性和司法上的可采信性。

推特、脸书、领英等平台的声音信息都可能作为采集来源

究竟哪些平台上的音频信息会被收录?

答案是:任何“合法截获”的声音!比如果手机、固定电话的通话信息、网络语音信息,或者社交媒体中公开发布的音频(比如招聘、宣传信息),预期用途是将从电话通话和社交媒体收集的声音与“黑名单”数据库相匹配来找出异常人员。

可以说,来源非常广泛,尤其是看到这份论文中公布的社交媒体上的名单,雷锋网编辑不由得虎躯一震~

文中指出,目前 SIIP 可以匹配来自各大社交媒体平台的语音样本,包括Twitter、Google+、LinkedIn、YouTube 和 Facebook,基本涵盖了大多数人的生活圈。

其实,匹配多个平台还不是最大的难点所在,真正的难点在于构建这种系统所需安装的诸多工具,比如过滤背景噪音,提高语音清晰度,隔离声音,以及为警察总部和外勤的应用轻松共享、收集和分类数据的各种小工具。

这样做的目的,是能够将新的语音录音与庞大的声音样本数据库进行匹配。未来,该数据库将由国际刑警组织来管理,来自192个国家的这些执法机构可以访问该系统。

除了数据更为丰富,由于社交媒体平台所提供的信息更为多元,平台还会通过基于语言相关性和地理位置等搜索标准对多媒体内容进行梳理,该系统将标记和处理这些材料,并在数据库中找到类似的片段。

也就是说,原来警察更多的是从文字信息中搜集可疑内容,但现在,不仅新增了视频和音频的识别,还会结合地理位置等信息做更加精准的判断。

安全监控PK个人隐私恩仇录

为了安全的监控和保护个人隐私本就是一对矛盾体。

以美国为例,自1997年2月,联邦调查局开发了能够对网络通讯进行监控的软件系统“杂食者”(Omnivore)软件,但其很容易截获法院令状之外的其他通讯信息,以致对公民的隐私和通讯自由构成巨大威胁,之后,其升级版“肉食者”也因为严重威胁公民隐私权而一直饱受社会各界的批评,甚至停用。

然而,2001年9月发生的“9·11事件”使情况发生了巨大的转变。“9·11事件”使美国民众对恐怖事件的忧虑上升到一个前所未有的高度,相应地,其对政府权力的扩张表现出异乎寻常的宽容。借助这一契机,美国政府开始大肆发展各种监听和监控项目。

这种宽松的态度也让隐私信息的保护发生了严重的问题,最终爆发了众所周知的“棱镜门”事件。

但这也并未阻止监控软件越来越强大的功能,近年来,从美国的联邦调查局(FBI)、中央情报局(CIA)到国家安全局(NSA),一直在开发和更新能够对网络通讯进行监控的软件系统。

在今天所讨论的论文中,有一组国际刑警组织所列出的数据:在对69个国家的91个警察部门作了一项调查后,我们发现,一半以上的警察部门已经在使用某种类型的自动语音识别系统。

未来,如何平衡办案效率和保护个人隐私的问题,也将一直是摆在各类监控软件面前的问题。

参考来源:

《Towards a breakthrough Speaker Identification approsch for Law Enforcement Afencies:SIIP》

《计算机网络犯罪对刑事诉讼的挑战与制度应对》

云头条

雷锋网

商汤科技、阿里巴巴及香港科技园联手成立 AI 实验室

5月21日雷锋网消息,今日,人工智能创业公司商汤科技、阿里巴巴集团及香港科技园公司宣布合作成立“香港人工智能实验室”。

据雷锋网了解,这是继5月14日中央宣布系列政策,推动香港加强与内地的科技合作,创建国际创科中心后的第一个重大举措。5月15日,商汤科技创始人汤晓鸥出席由香港特别行政区政府主办的内地与香港科创合作研讨会。

此次成立 AI 实验室是香港国际创新科技中心的重要载体,将扶持本地人工智能创业生态发展,与香港分享更多内地人工智能研发成果与应用场景经验。

通过三方合作,结合内地在人工智能核心技术与应用场景上的积累,以及香港在人工智能前沿学术研究上优势,在推动香港人工智能产学研协同发展的同时,也为内地和香港的科技交流搭建了一个平台。

此外,香港人工智能实验室今日还宣布发起“初创公司加速器计划”,旨在为香港培育更多人工智能初创企业。聚集商汤科技前沿人工智能研发及技术优势、阿里巴巴全球性资源平台优势、香港科学园初创企业孵化中心优势,香港人工智能实验室将从以下三方面为香港的创科生态发挥积极作用: 

  • 第一,香港人工智能实验室是加强香港和内地创新合作的有益平台。实验室将会发挥香港的基础科研优势、大湾区的产品优势、内地巨大市场优势,形成面向市场的全链条创新服务平台。

  • 其次,香港人工智能实验室是为香港青年创新创业服务的公益平台。入选平台的创业项目将得到从资金扶持、人工智能技术支持、市场需求对接、创业导师辅导和基本办公空间等系列支持。

  • 第三,香港人工智能实验室在香港首创“创业大讲堂导师”团,邀请了多名知名大学教授、香港和内地多家独角兽企业的创始人及CEO,为创业者带来从前沿科技到创业经验的全方位辅导。

雷锋网