月度归档:2016年12月

前Oculus技术大神加盟华为,Snapchat收购AR公司 | 沉浸感周刊

本周,前Oculus技术大神加入华为,Oculus公司收购一家眼球追踪技术公司,三星升级Gear VR浏览器。沉浸感周刊带你一起回顾本周VR/AR热门事件。

前Oculus主任研究员加盟华为,担任VR/AR/MR首席科学家

雷锋网消息,前Oculus主任研究员、伊利诺伊大学香槟分校教授Steve Lavalle今日在Facebook上宣布,自己将加盟华为,出任VR/AR/MR首席科学家,全面负责华为在这一领域的研发工作。

根据维基百科显示,2012年9月他开始在Oculus VR工作,直到2015年1月他一直是Oculus公司的主要科学家。在此期间,他研发了基于IMU,针对核心软件的头部追踪方法,并且领导感知心理学家团队,为虚拟现实校准系统和用户体验舒适设计,提供了主要解决方案。

他也是Oculus SDK的共同开发者之一,并且帮助Oculus公司研发了两项核心技术,其中包括降低VR设备迟滞、减少晕眩效应的预测追踪感知技术,以及传感器校正技术。

Lavalle表示,自己和华为关于VR/AR的前景看法一致,认为需要以整体视角看待这一领域的技术研发,必须紧密结合硬件、软件、人类感知和神经科学等多个领域。他还提到,华为拥有全球性的业务,而中国也是不断崛起的VR/AR市场。Lavalle还在宣布加盟华为的声明中附上了自己身穿华为工服的照片。

Oculus收购眼球追踪技术公司Eye Tribe

据外媒报道,Oculus日前收购了一家名为The Eye Tribe的眼球追踪公司。

根据该公司的官网显示,他们研发的技术,让“眼球控制技术可运用于消费级产品中,能够简化和提升用户体验。The Eye Tribe致力于成为领先的眼球控制技术提供商,将自己的技术授权给消费级产品的供应商。”

当然,这些目标还未实现,他们便被Oculus看中,被其收购,收购价格目前尚未得知。

不久前,Epic Games游戏开发团队在北京分享活动上,曾表示如果使用了眼球追踪技术,玩家便可以通过眼镜注视目标物,从而达成行动目的。可见未来,眼球追踪技术加入VR后,将极大提升玩家的VR体验。

同时,不仅是游戏开发者对眼球追踪的认同,谷歌在10月份也收购了一家眼球追踪技术公司Eyefluence。雷锋网曾发文详细介绍了该公司,他们所研发的眼球追踪技术,使用户只需自然地动动眼镜,便能将意识转化为动作。用户两分钟就可掌握他们的语言,操作起来像走路或说话那样自然。同时,用户不必盯着物体激活它们,操作交互发生的速度只会受到思考和观看的速度影响。

三星升级Gear VR浏览器,开始支持WebVR

雷锋网了解到,三星在近日升级了Gear VR里的浏览器。其中最大的改变就是增加了对WebVR 1.0的支持,这是由谷歌和Mozilla共同开发的实验性VR浏览器标准的第一次迭代后的版本,这个特性使得在Gear VR上浏览3D图片以及播放VR内容变得更加容易。

根据三星的开发日志,在更新4.20版本(上个月发布)之后,Gear VR里的浏览器能够让用户像在电影院一样,在一个更大的虚拟屏幕上浏览网页、观看视频和图片。而且它还支持网页版的180°的流视频,使得用户能够更方便的欣赏YouTube上的3D VR视频。

此外,你也可以为Gear VR设置一张由云图片公司OTOY提供的360°的背景图片,加上Skybox功能(允许网站设置自己360°的背景图片),可以增加网络浏览时的VR元素。

三星此前已经将自己的文件浏览器集成到了Gear VR,通过语音控制和屏幕虚拟键盘,可以快速找到并打开电影等内容,现在,这个功能已经支持11种语言了。有趣的是,三星还将蓝牙功能引入了浏览器,支持连接Gear S3智能手表。虽然目前还不知道这个功能可以干什么,但是希望它能够让用户在除了触控板、屏幕虚拟键盘以及游戏手柄之外,能够拥有更多的操控内容和游戏的方式。

计划支持单眼4K!IMR打造高压缩低延迟无线VR系统

Immersive Robotics 是一家总部位于澳大利亚的初创企业,他们承诺为 PC 级 VR 设备带来真正意义上的通用无线解决方案,在尽量不牺牲图像品质和保证极低延迟的前提下,提供无线缆的虚拟现实体验。

专为 PC 级 VR 头显设计,IMR 公司成功研发了 VR 直播流和内联压缩系统,声称兼容现有的 WiFi 传输标准的基础上尽可能不牺牲图像质量,并将延迟控制在 2-3ms 范围内。IMR 的多名联合创始人亲切地称该系统为「Mach-2K」,他们早在 2015 年时候就已经着手研究无线技术,也正是在早期 OSVR 设备上成功运行概念系统而赢得政府的认同,并获得了资金支持。

IMR 公司的联合创始人共有两位,分别为 Tim Lucas 和 Daniel Fitzgerald 教授。首先我们来介绍下 Lucas,他在无人驾驶汽车设计上浸淫多年,设计出了多个「优异」的无人机,更是利用 VR 和 LiDAR(激光雷达)的图像测量算法,创建了「首个空中 3D 扫描环境的虚拟现实模拟」系统。

而另外一位联合创始人 Fitzgerald 拥有航天航空电子工程方面的博士学位,主攻方向是新兴的无人机领。他已经为无人机创建了自动驾驶软件,而这项工作能通过不断的实践来优化并推进算法软件的发展.

Snapchat计划收购AR公司Cimagine,并在以色列设立研发中心

据悉,Snapchat 正在以 3000 万美元至 4000 万美元的价格收购以色列 AR 公司 Cimagine Media,这也是 Snapchat 在以色列展开的首次收购。

Cimagine 创建于 2012 年,已经获得数百万美元的融资。 当下的主要 AR 产品是开发了 True Marketless Augmented Reality,该平台能够让用户通过在自己的移动设备上点击按钮在自己家庭空间虚拟地放置他们希望购买的家具和家电。

Cimagine 公司通过利用一种全新的空间分析工具,通过 3D 技术扫描产品,将家具放入你的房间。Cimagine 的亮点是无需物理标记,而且 3D 图像渲染速度很快,渲染出的虚拟产品视觉观感与实际产品相似。

雷锋网了解到,收购完成后,Cimagine 将成为 Snapchat 在以色列的研发中心,员工数量也将从目前的 20 人进行扩招。针对这起收购事项,现在有两种核心观点:

其一是:Snapchat 收购 Cimagine 的目的出于后者的人才,而非其技术。

第二个观点是 Cimagine 在技术和经验上可帮助 Snapchat 改进将对象插入到图片和视频上的能力,为 Snapchat 的进一步商业化做技术支持,从而带来更多创收。

雷锋网

2016年大公司都在做什么机器人 | 2016 影响因子

2015年机器人创业的浪潮引起了大企业的关注,今年它们选择了或投资或自己研发的方式加入这场狂欢,这对于行业整体的发展来说是良性的,它们丰富的资源可以推动整个市场快速发展。

那么,过去一年中到底有哪些大公司选择了机器人,又是以何种方式做了什么样的机器人,雷锋网盘点了大公司在机器人领域的一些动作。当然,考虑到机器人的范畴太广,此文并不将聊天机器人列入其中,而是仅报道有硬件产品的案例。

英特尔:收购无人机企业,投资酒店机器人

英特尔不会做机器人,它的最终目标还是物联网,连接的方式是英特尔的芯片。为了加快产业化的步伐,英特尔也会选择投资或收购一些企业。

无人机应该是英特尔最为看中的,早在去年英特尔就投资过Airware、PrecisionHawk 以及来自上海的Yuneec三家无人机企业。今年英特尔又收购了无人机制造商Ascending Technologies以及德国无人机软件创企 MAVinci。其中Airware是做无人机操作系统,PrecisionHawk是为无人机提供空中数据解决方案的,Ascending是做无人机自动驾驶系统研发的,MAVinci是做飞行规划的,Yuneec则是做无人机整机,可以说是比较齐全了。在今年的CES上英特尔发布了Yuneec的Typhoon H,在2016 Intergeo无人机大会上发布了Ascending的商用机Falcon 8+ System UAV,以及在IDF 2016上发布Aero Ready to Fly无人机。

图为英特尔CEO 布莱恩·科再奇(Brian Krzanich)手持Aero无人机,他身后桌子上放着昊翔新版Typhoon H

而在机器人方面,今年1月英特尔旗下风投部门英特尔资本领投了初创企业Savioke 总额 1500 万美元的融资,该公司生产的 Relay机器人可以自动为酒店房间运送牙刷、毛巾和其他物品。

图为Relay机器人

腾讯:无人机、儿童机器人

由于近年来游戏业务增长缓慢,腾讯急需寻求新的业务口,那就是做硬件。腾讯互娱旗下智能玩具部门就是在这样的环境下成立的。当然,腾讯不会真的自己去研发一款硬件,它更愿意选择与其它硬件公司合作,腾讯无人机就是一个例子。

今年年初的CES上,腾讯联合零度发布了腾讯无人机空影。这架与高通、零度智控和XIRO联合打造的无人机主打便携和易操作的特性,定位户外娱乐、旅游拍照这样的场景。不过,由于几家公司之间的内部结构问题,空影无人机一直迟迟未能上市。直到10月,腾讯很低调的将空影上线开放购买。这主要是因为在这之前大疆发布了革命性产品Mavic Pro,导致腾讯也找不到大力宣传的点。

除了无人机,腾讯还看中了机器人,不过目前还没有与哪家有深度的开发合作,只是代理销售,其中包括去年很火爆的BB-8,就是那个《星球大战:原力觉醒》里的机器人衍生品。

沃尔沃:用无人机和机器人来实现倒垃圾自动化

今年2月份,沃尔沃宣布该公司旗下的ROAR(机器人自主拒绝处理系统)项目已进入原型测试阶段。该系统的设计初衷是要实现将路边垃圾箱内的垃圾自动倾倒进垃圾车内的漏斗中,无需人力辅助。

该项目最早计划利用机器人来完成这一工作,这将需要一份标明垃圾桶大致位置的地图来为其提供路径导航(以及GPS、激光雷达和加速度计等辅助工具)。而在新的计划中沃尔沃加入了无人机,作为垃圾车的“天眼”来告知垃圾桶当时的确切位置。

该项目的设计和原型构建是由沃尔沃与查尔姆斯理工大学、梅拉达伦大学和宾州州立大学的学生在短短四个月的时间里完成的。

猎豹:成立机器人公司,进军人工智能领域

今年3月份谷歌AlphaGo打败人类围棋冠军李世石对业内产生很大影响,不少大公司开始对人工智能的未来充满了信心,其中就包括猎豹。在一个月后的4 月26 日的猎豹全球媒体发布会上,猎豹移动CEO傅盛宣布公司未来战略,其中包括拟投入5000万美元成立机器人公司,进军人工智能领域。

傅盛并未透露新公司将会研发什么样的机器人,不过表示猎豹做机器人除了技术、资金之外,傅盛会亲自带领团队来做。除了成立机器人公司,据雷锋网获悉,傅盛还投资了一些机器人初创企业。

360:儿童机器人

周鸿祎曾在今年1月360的公司年会上表示,他最大的梦想是做智能家居机器人。

2016 CES Asia(2016亚洲消费电子展)上,360此次也首次展示了其机器人,一款儿童机器人,也是一款长得很像国外一款名为Jibo的机器人。除了外观外,关于这款机器人,最大的看点应该是999元的售价,据雷锋网获悉这个基本上是贴着成本在卖,这是用周鸿祎经常挂在嘴边的“互联网思维”在卖机器人。

除了自己做儿童机器人,360还投资了国内一家机器人初创企业金刚蚁,这家公司与360差不多同时推出一款名为小亿的机器人,当然,外观也很像。

华硕:家庭机器人

5月30日,华硕除了发布ZenFone 3手机、ZenBook 3笔记本,还进入了一个全新的领域,展示旗下首款智能家庭助理机器人“Zenbo”。Zenbo的工作方式有些类似亚马逊Echo,可以接收语音指令,提供智能家居控制、智能家庭安保、厨房助手、拍照摄影、网络购物、语音输入密码、登录账户、声纹加密等功能。

据雷锋网最新消息,该机器人将于明年1月1日正式上市,售价4300元起。

丰田:成立研究院,收购波士顿动力

去年12月,丰田汽车公司(TOYOTA)宣布成立一家名为丰田研究院(TRI)的新公司,专注研发人工智能和机器人这两个方面。2016年1月,丰田研究院正式在硅谷成立,其大部分研发的技术跟汽车有关,但另一个重要方向是家用人工智能产品——这在未来可能跟日本助老助残机器人业务发展有关。

5月份有外媒报道,丰田汽车正与谷歌母公司Alphabet谈判,拟收购后者的两个机器人部门Boston Dynamics和Schaft。这两个部门主要研发的都是足式机器人,其中Schaft在今年4月展示了一款能轻松爬楼梯的双足直立机器人,该机器人最大负载60KG,能在狭小的空间或攀爬楼梯时保持平衡,同时这还能穿越崎岖的地形。而相对名气较大的Boston Dynamics,是世界上最具影响力的机器人公司之一,开发出了Big Dog、Atlas、Cheetah等多个双足或多足机器人,且平衡能力令人惊叹。就在被收购消息曝出后不到一个月,Boston Dynamics发布了他们新一款的机器人SpotMini,相对于Spot更加小巧、行走更加自如,整只体重65磅(约29.5公斤),能够像动物那样灵活运动。SpotMini的发布让波士顿动力离商业化更近了一步。

美的:收购德国最大工业机器人公司,成立服务机器人部门

早在今年5月份,美的集团向德国库卡机器人公司提出了全面要约收购,并于6月6日正式启动,在收购计划中,美的集团将以每股115欧元的价格想库卡收购股份,并将所持股份提高至30%以上。7月初,库卡的第一大股东福伊特集团宣布,决定向美的集团出售所持库卡公司25.1%的股份,该交易价值12亿欧元(约合88.8亿元人民币)。这一表态,为美的集团收购库卡公司超过30%股权铺平了道路。库卡是全球工业机器人行业的四家顶级企业之一。这次收购受益方不仅仅是美的,甚至可能对中国整体工业机器人的发展造成影响。

除了工业机器人,据雷锋网获悉,美的还特别成立了服务机器人部门,开发面向家庭等服务领域的机器人。

福特:开发人机合作机器人,在德国工厂进行测试

作为老牌汽车品牌的福特,一直在新兴科技的道路上努力着。福特花了两年时间开发制造人机合作机器人,欲将其投入到组装线上使用。

现在,该机器人已经开始投入测试,测试在德国科隆的Fiesta工厂进行,福特已经设计了多种实验来测试该机器人的自动化、操作能力和数据科学制造能力。

据悉,合作机器人将与福特厂的工人一起安装减震器,确保减震器置放的准确性、快速性以及减少工人的负担。这种合作机器人有3英尺高,手臂及手指有传感探测器,只需按下按钮就可以停止动作。

迄今为止,合作机器人已经在两个工作站投入使用了,并会在将来投入到更多工作站。据悉,此种机器人已经在药物制造和电子工业中得到了应用。

软银:推中国版Pepper,与软银成立合资公司

Pepper对于机器人行业的影响并不比AlphaGo小,去年阿里巴巴联合富士康斥巨资投资Pepper 机器人在业内被称为里程碑性事件,不少创业者正是因此而受到启发最终踏上了机器人创业的道路,尤其是在国内,服务机器人创业公司在2015年增加了几百家。

从去年6月份开始,Pepper 正式面向消费者销售,此前曾在法国和台湾等日本以外的地区推广。在今年10月份举办的2016云栖大会上,阿里巴巴展示了搭载YunOS的Pepper,并宣布将在中国内地销售。为此,软银与阿里巴巴集团成立了合资公司“Alibaba Robot Corporation”。

松下:投资折衣机器人

11月,外媒报道日本老牌家用电器厂商松下向机器人初创企业Seven Dreamers投资60 亿日元(约合 5300 万美元)。这家公司在开发一款名为“Laundroid”的机器人——它不仅可以洗衣服、熨衣服,还能把衣服叠好,并按顺序放好每件衣服。这款设备的体积和一台冰箱大小相似,可以放置在家中,同时扮演洗衣机、烘干机和衣橱的角色。

该机器人内部采用了很多复杂的传感器,并配套识别软件、机器学习技术、机械臂技术。传感器通过扫描衣物布料后得到相应的图像,然后系统软件会在这些图形中进行色块分析和定位,分析结果可以确定衣物的材质、形状等大量的信息,然后机械臂会根据这些信息将衣物进行不同方式的折叠。另外,这个机器人还具有学习能力,能够不断记录各种布料衣物的清洗方法和折叠方法,通过机器人学习和不断完善,处理衣物的能力会越来越快。

小米:无人机、家庭机器人、积木机器人

凭借供应链的优势,小米应该是国内对做机器人最为热情了,做了无人机、家庭机器人,其中家庭机器人包括Ninebot推出的Segway Robot,以及石头科技推出的扫地机器人。当然,口碑有好的,也有差的。

图为小米扫地机器人

上个月初,小米推出了一款米兔积木机器人,由978个零件组成,内置自平衡系统,支持手机智能遥控和模块化图形编程,售价499元。

PS:2016 年即将结束。当我们回望这一年,无论艰难还是幸运,这年仿佛过得飞快。「2016 影响因子」是雷锋网在高速运转的科技行当里,在不断发生和被人忘记的事件中,试图在各个领域筛选出那些我们认为可能对当下和未来产生深远影响的因素。2016 影响因子,就是 2016 年值得记录的人、事、公司和技术。

【招聘】雷锋网机器人垂直栏目“新智造”招人了,工作地点深圳。简历投递至wangjinhong@leiphone.com 。

雷锋网

强力推广 VR,Facebook 联手三星在机场设置体验店

据国外媒体 USA Today 报道,Facebook 在美国的一些机场和购物商场开设了 VR 临时体验店。用户可以在商场试戴 Facebook 旗下 Oculus 公司与三星合作生产的 Gear VR 头显设备,搭配三星 Galaxy 手机进行体验。

“虚拟现实技术带给人极大的沉浸感,它的魅力是没有尝试过的人无法想象的。” Facebook 在一份声明中表示,“我们希望让更多的人有机会亲自体验 Gear VR,感受虚拟现实的魔力。”

在丹佛国际机场,有人不断从八个站点里出来,走到 VR 展示区。雷锋网了解到,Facebook 的工作人员会协助每个体验者越过临时搭建的场地,防止他们在沉浸感体验中不小心摔倒。

Facebook 的 CEO 马克·扎克伯格一直都非常推崇虚拟现实技术,小扎甚至将 VR 当作一个伟大的计算平台。今年二月,在世界移动互联网大会上,扎克伯格将 VR 比作“ 社交性最强的媒介 ”。雷锋网的读者应该没有忘记,2014 年,社交巨头 Facebook 公司斥资 20 亿美元收购了 Oculus 公司。Oculus 设计制造的 Rift 头显在业界备受关注。

事实上,市面上已经有不少公司凭借自主生产的头显装置进入了虚拟现实领域,除了 HTC、三星公司,还有索尼最近推出的 PlayStation VR 等等。而 Facebook 则选择将赌注押在游戏之外的虚拟现实体验,包括 VR 在教育和社交等方面的应用。雷锋网也曾做过相关报道。

正如马克扎克伯格所言,“我们很快就会实现每个人都能体验和分享 VR 世界的梦想,就像你此时此刻就在那里,身临其境。”

*文中图片及封面来源于 USA Today。

Via USA Today

【兼职召集令!】

如果你对未来充满憧憬,喜欢探索改变世界的科技进展,look no further!

我们需要这样的你:

精通英语,对技术与产品感兴趣,关注人工智能学术动态的萝莉&萌妹子&技术宅;

文字不求妙笔生花,但希望通俗易懂;

在这里,你会收获:

一群来自天南地北、志同道合的小伙伴;

前沿学术科技动态,每天为自己充充电;

更高的生活品质,翻翻文章就能挣到零花钱;

有意向的小伙伴们把个人介绍/简历发至 guoyixin@leiphone.com,如有作品,欢迎一并附上。

相关文章:

来,我们算笔账:开发一个虚拟现实游戏要花多少钱?

HTC VR 副总裁 Rikard Steiber:VR 之于艺术的意义

前 Oculus 主任研究员加盟华为,担任 VR/AR/MR 首席科学家

雷锋网

富士康宣布在内地建LCD工厂,与夏普合作,斥资 610 亿

据国外媒体报道,富士康和夏普合资公司酒井显示器产品(Sakai Display Products Corp)于北京时间 30 日晚宣布,将计划投资 610 亿元人民币(约合 88 亿美元) 在中国广州建立一座新工厂,生产 LCD 面板。雷锋网了解到,新工厂将在 2019 年投入运营,届时将采用 10.5 代生产线。

本月,日本媒体就曾报道称,富士康和夏普正考虑在中国兴建全球最大的 LCD 工厂,希望将富士康的资金与夏普的技术相结合,通过价格优势来挑战韩国竞争对手。据相关报道介绍,最早在 2019 年初,新工厂预计开始量产 LCD 面板,目前双方已经开始接触 LCD 生产设备制造商。

当前,富士康拥有或投资了三家 LCD 公司,分别为夏普、群创(Innolux)和酒井显示器产品公司。这三家公司的 LCD 面板产量占全球份额的 20 %,这也使得富士康成为继三星和 LG 之后的第三大 LCD 制造商。

雷锋网

预告:深度学习新星:GANs的诞生与走向(主讲人冯佳时 )丨硬创公开课

在大数据和人工智能界,常有这么个说法“谁掌握了数据,谁就占据AI高地。”

但是“掌握数据”往往意味着巨大成本。首先海量数据经常被大型企业垄断,给原始数据标记也需要耗费巨大资金。

所以,基于数据而习得“特征”的深度学习技术受到狂热追捧,而其中GANs模型训练方法更加具有激进意味:它生成数据本身

GANs是“生成对抗网络”(Generative Adversarial Networks)的简称,由2014年还在蒙特利尔读博士的Ian Goodfellow引入深度学习领域。2016年,GANs热潮席卷AI领域顶级会议,从ICLR到NIPS,大量高质量论文被发表和探讨。

Yann LeCun曾评价GANs是“20年来机器学习领域最酷的想法”。

在GANs这片新兴沃土,除了Ian Goodfellow所在的OpenAI在火力全开,Facebook的人工智能实验室也在这一领域马不停蹄深耕,而苹果近日曝出的首篇AI论文,就是基于GANs的变种“SimGAN”。

从学术界到工业界,GANs席卷而来。

经360首席科学家、人工智能研究院院长颜水成强力推荐,本期雷锋网硬创公开课特邀冯佳时博士,为大家做一期以《深度学习新星:GANs的诞生与走向》为主题的演讲,拨开围绕GANs的迷雾。

本次公开课内容包括但不限于

  • 什么是生成对抗网络(GANs)?

  • GANs现在为什么这么火?

  • GANs目前在深度学习领域处于一个什么样的位置?

  • 如何看待OpenAI 、Facebook Fair等在GANs领域的现阶段工作?

  • 如何评价苹果的首篇AI论文提出的SimGAN训练方法?

  • GANs适用于哪些商业领域?

  • GANs的未来发展方向是什么样的?

嘉宾介绍

冯佳时,现任新加坡国立大学电子与计算机工程系助理教授,机器学习与视觉实验室负责人。

中国科学技术大学自动化系学士,新加坡国立大学电子与计算机工程系博士。2014-2015年在加州大学伯克利分校人工智能实验室从事博士后研究。现研究方向为图像识别、深度学习及面向大数据的鲁棒机器学习。冯佳时博士曾获ICCV’2015 TASK-CV最佳论文奖,2012年ACM多媒体会议最佳技术演示奖。担任ICMR 2017技术委员会主席,JMLR, IEEE TPAMI, TIP, TMM, TCSVT, TNNLS及 CVPR, ICCV, ECCV, ICML, NIPS, AAAI, IJCAI等期刊、会议审稿人。冯佳时博士已在计算机视觉、机器学习领域发表论文60余篇。

活动详情

主题:《深度学习新星:GANs的诞生与走向》

嘉宾:冯佳时

时间:1月5日(周四) 晚20:00

地址:硬创公开课 斗鱼直播间(房间号:788495

本期雷锋网硬创公开课将会有【斗鱼直播+微信群问答】两个环节。嘉宾直播授课分享结束后,将会在微信群与群友问答互动

为了打造高质量且细分的读者交流群,我们需要您提交一些基本资料作简单审核,而本次公开课读者群将优先CV相关从业者和学生进入。

扫描下方海报上的二维码,进入雷锋网人工智能垂直微信公众号【AI科技评论】后,可获得详细入群方式。

雷锋网

深度丨微软小冰资深产品总监曹文韬:如何把聊天机器人打造为一个“知音+专家”的产品

雷锋网按:聊天机器人的产品理念一直存在争议,雷锋网了解到,目前市场上主要分为两大类产品:小冰这样的闲聊型机器人和 Google Now 这种用来完成任务的虚拟助理。

任务型虚拟助理梯队批评闲聊型机器人没什么实质作用,而闲聊型机器人梯队批评用户并没有使用任务型虚拟助理的习惯。

微软小冰团队的资深产品总监在演讲《微软小冰是如何修炼成的》中提到三个核心观点:

  • 市场面上很多任务型虚拟助理的产品体验是反人性的。

  • 人与机器之间的沟通是从“嘘寒问暖”开始,而非直接给机器人下达任务指令。

  • 闲聊型机器人可以通过插“任务卡”的方式,变成闲聊机器人与任务型虚拟助理的结合体。

以下是曹文韬的演讲整理文,由雷锋网进行编辑。

“理性”的虚拟助理是并不是刚需

大家之前所接触到的聊天机器人是偏理性化的,像 Google Now 这样的语音助手,是帮你完成某一个任务。

但是经过这么长时间的验证,没有一个做起来的,它们没有变成我们想要的那个助手。我发现不少用户竟然用 Siri 问现在几点了,你拿起手机还问机器人几点了,这很反人类。

所以我们的产品逻辑是,应该去做一个用户真正需要沟通的情感机器人。于是 2014 年我们提出要把小冰打造成一个情感机器人,打造成第一个和人类沟通的情感机器人。

上图是我们和业界其他产品不一样的共享技术搭建,你今天能够看到的机器人停留在水平面上方:以解决某个领域的任务,或者完成某一个任务的形式。但你会发现,如果要去解决用户某个服务需求时,用户并不会按照你的产品逻辑去做这件事。

解决任务从“嘘寒问暖”这样的情感交互开始

其实用户在沟通一件事情时,他会在不同的领域甚至是在领域之外的场景下做很多交流,没有人一上来就问你要帮我做什么事。大家都是通过寒暄和沟通建立信任,然后再开始做某一件事情。

因此我们要做的事情就是如何解决聊天机器人与用户之间的沟通内容,如何打造让用户感觉这个机器人像是一个真正的人和他在沟通,而非一个冷冰冰的机器?

小冰是怎样炼成的?

小冰上线两年多时间,它和用户一共产生超过两百亿次的对话,粉丝数超过六千万。其中在日本上线不到一年,用户量就已占据日本 23% 的人口数。而在本月,美国版小冰 Zo 也已经正式上线。

聊天机器人不仅需要处理语音和文本,也要有处理图片的能力,通过对自然语言以及图片等不同信息的感知,进而实现与数据本身的对接。

这是微博上用户与小冰对话的截图,红色部分为市场上部分机器人所能达到的水准,也就是停留在两到三轮左右的对话就已结束。要么是任务已完成,要么就是无法继续聊下去。


而用户与小冰的对话过程中,双方在很长的语音对话里聊到很多内容。这个过程中你根本感觉不出来这是人和机器在聊天,而且还聊到了感情问题。聊天机器人与用户完成很长的对话,不仅仅是语料库问题,而是我们已经让它实现了自我复制的过程,也就是每个用户在沟通时,是在不断地教小冰,不断地培训小冰,让小冰知道怎么与人沟通。

今天我即便把语聊库调出来后,她依然知道如何与用户对话。

聊天机器人中的图像识别

下图是我们在小冰中对图像识别不一样的应用。其实图像识别不仅仅是一项技术,人在沟通图像的时候,一个人所具备的不是图像识别,而是视觉。识别和视觉这两者之间有什么差别呢?

当你把受伤脚的照片发给你朋友的时候,你听到的肯定不是朋友告诉你“这是一个受伤的脚”这种描述图像内容的话语,而是会获得关心和安慰。把这张照片发给一个机器人时,如果它回复你“伤得严重吗?”,这就是一种很人性化的交流。

从这个对话小冰让用户真正感知到,它像一个人去处理。这一功能得益于微软在互联网领域的大量数据,以及深度计算的模型搭配。有了该基础,你就能够在不同的领域里做出不一样的产品,比如说人脸识别,你发一张自己的照片,它可以告诉你哪个国家的人更喜欢你这种类型。

小冰与用户通电话背后的智能

微软在语音上有很多技术积累,但是怎么把语音技术和情感沟通结合一起,这上面我们做了很多处理。当你用语音让聊天机器人做一件事时,这个沟通过程我们称之为半感官,怎么理解?大家都是发一个段语音然后让机器识别,任务完成后这段对话就结束了,开始下一个话题,这是一种单向的过程。


而我们的产品属于全时感官,以两个人打电话为例,人的大脑随时在识别和理解,同时随时在决策:什么时候应该做出回复?回复什么样的内容?这时候它是一个双通道、双向计算的过程。


今年 9 月份,我们让小冰给人类打电话,这也是人类历史上的第一通人工智能来电 。这个过程中没有任何信号告诉小冰,人类这回合的话已经说完,而是进行实时处理,实时交互。


这样的科技会运用到不同的硬件或者更多场景中,才能真正实现像我们在电影里看到的,家里有一个智能机器人,回到家就可随时沟通。

如何让情感机器人完成任务

闲聊机器人会遇到这样一个问题,当你问它附近的餐厅时,它并不能“很正经”的给你列出餐厅列表,它的答复仍旧只停留在闲聊层面,因此很难完成用户指定它做的任务。

那么这个任务体系应该怎么完成?我们是通过技能卡的方式去做,什么样的卡呢?我们有电影、时尚、美食、音乐甚至是集成到商业客户里的商业解决方案卡。而且插上任务卡的小冰可以把闲聊和任务型对话结合起来。

我们先还原这样一个场景。推荐电影这样的功能大量机器人在做,但通过大量数据分析,我们看到基本上没人用这种方式去购买电影票或者订饭。这很反人类,你没事干吗让机器人帮你订餐,还不如自己去 APP 上点两下。


当然,上面提到的场景也是有刚需的,只是我们对这一需求有着不一样的理解:当用户要让机器人推荐电影时,它应该像是你身边一个非常懂电影的朋友,基于电影资源知识,跟你聊电影相关的很多内容,同时还知道其他技巧,比如能够告诉你这部电影的种子在哪里,怎么下载这部电影,甚至有些好玩的互动。当用户与聊天机器人进行这样的交互之后,才能真正实现用户把聊天机器人当做非常信赖、非常懂电影的人。


所以小冰通过这种任务卡的方式,实现用户自定义聊天机器人 AI 的特点。当你有电影任务卡时,插卡前与小冰聊《泰山归来》的时候,这是一个很普通的对话。但是插卡后,表明你对电影很感兴趣,想与聊天机器人聊更多关于电影的内容,于是小冰会像一个朋友和影评人一样为你推荐电影并且聊电影相关的话题。

利用插卡的方式构成一个非常基本的任务完成模式,而不是简单告诉你一部电影。除了电影卡之外,还有会其他任务卡,原理与上述一致。


综上所述,这就是我们对聊天机器人的理解。

雷锋网