标签归档:Facebook

Facebook 最新研究:自主学习一个会和世界互动的智能体

雷锋网 AI 科技评论按:本文由来自 Facebook 人工智能研究院的研究员 Dhruv Batra 和 Devi Parikh 共同撰写,文中介绍了 Facebook 关于自主智能体的最新研究成果——目标驱动自主学习,并且还宣布了开源 EmbodiedQA 和 House3D 数据集,雷锋网 AI 科技评论根据原文进行了编译。

大多数能够与人类进行互动的自主智能体(Autonomous agents)都存在一些共同点:它们并不是那么自给自足(Self-sufficient)。例如,一个智能音箱(Smart speaker)虽然可以通过语音接口与人类进行交流并采取一些动作(比如订购产品),但是它却无法感知周围环境。而另一方面,割草机器人虽然具备动作(割草)和感知(通过传感器)能力,但是它除了不断闪烁灯光或者发送错误信息以外,还无法实现与主人的自由交流。

如果不同时具备三个重要的关键因素——感知、沟通和动作,那么自主智能体就无法成为一个全面的助理,而这其中的空白代沟还需要人类参与进来弥补。然而这个问题对于目前的智能体来说似乎并不是什么大毛病,例如,Roomba 机器人如果忽略了通知你有把椅子阻碍了它的清洁路线,这只是一点小困难而不是什么大灾难。但是为了让下一代智能体能融入并改变我们的生活,那么自主系统还需要变得更加自给自足。

训练人工智能系统时要扔下婴儿车

为了给那些对人类微观管理依赖程度较低且更具通用性的系统铺平道路,Facebook 人工智能研究院(FAIR)开发了一系列用于训练和测试自主智能体的虚拟环境,以及能够学习智能探索那些环境的新型智能体。这些智能体将被用来作为模拟机器人而使用,它们是 Facebook 与佐治亚理工学院的研究员合作创建的。使用虚拟智能体和虚拟环境比起将真实的机器人送到现有的室内场所要来得高效得多,因为这需要花费数千台机器来匹配基于 AI 训练的运行速度。Facebook F8 会议上关于通过 AI 提高内容的可访问性的主题演讲中简单介绍过这项工作。

FAIR 的目标是指导系统根据长期计划采取多种动作,同时还要努力完成所给定的任务。为了取得成功,这些智能体必须在它们的环境中行动,综合使用感知、导航和沟通的能力去寻找出给定问题的答案,然后使用简单自然的语言转达这些答案。对于 AI 来说,这是一个极具挑战性的问题,如果一旦实现就是朝着自治水平迈出了一步,并且该智能体的适应性也将足以在非结构化的人造世界中发挥作用。

为了测试这种目标导向(Goal-driven)的方法,FAIR 和佐治亚理工学院联合提出了一个多步骤 AI 任务,称为「具体化问答(Embodied Question Answering)」或者「EmbodiedQA」。与聊天机器人或者智能音箱相比,此智能体必须在物理环境(尽管是虚拟环境)中去学习和运行,因此称为「具体化的(Embodied)」。当智能体被问及单一问题时,例如「车子是什么颜色的?」或「我的钥匙落在了哪个房间里?」,智能体必须能够理解书面语言,然后用第一人称相机去感知周围环境,探索 3D 的室内环境直到找到答案。并且为了使得智能体的自主性更加完善,它还将通过自然语言的方式回复该答案以完成自己的使命。

FAIR 提出了一项新的 AI 任务——具体化问答(Embodied Question Answering)。上图中在一个 3D 环境中的某个随机位置产生一个智能体,并给出一个问题(车是什么颜色的?)。为了回答这个问题,智能体必须借助智能导航以探索环境,通过第一人称(以自我为中心)的视觉收集信息,然后回答问题(橙色)。

FAIR 相信这些是第一个要求 AI 系统综合展示感知、交流和动作以达成目标的实验。将完全自主(智能体在没有人类引导和干预的情况下实现了自主活动)和不熟悉的环境结合起来增加了整个任务的挑战性。智能体要在随机的、数以百计的不同楼层平面图(每个平面都是仿照现实家庭进行建模)中运行,而且不具有在该环境中实践运行过所带来的增益,也不曾在类似的地图上运行过。更难的是,为了回答提出的问题,智能体必须移动,因为问题中的对象也许无法立即看到。

在工作中学习

为了训练和评估这些智能体,所需的虚拟环境不仅仅要具备交互功能,还要具备多样化和数量充足的特性,以避免智能体在相同环境中反复运行,这对自主智能体的发展而言是一个更加巨大的挑战。FAIR 的解决方案称为 House3D,它是由 45000 个手动创建的模拟室内环境所组成的。House3D 是基于普林斯顿大学的 SUNCG 数据集而创建的,但是 House3D 作为一个完全可导航的位置集合(Fully navigable set of locations),使得智能体能够同时探索数千个房间,这比起在现实生活空间中训练具有复杂机械结构的机器人要来得快得多。它也使得我们可以进行可重复性的科学实验。并且 House3D 还进行了开源,目前可以在 GitHub 上获取

为了在 House3D 中每次都能进行独特的寻宝活动,智能体必须在完成任务的过程中学习一系列核心能力——从对室内物体的识别(沙发、椅子等)到对问题的语言理解。

第一种习得的能力是主动感知(Active perception),或者是智能控制前面像素的能力,因为一开始目标对象不太可能会刚好位于智能体的视线范围内(图像通过一个 224×224 分辨率的 RGB 模拟摄像头采集)。因此,智能体不是被动地感知问题中提及的对象(固定图像数据集中就是如此),而是通过探索周围环境主动将目标对象寻找出来。

这项研究的一个创新点在于实现了导航的模块化方法,该方法将导航任务划分成了两个部分。规划者(Planner)负责选择移动的方向,例如向左移动,而控制器(Controller)则负责确定在该方向需要移动多远。这种策略避免了智能体在移动前需要去创建长远而又详细的路径规划,因为这么干会导致更多的错误和更弱的适应性。此外规划者-控制器(Planner-Controller)这套设置也更适合于强化学习,在这里智能体将根据积极或者消极的反馈来动态调整其导航。

FAIR 的智能体将导航任务分解为一个规划者(PLNR)模块和一个控制器(CTRL)模块。规划者从卷积神经网络(CNN)获得输入,然后决定所采取的动作。同时控制器将决定继续执行该动作的时间步变量——从而实现方向和速度之间的解耦合。这使得规划者能够在更短的时间内进行更有效的操作,从而减轻了训练难度。

下一步,智能体必须学会常识推理,然后在一个新的但是却并非完全陌生的环境中去发挥作用。尽管人们可能知道车库往往位于房屋的周围,因此可以通过外部门进入,但是 AI 系统却需要自己去学习这些知识。随着在不同的模拟家庭中成功达到目标,智能体必须发展出这种常识,以缩短寻找指定对象然后回答相关问题所花费的时间。

作为常识积累的后续阶段,智能体还要学习语言基础,或者是学习如何把单词(比如针对对象的描述)与特定的动作联系起来。例如,当为了找到可能位于车库中的汽车而搜索车库时,智能体不会被迫查看每个可能的空间,直到它找到与车库对应的一组像素为止。恰恰相反,智能体使用「车库」作为一个行动的指令,然后直接去找到外部门,从而更加高效地定位它的目标。

最后,因为 FAIR 的目标是超越繁琐的、逐步的人为监督,从微弱和远期的目标驱动奖励中学习,所以智能体必须学会的最重要的能力之一是「功劳分配(Credit assignment)」,这意味着智能体能够知道自己一路上所做的行为哪些是正确的而哪些又是错误的。例如,如果询问「多少个房间里有椅子?」,然后智能体并没有被明确告知需要检查每一个房间,甚至没有被告知要从家中含有椅子的区域开始计算。智能体能够凭借自己的力量去探索和回答问题,而不需要借助人类提供的详细的逐步计划。因此,从它是否正确回答的一个微弱信号来看,它必须自行学习其数百项相互依赖的行动中是哪一项导致了成功。为了增强传统的强化学习,FAIR 使用模仿学习(Imitation learning,比较智能体的运动与到达目标的可能最短路径)和奖励塑造(Reward shaping,通过「变得更近」和「变得更远」信号随时间变化而改进智能体的表现)来允许智能体把它真正使命拼凑起来,即便该使命在开始时并不明晰。

让自主系统更加自主

经过训练的 EmbodiedQA 智能体与标准序列模型基准(一个 LSTM 导航器)相比,表现的相当合理。

该视频比较了 FAIR 开发的智能体(名称为 ACT+Q-RL)与基准的性能表现(名称为 LSTM+Q)。视频地址 https://youtu.be/gVj-TelJfrk

和 House3D 一样,FAIR 收集的 EmbodiedQA 数据将进行开源,并且旨在启发更广泛的 AI 研究社区内的其它项目。为了给其他研究人员提供完整的背景,FAIR 将人类带入了这个方程式中。FAIR 和佐治亚理工学院将自主智能体导航与问答的能力与远程遥控智能体进行了对比,这些远程遥控智能体由人类(通过亚马逊的 Mechanical Turk 平台)进行操控,从而建立了专家级别的基准导航示例。由此产生的数据集包括,与 750 个独特的、多房间的环境相关的合成产生问题(Synthetically generated questions)。智能体(和人类)准确性的故障以及我们使用的问答生成引擎也将成为 EQA v1 开源版本中的一部分,该版本在不久的将来可以获取到。

虽然 EmbodiedQA 是只涵盖了一种目标驱动的自主任务,但是它却代表了人工智能的高难度(因为它将各种各样的子任务合并成了一个任务),并且有机会探索采取「行动」的新学习范式,这是成功的先决条件。无法做出决策的智能体——在这种情况下,通过在现实家庭中导航,确定它们收集到了相关的数据,然后传达它们发现的内容——这种智能体在我们的实验中是无法完成任务的。

这种挑战是艰巨的,因为它至关重要。在短期内,目标驱动的算法可以使用自动化来改善 AR 和 VR 的体验,为可用的接口选项添加直观的语音交互。但这种基于行为的目标驱动方法的长期影响可能会延伸到自主性上。从数字助理可以根据单一命令(例如,不仅可以预约医生,还可以重新安排冲突的会议)执行一系列家务事,到灾难响应机器人遵循来自第一响应者的简单语音命令,这种适应性的自动化可能会对我们的生活产生重大影响。

Via Facebook AI Research Blog,雷锋网 AI 科技评论编译

雷锋网

Facebook 开源 AI 围棋源代码,击败职业棋手只需一块GPU

雷锋网 AI 科技评论消息:5 月 2 日,Facebook AI Research(FAIR)官网博客中宣布开源其 AI 围棋机器人 ELF OpenGo(包括源代码和一个训练好的模型),该机器人是基于 ELF 平台研发而成,曾击败了 4 位世界排名前 30 的围棋棋手。

据雷锋网了解,该工作主要是受启于 DeepMind 的工作。今年早些时候 FAIR 启动了该项工作,期望基于其进行强化学习研究而开发的可扩展、轻量级框架(Extensible Lightweight Framework,ELF)再现 AlphaGoZero 最近的结果。其目的则是创建一个开源实现的系统,该系统能够自学围棋进而达到人类职业棋手的水平或更高水平;同时他们也希望通过发布的代码和模型,激励更多的人去思考这项技术新的应用和研究方向。

据这个项目的负责人田渊栋介绍,他们用了两千块 GPU 训练该模型,约两到三周后得到当前版本的围棋 AI模型,该模型基本上超过了强职业棋手的水平。ELF OpenGo 在与世界排名前 30 的四位职业围棋棋手(金志锡,申真谞,朴永训及崔哲瀚)的对弈中,OpenGo 以 14:0 的成绩赢得了所有的比赛;在比赛中OpenGo使用单块 GPU 每步50秒的搜索时间(每步搜索 8 万个局面),而人类棋手可以有任意长时间的思考。

另外,ELF OpenGo 在与目前公开可用的、最强的围棋机器人 LeelaZero 的对一种,后者采用了除ponder外的缺省配置,以及公开权重(192×15,158603eb, Apr. 25, 2018),结果 OpenGo 赢得了全部 200 场比赛。

田渊栋博士随后在知乎上发表的一篇感想文章中提到,OpenGo 这个项目「不是为了做最好的围棋程序,不是说要打败谁」。之所以做这个项目有三个目的:

(1) AlphaGoZero/AlphaZero
算法很有意思,我们想知道为什么它有效果,是怎么会有效果的,是不是如同宣传的那样是百试百灵的通用算法,是不是只要堆机器,强人工智能马上就来了?还是说其实这个算法有什么问题和弱点?DeepMind
不开源也不透露细节,文章里面一些地方也没有写得很清楚。我之前写过 Blog
讨论过,但是没有第一手经验总不是很踏实。所以本着研究目的,我们需要复现一下,先有复现,才有创新,这个是做研究的习惯。

(2)
今年年初我重写了 ELF
的核心代码,另外也加了分布式训练,需要找个具体应用来测试一下。站在这个角度上,AlphaGoZero/AlphaZero
是个完美的选择,再说之前也有 DarkForest 的代码和围棋程序的经验,所以把它们拼起来不用花太多力气。

(3)
不管是通用算法还是分布式平台,都可以用来干很多别的事情,不一定是围棋,不一定是游戏。如果我们去看 ELF OpenGo
的代码,会发现其实很大一部分和围棋一点关系也没有,完全适用于其它方向的工作。而围棋对我们来说,只是一个把算法和平台做好的手段。在这一点上,花点时间把围棋做好是值得的。

田渊栋博士表示,随着今天 ELF OpenGo 的发布,这三个目的都已达到。当然,他们更希望的是能够借此机会推广一下 ELF 平台和 PyTorch 深度学习框架,让更多的人使用和完善它。

代码见:https://github.com/pytorch/ELF

模型见:https://github.com/pytorch/ELF/releases

英文 blog 见:https://research.fb.com/facebook-open-sources-elf-opengo/


ELF 平台

ELF 平台是一个可扩展、轻量级且非常灵活的游戏研究平台,尤其适用于实时战略(RTS)游戏的研究,于 2016 年 6 月首次发布。

在 C++端,ELF 与 C++线程同时托管多个游戏;而在 Python 端,ELF 可以一次返回一批游戏状态,这使得其对现代的强化学习非常友好。相比之下,其他平台(例如 OpenAI Gym)则只是使用一个 Python 界面封装一个单一的游戏,这种情况使得并发游戏(许多现代的强化学习算法都有此要求)的执行就变得比较复杂。

ELF 具有以下特征:

  • 端到端:ELF 为游戏研究提供了端到端的解决方案。它提供微型实时策略游戏环境、并行模拟、直观的 API、基于 Web 的可视化,并且还具有由 Pytorch 授权的强化学习后端,资源需求最少。

  • 可扩展性:任何具有 C / C ++接口的游戏都可以通过编写一个简单的包装器插入到这个框架中。

  • 轻量级:ELF 运行速度非常快,开销很小。在一台 MacBook Pro 上,基于 RTS 引擎构建的简单游戏(MiniRTS)使用 ELF 平台,能够单核每秒运行 40K 帧;而只使用 6 块 CPU+1 块 GPU 从零开始训练 MiniRTS,也只需要六天。

  • 灵活性:环境和参与者之间的配对非常灵活。例如单个 agent 与单个环境(例如 Vanilla A3C)、多个 agent 与单个环境(Self-play/MCTS),或者单个 agent 与多个环境(BatchA3C、GA3C)等。而且,任何构建在 RTS 引擎之上的游戏都可以完全访问其内部表示和动态。

随着这次 OpenGo 的开源,FAIR 也对 ELF 平台进行了改进,升级了更高效、更友好的 API 以及支持对数千台计算机进行分布式计算的框架。作为 PyTorch 的一部分,ELF 能够是研究人员能轻松地尝试不同的强化学习思想,并进行快速、灵活的实验。

雷锋网报道。

雷锋网

因数据隐私理念不合, Whatsapp 创始人离开 Facebook

雷锋网消息,据《华盛顿邮报》报道,Whatsapp联合创始人兼首席执行官Jan Koum 近日被确认已经离开Facebook,Koum离开的原因是与Facebook在保护用户数据隐私方面的意见不合。

在《华盛顿邮报》报道他计划离开之后,Koum在Facebook的一篇文章中写道:“现在是我继续前进的时候了。”据内部知情人士介绍,Koum一直在向Facebook和WhatsApp的高管理通报他的决定。最近几个月Koum在WhatsApp的办公室里甚少露面。

2009年,雅虎的前员工Koum和Acton创立了WhatsApp,每年向用户收取0.99美元的年费。到2014年,这家小公司拥有近5亿用户。因为此时Facebook正在寻求在海外拓展社交网络,它引起了扎克伯格的注意,

在扎克伯格的家中吃过晚饭后,扎克伯格向WhatsApp提出了让Acton和Koum成立即亿万富翁的提议。

雷锋网了解到,2014年2月, Facebook宣布以190亿美元收购WhatsApp,这笔收购在当时创下了初创公司被收购的金额纪录。截至去年底,Jan Koum的财富约为91亿美元,Brian Acton的财富约为67亿美元。

但是,Koum和Acton一直是数据隐私保护的大信徒,此前曾公开批评目标广告模式。在2012年的WhatsApp博客文章中,他们写道:“没有人会兴奋地看到更多的广告;没人会想到明天会看到的广告。“他们将在线广告形容为”对美学的破坏,对智力的侮辱,以及思路的中断。“

因此,维持用户数据的独立性一直是Koum及其联合创始人Brian Acton在向Facebook出售公司时约法三章的重要内容。两位创始人在一篇博客宣布收购消息时曾表示,“WhatsApp将保持自主和独立运作,你仍然可以相信绝对没有广告会妨碍你的沟通。”

就在上个月,Facebook用户数据泄露事件全面爆发,涉及到用户人数高达8700万,其中的矛盾关键点就在于Facebook允许第三方错误地处理用户的个人信息。

研究公司GBH Insights的首席战略官兼技术研究主管Daniel Ives表示:”Facebook成功的一部分是消化信息的能力,并将其整合到他们的广告机器中来实现盈利。但是,由于创始人的抵制,WhatsApp更具挑战性,”他说。“这是一场大规模的文化冲突。”

在WhatsApp如何赚钱上,双方出现了冲突。Facebook取消了0.99美元的年费,而Koum和Acton继续反对这种广告模式。该服务仍然没有广告,但WhatsApp已经着手实验以赚钱:今年1月份,Facebook推出了一个名为WhatsApp Business的工具,允许企业创建配置文件并在WhatsApp上向其客户发送消息。Facebook的创始人还与WhatsApp在印度建立移动支付系统发生冲突。

另一个分歧点是WhatsApp的加密。2016年,WhatsApp增加了端到端加密,这是一种安全功能,让包括WhatsApp的所有者在内的外部人员无法获取信息。Facebook管理人员希望让企业更容易使用其工具,而WhatsApp的管理人员则认为这样做需要削弱其加密功能。

尽管WhatsApp的创始人如此看重用户数据的隐私,但是这个美好的愿望却没能一直延续下去。Facebook迫使WhatsApp改变其服务条款,使社交网络能够访问WhatsApp用户的电话号码,除此以外,Facebook还在Facebook和Whatsapp上推行一致的用户特征以用于数据挖掘和广告投放以及推荐系统。

据知情人士介绍,WhatsApp的管理人员愿意与Facebook分享一些数据来衡量谁在使用该服务。但他们反对使用WhatsApp的数据来创建一个在Facebook多个平台上统一的用户配置文件,其中还包括Instagram和Facebook Messenger,并可用于广告定位或Facebook的数据挖掘。

人们说,最终,Koum被理念上的差异耗尽心力。据其他人士称,在Facebook被收购后的四年一个月里,其他WhatsApp员工士气都很低落,并且计划在11月离开,届时他们可以根据Facebook交易条款行使所有股票期权。

据雷锋网了解,此前离职的另一位WhatsApp创始人Acton向Signal捐赠了5000万美元的资金,这是一款加密及时消息应用。在最近一篇博客文章中,他宣布自己是非营利组织信号基金会的执行主席,并表示他的目标是建立“这个星球上最值得信赖的通信体验”。

雷锋网

扎克伯格在国会听证会上的表态,会成为 Facebook 的救赎吗?

对于即将步入 34 岁年龄关口的 Facebook 创始人兼 CEO 扎克伯格来说,2018 年 4 月 10 日(美东时间)可以说是他人生中值得铭记的一天。这一天,他出现在美国国会的听证会上,面向 44 位来自美国参议院商务、科学与交通委员会和参议院司法委员会的参议员,就近段时间以来持续发酵的 Facebook 隐私问题进行陈述和回应。

这是一场马拉松式的听证会,持续时间长达 5 个小时。

这次听证会以扎克伯格的讲话为开场。扎克伯格在开场讲话中表示,Facebook 没有能够采取足够的措施防止其工具被用于造成伤害,这其中包括假新闻、来自外国势力对美国大选的干扰、仇恨言论等;对此,扎克伯格表示了道歉,并表示他对 Facebook 发生的事情负责。他在证词中写道:

这是我的错误,我很抱歉。我创立了 Facebook 这家公司,并且是我在运营它。对于这家公司所发生的事情,我应该负责。

随后的环节中,扎克伯格回应了来自众多参议员的问题,这些问题涉及到与 Facebook 相关的方方面面,大致可以分为几个方面,雷锋网总结如下。

关于 Facebook 是否涉嫌垄断

发展到今天,Facebook 可以说是拥有全球用户数量最多的互联网公司之一。雷锋网了解到,它旗下的 Facebook、Whatsapp、Messenger 等 app 都已经进入十亿用户俱乐部;而庞大的用户体量也让垄断这个话题成为扎克伯格不得不面对的焦点。

一个名为 Lindsey Graham 询问扎克伯格谁是 Facebook 最大的竞争对手,扎克伯格回答说 Facebook 有很多竞争对手,包括 Apple、Microsoft、Google、亚马逊等巨头,只不过是在用不同的方式提供服务。然后 Lindsey Graham 冲追不舍,但扎克伯格并不理会,继续阐释 Facebook 的竞争局面……

答非所问之间,扎克伯格坚定地否认【Facebook 是一家垄断公司】的观点。但随之而来的问题在于对 Facebook 的监管问题,扎克伯格表示 Facebook 并不拒绝监管,但是它更加欢迎正确的监管。

Facebook 不排除会有付费版本

众所周知,用户使用 Facebook 服务是完全免费的,当然与免费伴随而来的就是无穷无尽的 Facebook 广告;而广告恰恰是 Facebook 营收来源的绝对主体。但鉴于这些广告与用户个人信息的强关联性和推荐机制,很多用户开始担心自己的隐私被 Facebook 所随意使用,因此关于【一个付费去广告的 Facebook 版本】的讨论一直潜在。

在听证会之前,Facebook COO Sheryl Sandberg 在接受媒体采访时,用一种模糊的方式回应了关于【Facebook 是否会寻求到一个去除广告的产品解决方案】的问题。她表示,其实有很多种形式,不过如果用户想要去除广告,可能需要付费。

Sandberg 的表态在扎克伯格的回答那里得到了补充。一个名为 Orrin Hatch 的参议员询问扎克伯格:Facebook 是否会一直免费?扎克伯格表示:

是的。Facebook 将一直会拥有一个免费版本。把全世界的每一个人连接起来从而让整个世界更加亲近,是我们的使命。为此,我们认为我们需要推出一个所有人都用得起的产品。

外媒 The Verge 认为,扎克伯格在这里提到【免费版本】这次词,为 Facebook【未来会推出付费版本】这个事情发生的可能性留出了空间,而用户对于付费版本的期待,显然不仅仅是免费广告烦恼,还包括隐私不被信息搜集。

人工智能会成为 Facebook 的救赎吗?

毫无疑问,几乎所有的科技公司都意识到了人工智能的重要性,Facebook 也是其中的重要参与者和引领者之一。在本次听证会上,扎克伯格更是把人工智能作为该公司解决隐私问题的重要法宝。

比如说,扎克伯格说,Facebook 可能会在 5 到 10 年内开发出人工智能工具,准确标记出仇恨言论。他表示,他很看好 Facebook 能在这段时间内开发出【能判断细微语言差别】的工具,从而更准确地标记出仇恨言论。当然,他补充称当前的 Facebook 【还没能做到这点】。

面对外界所担心的【其他国家可能会利用 Facebook 干扰美国选举】这个问题,扎克伯格表示 Facebook 已经在部署新的人工智能工具,从而更好地识别虚假帐户,防止外国势力干扰选举,并表示是一场【军备竞赛】。

实际上,扎克伯格此前曾颇为自豪地说,Facebook 今年的状态要比 2016 年美国大选时更好。

面对 Facebook 平台上出现的内容问题,比如说恐怖主义等相关信息,扎克伯格依然认为人工智能才是解救之道。他表示,人工智能的进步意味着类似 Facebook 这样的公司需要主动思考如何删除令人反感的内容,而不仅仅是在有人标记出这些内容之后再采取行动;这带来了【道德和法律】责任的问题。

Facebook 是否监听了人们的语音内容?

关于这个话题,外界对 Facebook 的质疑喧嚣不断。在本次听证会上,Gary Peters 参议员询问扎克伯克:

Facebook 是否搜取了人们设备上的音频去完善它已经得到的用户信息?Yes or No?

扎克伯格不假思索地说:No.

雷锋网总结

毫无疑问,今年 3 月份以来发生的 Facebook 隐私可以说是这家公司发展到今天面临的最严重的负面事件之一。尽管 Facebook 多次以各种各样的方式道歉并推出保护措施,但考虑到 Facebook 的庞大体量以及由此带来的影响力,人们还是会这个社交网络巨头存在种种疑虑。在这种情况下,扎克伯格站出来接受问询,可以说是对外界质疑最有力的回应。

一个好消息是,在经历了数周的下跌之后,Facebook 的股价终于在扎克伯格的听证会举行之际出现回升,涨幅高达 4.5%,达到了 165.04 美元,创下 2016 年 4 月以来最大百分比涨幅。这似乎是一个积极的信号,说明扎克伯格的挺身而出起到了应有的作用。

不过在雷锋网看来,从长远来看,基于如此庞大的用户体量和潜在的舆论影响力,Facebook 面临的各方面问题依然严峻,扎克伯格的表态只能算是 Facebook 重新出发的一个开始;在这条自我救赎的路上,扎克伯格要做的还有很多。

雷锋网

数据泄漏丑闻升级后, Facebook 将对隐私政策做这些改变

4 月 4 日,Facebook 的首席技术官 Mike Schroepfer 在官网发布的声明中承认,剑桥分析(Cambridge Analytica )公司从 Facebook 获取的用户信息高达 8700 万,远高于之前公布的 5000 万,其中,八成以上的用户是美国人。

北京时间 4 月 5 日,Facebook召开了记者会,创始人扎克伯格回答了各家媒体关于数据泄漏的尖锐问题,对日后 Facebook 将采取的用户保护政策、以及他本人是否卸任董事长一职做出了回应。

下周一将会逐一通知所有受影响的用户

首席技术官 Mike Schroepfer表示,Facebook 计划在 4 月 9 日星期一通知所有受影响的用户,并在 Facebook 时间表顶部显示通知消息。与此同时,Facebook 将对所有用户发出提醒(不仅仅是受影响的8700万人),建议用户查看所有可访问其 Facebook 数据的应用,并且建议用户删除不必要的应用,以免自身信息被搜集。

为了防止用户忽视这条提醒,Facebook 还将采取这样一条应对措施:那些在过去三个月中未使用的应用,会被自动降低访问权限。

雷锋网发现,其他更新措施还包括:

阻止应用程序访问 Facebook 活动参与者以及活动墙上的帖子;

阻止应用程序访问 Facebook 群组的成员名单;

想要访问 Facebook 群组的应用程序需要经过 Facebook 审核并获得群组管理员的批准;

应用程序无法访问 Facebook 群组内发表评论用户的姓名和照片;

Facebook工作人员将审查每个需要访问 Facebook 页面的应用程序;

应用程序将无法访问用户的宗教或政治观点、关系状态、自定义朋友列表、教育和工作经历、健身活动、阅读活动、音乐聆听活动、新闻阅读、视频观看活动和游戏活动;

用户将无法使用电话号码或电子邮件地址搜索其他用户。 Facebook表示“恶意攻击者会滥用这些功能,提交他们通过搜索和账户恢复功能获得的电话号码或电子邮件地址来公开个人信息”;

Facebook Android 应用程序不再收集电话和短信元数据。

针对这些措施,很多安全专家并不买账,他们认为不法分子已经将 Facebook 的大部分用户群映射出来,且相关数据已经泄露,被剑桥分析公司用作政治斗争的武器。这些政策只是为了安抚愤怒的用户,为时已晚。

Facebook将在全球推广严格的GDPR隐私保护措施

2016 年,欧盟通过了被称为史上最严的《常规数据保护条例》(General Data Protection Regulation,以下简称 GDPR)。其中要求数据控制者要严格执行条例所规定的数据处理规范,及时告知数据主体的使用情况,这相当于给互联网公司在获取欧洲用户数据时加上一道“紧箍咒”。

条例指出,任何公司只要收集欧盟公民的数据,就受到GDPR的管辖,与公司所在地、或者数据存储地点无关。

自 2017 年以来,Google、Slack 等包含互联网业务的科技企业都在重新修订自己的数据保护规则,绝大多数还推出了最新的数据工具。业内人士认为,它们应该都是在为欧盟即将在 2018 年 5 月份实施GDPR做准备。

针对这项严格的条例,扎克伯格表示将在全球推广GDPR,但不会采取完全相同的格式:

Facebook的隐私保护措施可能不会采用与GDPR完全相同的格式。 我们需要弄清楚在不同地区、不同法律、不同市场中,什么措施是有意义的。但是我要重复一遍,我们将在各地实现所有相同的控制和要求,不仅仅是在欧洲。

据路透社报道,扎克伯格透露Facebook正在制定一版即将在全球推行的数据隐私规范,其中包括部分的GDPR要求。在被问及哪些GDPR要求不被包括在内时,扎克伯格避重就轻,称“仍在推敲细节,但是精神上应该与GDPR一致。”

扎克伯格:我不会引咎辞职

雷锋网发现,在新闻发布会上,有媒体问扎克伯格,Facebook是否会让其卸任董事长以恢复公众信任时,扎克伯格回应“据我所知不会”。

生活就是要从错误中学习,并且弄清楚你需要做什么才能继续前进…… 我认为人们评价我们应该基于我们如何从错误中吸取教训……基于我们是否创造了人们喜欢并且让他们生活更好的事物……有数十亿人很喜欢我们创造的产品。

扎克伯格表示,自己依然是公司的合适人选,也不会因为丑闻解雇员工。

据悉,扎克伯格将会于4月10日、11日两天,在两场美国国会听证会上接受询问。

雷锋网 VIA bleepingcomputer,搜狐科技

雷锋网

我在 Facebook 上发了一张小狗的照片,Facebook 应该付钱给我吗?

雷锋网 AI 科技评论按:这是经济学家 Eduardo Porter 发布于纽约时报的最新文章,文章标题为《Your Data Is Crucial to a Robotic Age. Shouldn’t You Be Paid for It?》,本文从经济学和商业的角度论述当前的科技巨头们是否该在这个信息时代为使用了用户们的数据进行付费,雷锋网 AI 科技评论对原文进行了编译。

Facebook 公司需要因为使用了我们所发布的小狗狗照片而付费给我们吗?

这个观点也许听起来有点疯狂,因为在 Facebook 上发布小狗狗的照片并不是被迫的,我们仅仅只是乐于这么做。Facebook 的 14 亿日活用户每天都要在上边花费一个多小时,而我们却不需要为此付费,这真是太神奇了。

然而,这类思想正在硅谷及其它地区大受欢迎:Facebook 和其它高科技公司正在提供免费的在线服务,从那些本该支付服务费的用户手中,收取大量的数据以及用户信息。

Instagram 上的春假照片,YouTube 上解释《我的世界》技巧的视频,网络搜索和亚马逊购物记录,甚至是为了和公婆一块过感恩节而前往 Waze 旅途中的时速,这些数据都是有价值的。在不久的未来,它将变得更加有价值。

让这些公司明确地为这些数据信息付费不仅能够为用户们提供更好的交易,它还将提高当前正在建设的信息经济的数据质量。另外这还可能会打破数据巨头对未来技术的垄断,让新鲜空气进入这个失去活力的经济体中。

数据付费这种想法已经存在很长一段时间了。Jaron Lanier 是一名技术哲学家和虚拟现实先驱,目前供职于微软研究院,Jaron 在其 2013 年出版的《谁拥有未来?》一书中提出了这个建议,以此作为对网络经济的一种必要的纠正措施,因为网络经济主要是靠广告商通过「秘密操纵用户」的购物决策而获利。

它正在「激进市场」中凸显出来,这本书很快将从芝加哥大学法学院 Eric A. Posner 和微软首席研究员 E. Glen Weyl 那里发布出来。它在欧洲向美国互联网巨头收取税收过程中发挥了重要作用。

Politico 上月获得的一份报告中,欧盟委员会建议根据用户的位置对数字公司的收入进行征税,理由是「企业价值的重要组成部分在于定位用户位置以及数据收集与处理」。

用户数据是一项珍贵的商品。Facebook 根据用户画像为广告商提供精确定位的受众群体。 YouTube 也会根据用户的喜好来进行定向投放。尽管如此,与人工智能将覆盖到整个社会经济相比,这些还是相形见绌。

数据是 AI 革命的重要组成部分。训练系统在执行比较简单的任务时,如语音翻译、语音转录或图像识别等时需要大量数据——如标记的照片,以用于识别其内容。

深度学习专家吴恩达表示「对于那些顶尖的 AI 团队而言,许多团队很可能在至多一到两年的时间内就能实现对竞争对手人工智能软件的复制,但是要访问到对手的数据却是非常困难的。因此对许多企业而言,数据才是真正的壁垒,而不是人工智能软件或者说算法。」

我们可能自认为这是一项公平的交易,将我们的数据免费提供给企业,换取免费使用社交分享平台的权利。然而根据其它数据指标的显示,我们正在成为受害者:Posner 先生和 Weyl 先生写道,在最大的科技公司中,劳动收入份额仅占 5% 至 15%,这远低于沃尔玛的 80%。消费者数据等于帮他们获得了免费的工作。

「如果这些由人工智能驱动的公司代表了未来经济更广阔的部分,」他们认为,「如果他们的商业模式没有发生根本性变化,那么我们可能走向一个劳动力份额从目前的大约 70% 大幅度下降到接近 20% 到 30% 的世界」。

正如 Lanier、Posner 和 Weyl 先生所指出的那样,极具讽刺意味的是,人类正在提供免费的数据来训练人工智能系统以取代整个经济体中的工人。来自左右两派的评论员纷纷表示担心,一旦机器人夺走了人类的所有工作,普通人就只能干坐着吃白饭了。也许到时候只能由税收资助来提供基本工资了。

那么如果向那些提供训练数据的用户支付费用又如何呢?如果人工智能占经济体总量的 10%,大数据公司收入的三分之二都要支付给数据,提供数据的「工人」的收入份额将大幅增加。这与劳动在整个经济体中的收入份额相同。根据 Weyl 和 Posner 先生的推算,四口之家每年将获得 2 万美元。

其中一个关键点在于,如果人们因为提供数据而获得了补贴,那么数据的质量和价值都将增加。Facebook 可以直接要求用户标记小狗的图片用于训练模型。它也可能要求译员上传他们的翻译结果。如果交易价值更加明确化,Facebook 和 Google 可能会要求高质量的数据。而如果数据巨头不愿意给用户支付数据费用,那他们必须自己处理好用户提交的任何内容。

中间的过渡期并不会太轻松。我们需要弄清楚系统对数据的价值。你的小狗图片可能会变得毫无价值,但是来自塞尔维亚克罗地亚人的大学翻译可能是具有价值的。除免费数据外,YouTube 和 Facebook 可能会向用户收取服务费用——如 Netflix。或者,他们可以通过训练人工智能系统来赚钱,然后支付一些权利金(royalty stream)给那些提供有效数据的用户。

但无论如何,这种转变似乎是值得的。值得注意的是,它可能有助于解决这个新技术时代最值得关注的问题之一:谁来负责控制数据?

今天,各大企业中最主要的数据收集者是 Google 和 Facebook,而紧随其后的则是亚马逊、苹果和微软。他们的主导地位不可挑战:你能想象得到另一个足以和 Google 抗衡的搜索引擎巨头出现吗?或者出现一个全新的足以取代你和你朋友目前正在使用的社交网络。而如果公司不得不为用户的数据支付费用,这种支配性的主导地位也许就会小一些。

Google、Facebook 和亚马逊将无法扩展在技术生态系统顶端巩固其地位的网络效应。每个人都想使用 Facebook 因为我们的朋友也都在使用 Facebook。但是如果竞争对手为用户的数据支付费用,那么这种平台优势就可能会被削弱。

拥有不同商业模式的公司可能会参与其中。「这是其他公司进入该领域并进行尝试的一次机会,他们将为用户支付数据费用。」Posner 先生说道,「所有这些都很新颖,所以普通人甚至都没有理解清楚这些公司是如何操纵了自己的。」

当然,最大的问题是我们如何实现这种转变。我的猜测是,期待着 Google 和 Facebook 会为自己的用户数据付费简直就是一件天方夜谭的事情,即便这么做能够提高数据的质量。那么政策制定者能否介入,正如欧盟委员会所做的一样,要求科技公司计算出用户数据的价值呢?

无论如何,在未来可能会出现更合适的交易方式,总比免费为 Facebook 提供小狗的照片来得强。

Via Your Data Is Crucial to a Robotic Age. Shouldn’t You Be Paid for It?,雷锋网 AI 科技评论编译

雷锋网

Facebook 公布全身追踪技术,不只是脸,整个身体都可实现 AR 效果

日前,Facebook 人工智能摄像团队(AI Camera Team)正在研发各种计算机视觉技术和创新工具,帮助人们更有创意地表达自我。比如,利用实时“风格转换”技术,你可以制作出“梵高风”的照片和视频。使用实时面部追踪技术,你可以实现“一键美妆”或者“换头术”,变化成各种卡通头像。那么,你有想过“换身术“吗?Facebook 团队的 AR 全身追踪技术或许可以帮你实现。雷锋网将该团队目前取得的成果编译如下。

为了实现“换身术”,我们需要实时并准确地检测和追踪身体动作。这其实是一个非常具有挑战性的问题,因为身体姿势和动作变化会很大,识别起来并不容易。一个人可以是坐着的,走着的或是跑动着的;人们可能穿着长外套或者短裤; 有时候人的身体还会被他人或物体阻挡。这些因素都大大增加了身体追踪系统保持稳健性的难度。

我们团队最近开发了一种新的技术,可以准确地检测到身体姿势,同时将人体从背景中分割出来。目前,我们的模型还处于研究阶段,但这个模型的好处在于,它只有几兆大小,可以在智能手机上实时运行。不久之后,它还可以衍生出许多新的应用程序,比如创建“全身面具”,使用手势来控制游戏,或者对人体进行“去识别化(de-identifying)”。

MaskR-CNN2Go的架构

我们的人体检测和分割模型基于一个叫做“Mask R-CNN”的框架。这是一个简单、灵活且十分通用的对象检测和分割框架。它可以高效地检测图像中的对象,同时预测关键点的运行轨迹,并为每个对象生成一个分割掩码(segmentation mask)。Mask R-CNN 框架研究获得了 ICCV 2017 年度最佳论文奖。为了在移动设备上实时运行 Mask R-CNN 模型,Facebook 的 Camera,FAIR 和 AML 团队的研究人员和工程师共同合作,构建了一个高效而轻量的框架模型:“Mask R-CNN2Go”。

Mask R-CNN2Go 模型由五个主要组件组成:

1、主干模型包含多个卷积层,并且生成输入图像的深层特征表征。

2、候选区域生成网络(RPN)以预定的比例和纵横比(锚点)生成候选对象。OI-Align 层从每个对象的边界框中提取其特征并将它们发送到探测端。

3、探测端口包含一组卷积层,池化层和全连接层。它能预测每个候选框中的对象有多大可能是一个人体。探测头还可以改进边界框的坐标,将非极大抑制值的相邻框候选框进行分组,并为图像中的每个人生成最终的边界框。

4、利用每个人的边界框,我们使用第二个 ROI-Align 层来提取特征,这些特征来自于关键点端口和分割端口的输入。

5、关键点端口与分割端口具有相似的结构。它为身体上的每个预定关键点预测出一个掩码。并使用单一最大扫描来生成最终坐标。

一个针对移动设备而优化的轻量级模型

与现代 GPU 服务器不同,手机的算力和存储空间都十分有限。Mask R-CNN 最初的模型是基于 ResNet的,它太大而且太慢,无法在手机上运行。为了解决这个问题,我们为移动设备开发了一个非常优化而高效的模型架构。

我们使用了几种方法来减小模型的大小。首先,我们优化了卷积层的数量和每层的宽度,这也是我们在处理中最耗时的部分。为了确保拥有足够大的感受野,我们使用了包括 1×1,3×3 和 5×5 的内核大小的组合。另外,我们还使用权重剪枝算法来缩减模型。我们的最终模型只有几兆字节,但是非常精准。

模块化设计提高了计算速度

为了能够实时运行深度学习算法,我们使用并优化了我们的核心框架: 载有 NNPack 的 Caffe2,SNPE和 Metal。通过使用移动 CPU 和包含 NNPack,SNPE 和 Metal 在内的 GPU 库,我们能够显着提高移动计算的速度。并且,所有这些都是通过模块化设计完成的,并不需要改变模型的一般定义。因此,我们既可以获得较小的模型,又可以获得较快的运行时间,同时避免了潜在的不兼容问题。

Facebook AI 研发团队(FAIR)最近发布了 Mask R-CNN 研究平台(Detectron)。我们开源了 Caffe2 运算符(GenerateProposalsOp,BBoxTransformOp,BoxWithNMSLimit 以及 RoIAlignOp)并提供了必要的模型转换代码,供研究社区使用。

下一步是什么

开发移动设备的计算机视觉模型是一项艰巨的任务。移动设备模型必须小巧,快速而准确,并且不需要大量内存。我们将继续探索新的模型架构,力求进一步提升模型效率。我们还将探索更适合移动 GPU 和 DSP 的模型,让它们更加节省电量和算力。

via research.fb.com 雷锋网雷锋网编译

雷锋网

Facebook 推 Portal 视频聊天设备,涉足消费硬件业务

雷锋网按,据腾讯科技报导,外媒报道称,消息人士周二透露,Facebook 将通过推出名为“Portal”的视频聊天设备涉足消费硬件业务。此举也将让 Facebook 与谷歌、亚马逊等推出智能音箱的互联网巨头展开更直接的对抗。

报道称,不同于亚马逊把 Echo 与智能语音助手连接在一起,Facebook 的目的是通过 Portal,让用户能够与家人、好友通过视频聊天和其他社交功能保持联络。据悉,Facebook 将在今年 5 月初举行的年度全球开发者大会中正式推出 Portal,并将从今年下半年开始发售这款设备。

类似于带有显示屏的亚马逊智能音箱 Echo Show,Facebook 的 Portal 被设计在室内使用,且能够通过语音指令进行控制。据熟悉 Facebook 计划的消息人士称,Portal 将配有一个广角镜头,具备面部识别功能,能够通过面部识别把用户同他们的 Facebook 账号联系在一起。

消息人士透露,Facebook 当前计划以 499 美元的价格发售 Portal。不过为了进一步刺激消费者的采用,Facebook 有可能会调低这款设备的售价。与之形成对比的是,亚马逊 Echo Show 的售价为 230 美元。据悉,Facebook 联合创始人、首席执行官马克-扎克伯格已向员工表示,他不在乎设备是否能够盈利,但他关心这款设备能否改变用户的习惯,能够更多的使用这款设备。

据悉,Portal 将由 Facebook 通过实体店和网络进行发售。

截至目前,Facebook 对是否将推出 Portal 一事未予置评。

雷锋网

针对校园欺凌 英国拟向 Facebook 和 Twitter 征收网络安全税

在去年底,曾经有篇《每对母子都是生死之交,我要陪他向校园霸凌说NO!》的文章刷屏了不少家长的朋友圈,把校园欺凌这一话题送上了风口浪尖。而现在,随着网络在学生生活中扮演的角色越来越重要,这一问题在网络中也越来越受重视。

据 BBC 报道,英国政府近日提案,向脸 Facebook 、Twitter 等社交媒体公司额外征税,帮助英国的网络安全战略筹措资金,该战略旨在解决针对儿童和弱势用户的网络霸凌、网络滥用和其它风险问题。这类政策在赌博行业已有先例,目前赌博公司承担了一部分治疗赌瘾的费用。

英国政府还提议,社交媒体平台应公开网络仇恨的真实规模,以及每年清除多少内容。

根据报道,网络安全战略旨在解决互联网上存在的以下问题:

cyber-bullying 网络欺凌

trolling 网络喷子

abuse 网络欺辱

under-age access to pornography 未成年人接触色情内容

英国文化部长凯伦•布莱德利称,社交媒体公司必须正视自己的责任。

 互联网一直是一股神奇力量,但它也导致了不可否认的痛苦,对于儿童和弱势群体来说,互联网的危害尤其严重。 现实生活中不可容忍的行为在电脑屏幕上同样不可接受,我们需要一种在不限制数字经济增长和创新的前提下保护所有人的方法。

据英国政府称,在 12 至 15 岁的青少年中,有近 20% 的人在社交媒体上看到过令他们感到不安或冒犯的内容,而近一半成年人有此经历。

针对此政策,雷锋网发现脸书目前已有回应。

我们的首要任务是让脸书成为对所有年龄段的人都安全的地方,因此,我们花费大量时间和英国互联网安全中心等安全专业机构合作,研发能够带给用户积极上网体验的有力工具。我们欢迎企业、专家和政府密切合作,解决这一关键问题。"

参考来源:https://www.google.com.hk/amp/s/www.bbc.co.uk/news/amp/technology-41566833

雷锋网

Facebook 收购老员工创办的AI助手公司Ozlo

雷锋网消息,根据外媒Venturebeat的报道,Facebook已经收购了AI助手创业公司Ozlo,以帮助Facebook建立“由人工智能和机器学习加持吸引人的Messenger使用体验”。Ozlo将会加入Messenger团队的消息也在Ozlo官网上得到了确认。

此次收购,Facebook将获得Ozlo的技术和30人的团队。Ozlo将会关闭其网站API。Ozlo是Facebook的前员工Charles Jolley与 Mike Hanson于2014年创办的,此前Jolly是Facebook的平台负责人。Ozlo主要关注用对话的形式帮助用户筛选餐馆,2016年19月,Ozlo发布了iOS客户端。Ozlo后期也逐渐将服务范围扩大至为有饮食禁忌的用户服务,提供天气预报,以及推荐电影等。

Ozlo利用了Yelp, Doordash(雷锋网注:Yelp是美国在线点评公司,Doordash是美国外卖送餐服务公司)的API。今年三月,Ozlo也推出了自己的API。

上周,Facebook进军智能音箱的新闻才刚刚发布。这周,Facebook就收购了Ozlo。

Information也在今年早期报道了Facebook聊天机器人M与人类进行秘密的beta测试。M与人类的首次交互将是M Suggestion. M会根据人类的对话,为人类提供建议。此次Facebook收购Ozlo,将有利于提高M的用户体验。


雷锋网