标签归档:CCFGAIR

专访平安科技首席科学家肖京:平安智能化的甜蜜与辛酸 | CCF-GAIR 2017

“智能+其实是个甜蜜又辛酸的过程。最后产生价值自然很甜蜜,但结果的过程常经历一系列复杂的磨合与调整,需要业务和技术多方的协同合作,其中业务人员的理解和支持至关重要。”

当雷锋网问到,拥有金融全牌照,业务产品线繁多的平安集团在打通全体系数据的背后,是否隐藏什么故事时,平安科技首席科学家肖京由衷感慨道。

平安集团是业界较早布局新金融的传统金融机构,目前也已经拥有不少代表作。最广为人知的是陆金所、平安好医生、平安金管家、一账通等 2C 产品。此外,作为平安集团探索金融科技道路上的一步重棋,平安科技人脸识别准确率突破99.8%的消息也刷足了今年各大平台新闻。平安金融云也是平安力推产品之一,据了解,平安70%核心系统群以及数十家中小银行已经上云。

为了更深入挖掘平安集团的Fintech实践经验,在由中国计算机学会主办,雷锋网与香港中文大学(深圳)承办的第二届CCF-GAIR全球人工智能与机器人峰会的第二天,肖京作为金融科技专场的嘉宾分享了平安的“智能+”过去、现在和未来发展之路。作为平安科技的首席科学家,肖京在平安内部主要负责大数据和人工智能技术研发及在平安金融和医疗健康相关业务中的应用产品和服务,管理智能引擎部、技术研究院、后台大数据平台及前端客户关系管理CRM等多个核心部门。

“智能+”脱胎于“互联网+”概念,平安将此视为业务升级最关键的发展方向。相较于重在模式创新的“互联网+”,平安认为“智能+”实质是技术创新,需要由数据、行业专家、场景、技术(算法和计算能力)四因素协同合作来实现。

毫无疑问,数据是一切的基石。2013年大数据概念兴起,平安开始做数据集中。前后花费了近一年时间,才打通了集团内部的数据孤岛,整合到一个平台上,并配置了自动更新及质量控制机制。

搭建数据平台只是起点,如何利用这些数据实现业务智能化才是最终的目标。肖京告诉雷锋网,他在2015年加入平安科技,并统领大数据部,制定的第一个计划就是平安脑智能引擎规划,帮助核心业务做智能分析与决策。

平安脑智能引擎可分为四层。

  • 第一层是感知层,主要是进行数据的接入、采集和整合。

  • 第二层是索引层,刻画画像脸谱如用户画像、产品画像、渠道画像,分别做好模型。

  • 第三层是中枢层,聚集了商务智能、预测推荐、异常监控、深度智能等算法能力。

  • 第四层是执行层,是平各相关核心业务的解决方案和应用场景实现层,主要有八个核心板块,分别为风险控制、欺诈识别、运营优化、精准营销、智能监控、商务智能、智能金融、智能客服。

在演讲中,肖京还强调了第三层算法能力实现的三部曲,指出不能简单应用深度学习这样的复杂算法。

  • 第一阶段是需要建立全面的确定性专家系统和规则引擎。业务流程中的许多环节深度依赖规则、经验和知识,这些规则往往不能从历史数据中获取。

  • 第二阶段是商务智能阶段,例如用户分群和关联分析。对用户分群可以进行不同的营销和风控策略,通过关联分析发现销售线索或者风控因子,很长时间以来在大量场景中产生了良好的效果。然而商务智能一般是对单一目标关联因素的统计分析,往往难以深入挖掘多目标多因素复杂的关联关系,尤其是对弱相关因子的挖掘和利用,而在大数据时代有显著的长尾现象,需要尽可能挖掘大量的弱相关因子,才可能充分利用大数据的价值。因此我们需要进入第三阶段。

  • 第三阶段是人工智能阶段,利用机器学习及深度学习等人工智能技术,深度挖掘并充分利用大数据的价值,实现更精准分析。

    当前兴起的这波人工智能技术是历史上的第三次复兴。这一次主要依托基于大数据的机器学习,属于人工智能中的联结主义范畴。这些技术分别在对结构化数据和非结构化数据的分析挖掘方面产生了良好的效果,但也存在一些不足。例如表现在,对因果关系考虑不足,过于依赖数据的相关性,这往往导致可解释性不足。另外,相关方法常针对的是大数据场景,欠缺快速吸收业务规则和知识的机制。而在金融和医疗的业务场景中,决策时常常要求知道因果关系,也常常面临需要小数据学习的场景,并且需要能快速应对规则的改变。基于此,平安在这三个方面都做了相应的改进。

在肖京演讲结束后,雷锋网对他进行了一次专访。以下是采访实录,雷锋网作了不改变原意的编辑:

平安内部机制

雷锋网:平安集团内部的数据服务部门机制是怎样的?垂直业务线与数据部门如何配合工作?

肖京:平安集团有三地五个数据中心,这是基础架构服务。此外,平安科技针对每个垂直业务线设立了相应的IT服务部门,包括数据服务部门。这些部门和业务公司的相关业务部门协同合作,共同解决相应的业务数据分析需求。

雷锋网:曾采访过的一位互金企业CEO表示,他们不会特意研究前沿技术,因为高风险与高收益并存。风险有二,一是新技术的研发投入非常大,二是商用表现还是未知数。而平安不同,涉足了各个新兴技术领域,请问内部是怎么看待新技术的研究工作?或者说,平安在研究新技术时的追求是什么? 

肖京:我认为前沿科技并不一定意味着高风险。平安会让专业的人做专业的事,首先做好目标分析规划才会大规模投入。如果定性目的不清楚,目标、可行性无法确定,我们不会盲目地大规模投入,所以不会有太高的风险,这就像是研究院做了一个项目的小尝试。

如果目标、可行性都有所依据,在平安大体量系统中尝试一下,可以快速看到趋势性业务效果。例如说定价风控模型,若有很强的执行力和足够大的体量,那么就能像互联网一样快速迭代,验证效果的好坏并进行调整改进。这也是平安综合金融大平台相比其他单一小平台或者单纯技术公司的优势之一。

另一方面,集团本身就非常重视科技,投入力度很大,也很愿意创新尝试。董事长马明哲一贯强调科技引领金融,平安未来5-10年更大的收入和成来自于技术,而不是资本。

竞争与合作

雷锋网:作为传统金融机构旗下的技术公司,跟其他科技公司相比各有什么优劣势?

肖京:在人工智能基础技术研发方面,学校和研究机构是主力军。产业界的竞争优势体现在应用方面,演讲中我提过“智能+”的四要素——数据、行业专家、场景、技术。平安的优势也体现在这几点。

首先是数据优势。平安是一家全牌照金融机构,拥有绝大多数科技公司无法比拟的数据优势,包括广度和深度。科技公司更多地是分析用户的数字痕迹来猜测哪些服务有效,平安能更快速洞察用户需求并提供合适的产品和服务。

第二是专家优势。我们经过29年的发展,在金融和医疗领域有大量的行业专家。AlphaGo之所以比其他采用相似深度学习技术的机器人围棋水平更高,一个重要原因在于其核心研发团队不仅是技术专家,也是围棋高手。

第三是场景优势。平安的金融和医疗应用场景非常丰富,而大多数科技公司并不具备丰富的应用场景,要想验证技术效果,需要与业务公司磋商。从说服他们合作到最后的应用,需要经历很复杂的磨合过程,在得到甜蜜成果之前,这个过程会充满辛酸,绝不是一件容易的事情。实际上没有丰富的类似磨合经历的技术团队,最后的落地能力是要打个巨大问号的。

在技术层面,平安的综合性优势比较明显,经过多年的建设,平安拥有上万技术人才,搭建了强大的金融等级的基础架构及云平台,包括深度学习集群的集团大数据管理及分析平台。

当然,金融和医疗是两块非常大的蛋糕,有极其众多的技术应用的机会。科技公司深耕某一垂直领域,技术可能会更加深入。

雷锋网:平安会以什么形式与Fintech公司合作呢?

肖京:主要是技术合作方式,一般不涉及业务合作。我们已经跟MIT等多个顶级科研机构合作很多年了。此外,还包括承接平安的研发项目,或者直接合作应用对方已经成熟的某项技术等等。速度高效是我们决策的最重要因素之一,我们等不起,时不我待。总之对于技术合作我们是很开放的。

雷锋网:相较于传统金融机构旗下的科技公司,平安有什么差异性?

肖京:在金融科技方面,大部分金融机构战略战术上可能偏保守,缺乏足够的创新投入,对自身队伍能力的培养也常常比较欠缺,因而不得不依赖技术外包,购买别人的解决方案,但是外包会存在一些很大的问题,技术始终没有掌握在自己手中,恐受制于人,若是与小公司合作,稳定性也不太能保障。其实这也没关系,尤其是中小金融机构,像平安这样自建能力可能太困难了,但提高业务能力是必要的,只是要选对合作方。

行业洞察

雷锋网:目前的AI都是专用人工智能,您觉得与通用AI相比较而言,谁更有应用价值?

肖京:人工智能可以分为弱人工智能、强人工智能和超人工智能。目前人工智能处在弱人工智能阶段,这意味着它只是某些方面比人强,而有些方面还差得很远,它的能力是有限定领域的,而通用AI起码要到强人工智能这个阶段才会出现,现在还没有出现通用AI。

通用人工智能是个有意思的研究方向,但在大多数实际业务中未必能带来附加的应用价值。个人认为这应该留给科研机构来研究攻关,企业应该更专注于研发智能技术解决实际的业务痛点。即便要做也应该作为远期目标来规划,否则就有不切实际之虞。

现阶段人工智能技术要应用好,定义清楚目标场景和问题是很重要的。问题定得太大太通用,常常得不到很好的效果。目标清晰有的放矢,应用获得成功后,再考虑如何标准化并拓展应用。

雷锋网:那么,怎样将专用的AI技术快速复制到其他领域?

肖京::既然是讨论业务应用,而不是纯技术研究,我们一般认为,研发任何一项AI应用,首先要有明确的目的和目标,进行可行性分析,通过后再进行具体的规划和实施。

AI技术应用复制到其他领域,也应该采用类似的方式方法。先确定新领域相应的业务应用的目的、目标、可行性,再借鉴前期应用的工程经验,将前期成功的技术应用标准化并调整做出新领域应用的规划和实施方案。

雷锋网:有一种观点是,在金融行业,往往是5%的关键小数据发挥着作用。那么95%的弱相关数据怎样才能发挥作用?

肖京:5%关键小数据是强相关的,95%是弱相关数据。只看强相关的5%,是典型的商务智能的说法,还处于之前提到的智能化第二阶段,主要通过关联分析来挖掘数据价值。

而现在的AI技术不仅可以利用强相关数据,也能对弱相关数据进行深度的分析挖掘。弱相关数据也是有价值的,若方法使用得当,也能发挥作用提高模型效果。比如深度神经网络这样的端到端机器学习模型,不需要通过特征工程定义显性因子,可以充分结合所有数据深入分析挖掘自动找到最佳组合,以得到最优的业务应用效果。

雷锋网

招商银行、To B智能投顾讲述:金融机构的人工智能实践 | CCF-GAIR 2017

(从左往右:薛昆、夏雷、王蓁、杨永智)

雷锋网AI金融评论报道,2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳大中华喜来登酒店举行。本次大会由CCF中国计算机学会主办、雷锋网与香港中文大学(深圳)承办,期间聚集了全球30多位顶级院士、近300家AI明星AI企业 ,参会人数规模高达3000人。

在8日下午的金融科技专场中,来自招商银行、通联数据以及财鲸智能投顾的嘉宾围绕智能投顾的业务和技术实践展开了激烈的圆桌讨论。该环节由阿博茨科技CEO杨永智主持,招商银行总行研发中心副总经理夏雷、通联数据金融工程董事总经理薛昆、财鲸智能投顾联合创始人王蓁参与,共同分析了“金融机构的AI化实践”“智能投顾的销售与投资效果平衡”等相关问题。

雷锋网整理如下:

主持人杨永智:下一个问题我想抛给夏总,大家知道招商银行的智能在传统银行里面是做的最早的,想问一下,招行在实践人工智能或者新技术应用到智能领域里面有什么样的经验和教训可以供大家参考或者学习的?

夏雷:这个问题有点大,其实我们在招行的策略非常明确,第一步是移动化、第二步是数据化、第三步是智能化。目前处于数据化和智能化的交界点。在哪个地方用到智能,基本上银行的每个方面都可以用到智能,我们从前往后说。

比如说从新客服第一次进招商银行,系统就有人工智能技术参与,进行获客。举个例子,我们现在正在研究一个比较有趣的课题,客户进大堂我们就进行引导——如果他是一个有钱的人,我们就引导他到人工的方式,如果没有钱就引到自助设备上去。他第一次到来,既没有数据,我们也不知道他的账户,怎么知道有钱没钱呢?这个以前是靠大堂助理来看,有点势利眼。但是我们现在内部的研究项目是通过人工智能来判断,只要给它拍一张照片,我们内测能够达到80%的准确度。只要一张照片过来,就可以给你分辨出来你大体上是一个有钱人还是没钱人,再干后面的事情。(相由钱生?好看的是有钱还是没钱呢?哈哈)

这是一个很生动的例子,客人从还没有成为招商客户开始,我们就已经开始用人工智能。再后面比如说要在这儿开账户,你开账户的时候我要给你推荐产品、推荐协议,判断你这个人到底适合什么产品,后台是会有大量的智能推荐的系统。比如说判断你这个人可能适合理财、可能适合贷款等等,甚至判断出来你喜欢看某个资讯、某个新闻也有可能。

再后面刚才讲的智能投顾等等,这个前面已经说过了。再往后是客服,以往客户有疑问会打95555,但是我们90%以上的文字客户都是机器人在完成,准确度高的我们会把语音切换过去,大幅度地智能化。

还有一个领域是前面罗平教授(中科院罗平演讲全文:自动撰写金融文档如何实现,用 AI 解救“金融民工” | CCF-GAIR 2017)也讲到的,银行的中后台是极大的智能化的空间。比如说我们大量的票据录入,通过OCR一扫描以后,要识别出它里面的文字,还要进行分类、格式化、变成结构化的数据等等,这个里面有大量的人工智能可以干的事情。

再比如说我们的网点推荐,大家也可以想到招行的网点之间是可以调剂的,它要通过预测、通过一定的人工智能,结合大量的数据、包括天气进行预测。可能今天这个网点人少,多往哪个网点派一点,这里面又有大量的人工智能。

总结下来方方面面,银行基本上每个方面都要走智能化的道路。经常有新闻说,银行是最受人工智能冲击的行业之一,我想这是一个事实,大量的人工会以后会在银行减少。

杨永智:谢谢夏总!接下来的问题给王蓁,你们主要是2B的模式,给很多金融机构提供服务。请你给大家分享一下,你们跟大型金融机构合作中有什么样的经验和教训给在座的创业者。

王蓁:我们大部分是智能投顾,但不仅限于智能投顾,我们还做搜索和其它业务。首先和机构合作的时候,为什么是机构而不做个人?个人我们有过简单的尝试,国内做个人业务的流量太贵,不适合,流量已经被大头瓜分完了,做机构可能是更适合中小公司的机会。这是第一。

第二,和机构合作的时候,因为中小公司相对来讲船小好调头,大公司的决策流程比较复杂,整个业务推进会相对比较慎重。在这个时候,中小公司有自己的技术优势的时候,他是可以给那些大的机构提供服务的。当然其中可能有一个理念会比较先进,大的机构不一定能够立刻接受,需要反复地对机构教育。

其中一个典型的例子,我不太同意薛总的看法,长期投资或者被动投资我认为在中国是无效的,这是美国市场的东西。其实我刚才已经简单讲了,我们可以看2007年4月份到2017年4月份,中国A股市场也投进去了,一分钱没有拿到,10年投资,长期吧、被动投资吧,1分钱都没有。

但是美国屡创新高,买入并持有的被动投资或者长期投资,只有放在美国市场才有效,放到欧洲也是没有效的。更别说国内的,在国内因为水土的原因,国内的证券市场发展相对来讲还是不是特别长,但是很迅速,变化很快。其实很多人是从教科书里读出来的,教科书告诉我们,投资是一个好东西,但是在国内市场不一定。

我们要根据中国的国情和实际情况进行判断到底是怎么样的,像类似于这种情况,我们和机构合作的时候,要说服他们做很多工作、告诉他们为什么要这样。我们可能有一些反直觉的结论,但是这些数据是真实告诉我们的东西,我们需要去教育他。

杨永智:谢谢!夏总有没有不同的观点?

夏雷:我非常同意王总的观点,我们有没有看到智能投顾公司的成立时间都是2008年?都是美国金融危机的时期。所以他搞被动投资问题不大,而且很容易取得客户信任。如果你在中国做这个事情,恐怕和美国的环境完全是不同的。

另外我还补充一个,中国客户的心态和美国也不太一样,在美国基本上散户操作,不像大部分的机构操作,中国的散户操作比较多,而且赌博性比较重,追涨杀跌比较重。

你认为在一定的风险之后给他一定回报是可以的,但是客户看不到这一点,他觉得收益率你给低了不好,但是你已经评估了他的风险,如果他自己真正操作比这个还要差很多。所以在客户心态上,也是中国的一大问题,所以我们要把中国的智能投顾做好,在资产选择上只能有中国的特色。比如说你投资ETF就不行,要选择一些主动型的。

在客户对于风险的认识上,我们要通过服务不断地提醒客户。在招行,客户买了招行的理财产品,我们会不断地跟进,以收益报告提醒客户当前的情况——风险怎么样,当前要不要调仓等等。其实这个过程也是在引导客户的风险预期,让他知道在这个过程中不是没有风险的,不是到最后越高就越好。

从这些角度来讲,中国的投顾行业跟美国不同,但是恰恰给人工智能提供了广泛的空间。仅仅是被动投资,人工智能能做多少呢?如果是主动的就做得多了,还有客户的心态好也可以做得多。

主持人杨永智:我自己也研究过这个领域,刚才两位分享的总结下来,像智能投顾的鼻祖现在管理的资金规模是几十个亿美金。和做财富管理的相比,这个钱是很少的。你说美国的第三方智能投顾公司非常成功,我觉得现在还谈不上。有些第三方也做了智能投顾平台,一上来就是几百亿、几千亿的资金。所以做这些第三方的智能投顾公司,比传统的金融机构去应用智能投顾技术,可以迅速吸纳非常多的资金。

总结下来,这里面2B的机会可能会更多一些,2C的机会最起码我们现在还没有看到。因为这里有一个逻辑悖论,中国的屌丝只关注赚不赚钱,其它都不认,你这么牛逼、这么赚钱,你干脆自己赚钱好了。从刚才几位嘉宾的对话总结下来是这样的。

现场互动

时间已经到了,我想接下来留一点时间给大家互动一下,给大家留一点时间提几个问题。大家有什么问题想跟台上的嘉宾探讨吗?

提问:我想请教夏总一个问题,因为我们大家都看到招行在Fintech这一块跟进比较快,在去年的时候推出摩羯智投,不知道这个产品客户的认可度怎么样?包括使用情况、投资规模。

夏雷:我简单用一个数据说话,我们每个月的投资交易量购买额40多个亿,不知道这个数据是否能够说明问题。刚才主持人说几十亿美元,这个规模太小了,可以说中国这个市场也太大了。招行在这一块也仅仅是做了一个起步,效果已经很明显,所以我相信各位在座在这个领域里面能做得更大。

提问:几位嘉宾你们好,我是一个创业者,我做的事情是做股票的智能投顾,做一些2B和2C两方面的智能投顾服务。虽然是做股票的,但是我们也特别关心大类资产配置和财富管理领域。其实我们有遇到这样的问题——现在大部分的理财类的智能投顾或者资产配置客户只是一个外壳,销售的成分更重于技术的含量,比如有了一个包装以后,不管是什么样的理财产品也好、还是基金也好,会有原来更有利于他的销售。

刚才王总和夏总都谈到这个问题,夏总的观点更多是强调销售,王总更多是强调产品有多好,可能是一个买方和卖方的差别。我想问的问题是,两位怎么看这个问题?比如说对于一个金融机构可能需要这样的服务,对于卖方来讲他不可能给买方强调这个东西包装得多好,他更多的是从他的能力来讲,但是他的能力又是很难评估的,我怎么论证这个事情?

夏雷:你谈到金融机构,我首先谈一下我的看法。我们本来没有对摩羯智投提出多少销售的目标,我们引用人工智能做投顾,并不是在摩羯智投才有的。在这之前,我们在网点线下就已经把这样的算法放到大堂经理的系统里面,其中一个重要的目的就是防止他的过分销售倾向。在我们看来,给客户增加价值才是我们追求的目标,而不是去销售。

当然这个是从银行角度我们自己有这样的条件,因为我们经营的范围很大,不至于说需要从理财产品销售上赚取不应该我们赚的利润。所以对于我们来讲,争取客户价值才是最重要的,要防范的反而是各级的网点销售人员因为绩效和考评原因导致的销售,这样的人工智能对于我们来讲反而是过分销售。

王蓁:我来简单补充一点,刚才你提到销售这个事情,其实主持人提到美国智能投顾是第三方规模还是没有起来或者起来没有那么快,反而美国的传统金融机构,比如说先锋基金收购了FutureAdvisor之后,立刻到了几百上千亿美元的规模。为什么?因为他本身就有流量。

这个问题再拓展一步,像刚才夏总说的,招商银行每天卖几十亿的摩羯,其实说实话他不卖摩羯,他卖蝎子、卖螃蟹一天也是这么多,没问题的,这个和人工智能没有什么关系。因为他的渠道真的很强,品牌背书在这儿,但是要是让我们去卖肯定不行。

其实我们一直坚信的事情是什么呢?做智能投顾其实属于投资的一种,只不过它是希望能够帮助大家做得更好,帮助90%以上的人在90%以上的时间战胜他们自己,这是我们的最低限度。用人话来讲,我们想做到两个目的:

  • 第一点,最基础的就是帮客户赚到钱,无论你怎么样,你赚不到钱,你再人工智能都没用。因为中美市场的差异其实是很多人工智能的机会,他的机会是很多的,这是底线,不能突破。所以说,在这一点底线上,其实我们的策略来讲,我们叫“五频”,有高频、中频、低频,我们不是以销售为目的,不对客户直接进行这方面的收费。我们服务机构的时候是按照我们真实的表现业绩。举个例子,我们超过了比如说年化百分之多少的时候或者超过大盘百分之多少的时候,我们才能够有这样的一个收入,我们是以真实是否赚钱来获得收入的,这是我们的第一点。

  • 第二点,在赚钱的基础上或者在帮用户赚到钱的基础上,我们才考虑是不是能够节省成本,提高效率。这两点合起来,其实才能够保证我们整个这套系统,第一保证我们和客户的利益是一致的,第二保证了我们的人工智能真的是用到未来发展方向有效的方向上,这两点是缺一不可的。

杨永智:今天智能投顾的专场到此为止,我们接下来是区块链专场,请各位嘉宾就座。

雷锋网

平安科技首席科学家肖京:如何让AI更好地服务金融业| CCF-GAIR 2017

由中国计算机协会(CCF)主办,雷锋网、香港中文大学(深圳)承办的第二届 CCF-GAIR 全球人工智能与机器人峰会在深圳成功举办。

会上,国家" 千人计划 "特聘专家,平安科技首席科学家肖京博士带来了主题为《“智能+”探索与实践》的演讲。

肖京博士介绍,平安集团创办至今在运营和决策方面经历了三个阶段:

  • 信息化阶段:打通各个环节,让公司的业务人员和决策者能够快速获得信息,做出决策;

  • 数据化阶段:公司把信息存储下来做分析统计;

  • 智能化阶段:公司不仅可以把数据存储下来做分析,还可以做深度挖掘,帮助管理层更好地做决策,甚至自动做决策。

而关于AI在金融领域的应用,肖京博士表示,AI是个相对较老的概念,从1956年至今,人工智能已经经历了两次兴衰。在他看来,从不被看好到全员接受,AI的爆发取决于以下三点:

互联网及大数据的出现;

存储能力和算法的显著提升;

深度学习兴起。

在他看来,AlphaGo成功吸引了人们对AI的关注,但它还存在诸多不足。“如知道会赢,但不知道为什么会赢,也不知道会赢多少。因此,在金融决策时,除了智能外,还必须使用量化的数据和信息快速了解业务规则做决策。”

基于此,平安科技在此基础上有所改进,主要分为三大方向。

一是可解释性;

二是小数据学习;

三是记忆增强神经网络。

总体来说,肖京博士认为如今AI技术发展非常快,对各行各业都有非常明显的促进作用,但如何利用技术去更好地服务市场还存在很多不足,之后还会有很长很陡的坡要爬,前行之路肯定不易。但肖京博士同时又通过雷锋网表示,平安愿意跟大家共同探索未来,共享集团的业务经验和技术能力。

以下是肖京博士演讲全文,雷锋网作了不改变原意的编辑:

大家好!今天非常高兴能在这里跟大家交流。两位教授的报告非常精彩,张教授(港科大张晓泉教授)谈到为什么AI需要经济,我谈谈为什么经济学和金融行业需要AI,AI如何更好地帮助金融行业。

首先来简单介绍下平安的基本情况,平安集团从最初100平的小房子做财险到现在150万人的大企业,它的发展经过三个阶段:

一是自营模式,做保险、寿险、银行;

二是允许其他公司的服务进入平安集团,比如陆金所;

三是允许其他公司的产品在平安的平台上做交易。

这也就是平安3.0阶段。它的战略目标是成为国际领先的个人综合生活服务提供商。这其中包含两个战略,一是大金融资产;二是大医疗健康。

平安从一开始就接触金融业,非常了解传统金融行业,平安是全牌照公司,业务范畴包括保险、银行、资产管理等。

传统金融+互联网把传统业务互联网化,将线上线下打通结合、降低成本、提高效率、提升客户体验。

互联网+传统金融与互联网+金融与非金融是围绕用户需求建立的互联网生态圈,在生态圈植入金融服务和非金融服务。

除了金融服务外,平安还关注房产服务、医疗健康和汽车服务。所有架构下面是平安的综合平台,它提供全集团所有的金融业务和非金融业务的技术支持。

平安在IT方面同样也经历了三个阶段。

一是信息化,我们在很多年前实现信息化,打通各个环节,让我们的业务人员和决策者快速获得信息,做出决策;

二是数据化,我们把信息存储下来做分析统计;

三是智能化,我们不仅可以把数据存储下来做分析,还可以做深度挖掘,帮助我们更好的做决策甚至自动做决策。

为了这三个方向的全面发展,平安在模式上、业务形式上作了很大改变。2000年开始,平安开始转型互联网+,之后的20年时间,平安所有的业务都实现了互联网化,通过互联网化可以降低成本、提高效率。

互联网只是模式的创新,相对容易实现。而过去几年整个市场开始进入一个新阶段——智能+,我们希望在业务流程的每个环节里植入智能元素,让每个环节智能化,效率更高,成本更低,用户体验更好。

智能+主要是技术的创新,它跟互联网+有很大区别,主要区别在于智能+需要数据分析、挖掘价值、体现价值。而在这方面,平安有得天独厚的优势,平安在过去29年的发展中积累了大量的数据,现在我们有3.76亿互联网用户,1.37亿个人金融客户。

如何通过智能+把要素挖掘出来?

一是业务规则,我们做专家系统、规则引擎。数据依赖于规则、经验和知识,不能直接从数据中出来。比如平安的反欺诈理赔系统,覆盖上万车型、零部件。假设本田车主来理赔,换保时捷的部件,可以快速发现这是违规和欺诈。

二、商务智能,将用户分群然后关联分析,对不同的用户群体进行不同的营销、风控策略。 

再之后就到了AI时代,人工智能历史悠久,比大数据、云计算出现还早很多,它并不是新的概念。那问题是为什么AI现在又火了?

早在70年代,当时电视广告里就有人工智能机器人助手,每天帮你查邮件、语音交互,大家认为人工智能可以做这些事,后来发现当时的计算能力很弱,一个词库只有30-40个词,所以大家认为人工智能是骗子。

而90年代中期开始,由于互联网的出现,数据、存储能力、算法都有显著提升,AI技术又开始蓬勃发展起来。

再到后来,2006年深度学习出现后,对非结构化数据处理带来了非常大的突破,产生了非常多的应用场景。

而从这开始,AI就彻底火了。

技术的发展始终都是围绕人类的实际应用展开的。随着深度学习技术的出现,我们在金融、医疗等很多行业不再是纸上谈兵。以前我们做语音、图像,需要定义很多特征,在特征的基础上做算法、机器学习、数据分析达到我们的目标。现在深度学习出来后,在非结构化数据下,自动做端对端处理,完美解决了之前遇到的棘手难题。

 张晓泉教授刚才提到深度学习的很多问题,如数据量巨大、机器学习的方法等,这些都不用太多考虑因果关系,而在实际应用中,就必须重视。

AlphaGo告诉你会赢,但不会告诉你为什么会赢。我们的金融场景、医疗场景在很多情况下需要知道原因,你给客户的贷款利率比别人高,我需要有原因。

AlphaGo的不足还体现在它知道赢,但不知道赢多少。

金融决策时,不知道赢多少或者输多少,那就等于没判断。另外,我们还知道金融、医疗等行业很多时候都是小数据的(数据量很小),它无法快速吸收业务规则。

对此,我们做了相应改进:

一是可解释性;

二是小数据学习;

三是记忆增强神经网络。

小数据学习的例子非常多。比如平安针对生猪推出的牲畜保险、小的时候投保,如果长大后死了,可以找政府申请补贴。由于猪脸图片很少,可以拿别的死猪图片来识别,很多人看到了这个“市场”,就纷纷跑去要补贴。而小数据学习就可以轻松解决这个问题,从深度学习到增强神经网络,用对抗网络的方法识别出病死猪和健康猪。

总结来说,金融、医疗等行业光靠自己会受到很多限制,应用如AI等最新技术可以很好地解决棘手难题。基于此,平安也花了两三年时间建立一套智能引擎。

第一层是感知层,把所有能收集到的数据集中在这一层,做好清洗、整合、存储、安全。我们建好这个平台后,这是金融机构最大的大数据平台,我们有最强的团队;

第二层是画像、脸谱,分为用户画像、产品画像、渠道画像,分别做好模型;

第三层是平安脑算法能力,这是三个阶段的不同技术;

第四层是我们的解决方案和应用场景,虽然我们有最好的团队,金融行业应该没有别人有这么好的平台。平安的场景太多了,我们还是非常缺人的。

功能实现分为八个领域:

主要是分辨以金融为核心的风控、欺诈识别。

精准营销,我们是全牌照集团,有非常多的细分业务,每个业务有几千万客户,如何洞察客户需求,做好精准营销非常重要。


运营优化,平安有110万业务员,保险业务员是最难管理的群体,他们每天都在外面,如何控制风险?如何提高绩效?如何用智能的方法更好的提高绩效?这些都是我们思考的问题。


我们可以通过大数据更好地匹配业务员和客户,更好的个性化简化流程。原先一个常规流程是25个问题,通过客户背景和资料,可以减少到3个问题;车险自主理赔占非常大的比例,拍摄照片自动判断赔偿多少钱,上线六个月以来,已经在多个地区应用。


24小时监控风险系统,这套系统可以帮助大家做出非常好的选择,24小时不间断地监控风险,包括传统金融信息、200多家网站新闻舆情等等。

 总体来说,现在人工智能发展非常快,但后面会有一个非常大的坡。未来,平安愿意跟大家一同探索未知,共享我们的业务经验和技术能力,谢谢大家!

雷锋网

时隔一年 Vijay Kumar 再登 GAIR 讲台,讲述自动化的技术与社会挑战 (下) | CCF-GAIR 2017

雷锋网按:本文为美国宾夕法尼亚大学工程院院长Vijay Kumar在CCF-GAIR大会上做的题为“Challenges in Autonomy”的分享,雷锋网进行了全文整理。全文分为上下两部分,以下是第二部分。

传送门:时隔一年 Vijay Kumar 再登 GAIR 讲台,讲述自动化的技术与社会挑战(上)

2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳成功举办。本次由CCF中国计算机学会主办、雷锋网与香港中文大学(深圳)承办。来自全球30多位顶级院士、近300家AI明星AI企业,齐聚智能科技产业盛会。

Vijay Kumar在无人机领域被称为“无人机大神”。他在多机器人的编队控制协调,做出了非常大的贡献。2016年,Vijay Kumar在CCF-CAIR峰会介绍了无人机会向着Small(小型),Safe(安全),Smart(智能),Speed(敏捷)和Swarm(集群)“5s”的趋势发展。时隔一年 Vijay Kumar 再登 GAIR讲台,今年Vijay Kumar以“Challenges in Autonomy”为主题,进行了演讲,重点介绍了自动化浪潮的技术与社会挑战。Vijay Kumar是美国宾夕法尼亚大学工程院院长,同时也是美国国家工程院院士,美国电子电气工程师协会研究员(IEEE Fellow)。

以下为Vijay Kumar演讲速记全文整理,雷锋网在不改变原意的基础上做了精编:

机器学习的重要意义

说到自动驾驶汽车或者无人机的时候,大家都说,我们要有机器学习,我们确实在做机器学习,但是它有很多的限制。我们要让机器懂得学习,如果操作者、设计者想要打破固有的框架,我们希望让机器做更多的事情。比如我们可以做一些抽象算法,这些抽象的东西是人进行控制的,比如动态的模型,我们想学习如何在高速情况下防撞,我们可以用一些计算机学习通过对数据的收集、分析处理,当时我们也可以让我们的机器做更加复杂的运算。

另外汽车也可以去越过一些障碍物,但是需要掌握更加复杂的技能,这是机器学习的重要意义。能够在更加复杂的环境当中驰骋,我们要解决一些问题,包括计算机技术的发展,可以让计算机做一些更加复杂的信息,可以建立不同的传感器获取更多的信息。我知道这里有张桌子、有椅子、后面有门,这样的图像就可以建立起来,帮助计算机学习和了解周围的环境。现在我们的计划和控制没有办法通过机器学习来实现。

试验深度学习对精准农业的帮助

深度学习在我的实验室里也有一部分,就是我们说的精准农业,机器穿过橘子林,就能算出橘子的数量,飞机起飞之后,它可以穿过橘子林,正确得到橘子的数字,我们计算是很重要的。但是这样的成果就可以让农民知道它今年的收成是多少,这样就可以更好的优化它生产的系统,包括后续的果实采摘、交通运输等等,在好的收成年份有很好的帮助。比如一棵橘子树,你数到一半就数不下去了。现在有这样的技术,你拿到95%的数据,这样对精准农业非常有帮助。

机器人和人工智能可以说还不能想象。我们应该有更多的期待。格林斯潘在1997年就尝试过利用机器预测金融危机,但失败了。我们现在不能过度夸大人工智能的能力,我认为人工智能是有局限的。

  • 首先,现在有很多数据过程,它需要机器学习。在学习过程中会带来新知识。现在,我们数据的量每九个月就会翻一番,我们学习的知识远远赶不上这样的速度。我想说机器应该加强学习能力。我们计算非常复杂,现在可以做很高强度的计算,但不意味着机器就可以自动的完成这些事情。

  • 其次,如果我们可以数果实,99%都是对的。但我们可能需要很大的数据才能够完成这个任务,如果要把准确率从90%提升到99%,可能需要花很大的力气才能实现这个目标。所以,在某种程度上,我们所需要的数据量,是乘几何倍数的增加。你要数果实,可能不需要99.99%的准确率,只需要90%。但是你一辆车每分钟90分钟的速度就需要99.99%的准确率。自动化数果实不一定要那么准,但你要开车或者在YouTube上找一个猫,准确率不需要那么高,但要驾驶一个车,准确率就要非常高。另外,采取行动之前必须要有认知,这个认知越来越困难。同样,行动也是一样的。你要经过感知之后采取相应的行动,这样一个循环往复,就会给你带来一个很大的计算量和很大的数字。

  • 最后,我之前没有讲到这一点,但是Oussama Khatib教授提到了。那就是我们想做实体的会更难。尤其是飞行和开车,我们不会有实际的接触,这只是通过数据实现。但如果要有实际的接触,会更难。

未来自动化机器人,人机之间的互动,会是发展方向。现在我们对这一点的研究还非常初步,除非能够找到人机互动之间的和谐方式。我们可能做一些非常简单的任务,未来会有更多的挑战。人工智能还有机器人要往前发展,还需要做很多努力。

另外,关于能源问题。我们在空中举起一公斤的重量,需要200瓦,如果你要举起一个50公斤的人,可能需要更大的能量消耗。现在我们的技术还没有达到这样的水平,尤其是要消费的能源,如果模式不发生改变,在未来就很难实现。因为你可以看到电池越来越贵。我现在要来到北京,可能看到很多电动车在上路。那就意味着这个电动车未来的电池价格会下降,特斯拉也在做自己的电池工厂。但现在我们知道,事情还远远没有达到理想的状态,我们将会在未来把很多东西提到天上去。这个过程需要消耗大量的能量。有一家公司叫做Jet Optera,他们由一个非常快的速度,承重可以达到5镑,是用化学燃料。尤其是航空行业,如果不用化石燃料,可能很难有发展。

未来工作如何做到不被机器人所替代

现在我们有很多挑战,比如在社会中。第一,这个世界是多种多样的,这个世界可以获得各种各样的科学技术的发展和进步。我觉得这就是所谓科技的民主化。现在一个高中生,对于机器人的了解比我在大学之后的程度还要深。这就是技术发展的速度,当然,也有很多的机会,同时,也有一些陷阱。为什么我这么说?我想向大家展示一张漫画(上图),我们当时在发明车轮的时候,是怎样的情景。如果有人要做车,这个人要很有钱才行。这张图片可以看到,这个国王是四个人才把他举起来,而我们说只有国王才能坐轿子,其他人没钱坐轿子。但现在有了车轮之后,三个人丢失了工作,只需要一个人就能够拉车。好像现在计算机技术的发展,机器人未来可以完成越来越多的工作,就会有很多人失去工作。对于我们来讲,就会有更多的技术呈现在我们面前。

从我们的角度出发,有这样一个金字塔,当谈到研究以及研究到哪个程度,就会出现这个金字塔。这个金字塔展示了最底部,有很多人薪资非常少,很有可能能换成人民币,不管是在哪个国家,同样的情况都是如此。但随着研究程度不断提升,这个金字塔越往上走,人就越少,社会财富总是掌握在少数人手中。你研究的越多,就会有更多的机会能够接触到高薪工作。这对于目前的环境来说也是如此。

从四年前到现在情况发生了极大的变化,金字塔发生了变化,我们都在探讨这个金字塔到底哪个部分会慢慢失去。很多人认为,最低端的工作会被机器人期待,但我认为不是,因为现在机器人还没有办法达到三岁小孩的思考能力。我们不可以同样一个机器人和中国五岁的小孩玩其他游戏并且战胜这个小孩。我们认为机器人在复杂的计算能力里还是有局限的。在没有特别多的训练里,他们的工作仍然可以做得很好。但四年之后,中间的工作会消失,可能并不是最顶尖和最底部,而是中间的工作会给到这些人。现在可能最好中国大学毕业的学位或者世界上最好大学毕业的学位,你们已经做到这一点。

在考试中得到了好成绩。但机器人现在最擅长的就是考试。所以对我们来说,如果你只是擅长考试的一个机器,你今天就有可能被机器人取代。因为机器人可能考试比你好,四年后你的工作可能就要拱手让给机器人了。这是我们对未来机器人发展的想法。对我们来说,最好的解决方案就是通过教育做到,我们要不断学习,尽管我已经是一个教授。拜登曾经说过永不停止的教育,这样的说法能帮助我们拯救社会,帮助我们免予受到机器人取代这一步。

机器人的安全性

安全性,我们很难理解到底在机器人当中所谓的安全性是什么,现在并没有过多的数据指导,对安全性进行量化。但我们现在谈到的安全性多种多样。

  • 第一,所谓验证。比如你有一个洗衣机,如果你想证明它是一个洗衣机,就必须要证明这个洗衣机是一个洗衣机的特质。洗衣机的特质是把衣服放进去洗衣机就可以洗衣服。所以你可以证明这个机器是一个洗衣机。但现在要证明是机器人很难。

  • 第二,信任。我们提到这个机器人,我们要证明机器人,事实上并不会出现任何人类所希望看到的结果。我们会看是否能证明它不会漏水,它并不会造成电器的短路。所以我认为信任也非常重要。

  • 第三,安全性。在实体世界中,有两种方法,能真正触动一个系统或者侵入一个系统。要么黑进一个系统或者黑进一个感应器。现在如果要去黑一个自动驾驶,不是黑系统而是黑感应器。要么是摄像机要么是其他感应器黑掉,黑掉以后就黑掉整个系统。谈到安全性,很多人之前没有提到或者想到。在不断推动自动化系统过程中,安全性非常重要。

我们生活在一个非常兴奋的时代,如果我们来看一下这个横轴,当时出现了实体世界的革命,然后进入半导体革命,然后有互联网带来网络革命,现在正在进行人工智能以及机器人,现实世界和虚拟世界的结合。我们相信未来会不断推广,我们走着这段发展道路。而对于人来说,发生了变化,但是人的发展是一个线性的过程,如果看一下政府对技术的理解以及政府如何通过技术进行政策推广。事实上比我们更慢。人在不断的适应各种技术,社交媒体就很好,我们现在在不断的接触和了解并且适应机器人。

未来有了自动驾驶的汽车和飞行器,除了安全问题,还要探讨政府的政策和法律监管。很多政府现在还没有想到那么多,美国的政府可能已经在探讨这方面的问题,而中国政府还没有探讨到很多对于自动驾驶汽车、自动驾驶无人机的法律监管问题。我相信这部分也是我们重点进行关注。我知道我们现在确实有Oussama Khatib提到的潜水机器人、手术机器人,都能得到有效的利用,但我们要探讨如何进行安全利用。未来这点会越来越重要。

雷锋网

中科视拓CTO山世光:如何用X数据驱动AI成长? | CCF-GAIR 2017

雷锋网AI科技评论按:7月7日,全球人工智能和机器人峰会(CCF-GAIR 2017)在深圳如期举办,由CCF中国计算机学会主办、雷锋网与香港中文大学(深圳)承办的这次大会共聚集了来自全球30多位AI领域科学家、近300家AI明星企业。雷锋网最近将会陆续放出峰会上的精华内容,回馈给长期以来支持雷锋网的读者们!

本次带来中科视拓CTO,中科院计算所研究员山世光博士在GAIR 2017大会上的分享精华。

山世光,中科院计算所研究员、博导,基金委优青,CCF青年科学奖获得者,现任中科院智能信息处理重点实验室常务副主任,中科视拓创始人、董事长兼CTO。他的研究领域为计算机视觉和机器学习。已在国内外刊物和学术会议上发表论文200余篇,其中CCF A类论文60余篇,论文被谷歌学术引用10000余次。曾应邀担任过ICCV,ACCV,ICPR,FG,ICASSP等国际会议的领域主席,现任IEEE,TIP,CVIU,PRL,Neurocomputing,FCS等国际学术刊物的编委。研究成果获2005年度国家科技进步二等奖,2015年度国家自然科学二等奖,CVPR2008 Best Student Poster Award Runner-up奖。

如何看待这次AI热潮?

谷歌AlphaGo与李世石的世纪之战,让人工智能(AI)这个话题再度火爆起来。山世光博士早在20年前就开始做AI领域中的计算机视觉技术研究,在这次GAIR大会分享中,他结合自己过去的科研经历和行业观察,分别从四个不同的角度分析,给出了他对此次AI热潮的一些看法:

从方法论角度看:过去几十年流行的人类专家知识驱动的AI方法论被数据驱动的AI方法论全面取代。这里的数据主要指有监督的大数据。人类智能的产生是不是也完全基于有监督的大数据学习而来尚不得而知。从这个意义上讲,计算智能和人类智能之间的差异也不得而知。

从学术角度来看:虽然有监督大数据驱动的方法论在某些领域已经构建出了超越人类智能的AI,但基于有监督大数据的深度学习是否构建机器智能时代充分且必要的基础性方法?他个人认为至少是不充分的,需要新的方法论。

从算法角度来看:主要得益于两个方法:一是深度学习,二是增强学习。增强学习被大家所熟知是因为AlphaGo在围棋上战胜了人类最强的棋手。但实际上增强学习在很多场景下是不能用的,至少目前在视觉和语音处理等任务中尚未得到有效的应用。而深度学习可类比人类学习方法里的归纳学习,却不适合演绎学习。深度学习是否可以广泛应用于推理类任务尚不得而知。

从做计算机视觉的角度来讲:包括智能视频监控、考勤门禁等在内的安防应用以及医疗读图、基于视觉的汽车辅助驾驶等都是计算机视觉技术落地的方向,商业化产品已经雨后春笋般涌上市场。

关于演讲主题中的X表示什么意思,山世光博士在接下来的演讲中给出了X数据的五个含义,分别是:第一,大数据;第二,小数据;第三,脏数据;第四,无监督数据;第五,是增广,通过增广获得更大的数据集。下面的分享实录中会有对各个含义的详细解读。

为什么要用X数据驱动?

山世光博士将深度学习算法、强大算力、大数据比作AI革命背后的“三驾马车”,而这“三驾马车“背后的现实问题是金钱投资,需要非常厉害的牛人做深度学习算法、搭建更加强大的计算力平台以及收集更多的数据。其中数据收集和标注的成本日趋昂贵,所以他们希望在这方面看看能不能做点什么。

关于SeetaVision视觉技术

人脸识别技术SeetaVision的多姿态人脸检测技术,是在标准人脸检测评测集FDDB上最好的方法之一。在100个误检的情况下,SeetaVision的检测率达到了92%,此外还研发了检测加速技术,从而可以在嵌入式设备上实现实时的多姿态人脸检测。第二个人脸核心技术是面部关键特征点的定位,SeetaVision实现了81个关键特征点的超实时检测与跟踪。SeetaVison人脸识别具体应用包括人证一致性验证,员工考勤与打卡、黑白名单目标人检测等。

手势识别:SeetaVision可以实现实时的手语翻译,就像语音识别一样,把1000常用词形成的手语句子翻译成自然语言文本。基于此,视拓目前已经和美的合作,将其应用于智能家居中。

情感计算:SeetaVision的基本表情识别率超过85%,基于普通摄像头的心率估计也非常接近医疗设备的检测结果。

视频结构化:面向智能视频监控类应用,SeetaVision实现了嵌入式设备上的实时人车跟踪,准确度超过85%。

无人机视觉:针对无人机地面目标检测任务,SeetaVision实现了高清视频中地面车辆等目标的实时检测、分类与跟踪。

山世光博士还表示,中科视拓的终极目标是让AI知人识面看世界,给每个AI装上智慧的眼睛,让它看清在跟谁交互,周围环境如何,以及正在发生什么事情。而面对目前市场上已有多家做人脸识别等视觉技术的创业公司,如何才能在竞争中脱颖而出,山世光博士表示,将SeetaVision的商业模式定位为“开源赋能“,走差异化竞争路线,重点关注与行业客户之间的深度合作。

在大会分享的最后,山世光博士对AI未来发展需要注意哪些问题做了一些总结,他认为:

其一,鲁棒性可能是AI和视觉智能一个最致命的问题。其二,AI的成长需要多模态协同,不能单靠视觉智能或语音智能等。其三,如何基于小数据甚至是零数据准确完成各类视觉任务,还需要大量的深入研究。

以下是山世光博士在CCF-GAIR 2017的现场实录,雷锋网做了不改动原意的编辑:

我今天报告的题目是《X数据驱动的Seeta平台与技术》,可能大家都在想X是什么,这里我们暂时认为X就是一个问号。在接下里的报告中,我会从X数据入手,来重点介绍一下我们所做的工作。

其实我们大家都非常深切的体会到,我们正在邂逅一场前所未有的人工智能技术革命和应用的井喷。在这样的一个状态下,它的背后是有“三驾马车”或者“三个引擎”,就是深度学习算法、强大算力以及大数据,这些因素的共同作用才产生了这一轮新的AI热潮。

我这次报告的题目为什么叫“X数据驱动”,主要从数据角度出发,来看对AI产业能做什么事。

这一轮人工智能的热潮,从方法论的角度来讲,主要是源自AI研究范式的变迁。即从人类专家知识驱动的方法论到数据驱动的方法论的变迁。我们指的数据,其实是特指有监督的大数据:一方面是数据量必须足够大,另一方面这些数据还必须是带有内容标签的。人类智能的本质同现在的计算智能之间的差异,在目前而言还是不得而知。因此我们非常有必要从学术角度来探讨,数据驱动或者有监督的大数据驱动这样一种方法论,是否会是我们构建整个机器智能时代的基础设施。

当然,在目前这种有监督大数据驱动的方法论条件下,在某些领域确实已经出现AI超越人类智能的情况。这一轮AI热潮,从算法角度,主要得益于两个东西:一是深度学习,二是增强学习。增强学习被大家熟知是因为AlphaGo在围棋上战胜了人类最强的棋手。实际上增强学习并不是放之四海皆可用的方法,它在很多场景下是不能用的,特别是在视觉和语音等场景下并没有得到非常有效的应用。因为它需要AI能够自动的判断对错,比如说下围棋或者一个游戏,做得好或者不好,算法是可以自动去判断好或者不好、对或者错的。像我们的视觉、听觉这样的一些问题,比如说做人脸识别,AI算法本身识别错了,它是不能够知道自己识别错了的,识别对了它自己也不知道,所以很难形成一个迭代的自我增强过程。如果是硬去迭代,很可能会学偏学傻,乃至走火入魔。

所以增强学习在这些问题上并没有得到非常好的应用。深度学习目前适合解决我称之为“好数据肥沃”的领域,而且通常只对应于人类学习方法里的归纳学习。然而,人类的学习除了归纳学习之外,还有演绎推理。针对演绎推理,深度学习则存在严重短板。举个演绎推理的例子,比如说《几何原本》,是欧几里德从5条公理推演出来的。想用深度学习做这类自动推演,目前来看是完全没有希望的。当然,这是一个很极端的例子,但我们在日常生活中是需要大量推理的,深度学习在这一点上,目前来看也没有太多可以有作为的地方。

李开复老师在过去一段时间多次提及,在未来10年可能人工智能会取代10种职业50%的工作。我不知道大家怎么去看,我个人觉得保姆可能还是很难取代的,也许医生更有可能会被取代。从我们做计算机视觉的角度来讲,医疗读图是一个很重要的方向。对于做人脸识别或者图像识别的人来说,保安则是我们更感兴趣的群体,在未来10年,也许不是50%,而是80%的保安,会被一些自动的系统所取代。比如说我们的一个企业客户,用我们的人脸识别技术做单位的门禁和考勤,在1万个员工的情况下,可以实现不需要员工卡自动做识别、开门和考勤的系统,我想可能未来真的不需要一个保安坐在那儿了。

我和我的学生们在去年8月,基于计算所在视觉信息处学习方面的研究成果做了一个公司,叫做中科视拓,形成了一个产学研联合体,一起开发SeetaVision技术。我们的目标是让AI能知人识面看世界,让每个AI都长上智慧的眼睛,让它看清它在跟谁交流、了解周围正在发生什么事情,以便智能地应对这些场景。

我们主要的底层技术,就是在机器学习特别是深度学习理论、方法与技术。基于这些机器学习的方法,在人脸识别、情感计算、视频结构化和无人机视觉等方面,我们有自己的一些布局。我们过去的积累包括在这些领域的竞赛中,取得一些最好的成绩,其中包括人脸识别、手势识别、行人检测、图像搜索等等任务。我们刚才也提到,业界已经有像商汤、Face++等等有很多前辈公司,比我们早走了多年。我们在商业模式上也希望不断探索新的路径。当前阶段,我们采取”开源赋能“的差异化做法与一些重点客户开展了深度合作。

所谓的开源,是指我们可以给B端客户提供源码级的引擎技术。更进一步的是赋能,我们可以提供生成这些引擎的引擎技术。通俗地讲,我们不但卖鸡蛋,还卖下蛋的鸡,这是完全不同的合作模式。去年8月中科视拓开源了Seetaface人脸识别引擎,它虽然不是业界最好的人脸技术,但提供了一个优秀的基准,从而显著地提升了业界基准水平,也为一些公司提供了参照。有很多客户把Seetaface代码用到产品中,并进而与我们建立了更深度的合作。

在这里我也展示我们的一些核心技术:

多视角人脸检测技术

在人脸检测方面实现多姿态的检测,在FDDB上是最好的方法之一。其实人脸检测大家都非常熟悉,就是我们把这个画面有多少个人脸找出来。FDDB也是在这个领域里面被广泛采用的标准评测,我们在100个误检时达到了接近93%的检测率。另外,我们还实现了很多加速的方法,实现人脸的快速检测,包括在一些嵌入式设备上实现实时的检测。

面部关键点定位技术

面部关键点定位技术,是指在检测到人脸的基础上,实现一面部关键点的定位。我们的技术可以定位80多个面部特征点,当然我们也可以定位更多,但数目并不是关键。我们已实现超实时的特征点定位,在相关的数据库中我们也取得了最好的成绩。基于这些技术,我们落地了一些人脸识别应用,包括1:1的人证比对、网纹身份证照片人脸验证、以及人脸考勤系统等。与简单人证比对相比,在公安的应用场景,身份证查验中心会把照片加一个网纹,再传回来,而我们则需要首先把网纹去掉,再跟现场人员比较看看是不是这个人。目前我们的算法是可以正确判断的。在人脸考勤方面,技术已经成功应用,可以实现1万员工的考勤和门禁,在误识率约为1%的情况下,可以达到95%以上的正确识别率。

情感计算与心率估计

此外我们公司还在情绪感知方面有一些积累,可以实现85%以上的表情识别率。SeetaVision还可以实现准确的心律估计,这里的心律估计是指通过摄像头拍摄人脸部视频来估计人的心跳次数。只要摄像条件好,即可准确估计。

手势识别与视频结构化分析

我们还有一些手势识别的技术,以及手语实时翻译技术。手语识别是指,用手语打一句话,把手语实时翻译成文本,我们目前已经和美的合作,实现对一些基本手势的准确识别,用于智能家居控制。

此外在视频结构化分析方面,我们也可以实现人车的跟踪,在TX1上做到准确度85%以上的实时检测。

无人机视觉技术

我们还有一个方向是在做无人机视觉,能够实现地面车辆目标检测,以及地面车辆的实时跟踪。左图是地面车辆目标检测。每个绿框都是我们检测出来的车辆。我们特意选了一个堵车的场景,在目标如此小且密集的情况下,人为识别都是有很多困难的,但我们的算法能够实现接近90%精度的检测。右边的视频是实现跟踪,能够实现对地面上车辆的实时跟踪。

下面我回到报告的主题上来,即X数据驱动,针对X是什么,我想讲几种不同的场景。

第一,X=大,就是大数据驱动的视觉引擎的设计。现在,无论大公司还是小公司,都是在拼命的收集数据,进行深度学习模型的优化和训练。我们在人脸方面有百万级人数的亿级人脸数据,每个人又进一步有很多不同的场景和照片。我们在车辆和行人方面也有千万量级的图像和视频,我们对这些数据做了大量的标注,如:人的头部、躯干和四肢的标注信息。在无人机视觉方面,我们大概三四个月时间,就积累了百万量级的无人机视觉数据,可以实现对车辆目标以及车辆类型的检测和估计。在大数据的条件下,类似于人的熟能生巧和见多识广,见得多你就可以积累出来非常多的经验。

第二,X=小,在很多场景下,我们人类获得智能的能力并没有依赖于大量的数据学习,反而是一些小数据。所以在小数据的情况下,如何使得我们的算法也能够有效果。

最通常的思路是做迁移学习,所谓迁移学习最简单的是做Finetune,我们把一个已经训练好的模型,再用小量的数据做调整和优化,使得它适应这些小数据所代表的应用场景。例如:我们在2015年参加感知年龄估计的竞赛并取得了亚军。我们采用的算法是首先在人脸识别的数据库里面,利用百万级的数据做训练,再用几万量级真实年龄的数据做Finetune,最后在竞赛方提供的感知年龄的测试数据集上,取得了非常好的效果。

在表情识别方面,我们在2014年参加了一个竞赛,因为没有大量的表情数据,因此,我们采用人脸识别的数据做训练,直接拿人脸识别的特征来做,最后也是取得第一名的成绩。可见我们很多的任务,特别是相关的任务,是可以运用相关领域的数据来实现迁移的。

另外一个例子,比如面部特征点定位,要用到在面部标注点的数据集。现在学术界或者工业界可能会有很多不同类型的数据,比如一个数据集可能是68个点、另外一个数据集是74个点,它们之间的定义是不一样的,如何把它合并起来,使它变大,从而形成更好的算法,也是一个很值得关注的方向。

我们的一个博士生就做了这样的一个算法,利用预测填补和深度回归的方式解决问题,其背后也是深度学习的方法以及一些适应性的调整。

另外一个例子,手机上会有越来越多的摄像头,这些摄像头有可能是彩色的、也有可能是黑白的、还有可能是深度的,还有可能是近红外的。这些摄像头采集的数据,如何实现共用,这也是一个非常值得研究的话题。比如说在RGB-D数据集不足的情况下,如何基于大量的RGB数据来完成跨模态的融合,以实现更好的结果。

首先通过不同模态的数据分别建立深度学习的模型,之后再通过共有的网络去实现它们的融合,再反馈回来调整每个模块的深度模型,最终可以实现不同模态数据之间的跨模态的比对以及融合利用。

这种方式其实也是在利用小数据和大数据的关系,在小数据条件下更好地学习算法模型。利用这样的一种方式,我们在去年2016CVPR上发布的模型,实现了彩色和深度信息之间的融合,乃至比对。这就是第二个X=小数据。

第三,X=脏,还有很多情况下是脏数据。所谓的脏数据,比如在百度图片搜索“成龙”,确实会反馈很多成龙的照片,但是也会有大量的不是成龙的照片。而我们又不想雇1000个人大量的数据把它标注出来,干脆就基于有噪声的数据实现机器学习。所以我们在今年提出具有“自纠错学习”能力的深度学习方法,在深度学习的过程中,一边去学习算法,一边去估计哪些样本的标签可能是错误的,我们把一些可能错误的标签修正过来,从而得到更好的算法。利用这种策略,我们发现,即使加了40%或者60%的错误标签,我们的算法也能够实现不错的深度学习效果。

X=脏,这个脏还可能有另外一层含义,比如说有遮挡的情况。我们也提出了一个算法,在这个任务里面,我们能够把面部的遮挡部分、脏的部分补出来,补出来之后再去实现感知。把这两个过程迭代起来,形成联合的学习,这个工作发表在去年的CVPR上面,也是取得了非常不错的效果。

第四,X还可能是无监督数据。所谓的无监督数据是指没有标签可以利用的数据。想象一个场景,比如我们手里面有大量东方人的有标签数据,但是有标签的黑人数据相对较少,而我们可以在网上找到大量的无标签的黑人数据,我们如何能够利用这些没有标签的数据进行识别,这是一个很重要的问题。因为只用东方人的数据做训练,去识别黑人效果会非常差,反过来也是一样,所以我们要进行模型的调整,以实现从东方人数据到无监督的黑人数据的迁移。我们这方面的工作发表在ICCV2015上面。

第五,X还可以是增广数据,即通过对已有少量数据进行修改的方式,来生成大量数据。人类有一种能力叫做举一反三,比如说给大家一张平面的照片,可能看到这张很帅的照片之后,你就会浮想联翩,怎么浮想呢?可能会想这个人从侧面看是什么样子,他笑起来是什么样子,他戴上眼镜会变成什么样子,我们具备这种能力。我们能不能让机器也有这样的能力,从一张照片增广出大量数据,用于学习。这里示例的是我们基于三维模型的方法做数据增广的效果,我们可以生成这位帅哥在不同视角条件下的照片。

完成这个任务,另外一种方法是采用这两年非常火的GAN方法。输入最左侧的照片,用GAN可以生成不同表情的照片。还可以有更加复杂的,比如说带上眼镜,加上胡子等等。当然这个也是有条件的,并不是说每张照片都可以做得这么好,基于GAN生成的人脸图像是不是能够用于提升算法,目前还是存疑的。

总结一下,X等于什么呢?大数据、小数据、无监督数据、脏数据、或者通过增广的方式,实现更大量数据的收集。其实还有一个非常重要的角度,就是类比人,人在很多时候都是自寻烦恼,当然不是自寻烦恼,是自寻数据。例如,在我们观察一个物体的时候,如果从一个角度不能全面观察,我们会移动来收集不同视角的数据,这种主动收集数据的能力,是现阶段AI系统升级为自主AI系统的必备能力,特别是对自主无人机和机器人。

此外,从整个视觉智能的宏观角度来说,我们现在已经非常清晰的看到,鲁棒性是视觉智能乃至整个AI的核心问题之一,即如何能够实现万无一失。其实,现在像人脸识别的场景下,有些情况下我们已经做到万无一失,但是仍有很多实际应用的场景,例如智能驾驶等领域,我们需要的是百万无一失,意味着我们需要百万分之一的错误率。在这样的条件下,才能够有更加广泛的应用。在这种情况下,是不是仅有大数据就足够,这一点还存有疑问。

我们类比人类的发育成长过程,人类具备两个特性:一是多模态数据协同;二是基于小样本的自主学习。

多模态数据协同

人类的多模态数据协同是指什么呢?对于人来说,除了眼睛之外,我们有很多其它信息来对我们的智力发育提供帮助,包括语音、姿态、动作、以及背后有大量的知识库作支撑。因此,人本身是需要一个多模态系统协同工作的鲁棒AI,这带给我们一个思路,AI的成长和发育也需要多模态。

基于小样本的自主学习

对人的智能发育来说,我们生来就有“大脑”,有所谓的智商,我们从一出生的时候,神经系统基本上发育的差不多,到3岁就基本发育完毕。也就是说,人类作为一种高级生物,经过数百万年甚至更长的时间进化出了这样的一个”先天脑“模型。假设我们拿深度学习作为一个模型来类比,相当于人在出生的时候,祖先已经帮我们利用大量数据训练出了一个深度学习模型。

在后期的成长过程中,其实是对这个深度模型基于小数据的不断调整和适应性的优化。所以说,我们认为AI发育的非常重要的一点,就是如何基于小数据甚至是0数据完成智能的发育和后天的学习。比如说我跟大家描述一下某个人长成什么样子,你并没有见过这个人,你并没有见过这个人的照片,我们称为0数据,你如何能够识别这个人,是对AI的一个挑战。类似这样的应用场景,将来会有非常多的研究空间。

综上,从人类智能的角度出发来看AI,AI要想在更多的场景下实现强大的视觉能力,还需要基于小数据乃至0数据情况下的自主学习能力、以及多模态的数据协同能力,这两种能力为AI的发育提供了可能性,也为AI真正理解世界并服务人类提供了可能

我的演讲到这里,谢谢大家!

雷锋网整理编辑


雷锋网

CV+圆桌对话:算法不是唯一考量,创业公司的商业闭环才是最大难点 | CCF-GAIR 2017

7 月 9 日下午,由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的第二届CCF-GAIR全球人工智能与机器人峰会,进行到最后一天,CV+专场的圆桌论坛作为本次大会的最后一个议程顺利进行。圆桌讨论的主题是,计算机视觉渗透生活。本次圆桌由微软亚洲研究院资深研究员梅涛博士担任主持人,他幽默但犀利的主持风格博得现场阵阵掌声。

参与本次圆桌的五位圆桌嘉宾包括:中科院计算所研究员、中科视拓董事长兼 CTO 山世光、阅面科技 CEO 赵京雷、图麟科技 CEO 魏京京、瑞为智能 CEO 詹东晖以及臻识科技 CEO 任鹏。

虽然大会已经接近尾声,但现场依然座无虚席,观众们也幸运地看到了六位大牛时而轻松愉快、时而严肃认真的讨论。

雷锋网整理了本次圆桌的讨论全文。

梅涛:今天我们圆桌的主题是「计算机视觉渗透生活」。为什么今天选择这个主题?因为我们觉得计算机视觉已经渗透到我们生活无处不在的地方,渗透这个词英文是「permeate」。计算机视觉已经在改变我们生活的方方面面,我们有必要探讨一下计算机视觉到底在我们生活中能够产生什么样的影响以及怎么落地。

今天我们会邀请到五位嘉宾,刚才我用好奇心给每个人起了一个外号,如果不当请原谅。因为做科研,总是喜欢做一些很创新的事情。

第一个嘉宾,刚才山老师说公司最小,所以请他第一个上台,给山老师起名字叫「X man」,因为山老师刚才讲了很多「X」(雷锋网 AI 科技评论按:山世光博士的演讲题目为《X 数据驱动的 Seeta 平台与技术》)。有请山老师。第二位嘉宾我起了个名字叫「忧郁的男子」,欢迎赵京雷赵总。赵总是毕业于上海交通大学的人工智能博士,现在是阅面科技的 CEO。第三位嘉宾我起的名字叫「Cool Man」,有请图麟科技 CEO 魏京京,他是我的师弟。第四位嘉宾我给他起的名字叫「风一样的男子」,因为他穿着黑衣服,像个黑衣人一样,他就是瑞为智能的 CEO 詹东晖。詹东晖博士是瑞为智能的创始人兼总经理,十一年在华为的经历,创立了瑞为智能。最后一位嘉宾我们叫「Cooler Man」,因为他看起来比我师弟更酷,有请臻识科技的 CEO 任鹏。(现场笑声+掌声)

今天有几个话题给各位嘉宾准备,在座来听课的各位老师和朋友也可以提出你们的问题,通过雷锋网的同事给我传达一下。

第一个话题比较简单一点,大家觉得计算机视觉对我们生活产生了什么影响?大家可以结合自己的生活讲一讲你们的体会,我们从最小的公司开始吧,山总。(现场笑声)

山世光:我最近经常在演讲的时候问大家一个问题,你今年刷了几次脸?我相信在今年也许你会刷三五次,明年搞不好得三十到五十次了。为什么这么说呢?因为人脸识别,就像刚才说的,在过去几年时间里面是计算机视觉里面最快落地的一个技术。我自己做人脸识别,我就不说「之一」了,这个技术确实在不断渗透到我们日常生活里,大家可以看到出行方面,比如说坐高铁、飞机,机场需要刷身份证,验证你这个技术是不是能应用。包括接下来几年,我们有大量公司采用人脸识别的技术做员工的考勤和门禁。这一代考勤门禁跟上一代不一样,三四年前我们家旁边的门禁考勤都是人过去,还是要看着屏幕做考勤,未来将会是无感的考勤,我相信人脸识别会越来越多的渗透到日常生活中去。人脸识别就像门和锁的关系一样,你需要进入到某一种状态,有这个权限就可以验证你是你,这是几乎无处不在的场景。我就说一下人脸识别,后面还有很多空间可以说。

梅涛:谢谢山老师,山老师认为人脸有很多因素。

赵京雷:「忧郁的男子」这个名字特别贴切,因为我这一年马上要开始驾照年审了,我已经被抓拍三次了,马上要开始去学习了。

对我而言,计算机视觉对我而言不能说是好的改变,但是对车牌的识别(很重要),每天我们开进去停车场,这种技术很成熟,已经潜移默化了,我们已经意识不到这种技术的存在了,包括臻识科技也在做这种技术。我们生活中类似车牌识别的技术大量存在了。跟车牌识别相关的 OCR 技术,包括手机里面各种各样的贴图、美颜。说到美颜,好像在座的女生不是很多,只要是女生,我觉得这已经是必备的。很多技术我们每天意识不到它的存在,我觉得这更是标准的这些技术的成熟。

反过来,我们思考一个问题,比如说山老师刚才谈到的人脸识别,包括马云,包括很多公司,每天都在讲刷脸,为什么把它叫做一种技术呢?从这个角度考虑,我认为这个技术反而是不成熟的。过几年以后,我们再也不讲刷脸,每天很正常,我上街买一个东西,不需要站在那里一刷,付一下款就可以了,这个时候技术会真正走向成熟。

梅涛:谢谢赵总,人工智能带来很多便利,但是需要人们更加的自律,希望赵总以后不要再忧郁了。接下来请魏总谈一谈计算机视觉给你生活带来什么改变。

魏京京:人工智能给我带来很多借鉴,我们平常感受到人工智能的点非常少,比如说我们用 FaceU 这种产品,还是比较简单化的产品。其实 2C 和 2B 我们看了很多,但是真正 2C 落地非常难,大部分公司都在做 2B 的业务,2B 是做我们正在做我们用到的东西。如果说视觉改变生活,现在这个阶段是非常隐藏的,你是看不到的,在每一个商品的背后是大量的服务和技术在里面,只是你感觉不到。后续的发展会从后端延展到前端,我们用的东西会慢慢感觉到有视觉的东西在里面,这个时间还很长。现在 2B 的业务我们做不过来,还有很多需要挖掘,2B 的爆发点还在后面,我非常看好后续三五年视觉在我们生活中显现出来,大的关键的应用机会非常多,我们创业公司先做 2B 的事情,慢慢技术、场景、用户行为习惯和付费习惯成熟之后慢慢会到前端。

梅涛:魏总的意思是你认为人工智能先从 2B 业务开始,然后慢慢渗透到生活。

魏京京:对,先从 2B 渗透到产品,慢慢渗透到前端,包括 2C 的产品和应用会越来越多,这是创业公司和产业发展的大的机会。

梅涛:下面请詹总讲一下人工智能的变化。

詹东晖:我觉得如果从人工智能对生活的影响,最直观的还是臻识科技他们做的车牌识别,以后每次进出停车场不用取卡。我们四位都做人脸识别,大家感受很多的还是刷卡,未来很多机场会增加人脸识别的登机,包括厦门码头,你去鼓浪屿必须做人脸识别,包括未来做长途汽车,这些领域都会通过人脸识别技术的引入,让整个生活变得更安全。

开始我们也做了刚才魏总讲的 2B 的场景,这两年我们开始在家电领域引入人工智能的技术,比如我们跟美的合作开发了智能空调的产品,现在已经开始在卖场做销售。你可以通过手势、语音可以让空调更智能的感知人的喜好,这是潜移默化的对生活的影响。我们瑞为智能做的更重的是 AI+零售的应用,现在在很多门店,特别是在北上广深很多门店逛街的时候,我们摄像头已经在分析你的喜好,包括分众的媒体已经有我们的一些摄像头,这些已经在间接的潜移默化的改变我们的生活方式。这是我做的一点补充。

梅涛:谢谢詹总,基本上你们会让我们购物非常方便,也方便了商家。最后是任总,谈一谈你的看法。

任鹏:刚才两位老总还介绍了我们公司。我们做的确实对大家当前的出行带来很多方便,现在停车场的进出就已经很方便了。其实还有一些很简单的,大家已经感觉不到的其实对生活改变更大。我想问大家每天会扫几次码?这是非常简单的计算机视觉技术的应用,里面的关键在于它的准确度,如果人脸识别真的像山老师讲的那样,准确度达到百万分之一的时候,对大家的改变就完全不一样了。一个技术要改变生活,还是在于这个技术的成熟度。如果不是走这个方向,可能会在娱乐方面,比如说在游戏方面改变生活。我们走的是工业化的路线,比如说安防的应用、工业自动化的应用,对算法的准确度要求是非常高的。现在随着技术的发展,我相信我们技术的改变对大家生活的影响,可能不知不觉中大家的习惯就改变了,还不知道这是因为计算机视觉的改变。

梅涛:谢谢任总,谢谢五位嘉宾的讲解。我自己感觉刚才问的问题比较简单,我是比较喜欢提一些难的问题的,我对刚才问题的解答不够满意,因为他们在变相做广告(现场笑),所以我接下来的问题稍微难一点。问题没有变,我想问大家,你觉得计算机视觉能够改变生活的哪个方面呢?但是得是除了你们业务以外的方面。把这个问题先提给詹总。

詹东晖:您的意思是在我们业务范围之外。

梅涛:对,这才是真心话。

詹东晖:我觉得人工智能对生活的影响,这个趋势肯定是必然的,只不过我们看它是在五年之内、十年之内能够多深地改变我们的生活。我可能偏悲观一些,在我们能看到的眼前三到五年时间,我觉得还不会给我们带来很大的变化,比如说机器人,虽然现在机器人很火,但之前看起来很傻萌的机器人有没有用处?好像没有什么用处。

梅涛:大家可以看到,我第二个问题把他真心话问出来了。(笑声+掌声)

詹东晖:对,我认为还需要蛮长的一条路,在技术上面做更多突破和革新。刚才任总说到,对人脸识别来讲,客观来讲,我们不吹牛的话,它还是能够达到非常高的精准度,能不能把人脸识别作为唯一的取款方式,未来三到五年是不可能的。我们讲阳光大道的同时,其实还是有很多挑战存在的。

梅涛:这一点我深为赞同,谢谢詹总。谁自告奋勇第二个来讲一讲你的真心话。

赵京雷:这个问题非常有挑战。对大部分视觉公司来说是有需求,然后卖技术。我觉得这是我们要思考的问题,我们成立一个公司,80% 是不做得,10% 或者 20% 要专注做这个才可以,首先要看我们专注的点是什么,我们在视觉上面,但是不代表我们不具备其他的能力,比如说 FDDB、LFW 技术我们公司目前排第一,我们也可以解决很多安防问题、金融问题等等,和人相关的东西我们都可以解决,但是有所为、有所不为,我们目前主要关注怎么思考山老师讲的刷脸。

刷脸讲了这么多年,在消费级范围内怎么能够成为现实,有没有具备创新性的产品出来,所以我们更多是基于对这个核心技术自己去做一些创新性的产品,希望能够做一些能够改变行业的产品,而不是做大家都能解决了的问题,解决不了的问题是大家没有好思路,我们希望从自己意愿而言寻找这些思路和寻找方法,不是喊两三年,大家针对这个问题一直停留在这个状态,这是我们去做的。反过来,某种意义上讲,如果大部分人都能解决的问题我们不太会去做。如果问题很强,比如说在识别里面,怎么能够在未来普及,怎么样成为人人可用的技术,不只是掌握在政府、只是掌握在少数人手里的技术,我们希望更多的做这样一些事情。

梅涛:谢谢。魏总,你有什么高见?

魏京京:刚才都说了一些虚话,现在说实在话。说心里话,从一开始我们做这个行业,从三年前到现在为止,我们对人工智能和这项技术的理解并没有像外面媒体宣传的那么酷、那么炫、那么反人类,它只是对软件技术的爆发而已,对我们生活或者行业的改变,我觉得是润物细无声的改变。上一个潮流是在讲互联网和移动互联网,互联网和移动互联网的特点是爆发力度非常强,爆发出来的时间点非常短,比如说共享单车等等互联网的产品。在人工智能这个产品,你希望在一年两年或者三年五年有更新换代变革的东西不太可能,不管在产业过程还是在我们生活过程中,它只是一个辅助手段,只不过把我们原来认为比较难被智能化的东西逐步开始智能化,但是这个过程也是非常缓慢或者非常逐步的。

我们给客户做产品,一开始不是把所有东西都颠覆掉,只是在某一个环节能够帮你节省人力、金钱或者时间效率,说实在话,这个东西没有那么高大上,也没有那么反人类,只是这个时间点出来一个很好的技术,给它插上一个翅膀,在每个行业慢慢显现出它的价值。所以,这个行业的周期应该比互联网和移动互联网长非常长的时间,我看好十年、二十年之后可以在技术革新和产业进步方面发挥更大的作用。

梅涛:魏总说了很多真心话,至少是有希望的。任总呢?

任鹏:我讲一个改变生活的场景,我们也想做,但是技术还达不到。比如今天这个会场,如果安防领域的技术能识别出在场的每一位是谁,这会儿在讲什么话,我觉得这个场景会对大家的生活有非常大的改变。

梅涛:你想干嘛?(现场笑)

任鹏:我们想做,但是这个比较有难度、比较有挑战,受限于当前的技术。

梅涛:比如你知道各位的知识文化水平、受众面,可能今天讲得会不一样。

任鹏:简单一点,有点像上帝。做技术的可能会有这样的想法和追求,但是实际上他对生活的改变可能是负面的,没有隐私了,也有可能有的人的工作会失去,但是这种发展是挡不住的。

梅涛:谢谢任总,最后有请我们最小的公司的山总。(现场笑)

山世光:我想跳出来计算机视觉讲整个 AI 领域。这次大家注意到搜狗同传这件事情,还是蛮有意思的,中文不太好,但是对英文,包括同传比较好,包括今天听医疗那边讲的,不用听英语,看中文基本上能理解是什么意思。像这样一个技术不是说多么成熟,但是如果不去用,更加不能走向我们的日常生活。对计算机视觉来说,需要比语音识别还要更晚一点,这是一个必然的现象,因为语音识别的好处是识别完以后变成文本,变成文本就有语义,直接可以跟互联网挂钩,这对计算机视觉来说,大多数场景里面我们看到图像里面精确的语义比较少,我们希望把图像里面尽可能多的语义尽可能精确地提取出来。当尽可能多的语义被提取出来以后,后面是有很多空间可以做的,但是相比语音识别我觉得会晚蛮久。如果不是人脸识别,还有很多,计算机视觉一定是润物细无声的作用。

如果非要说计算机视觉,最广泛的应用就是在鼠标领域。大家知道光学鼠标的原理,就知道光学鼠标在移动过程中是通过图像匹配做移动位置的检测的,大家天天都在用计算机视觉的产品,但是大家不觉得它是计算机视觉的产品。很多时候计算机视觉产品往往是锦上添花,润物细无声,你没有感觉的时候让你体会到技术给你带来的好处。在医疗方面我非常看好,我觉得未来自动这件事情很快会超过中国平均以上医生的水平,对医疗的改变会非常大,当然政策上的原因,如果政策能够突破,这是非常大的改变。

梅涛:刚才问这个问题我是希望大家能够发散思维想一想,也许十年、二十年后大家可以去那个方向创业。

接下来的问题,请允许我作为主持人再问最后一个问题,待会儿大家可以准备一些非常难的问题。下一个问题很简单,我想问大家,因为大家创业好几年,踩过很多坑,我们在微软做产品、做研发的时候也遇到好多坑,我想问大家,你觉得人工智能技术在落地过程中最大的难点是什么?希望大家简洁明了的告诉我们你遇到的难点是什么,你觉得这个难点应该朝哪个方向解决?

任鹏:我觉得最大的难点是闭环。这个闭环是指什么呢?市场的需求和当前的技术能达到的水平的闭环。做这个产品的时候,作为一个创业公司,你能把握的影响产业链的闭环,比如说取得数据,以数据来驱动,当前产品的结果和客户市场的需求还有差距,你反过来怎么迭代?所以这个闭环是非常关键的。

举个例子,安防行业,08 年我们刚刚开始创业的时候,客户提了这样一个需求,你们的算法能不能把场景里面的人、车都识别出来?过了九年,当前的技术是可以解决了,但是要批量化成本很高,客户会不接受这个东西,他想的是,你们能不能把这个东西识别出来,又很便宜。所以,这个闭环是很难的,做产品的时候就有很多需要取舍和平衡的东西,要去平衡你的功能、性能,满足客户的指标、期望,最后在产品设计和成本相关的这些方面,其实一个核心就是闭环。

梅涛:任总认为闭环是一个难点。詹总呢?

詹东晖:我也同意任总的说法,闭环是一个难点,对商业场景来说,对人工智能的需求是存在的,但是为什么这么多年没有什么应用?最根本的原因是技术,这两年比较火,因为深度学习的引入让技术的性能上达到一个跳跃,我们发现很多场景似乎具备了可应用的基础,这距离人工智能要达到的目标是有差距的,但是不意味着不可用。如何让这个技术和用户需求达到一个平衡,这是一个难点。

另外,刚才提到深度学习,深度学习是一个很消耗处理资源的技术,很多时候一个问题是如何在一种低成本、高性价比的方案里面去实现。你可能做出一个很牛的识别相机,但是成本要 2 万块钱,这个相机可能就基本上没有办法销售和商用。

举个例子,我们在做 AI 放到零售的时候,做了快四年才推出第一代产品。从算法上来看,我们并没有做太大的革新,这三四年都在做它的落地。从最开始很复杂的系统,要前端相机、后端服务器,那时候成本要大几千块钱、一两万块钱,做到现在可以很低的成本,一两个很小的摄像头,可以完全不依赖网络和云端,可以做复杂的智能学习的算法的实现,我们花了四年时间。因为这四年时间的投入,达到这样一个落地化的产品,才使它具备开始规模的在商业应用的情况。我觉得这里面很大的挑战在于,算法本身已经不是一个最主要的维度了,而是看怎么做落地化。

梅涛:关于落地化我自己感触很深,因为我经常遇到客户,客户经常提出无理的要求,客户说你能不能识别人脸做到 5 个 9、6 个 9?我说我可以识别出来黄晓明,但是识别不出来梅涛,这是两个不一样的场景。

魏京京:观点基本类似,我们创业过程中最大的一个难点是怎么从飘在天上落到地下,因为视觉这个领域基本上是很高的技术壁垒或者带着技术光环创业,否则做不了这个事情。通常是以我为主,客户围绕我来转,我们也犯了这个错误,我们产品设计的时候以我为主,这是技术背景的公司很容易犯的问题。

我们慢慢从飘在天上到接受现实落到地下,跟之前两位的理解是差不多的意思,最关键的不是你有什么技术,而是你把已有的技术跟他的痛点结合,这个问题不是技术的问题,基本上就是商业问题。你要做商业闭环,同时要跟已有的环节有合适的商业产品的设计,这个需要付出的努力不是做技术的来做的,而是你要接地气,围着客户做讨论、设计和服务,让他慢慢接受你,这是很痛苦的,也是我们做技术创业需要转换的地方。我原来也做过投资,看过很多以技术为背景的创业公司,这是很容易犯的一个问题。

梅涛:谢谢魏总,魏总说出很重要的一点,要服务客户,要理解他的需求,要整天围着客户转。(现场笑)

赵京雷:非常同意前面几位嘉宾的观点,这确实反映了技术创业遇到的比较大的难点或者痛点。从我们自身而言也是这样,可以归纳为两点:第一点,怎么样管理客户的期望,不一定是用户的期望,因为大部分是 2B 的。可能受很多媒体或者各方面的宣传,如果不是做技术这个行业的,总是对 AI 能做的事期望太高了,不管是普通的小机器人或者对视觉技术期望太高,经常有各种各样的公司找过来说,我有这样的需求,你能不能做。

第二点,计算机视觉不是万能的,比如说我们一般说的视觉是 RGB,计算机视觉这两年进步很大,在 RGB 普通镜头下,光线、角度各方面都有了比较大的进步,但是现在的技术发展的情况还不是所有问题都能解决。跟客户解决的问题可能依赖计算平台,依赖整个体系的联合优化,比如说有很多场景的客户找到我们说,能不能帮我们做一件事,我们会问他,这个事情晚上要不要做?晚上要做。他是拿普通摄像头,补光的时候,这是消费级的,你又不能拿灯去补光,这种情况怎么去管理,和客户一起去梳理行业碰到的这样一些需求,然后把它抽象出来,怎么样用最好的芯片、最好的后台系统结合算法一起去做,其实算法一定不是孤立的。

梅涛:谢谢赵总,其实我也很赞同,因为我发现用户需求和期望有两种,一种是用户没有期望到你算法能做到这一步,另外是用户觉得这么低的要求算法做不到,其实用户需要引导。

山世光:其实我特别不想同意他们几位的观点,但是在是没有办法不同意。(现场笑)我就不重复了,但是我的观点是,最大的障碍还是技术不完美。我们所谓的技术完美,当然我们希望「快、准、稳」。快是随便找一个很烂的芯片就可以做;准是什么情况下都能工作;稳是不会出现差错,这样落地和闭环就不会出现难题了,但是我们现在真的做不到。比如刚才说的万分之一,很多时候是达不到的,比如变换场景,晚上你非要用普通的摄像头就是做不到,没有办法。我觉得真的还是技术上不完美,这也是这个领域并没有到非常非常完美的马上可以四处用的阶段,在这个阶段最难的是怎么去找到客户的需求和技术的边界能够结合的应用,再配合上其他的一些条件,能够满足用户的需求。刚才几位说得都对,技术不完美还是一个很大的障碍。

梅涛:其实我觉得不完美有时候也是一种完美,正因为不完美所以我们有很多机会。

山世光:对,上帝也不完美。

梅涛:谢谢大家。接下来把时间留给在座到场的听众,不知道有没有非常难的问题?

听众:我想问一个很具体的问题,关于图像识别领域的竞争差异化的问题。现在有一种说法,在人脸识别、医疗读图领域,行业里面这两个领域主要的公司用的技术都非常像,有人就说现在这些领域的发展变成不是拼技术,而是拼市场,去跑马圈地,去融资和烧钱,不知道对这种情况台上各位老总怎么看?

魏京京:你刚才提到图像识别视觉差异化的问题。每家从图像识别本身来说,从技术到落地中间的环节非常多,并不代表有图像识别技术就既能在医疗领域做,又能在营销领域做,又能在工业领域做,差的十万八千里,这中间是显现每家公司技术核心竞争力的。你要有技术落地,需要找数据源、找他的痛点,同时把商业闭环做好,不代表我直接说一个故事就有人给你钱,你就把这个事做成,中间的过程还是非常复杂的。我们做很多细分领域,每个细分领域少则半年,多则一年到一年半,中间需要打磨的东西非常多。

图像识别虽然是有技术的通用性,但是到细分行业需要做的事情非常多,这个事情不仅仅是技术问题,技术只占 1/10 甚至更少的环节,因为机器学习的原理逻辑带来技术壁垒本身不是特别高,很多时候需要你把商业的东西完备的提供给客户,这是商业要做的事情,也是我们公司创业要做的事情。我们不是做学术,是真正做一个人家愿意买单的东西,要把这个价值链条梳理的更加清晰一点。

詹东晖:我简单补充一下,我很同意,我的观点是不会有所谓纯粹的 AI 公司,AI 只是一个技术,对于我们在座的几位来说也只是 AI 的创业者,每个人可能会选择不同的落地行业、落地跑道。未来可能有人做安防,说谁是在安防领域做的最好的 AI 公司、谁是零售领域做的最好的 AI 公司。单纯的计算机视觉技术的壁垒,对做得好的公司来讲,这个壁垒越来越没有差异化,做得好的就是看谁跑得更快,能够更快让技术和产品落到行业里面去,更深的铺到这个行业,构建一个更完整的行业壁垒,这可能会是一个更重要的地方。

赵京雷:我觉得这是一个蛮重要的问题,所以我补充两句。其实大部分人都会问到这个问题,这家也在做、那家也在做,为什么还要做这一块?我觉得这个事情分两个阶段,一个阶段是人工智能技术底层还不是非常成熟,我们在做 AI 底层基础设施铺垫的阶段,这个阶段不像大家想象的那样,比如说我们有开源的框架,把不同算法写上去,大家跑出来的东西是一样的。如果是这样,Facebook 和 Google 这样的大公司就不用收购这种基础性的公司了。像刚才魏总谈到了,每一个单项技术成熟在不同领域、某一个点成熟,在这个结点需要至少一年半到两年的时间,比如说一家公司从无到有的模型上做,第一个是在云端能不能部署,在前端能不能部署,肯定需要一年半到两年的优化过程。

我觉得在这个阶段,人工智能基础设施快速落地的阶段,不同公司的技术差异非常大,但是如果过了这个阶段,我非常同意刚才谈到的,这些技术不是绝对的壁垒,一年能算什么呢?未来人工智能的场合里面一年可能就是一瞬间,所以这里面技术肯定不是壁垒。那什么是壁垒?刚才各位已经谈到应用领域,我觉得主要就是产品。像移动互联网早期那样,基础设施和运营商很早出现,最终是什么样的东西把不同的做这一块的公司区分开来?一定是产品。比如说苹果是爆品,iPhone 出来了。其实人工智能现在缺少爆品。有一些公司,不管做什么领域,能从这个领域里面把自己的爆品打造出来,我觉得这就是未来 AI 公司本质的差异化所在的点。

梅涛:谢谢赵总。由于时间关系,可以再来一个问题。

听众:这个问题想请问一下山老师,刚才讲到表情识别,识别表情到底干什么?我们是做行业应用的,在行业里面的服务人员的微笑有一定的要求,微笑是比较简单的事情,我的想法是通过这个表情我们在后台再进行一些深度的应用挖掘,比如说他的绩效,企业可以根据这个做员工的关怀,这种劳动强度可能比较高,在后端进行进一步的挖掘,我想请教您的看法。

山世光:这是蛮好的问题。我觉得对 AI 感知人本身,除了认出他,还要了解他的意图和情感,这一点是非常非常重要的。我们能够想到有很多可以落地的应用,比如说风控,当然我不能做测谎,但是可以做情绪的感知。我可以做教育上的评估,比如说小孩在上学过程中的专注度、接受度等等这些方面,都是可以去做的。当然其实大家已经看到笑脸快门这些非常普遍的锦上添花的应用。另外一种是跟疾病、健康相关的,其实是泛情绪、泛情感的这部分,通过估计心率,不知道未来是不是存在这样的可能性,可以测血糖、血压,以前觉得技术上难度太大,现在看来其实都有可能,不是不能做。一旦当非接触式的通过视频方式可以做,我相信可以带来非常非常多的应用。

梅涛:谢谢山老师。最后一个问题,我代表雷锋网来提问,请各位嘉宾展望一下未来五年计算机视觉的发展方向,以及未来五年你觉得哪个方面可以更加深入我们的生活,哪些计算机视觉技术可以更加渗透我们的生活,给我们带来更多便利?

任鹏:未来五年,我觉得传感器技术会变,深度的传感器可能会普及。多种数据源的融合,不只是视觉,多种数据源融合结合成产品解决问题,这种情况会越来越多。这是技术层面的。

当然,算法也好,芯片、计算资源也好,肯定要符合摩尔定律,五年以后我觉得不会是瓶颈。因为十年前我做的是增强现实 AR,我觉得下一个五年增强现实会越来越普及。

梅涛:你认为是增强现实。

詹东晖:我觉得未来五年工业视觉这一块会有比较大的突破,因为目前这一块不仅问题很多,而且市场刚需很大。另外,山老师提到 AI+医疗,医疗领域引入 AI 可以很大改变医疗的现状。

魏京京:我们也是做工业设计的,非常同意詹总的观点。我觉得分两方面,第一方面是未来五年会有一大波机器替代人的过程,包括工业视觉的制造环节和服务环节,很多 AI 算法会集成到产品里面把人的工作替代掉,这是不可逆转、必然要形成的。另外一个,现在 AI 算法比较重,后面有大批量服务器支撑,所以后面的趋势是轻量化,轻量化到我们家庭和身边,让更多能够触碰到的功能带到我们面前。一方面是我们后面看不见的很多人会被替代,另外是我们中间会出来很多大家比较惊讶的智能化产品。

赵京雷:我觉得未来几年对人类生活影响非常大的计算机视觉的应用,一定来自于受众最广的领域。哪个领域最广?一定是手机。未来五年什么样的视觉产品会成为爆品?大家只要看苹果一代一代的会加什么样的视觉功能就可以了。如果加刷脸,那刷脸就是爆品,人人都会刷脸,所有硬件都会通过刷脸去登录。所以未来很简单,看苹果这样一些产品行业的大师怎么去思考视觉,在对人类生活影响最广的领域的构思。

山世光:我觉得是医疗,因为医疗真的非常非常重要,每个人都会涉及到去医院做检查的问题,所以我觉得医疗肯定是非常大的一个市场。另外一个就是自动驾驶,我不知道大家看不看好,我自己还是觉得未来五年里面,至少辅助的驾驶系统会逐渐进入到几乎所有的车上去,这会给大家带来生活态度、生活方式的变化,我相信一定会带来。当然,五年之后是不是真的全自动驾驶不好说,全自动驾驶在一些封闭的环境下面、可以拿到高精地图的场景下面,我相信也是有非常大可能性的,所以我还是非常看好这种。而且我相信自动驾驶领域里面,视觉 Camera 这种方式应该会超越雷达的方式,使得它能够更快或者更有可能普及。

梅涛:谢谢世光,世光认为自动驾驶是下一个五年的热点。我们的圆桌讨论非常成功,再次感谢五位嘉宾的参与。其实人工智能离我们很近,计算机视觉离我们也很近,未来离我们并不遥远,将来我们可以想象将来身边围绕各种各样的机器人,医疗机器人、无人驾驶机器人、看护机器人、情感机器人,我们人类会变得更加聪明还是更加懒惰,我不知道,但是不管未来怎么发展,我们人还是会来到这个会场,面对面的具有感情色彩的深入交流。感谢雷锋网,感谢 CCF。

以上为雷锋网整理的圆桌全文,更多资讯请关注雷锋网。

雷锋网

辩论:智能投顾是否真AI ?这么厉害怎么不自己用而要开放出来?| CCF-GAIR 2017

(从左往右:薛昆、夏雷、王蓁、杨永智)

雷锋网AI金融评论报道,2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳大中华喜来登酒店举行。本次大会由CCF中国计算机学会主办、雷锋网与香港中文大学(深圳)承办,期间聚集了全球30多位顶级院士、近300家AI明星AI企业 ,参会人数规模高达3000人。

在8日下午的金融科技专场中,来自招商银行、通联数据以及财鲸智能投顾的嘉宾围绕智能投顾的业务和技术实践展开了激烈的圆桌讨论。该环节由阿博茨科技CEO杨永智主持,招商银行总行研发中心副总经理夏雷、通联数据金融工程董事总经理薛昆、财鲸智能投顾联合创始人王蓁参与,共同分析了“智能投顾是不是真AI”“智能投顾的效益”等相关问题。

雷锋网整理如下:

主持人杨永智:人工智能最近这几年非常火爆,智能投顾也非常火爆,而且各种各样的AI项目、各种各样的智能投顾项目让人看得眼花缭乱、应接不暇。但是我们也经常抱怨,这是人工智能吗?这是伪智能吧?是不是有很多泡沫?包括资本的投顾,也有很多人有不同的疑问,甚至是质疑。你的智能投顾这么牛,能帮我赚钱,干嘛给大家用?你为什么不自己用?包括智能投顾是不是真正的AI……这些问题是很多人都有的疑问。

那么今天我们有幸请到三位业内的资深人士,有从科技行业来的、也有从金融行业来的。我们先请几位嘉宾从自身的角度谈一谈,AI和智能投顾的这些疑问。

夏雷:我先开个头。首先这个问题实际上是很常见的问题,很多人把智能投顾和智能投资甚至量化投资搞混了,以为一搞智能,投资就变得很牛。实际上这个智能投顾有它的特定含义,简单的说就是把合适的产品卖给合适的人,它的重点配置是什么。智能投顾大体上是几个环节——首先是认知这个客户有什么样的特性,第二是你能组合出什么样的投资产品,第三是把这两者配置起来,第四是卖完以后还要进行后续的服务,比如说有风险要提醒、要调仓等等。

这个智能投顾它是从哪里来的呢?这个逻辑是什么?为什么这个行业要存在呢?实际上做智能投顾这个行业的公司都有类似的数据,我们也有。我们有一个从2003年开始记录下来的公募基金的投资数据,从2003年算到2016年,股票型公募基金的年化收益率13%,接近巴菲特的20%。就是说做公募基金,如果长期持有基本上是盈利的。但是为什么大家还是要抢理财产品,抢5、6%不能长期持有的公募基金呢?另外一个数据,我们从客户端看到的情况是反的,整体的公募基金的客户端90%是亏损的。从一个银行出具的销售数据来看,70%是亏损的。也就是说,这两点是非常不匹配的,一边赚得很厉害、一边亏得很厉害。

为什么会出现这个情况呢?这个我们分析下来,投资者有一个心理风险容忍底线,他们往往做不到长期持有。所以在中国的投资环境之下,我们的指数还断崖式下跌好多次,所以很多持有公募基金的人很快就抛出去了,不能够做到长期使用。所以怎么让客户长期持有我们的公募基金(我只是以公募基金为例,不一定是公募基金),持有我们的投资产品?这才是一个问题。

所以智能投顾这个事情要解决的就是把我们的投资组合和客户真实的心理容忍底线匹配起来,让我们的组合产品能够在客户自己的底线上精确地认清。从这个角度看,就有很多的智能工作要做。刚才主持人提了一个问题,智能在这个里面有没有用呢?如果从这个角度看非常有用,我们首先要识别客户自己的容忍底线,目前普遍的销售是调查表问你几个问题,但是这几个问题是不是真的是客户的底线呢?不是,客户的底线不只是嘴上说的,他说持有两年,但是股市波动就抛出去了,不能真正做到,所以要有人工智能来做。

另外资产组合和资产管理,这个更接近量化投资和智能投资的范畴。

第三个是配置。配置这一块也是做智能投顾的核心竞争力。其实这个东西有点像各位可能做过的智能推荐,比如说智能资讯推荐、产品推荐等等,只会找到最合适的客户、最合适的产品,这也有大量的智能算法在里面。

第四个是售后服务,这里面到底有多少智能?售后不能卖完就了事了,还要及时提醒他。这个靠谁来提醒?如果靠人提醒,人工成本就不得了,这个地方要有智能。你要沟通解释各种各样的产品,而且沟通成本太高了,人也不见得精通这些东西,所以我们需要大量的智能。刚才罗平教授讲得很好,我们就需要这些东西帮助解决理财经理的客服问题,我们要建立自己的知识图谱,帮助客户理解他们的产品和他们的需求。

所以刚才这一系列讲下来,在智能投顾的方方面面都有非常广泛地应用,至于说能不能战胜市场,那是刚才王政博士(通联数据 CEO 王政演讲全文:人工智能如何助力复杂的投资管理? | CCF-GAIR 2017)的事情,不是我这个智能投顾的事情。好的,我就这样回答。

主持人杨永智:夏总讲得非常好,他刚才是从两个角度讲这个问题的,第一是提高效率,第二是从促进销售的角度去理解智能投顾的价值。我想接下来请财鲸的王蓁分享一下你的洞见。

王蓁:不敢说,我只是说销售经验。我是一直做量化投资出身的,做了很多年。首先我先给大家简单区分一下,其实国内大家意义上的量化投资是更偏重高频交易,像之前几位嘉宾提到会有一个自动化的系统。今天我想把它单独区分下来,这个可能叫自动化,不一定叫人工智能。

因为自动化的流程是一个点到另外一个点,智能投顾或者人工智能的量化投资,相对周期会比较长。但是中国和美国的情况不一样,美国有天然的土壤,一方面是401K等的长期养老金投资计划,另外一方面是美股可以买入持有,并且策略是可以有效。A股要是10年前玩,2007年你买入持有,到现在还是亏钱或者持平的。如果是欧洲股票,你不幸持有银行股,你可能亏30%,10年时间,时间够长吧。不同的市场有不同的投资策略,对于量化投资策略肯定也是这样的,必须对市场要有一个看法。

具体到智能,其实国内现在已经有了很多先进的尝试,包括我们在内。这个智能体现在哪儿呢?我们把人工和智能区分开来,有的人可能说的是智能,但是实际上背后可能是人工在做。以我们为例,可能还有一些其它的公司,我们可以做到一个怎样的事情呢?在防火墙安全隔离方面,在完全没有任何人工干扰的情况下,它能够产生出一个合理的投资结果,并且实时监控市场。如果遇到极端情况,比如说一些重大的政策调整,像股指期货不能做了这种重大的系统性风险,可能需要人工干预。但是如果没有极端情况发生的情况下,可以用机器学习的方式做大类资产的配置。

首先第一步是底层资产的评估,第二步是对大类资产概率的配置,第三步是整个组合的优化。这三步的流程,其实现在是可以用机器来完成的。但是投资效果并不能一定保证赚,这也是为什么我们说智能投顾虽然很好,市场容量很大,但是可能现在我们还做不到像私募的事情。因为现在国内哪怕你是私募大佬,如果他出现回撤,也要自掏腰包实现刚兑,我们现在还没有到这样的阶段。

智能投顾也是这样,它能够帮助90%以上的个人投资者或者“韭菜”,在90%以上的时间,能够做得更好。做得更好是指赚钱的时候比自己赚的可能更多,亏钱的时候比自己投资的时候要亏得更少,但是并不能保证一个绝对的收益。当然这只是现在来讲,在未来我相信会一直发展得更好,有可能会做得更好。

主持人杨永智:谢谢!下面请薛昆谈一谈。

薛昆:我的想法可能比较另类一点,分长期和短期来讲智能投顾。

长期,智能投顾要发展起来,首先必须是低成本的量化和被动投资发展起来。所以为什么说我们公司要先做量化的业务。如果看美国的数据,美国从2008年到现在,整个Factor Based的整套AUM大概是发展了从0.6个T到1.4个T增长的发展,这就是为什么美国2013年的时候出现海量的智能投顾的创业公司,像Wealthfront、Betterment,都是那个时点出现的。这就在于说,可配置的资产已经足够多了。比如在美国想有某一个风险暴露,你只要买相应的smart bater ETF就好了。这就是为什么美国像先锋基金等这样的公司先发展起来,因为他们提供了海量的可配置的产品。这是第一步,后面才会出现现在我们所熟悉的智能投顾。

我认为中国也会存在这样一个长期的趋势,我们还是首先要教育投资者,被动投资是好的东西。其实我们现在也看到很多去年的趋势,当然现在可能前半年的公募量化是招收一些阿尔法,大家都赌size、小市值,这是大家不专业的一种表现。我们会做到的一点,就是让现在大部分国内做量化低波动的基金经理,能够很专业的做量化投资,这是第一步。这个东西长期发展以后,我们现在熟悉的美国智能投顾的算法和模型才会比较适用于中国市场。这是我的第一个观点。

第二个观点,就现在中国的投资结构,智能投顾能做一些什么事情,我们公司有一个叫做智能投顾的项目,长江证券阿凡达做的尝试。像刚才夏总说的,其实真的要第一步让客户了解自己,怎么让客户了解自己,就是有一个用户画像的过程。用户画像的过程能够帮助客户找到他,不是他通过问卷调查等等一系列的东西做出来的,因为他也不了解自己,他也不知道自己的投资风格到底是怎么样的。你需要有AI、需要有海量数据和技术,帮助客户了解他的投资风格。第二步是怎么帮助他做产品的推荐,这个也有很多智能的技术可以做到的。我的观点是这样的,一个是长期的、一个是短期的。

雷锋网

哈工大教授刘挺:人机对话技术的进展| CCF-GAIR 2017

7月8日,由中国计算机学会(CCF)主办、雷锋网与香港中文大学(深圳)全程承办的 AI 盛会——全球人工智能与机器人峰会(CCF-GAIR)上,哈尔滨工业大学刘挺教授现场讲解人机对话技术进展历程。

刘挺表示,人机对话概述,就是人机对话的基本框架,包括语音接入、语音输出,或者说文本直接交互。其中包括三个重要的模块——语言理解、对话管理、语言生成。

从学术界角度切入,刘挺将人机对话的历程分为三个阶段——语音助手时代、2014年进入聊天机器人时代,以及场景化的任务执行时代。

2011年,在技术尚未成熟时,乔布斯临终前在iPhone4S中推出Siri。2014年,据雷锋网了解,中国各厂商纷纷效仿推出语音助手,与此同时,也有很多企业将语音助手团队解散。主要原因,刘挺解释道:

  • 第一,技术尚不成熟,听得见,但听不懂。以至于很多本来严肃的服务,最后变成对其他语音助手的调戏。语言并不总是最自然的沟通方式,它需要私密的环境,有时候还需要图像界面进行配合。

  • 第二,语境的建模和机器人自身建模方面,还有很多困难。比如你问机器人,“你今年多大了?”“我5岁了”,“你结婚了吗?”“我结婚10年了”。这就自相矛盾,因为机器人建模很困难。

  • 第三,在具体应用上,用户留存率并不是很高。虽然用户量大,但持续跟机器人聊下去的并不多。

而就人机对话功能方面,刘挺对雷锋网表示,主要有四大功能——聊天、知识问答、任务执行、推荐。

人机对话系统层面,分为三方面——自然语言理解、对话管理、自然语言生成。刘挺从功能方面切入技术的发展状况——聊天上,最早是在上世纪60年代有人研究出与精神病患者聊天的机器人,之后,腾讯推出小Q机器人,微软小冰等。

单轮对话的进展比较技术化,发展趋势不仅通过算法解决问题,且要确定一个主题借用外部资源,把话说得更丰满。

多轮对话方面,聊天与搜索有很大区别。虽然目前搜索也启动多轮搜索,但真正的多轮对话需要让人感觉到这是一个完整的对话,其中包括深度学习与强化学习的融合等多方面技术。

从Siri开始,微软、Facebook、亚马逊、百度等大企业,不但自己做智能助手,而且提供对话平台,即对话操作系统或对话人工智能。

对话型技术发展,经历普通的时间、地点等基础要素,要之后又CRF与LSTM,以及之后两者结合。对话生成,略过模板阶段,进入序列深度学习。

刘挺以哈工大实验室研制的名为“笨笨”的系统为例,功能包括聊天、知识问答、任务执行、推荐。多轮对话是基于DQN进行。这个优化和任务执行的优化正好反过来。聊天的优化是要尽可能让这个聊天能继续下去,让话题轮数更多。

刘挺在雷锋网CCF-GAIR现场表示,人机对话是自然语言处理发展的一个高峰,从历程上分为四个阶段——从形式匹配到语义匹配,到文本推理,再到言外之意。目前刘挺教授所在哈工大实验室具体布局工作,主要分几个方向,第一,基础架构、LTP;第二,人机对话;第三,篇章划分。

雷锋网

AAAI学会主席Rao演讲:AI系统崛起后的未来应当是更好地服务人类 | CCF-GAIR

2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳大中华喜来登酒店举行。本次由CCF中国计算机学会主办、雷锋网与香港中文大学(深圳)承办的大会聚集了全球30多位顶级院士、近300家AI明星AI企业 ,参会人数规模高达3000人,都是国内顶级阵容。 

在7日上午的人工智能前沿专场中,亚利桑那州立大学教授、AAAI学会主席Subbarao Kambhampati教授进行了题为“人工智能的崛起与人类感知AI系统的挑战”的演讲,分享了他在AI浪潮中的感受和对AI未来的思考。

以下为Subbarao Kambhampati教授演讲图文全文,雷锋网 AI 科技评论整理。

我是Subbarao Kambhampati,我来自亚利桑那州立大学,我今天将和大家共同探讨一下AI的崛起以及人类感知AI系统的挑战。非常感谢主办方邀请我来中国,这也是我第三次来到中国。下面有我的联系方式,最重要的应该是微信吧,在中国可以用微信搞定所有事情,大家如果有任何问题可以通过微信联系我。

刚才介绍的时候说到我是AAAI的主席。首先我向大家简单介绍一下AAAI,AAAI是关注于人工智能的研究社区,它同时也是人工智能界最为久远的一个科学研究社区。它是在1979年建立的,它现在拥有大量的成员机构,同时AAAI也举办了目前全顶尖的人工智能论坛和相关的活动。我特别要提到的是,最近中国已经成为了AAAI非常重要的一员,有来自中国的很多的学者,特别是在中国加入之后,目前在整体的AAAI论文的提交数量,以及文章的接受量已经可以与美国相提并论,今年2017年可能会超过美国。其实AAAI2017会议时间本来计划在春节期间,那么会议可能只有一半的人参加,所以我们才把会议地点从新奥尔良更换到了旧金山,时间也换了,方便中国学者们参会。2018年的AAAI还会在新奥尔良老地方。顺便说一下,杨清教授是AAAI执行委员会成员,周志华教授是AAAI 2019的两位程序委员之一。 

而且我还想强调,AAAI希望可以有更多有活力的中国参会者参加。现在每两篇提交的论文里就有一篇是来自中国的,每两篇接受的论文里也有一篇是来自中国的,但参会人员和AAAI成员里中国人的比例却很低,23个人里才有一位中国人。我很希望这个状况能够有所变化,这样我们就能变得越来越国际化,中国的学者的声音也会更强。同时我们也希望大家能够注册成为AAAI的会员。对中国来说会员年费只需要一年20美金,学生是18美金,所以对各位来讲,加入学会是一件很简单的事情。

另一件事是,当大家加入到AAAI以后会有一些本地的活动,最近印度就有一个AAAI分会,我希望中国也可以有。希望大家能够有所关注。关于AAAI我就说这么多,最核心的信息就是欢迎大家成为AAAI的会员。

现在我先花点时间给大家讲点背景知识,就是这些高级人工智能是如何制造出来的,以及谈谈AI除了现在已经能做的事情之外还有哪些需要跨越的门槛。然后主要要讲的是跟我自己的研究密切相关的:人类感知AI系统,为什么它们很重要,学校中对它的研究为什么越来越多,有哪些有意思的地方。

当我1980年左右刚开始接触AI的时候, 人们讨论的都还是AI为什么是做不出来的。当我在马里兰大学读书的时候,我读到了一本书,但是我读了这本书之后,我发现人工智能还有很多能做成的地方的。

现在每天我订阅谷歌的文章提醒,他们把关于人工智能的所有新文章都发给我,可以说在每一天收到的所有的文章里面都有至少二三十篇是关于人工智能的,媒体都在关注人工智能。而且这些文章越来越离谱,今天早上都我收到一篇文章说人工智能是不是被炒得太热了?

大家能够看到在人工智能的领域,现在有很多有趣的情况,有很多的公司宣称都他们正在使用AI技术。在2008年的时候没人说自己用AI,但是现在你必须说你正在用AI,不然看起来就很落伍。当然,各国的政府也正在关注AI,在美国奥巴马执政期间,美国政府有一个面向未来的计划,这个计划也主要是关注人工智能,奥巴马说,他希望整个美国都能够被AI技术变革,当然我们也看到同样的国家执政者,在中国也是一样的,希望大力去发展AI技术,变革中国的生产力。

AI还有什么影响呢?就是像我这样的书呆子能够有机会上电视,在摄像机前讲AI技术,在之前像我们这些做研究的学界的人士是没有机会到电视上的,我们跟别人讲我们做AI,但是没人知道AI是什么。现在整天都有记者想请我们讲讲人类会不会被机器人取代。

考虑到我刚刚讲的这些大的背景,在座的各位观众可能有的是研究AI的专门,有的是初学者,我给大家简单地做了一个梳理,来帮助大家了解为什么现在AI变得这么热。我们先想一想人的智能,我们看看宝宝,人类的宝宝在出生的时候,他们开始有一些特征和行为,在早期的时候,孩子会有感知和控制的能力,他们会观察世界,然后他们会去模仿我们的行为。这是我妻子的学生做的一个图,图中这个小孩可以把很多东西装进这个塑料袋里,这是一种很高级的动作,现在没有任何机器人能做到这些。另外,在孩子成长的过程中,他们会逐渐学会如何认识这个世界上的事物,然后他们开始有了情感的智力,然后他们有了社会的智能,知道如何和其它小孩相处。在这之后他们才会有认知的智能和推理的智能,比如说大家去上学,在上学的时候就培养我们自己的认知能力和推理能力。当然,在大学、中学和小学,我们都要进行各种各样的考试来培养和锻炼我们的认知和推理能力。这就是人类学习智能的路径,从感知到认知。

我们再看一下AI,在90年代的时候,我们有一个专家系统,这个专家系统是一种基于规则的系统,当时许多企业都开始采用这种系统自动解决一些疾病诊断之类的非常具体的问题。在90年代的时候有深蓝计算机,它和俄罗斯的国际象棋手进行了比拼,并且获胜,所以那时候计算机开始有了推理的技能;但很有意思的是,这时候能够胜过卡斯帕罗夫的计算机却没办法区分一个蛋糕和一个棋子,它没有任何头绪,它只能接收棋盘上棋子位置的符号化表达然后进行搜索。所以那个时候计算机还没有感知的能力,而在2000年之后,我们会看到现在最新的一些AI技术,让我们的AI有了感知的能力。比如他们开始进行语音识别、图象识别,都取得了很大进步。而且我觉得如果把识别跟感知结合在一起,将会是未来一个很火热的话题。

说了这么多,我们就可以看到一件很有趣的事情,从过去到现在,人类是从感知到智能,而机器是走了一条相反的路,从识别到感知,所以机器的学习跟人类的学习是不一样的。大家以后记得这件事的话,会帮助你增进对AI的理解。

为什么机器或者是AI的学习跟人类的学习是相反的呢,它们为什么不是先去感知,然后再去观察呢?在这里就得到解释了,我们只能让计算机做那些我们知道如何做的事情。我们说不清自己是具体怎么样观察世界的、怎样抓取东西的,但是我们能够教会别人做诊断、做法律辩护。所以把我们清楚地知道理论的事情编程到电脑上就很容易。这就是机器先拥有推理和认知能力的原因。因为我们不知道自己是怎么样感知物体的,所以计算机只能模仿我们的样子去感知。不知道大家有没有意识到,我们的小孩有六七年的时间都外表看起来可爱,但是同时在不停地吸收外界的信息,在从数据中学习。这也是计算机需要做的事情,我们先让计算机通过大量数据学会了认知智能。

这并不是说一种智能就不如另一种,人类就具有全部的这些智能,只不过有的智能我们先学到,然后在它们的基础上才能学到更高级的智能。而且不光是学习,机器对于视觉的信息和图象的提取都会变得越来越好。另外,在未来我们还会训练机器去进行说、理解和解释这样的连环的培训。

现在AI技术为什么变得大热呢?这是因为我们发现在现代的AI技术之下,我们能够通过人工智能的技术,让我们的手机看到我们所看到的世界,并且这个手机还能把它看到的信息跟我们进行反馈。如果我们能够实现这样的人机互动,每个人都能够去用人工智能。大家都能知道在最新的围棋比赛中,如果我们能够使用这种人机共识或者是共同工作的状态,在未来AI技术会得到更大的应用。同时,这个现象也有一些副作用,我们在生产生活的各个方面都看到AI技术的使用,在漫画里边大家能够看到,当深蓝计算机跟人类的棋手进行比赛的时候,它说“这是1970年,你不要跟我讲AI,这时候AI技术还没有这么智能”。现在又走到了另一个极端,任何一个行业都在讲AI,而深蓝以及AlphaoGo,这些机器每天都在跟人类的智能进行比较和衡量。所以现在大家看到任何东西都要言必讲AI,因为这是人们愿意听到的,这也是AI大火带来的一个负面作用。我觉得AI技术的大热可能会让我们蒙蔽了双眼,不能看到它未来的前景。

现在当然我们能够做图象的抓取,能够做语音的识别,但是这就够了吗?

这是阿基米德,他是希腊的哲学家,他说“如果你给我一个支点,我就能够撬动地球”。现在人们说,如果你给我一个足够大的GPU、足够多的数据、足够深的网络,我就会给大家创造出超智能。但是其实这种事情是不存在的,超智能不是这样就能得到的。

现在我们必须要去吸取早期在80年代、90年代在深度学习和大数据方面所走过的弯路,并且看未来一步怎么走。这就给我们带来了一些关于AI的风口期,我们都知道到目前为止,AI的发展是非常快的,但是也有人认为AI走向了冷冻期。当然很有意思的一点,去年有一家公司说,我们可以使用面部识别的方法告诉你这个人到底是不是犯罪分子或者是恐怖分子,这样我们可以建立起一个机器学习的系统,最终能够帮助我们去预测哪些人可能会成为恐怖分子,这是一家以色列的公司,但是我并不确保这到底是不是所谓的人工智能的系统。

在中国,人的智商也是非常高的,在去年我们可以看到有一个来自中国的数据。我们如何使用面部识别的方法,能够帮我们进行人的面部的感知,以及包括一个推理,如果大家去到警察局,可能会看到有大量的人的照片,然后在云端寻找这些数据,同时通过深度学习来进行推理,预测这些人是否会出现任何的犯罪行为。这些照片显示的都是中国人,不是说他们都是犯罪分子,我们只是拍了他们的照片而已。

 通过机器学习,可以进行犯罪分子预测行为的准确性达到95%,可以甄别谁是犯罪分子,谁不是犯罪分子,它可以通过我们帮助社会上的人是不是犯罪分子,但是这样的系统也出现了很多争议,大家在探讨这到底是不是人工智能的一个好的应用,这样的方法是不是能够使用在智能的犯罪分子的预测上。这篇文章要让我们设想一下,为什么我们要在人工智能方面谈伦理学,我特别谈到这一点,对于任何复杂、强大的技术,我们都要思考一下,我们到底应该如何使用它,如何用一种谨慎的方法来使用他。当AI在发展的过程中,很多人报道关于AI的技术,我们谈到的只是技术本身,我们现在也要探讨在人工智能方面的一些伦理方法,以及包括在技术使用上的伦理道德的原则。

这就让我想起了另外一个组织,就是人工智能的合作伙伴关系,这个组织是由世界上非常知名的谷歌、微软,以及脸书、IBM等等几大公司发起的联盟,我也是作为一个AI部门的理事加入到这个联盟,我们这个组织最重要的目的,就是希望通过这个组织帮助我们了解,如何用有社会责任的方式来使用人工智能的技术。我们确实做出了很多的技术变革和技术发展,但是我们不希望用这个技术决定谁是犯罪分子,谁不是,因为这样的做法实在是太疯狂了。同时我们也可以探讨其它的AI技术的使用,可能会造成人的隐私的泄露,或者是影响到公民的权利,从这一点来讲,就是我们建立这个联盟的原因,而我本人也是这个联盟的理事。从我个人的角度来说,我们提到了关于安全重要性的人工智能,以及包括一个公平、透明、可信的、问责制的AI,以及包括人和人工智能系统之间的合作。

我们这里特别提到了这一点,如果我们要让AI来决定人到底是不是犯罪分子的话,我们不能找一些滑稽可笑的理由,我们必须要能够向人们解释出来,以合理、公平、道德的方式展示,为什么这样使用。这是我今天演讲特别要提到的,AI对我们的文化产生了非常大的影响,同时AI也带来了大量的福祉。但是现在AI已经是一个非常强有力的技术了,这个技术在发展过程当中,有很多的公司对其进行商业化,进行了大量的转化。但是我们应该想想这些技术的使用,如何能够进行一个审慎的、具有伦理性的发展,我相信大家可以更好地了解我们AAAI,以及我们这个联盟,事实上我们都在不断地倡导对于AI技术的伦理性、道德行的使用。

在youtube上有这样一个视频,我在这里面特别提到了关于人工智能对社会伦理的影响,以及使用上的问题,如果大家感兴趣的话可以看一看。

接下来我想跟大家探讨的是,我们在智能、认知、感觉技术上的发展,特别是在感知技术和认知技术上的变化,还有一点就是我们对机器人的控制和操纵,从操纵的角度来说,我们也可以依靠大数据来达到这一点。但是我想问一下,我们是否就已经做完了所有的研究呢?事实并非如此,我们仍然有很多的挑战,在这里有一点就是我们现在大部分的学习和案例都是基于以机器为基础的,学习知识为基础的学习,但是它的案例数量仍然非常少。人类的学习一般是你给我一个片断,或者我根据我自己所得到的知识来进行模拟、使用。但是目前在人工智能行业还做不到。还有另外一点就是常识,这一点是我稍后要跟大家探讨的,还有一点就是世界的不完整性,我们可以看到目前我们所有的关于这个世界的了解仍然是不完全的,在我们做AI的过程当中,我们是否需要一个完全完整的知识?但是对人来说,我们都没有办法对全世界有一个清晰的认识,我们如何能够确保AI可以做到对世界完整的认识?还有一点就是交互,机器以及人工智能和人的交互。我们希望在和人交互的过程中,不会出现任何的不良事件,我们希望这个人工智能能够和人进行紧密、有效、正向的联系,而不会带来过多的不良事件。稍后我会和大家探讨一下这方面的研究上的挑战。

首先我们来看一个常识。常识是我们经常提到的,什么叫做常识?我最喜欢的就是麦哲伦的这个案例,“麦哲伦曾经三次环游世界旅行,那么他是在哪一次旅行中去世的?”我们大家都知道这个问题的答案是什么,但是智能系统就不能像人类一样马上得出这个答案。

还有一个例子,“这个女的停止吃药是因为怀孕了”,是谁怀孕了,这个女的还是药片?下面看第二个,句子:“这个女的停止吃药是因为会致癌”,是谁会致癌,这个女的还是药片?两句结构一模一样的话,人类却能很快地区分出它们间的区别并正确地理解它们。

实际上从2016年开始,我们就开始进行关于语义的了解,我们去年开始了一个比较大的竞赛,这个竞赛最终的结果事实上并不是很理想,我们希望能够真正地寻找到在同样的语言背后的语义的变化,能够让我们的人工智能真正了解到这一点,同时能够帮助我们更好地了解到这个机器所没有办法了解到的人类的自然语言的语义变化。事实上还有其它的一些变化,我也想和大家进行分析,就像我们提到的关于麦哲伦的这个问题也是如此。

我刚才和大家提到了一个不完整性,也是一个非常大的挑战。因为现在越来越多的人开始探讨超级智能,或者是包括智能至高无上的发展,以及机器的完全智能,它们将取代全世界,人类将会灭绝,或者有人说人类会成为机器的奴隶,我觉得你完全不用担心这些部分,因为我相信如果我们有这种杀戮的机器,如果它使用的是一个对世界的不完整认知,它确实会带来很多负面影响。但是对我们来说,它这样的一种结果是非常不可预见的。我们如何能够在一种不完全的模式下,能够对机器来进行训练,这一点是非常重要的,接下来这个部分我还会谈这个观点。

最后一个部分我想和大家探讨的是一个非常大的挑战,也就是我们如何去确保人工智能和人来进行共同的交互。这一点也是在接下来的十几分钟我会和大家进行分享的。

在这里我想和大家特别提出的是,在人工智能当中,人工智能作为一个整体,它和人之间的关系是非常有意思的,他们希望能够帮助人类,但是他们并不是非常希望能够看到在人机协作方面所出现的大量的问题。大家想想下一次你提到人工智能的发展的时候,我们可能花了很多的时间来看我们的人工智能的机4器战胜了非常知名的棋手,它在帮助人的同时也战胜了人,很多人提到了人工智能和人之间的关系的恶化。与此同时还有一点就是在之前的文章当中,很多人提到人工智能会取代人,人将会成为人工智能的奴隶。但是对于我们来说,我们自己应该要关注这一点,特别是对于人工智能的负面报道,我们必须关注。

去年我负责了我们的全球人工智能联合大会的国际会议的主办,当时我们就建立起一个特别团队,我们提到了应该是有意识的人工智能,我们特别提到了关于人和机器如何能够得到有效的结合,能够共同协作,这才是最为重要的。在那次会议上,我们就提到了我们为什么要主观地设计这样一个未来,我们为什么要去设计一个让我们自己能够担忧的未来,而与此同时,你们如果认为机器能够战胜人类的话,人还应该做什么事情呢?我们人应该是能够让机器辅助人,增强人的能力,这是需要我们各界相互协作。很多人提到了有意识的人工智能,人工智能或者是有意识的人工智能,可以真正地将我们从传统的机器人为主导的趋势中救出来,我们相信对机器人的负面的报道也会不断地减少。

这是JASON报告,这是一个非常知名的智囊团和咨询团,他们为美国不同的部门提供服务,我之前参加过一个JASON的会议,有一个人说了我们现在必须决定的三大问题。在JAZON现在进行了大量的关于人工智能的研究,同时他向我们展示我们如何在人工智能的各个方面发力,其中他特别提到了一点,就是以增强人类生产力为发展的人工智能,将会最终走向有意识的人工智能的发展。与此同时,我们可以看到当我们在预测未来的人工智能发展的时候,也有一个白宫的报告,它特别提到了我们必须要寻找到有人类意识的人工智能的新算法。

这是潘云鹤教授的文章里的,现在我们已经进入了人工智能2.0时代,我们会走向更多的人机协作的时代。为什么我们必须要让人们意识到这一点?为什么我们会提到这一点?为什么我们在做这方面的工作?我在这里和大家探讨一下目前在AI方面的社会学问题。当每次提到人机协作的时候,人们都是觉得好像是一种期待的过程,大家觉得只是人去解决问题,而机器就站在旁边,什么都做不了。对于我们在座的很多年轻人,或者是各位工程师、技术人员,我们都知道这是我们真正的机器对话,这个机器可以有非常好的智能,但是这个机器后面还有一个人,他在阐述这是一个机器人,但是里面藏着一个真正的人,这是一种谎言,这样的谎言也是人们希望有人的感知能力的人工智能发展过程中的谎言。

人工智能还有没有别的挑战?如果机器做的事情越来越多,人的能力会不会被机器取代?大家都认为,如果机器的能力越来越高,我们就不需要人了。我们再看一下人机融合或者人机合作,人机合作就能拓宽AI技术的深度和广度,而现在人机融合也能打消人们的担忧,比如说有些人担忧机器人将会取代所有的人类进行工作,如果进行人机协作的话,就打消了这种疑虑,同时人机合作或者是有意识的人工智能,它还是一种全新的研究方向,这在未来可能会被认为是一件很酷的科研的方向。现在有许多新的科研的挑战在人机融合方面,从高层或者是政府层面来看是看不到的,我们讲人机融合在操作上有许多的问题需要解决。

有人说,人们需要我们自己的大脑,不光是去看老虎,看狮子,而是去互相观察,在大多数时候,人类的大脑实际上做的事情不是自然的观察,而是社会的行为,比如说我们会倾听、交流和互动,这也就是人脑和机器的大脑能够互相进行合作的地方。因为人脑具有社会交际的功能,所以它能够填补机器在这方面的空白。

这一张片子是我在前面给大家看到的,我刚刚没有讲过情感和社会的智能,但情感和社会的智能恰恰是人脑所拥有的,并且擅长的,我们利用这两个方面的智能教育孩子在学校里要守纪律,并且我们告诉他们如何掌控自己的情绪。同时我们还有社会的智能,社会智能让我们更好地跟别人进行互动,比如说如果没有这种情感和社会的智能,我们在采访的过程中,可能采访人和被采访人之间就不会进行任何的互动,如果机器人去采访,他就会丢掉这份采访的工作,因为他没法和他的采访对象之间进行互动。另外,情感和社会的智能还会帮助人工智能模拟人脑,并且逐渐的具有一些情绪和社会的智能。现在我们已经知道,如果人们开始不使用AI系统,是因为AI系统没有社会和情感的智能,对于现在在座的一些微软的专家,可能听起来不是那么高兴,因为人工智能的确没有社会和情感的智能,而我们知道在微软的办公室里,他们会有一种机器人,会帮助他们的员工去进行工作。在这个机器人身上体现了微软现在已经取得的所有最新的机器人和人工智能的技术,但是当比尔盖茨宣布他要退休的时候,在座的所有的员工都有了情感,有的人开心,有的人难过,有的人可能会哭。但是他们就发现跟他们在一起工作的这些机器人是完全没有任何情感表示的,这也就是说如果我们在平常工作的过程中表现欠佳,我们需要同伴对我们进行一个情感安慰的时候,跟我们一起协作的机器人是做不到的,因为它们本身并没有情感。所以我们现在要开始考虑这种机器的辅助人工智能是否能够被引入到工作场合中去,因为它们本身并不具备情感和社会的智能。

现在大家再看一个智能主体的结构。我们会有一个智能的主体,首先我们要看在这个智能主体之内,它有制动器,也有传感器,我们会看世界,观察这个世界的信息。而对于人脑来讲,人脑也是一个智能主体,但是他观察信息的方式是完全不一样的,大家知道人脑,我们也可以模拟人脑,我们会发现,如果我们让AI的机器模拟人脑的时候,我们就会看到在这张表上一个智能主体的结构变得非常的复杂和丰富。举个例子,如果是出现一个表征的情况,他们不光能够看到现在是什么样,而且他们会想到此刻我周围的人在考虑什么,我周围的人考虑的东西和我之间有没有什么关系。机器不光是对周围的信息感兴趣,而且他开始因为新的人机融合的智慧主体,开始对周围的事情产生关联和联想。就像人脑一样,我们的机器和人脑进行融合,就会关注越来越多的周遭环境的信息,包括这个人在想什么,这个人下一刻在想什么,他想的东西跟现在的环境有没有关系,另外我们还要对这些信息保持持续的追溯。所以人脑抓取信息是越来越复杂和丰富的,如果进行人脑融合的话,我们就可以让机器感知和解决现实中的问题。如果我们关着门一个人待起来的话我周遭的世界是很简单的,但是在社交生活中永远都不是一个人在闭门造车,所以我们需要社会的智能和情感的智能来弥补机器所不具备的这两部分的技能。

我们接下来再看这张图片,在接下来的几分钟我会讲一讲我们的团队在人类意识的人工智能方面做了哪些研究。我们主要是研究人和机器不同的决策、学习的过程,然后去进行和人机融合的模拟,另外我们还要人和机器一起合作,在这里面大家可以看到,我们让一个人和机器进行对话,让机器试图去理解它对面的这个人的意图,通过理解到的意图做相应的动作。比如说他张开双臂是代表什么意思,他把手放在桌子上是什么意思。当然在这个项目里边我们也投入了大量的资金,到现在为止我们的技术能够在某种简单的层面下去让机器了解到它的人类的协作者希望它做什么,并且了解人类的意图,而通过人类的表情去看这个人是开心或者是不开心。另外人类还会给它发送不同的信号,有些信号代表的是高兴,有些信号代表的是不高兴,机器要根据接收到的信号做相应的判断,并且它不光是要做人类期望它做的动作,而且要做人类接下来在下一个环节希望它继续去从事的动作。因为一般情况下,我们可能都很容易去了解我们想做什么,别人希望我们做什么,但是别人为什么希望我们这么做是一个更加复杂的命题,所以在人机训练的过程中,我们训练机器听我们的指令,不光是了解我们的意图,我们不光做人类的语言,跟机器进行沟通,同时还加上手势和表情,而如果手势和表情不足够的话,我们还提供额外的信息来让机器了解人类,让它做某种动作的意图是什么,期待是什么。

举个例子,在荷兰我们做了一个类似的实验,人们看到前面的一个球,然后把信号传递给机器,机器自己去感知它到底是不是要去抓这个球。现在大家来看这个机器和人试图抓取桌子上的积木,而机器人需要了解,当人类开始去抓取的时候,人类希望它怎么做,所以通过人机协作,人类的情感和社会智能就弥补了机器所不具备的情感和社会的智能。

我们现在看一下有哪些挑战。首先,我们必须要有一个很好的人类和机器互动的体制,我刚刚也讲过,现在世界上最复杂的一个问题就是我们去考虑旁边那个人在想什么,这是世界上最难以解决的命题,所以要考虑到人类的思维实际上是很难解决的,我们要训练机器去了解它旁边的人在想什么,这是难上加难的问题。另外,我们不光要确保机器去了解它旁边的这个人想什么,而且要能够根据它的判断去做出一个明确的行为。另外还有一点就是,大家都知道我是一个AI的专家,但是即便是我这样的专家,我也没有办法研制出一个机器人,让它完全了解人类的意图,并且跟人类进行互动。当然,我们都知道如果真的有这样一个机器人产生,它可能会更好地跟人类进行相处,因为它能够了解在这个封闭的社交环境里边人类希望它做什么,但实际上要做出这样的机器人是非常难的。另外我们也需要各国的政府批准人机可以在某种层面上进行互动和协作。举个例子来说,在某些特别的情况下让机器人跟人类一起去互动是不是一种可以被接受的情况,另外在某些细分的行业,比如说国防,是不是人可以和机器人进行合作。

另外,在这张图片上大家可以看到,机器人对于世界有自己的感知,而人类有大脑里边自己的关于机器能做什么的预设,这两个预设之间是不是完全一样的?未必。我们必须要让人类去了解他们脑中所设想的那个机器能做的事情,并不是真正机器在大脑里头所想的东西。我们必须要让机器人能够更好地跟人类沟通,比如说到底如何从一个目的地走向另外一个目的地,在前进的过程中最短的路径是什么,最好的计划是什么,人类和机器还有很多的在这样的简单互动方面需要协作的东西。另外还有如何去制定计划,如何把制定出来的计划用清晰的语言去解释出来。所有这些沟通的方方面面都会影响到人机融合未来的前景。

我差不多讲到这里,最后我会给大家放一个短片。我再简单地回顾一下我刚刚讲的所有的东西,首先我给大家做了一个简单的关于AAAI的介绍,AAAI是美国的人工智能年会,我们每年都接收关于人工智能方面的论文。今天关于人工智能的研究已经成为我们社会责任的很重要的一部分,而且我们也可以看到中国在全球的人工智能方面的贡献正在变得越来越多,因为我们收到的每两篇人工智能的论文里面就有一篇是来自中国学者的。其次我还讲了人类的婴儿和机器在学习方面的差异。另外我还讲了现在AI技术的一些专业的门槛。最后我讲了如何进行人机协作,并且培养出有人类智能的人工智能,当然这也是我们未来非常困难的命题,这也是像我这样的科学家在未来可能去解决的问题。因为大家都知道,最终的目的实际上不是让机器去取代人类,而是让人类更好地跟机器协作。

(完)

更多人工智能行业和学术更多报道,更多人工智能重要人物成果和演讲内容,请继续关注雷锋网 AI 科技评论。

雷锋网

科技谷CEO陈思恩:用数据驱动决策,需要把算法和运筹学结合起来| CCF-GAIR 2017

雷锋网消息,2017 年 7 月 8 日,由 CCF (中国计算机学会)主办,雷锋网与香港中文大学(深圳)承办的全球人工智能与机器人峰会 CCF-GAIR 大会进入第二天。科技谷CEO陈思恩博士进行了题为“交通出行大数据——引爆智能商业新浪潮”的演讲。他表示,公路、铁路和民航等交通方式具有巨大的出行量,每年有数十亿的需求,这其中就存在 AI 和大数据的需求,AI 落地的场景会逐步在出行的领域渗透。

陈思恩还认为,算法必须要和运筹学结合起来,因为最终实现的是数据驱动决策,真正的AI是要跟大数据有一个有效的融合,去解决用户的痛点。

以下为陈思恩演讲实录,雷锋网做了不改变原意的修改。

陈思恩:大家好,今天上午的最后一个环节由我给大家介绍一下 AI+交通出行的方向,其实大家看到这个命题就知道在这个领域里面肯定不会是一个伪命题,也不会是一个伪赛道,因为现在无论是创业公司还是投资机构都担心做的方向错了。科技谷公司选择的方向是在公路、铁路和民航的出行上。大家知道一年铁路有 30 亿人次的出行量,民航大概有 5 亿人次,公路总共有 30 亿人次,在这里面有大量优化的需求。也就是说他会存在 AI 和大数据的需求。随着 AI 和大数据的推演, AI 落地的场景会逐步在出行的领域渗透。

传统的智能改造方向已经产生很多的应用,从早期的人工智能到现在的机器学习。机器学习是实现人工智能的一种方法,而深度学习是对机器学习技术的推进。科技谷本身专注在交通出行和大数据方向,在这个方向里面,不管是航空公司还是机场都有大量的需求,大家可以看到,在运营方面还是在收益、营销的体系建设方面都有需求所在,同时大数据的引入需求也是比较旺盛的,所以我们选择的点主要是在收益优化和安防方向,也就是维稳这个方向。

可以看到在交通大数据和 AI 这个方向的结合是比较好的,因为交通数据比较容易开放,而且开放完以后比较容易产生价值。首先它也是需要遵循一定的规则,大数据前面这一波的热潮出来之后使得很多交通数据形成了堆积,无论是使用什么样的大数据厂商提供的服务,都把数据汇总起来了,这是很关键的。后面就用统计和机器学习的方法去建立相关的模型,为算法做一些准备。我们认为算法跟运筹的最优解可以结合,因为最终是要实现某一个供应链的配置,比如说通过客流、民航、铁路和公路找到最优解。同时能够增加多种收益,比如说收放仓的控制,这种环节都需要用到一些比较核心的 AI 的算法,而且能够自动化控制。

我们认为在交通出行领域需要三个要素才能够比较好地实现整个环节,也就是说它首先是需要有大量的数据,无论是内部还是外部的,这里面需要有大数据的掌控公司,同时还需要有大数据的中间商,也就是买卖、交易,现在国内做了很多的交易所,还有一种是大数据的技术公司,可能是从统计部分的机器学习,再加上计算机的原理去实现大数据的架构,到后面需要用深度学习的方法去落地,所以三个环节是很重要的,一个是大数据本身,另外一个是大系统,也就是前期在推使用的算法,要用什么样的构架来跑,还有你的服务器用什么方式来做。后面就是算法跟运筹优化这一块结合,解决一些比较实际的用户的痛点。

为什么会跟运筹这一块结合起来?因为你最终实现的是数据驱动决策,真正的AI是要跟大数据这一块有一个有效的融合,去解决用户的痛点,比如说如何更好地实现它的票价,更好地最优,会员日的如何更好地把优惠券以合理的价格、合理的时间推送到真正有需求的用户手上,这些都是真正去解决它的实际痛点。

在交通出行这一块的分布,我们也是采用了渐进式的方式。什么叫渐进式?就是说它会采用除了PDCA形成一个闭环,然后逐步 AI 实现的就是人工介入部分,把大数据落地。然后用工程的方式来做,所以我们把国外很多facebook、推特这些可以触达旅客的点结合起来,比如说航空公司在订票的时候,他根本不知道他的哪些顾客来自facebook,哪些来自推特。但是通过我们和他们合作,可以找到机票的用户从哪里来,下一次有优惠信息的时候可以推荐到他的行程上。把国外的数据源带到国内,对大的航企、12306都有很大的帮助,也就是直接带客源进去,他在整个大数据的连接上面产生价值之后,就需要开始去做内部的数据深挖,这时候就需要用机器学习的方法,甚至是一些AI深度学习的方法去做。

外部的数据引入之后,就需要对某个人或者某个事件做画像,这个航线要怎么画像,客源是怎么来的,这些都要有深度的识别,对我们来说是上百个维度的识别。这些推演的背后就是机器学习,它是人工智能很好的实现方法,同时深度学习也是对机器学习很好的实现,就像《黑镜》里面的女主角通过机器学习的方式,在社交网络上模仿她的男朋友的语态。你要更了解你的客户,才能真正实现更好的策略。

刚才讲的是大数据的数据部分,接下来是系统部分,微软在这一块有HD  inside,我们也有自己的inside套装,我们认为在企业需要混合云来搭,就像12306在出行高峰的时候用阿里云的资源,降低它的主机的负荷。所以分布式架构用混合云的架构会长期存在,而且对云端的依赖会加大,就像华为进入公有云的市场,中兴通讯也有它的云,国内是阿里云比较有名,我们也把我们的系统搭建在亚马逊的云上,通过混合云的架构帮助客户实现大系统的搭建。

接下来这是我们的大系统的架构,因为要跟云结合,里面包含了各种技术的组合,然后有我们自己的 SDK,封装了很多方式,这种方法已经用在国内的很多大型的航空公司和铁路的12306,这里面还包括一些推荐的引擎和算法,这完全是To  B的架构,但是它做的是B2C的方向。

这里面有两个重要的东西,一个是平台,在这个点上跟其它的平台是大同小异的,但是它会偏行业,因为行业的东西是比较不一样的,特别是数据清洗这个环节,还包括在数据建模。因为算法跑起来,模型是很重要的,还有约束条件、建模的方式都是不一样的。另外inside这一块是比较有特点的,也就是我们的套装化之一,这里面含了画像的场景、关系图谱。知识图谱里面很重要的一个就是建RDF,也就是整个关系建立的套件,还有推荐引擎和算法。这里面涉及到数据建模的优化和神经网络的东西,所以这个套件我们花了大概三四年的时间,而且这个很需要在大的数据库里面去练。因为我们做得比较早,在这个领域里面,像12306,中国大的企业都是我们的客户,所以我们这个产品得到了很好的历练,它相对来说是能够接受体量很大的数据场景去找最优解。

在这个之上,它这里面涉及到大量的运算方式,比如说画像的场景,它可以支持上千个维度的自动化,它是通过参数配置的,自动化形成多种算法的场景。同时在推荐系统上也是多种关联,时间节点、分布式算法,同时对用户行为进行预测。

之后我们关注在我刚才提到的三个要素,一个是数据,第二个是平台,第三个是算法。算法我们选择的是收益这个环节,我们能够真正帮用户实现收益,也就是 AI 这一块新的优化。就像星河互联的傅总讲的,航空这一块的自动化程度高,但是对创业公司也不意味着没有太多的机会,国外做这一块的就有好几家公司,但是国产化的公司还没有,酒店行业现在有几家起来了,但是航空产业基本上是没有的,我们会从航空和铁路的收益环节去做,把大量的运算放在云端,客户用租用的方式就可以实现对算法的采购,用许可的方式和服务费、订阅费的方式去支付我们的产品费用。

收益这一块,我们也是大概6个月的时间可以帮助客户实现从大数据的引入到平台的建设,到收益优化算法的建立。所以现在已经有比较大的合作伙伴在用这套系统,而且这个平台可以直接用于更多的平台性的客户,比如说阿里的飞猪、美团、滴滴,它需要做求解器,收益有关场景的用户都会去用,我们会先从航空和铁路这方面的客户做起。

这里面具体做什么?在航空领域,它的 NO-SHOW 的模型也是要改变的,因为天气数据现在都是开放的,这些维度的数据要实时的整合,你的算法现在不是静态模型,而是需要动态模型,同时你在外部的行为都是动态的,这些环节都需要导入,导入完以后你对NO-SHOW这个环节,包括座位分配的环节,都要重新用机器学习的方式去做,最终实现一个最优化。对航空公司来说,虽然是最优化,但是它是基于机器学习的,最终它的 AI 对比就是说我算得比别人更准,我的收益提高得比别人更高,最终它就达到了结果,而且全面国产化是一个很好的趋势,因为很多央企也都非常支持这个事情,我们这个公司现在就是在立足做国产化的收益求解器。同时我们在做的时候是用工程的方式落地,而不是把产品推过去用云的方式落地。针对大的企业级用户,任务分解必须做得很细。这里面需要航旅类的企业配合,需要IT、营销人员参与,当然任何做 AI 和大数据方向的都是公司的战略决策,无论是首席数据官还是首席信息官,或者是 CEO 都要参与这个事情。中间它就需要我们的大数据工程师和数据科学方面的人一起整合去做这个事情,长期迭代服务才能够建立比较有效的环节,同时还要导入一些外部的数据,因为企业内部的数据远远是不够的,包括 12306 都不敢称自己是大数据公司,当然BAT是真正的大数据公司,因为它的数据够多元化。

对科技谷来说最主要的是要帮客户创造商业价值,带来创新。真正使这套技术落地,给客户变现带来收益,所以我们也是立足这个方向,持续做这个市场相关的东西。

通过这几年的积累,我们也建立了非常多的合作伙伴和客户,因为要成就一个比较好的公司,它需要有一个完整的上下游的产业链配套,很多是我们的兄弟公司一起推动,对这种大的企业,单打独斗是很难在一个市场立足的。

我的报告就到这里,谢谢大家。

雷锋网