预告:解读全新声学模型与算法:2016 年语音识别的重大进步丨硬创公开课

在去年的锤子发布会中,罗永浩现场演示了讯飞输入法后让用户意识到当下语音识别能力的强大。当然,语音识别在安静环境、常用字词、发音标准情况下已非常成熟,但在复杂环境下如远场识别、带噪声识别等情况下仍有一定的提升空间。

2016 年语音识别领域有着不小的进展,其主要体现在模型方面的突破:

Deep CNN 模型大热,百度把 Deep CNN 应用于语音识别声学建模中,将其与基于 LSTM 和 CTC 的端对端语音识别技术相结合,大大提升了语音识别能力;微软则是把 ResNet 应用于语音识别,在产业标准 Switchboard 语音识别基准测试中,实现了词错率(WER)低至 5.9% 的新突破;科大讯飞也推出了全新的深度全序列卷积神经网络 DFCNN。

与此同时,新的深度学习开源框架层出不穷,开发者做语音识别到底是用 Kaldi 这类传统框架还是用 TensorFlow 这类新型框架呢?

针对上述几大话题,雷锋网硬创公开课特邀供职于阿里巴巴最神秘的研究部门 iDST 的语音专家薛少飞博士,从声学模型和算法角度深入讲述 2016 年语音识别领域的重大突破。

嘉宾介绍

薛少飞,阿里巴巴 iDST 语音识别专家,中国科学技术大学博士。现负责阿里声学模型研究与应用:包括语音识别声学建模和深度学习在业务场景中的应用。博士期间的研究方向为语音识别说话人自适应,提出基于 Speaker Code 的模型域自适应方法,在语音相关的会议和期刊上发表论文十余篇。

本期公开课内容将包括但不限于:

  • 语音识别领域的最新进展。

  • 详解阿里的声学模型。

  • Deep CNN 的原理,相比于之前的 LSTM、RNN、CTC 模型有哪些不同和优势。

  • 介绍不同单位提出的 Deep CNN 结构,如科大讯飞提出的深度全序列卷积神经网络 DFCNN 等。

  • ResNet 在语音识别中的应用。

  • 对比传统语音识别开源框架(Kaldi、CMU Sphinx、Julius)与深度学习开源框架(CNTK、TensorFlow)

活动详情

主题:解读全新声学模型与算法:2016 年语音识别的重大进步

嘉宾:薛少飞

时间:1 月 19 日周四晚上 20:00

形式:斗鱼直播+微信群与嘉宾问答互动

地址:硬创公开课 斗鱼直播间(房间号:788495)

本期雷锋网硬创公开课将会有【斗鱼直播+微信群问答】两个环节。嘉宾直播授课分享结束后,将会在微信群与群友问答互动。

为了打造高质量且细分的读者交流群,我们需要您提交一些基本资料作简单审核,而本次公开课读者群将优先 NLP 相关从业者和学生进入。

扫描下方海报上的二维码,进入雷锋网人工智能垂直微信公众号【AI 科技评论】后,可获得详细入群方式。

雷锋网

苹果App Store排名遭大面积刷榜?淘宝商家曝光内幕

有业内人士分析,这与4年前苹果App Store被爆出的“刷榜”事件如出一辙:App企业购买刷榜公司的“关键词排名”业务并设置指定关键词后,由刷榜公司通过短时间内大量、集中地刷下载量、浏览量等数据,将前者的App刷到相应关键词搜索的指定位置。

IT之家

微软全球执行副总裁沈向洋:7 点总结 20 多年的 AI 从业经验

雷锋网按:人工智能发展到今天已有 60 年的历史,成果累累,当然也遗留了 60 多年没有解决的问题。那么到底哪个问题 60 年都没解决,而且会继续延续下去,其中被人提及最多的就是如何赋予 AI 情商

雷锋网了解到,在 AI 研究方面,微软有着 25 年的积累。环顾全球所有科技寡头,鲜有可与微软 AI 匹敌的公司。近日,微软全球执行副总裁、微软人工智能负责人沈向洋在北京的“未来论坛”中发表了《有情商的人工智能,让世界更美好》的演讲,深入讲述了自己多年的 AI 从业经验、微软 25 年的 AI 研究成果,以及他对赋予 AI 智商和情商的看法。

沈向洋之“北京遇上西雅图”

从西雅图到北京后,沈向洋先是回忆了自己小时候的故事和在微软亚研的工作经历:

“我这次回国之前,我想起自己小时候在南京的一些场景。现在的计算机可以改变整个世界,而在 80 年代整个南京市都没几台电脑。当时我父亲激励我,希望我可以用知识去改变世界。

后来我去了微软,微软给了我很好的机会去启动我们在北京的研究院。九年间,我的团队给我留下了深刻的印象。与此同时,微软亚洲研究院也取得了巨大成就,这让我感到自豪。

不仅每个产品不断有新的进展,而且在人工智能和计算机科学领域有着很前沿研究和探索。

此时此刻,大家就能看到我们的成果:同传。同声传译现在已经可以做到实时翻译,这些都是依靠人工智能实现的。

这次来到北京之后,又感觉到我在整个数字时代当中和整个社会产生了一种共鸣,当然,在这方面还有很多工作可以做,未来的路还很漫长。”

一、AI 可能是人类最重要的加速器

回顾人类创新史,人类发明了轮船、飞机、蒸汽机、火箭以及卫星等。但这些并不是物质方面的创新,其实它们所代表的都是一种加速度,是一种促使人类不断进步的源动力。相比而言人工智能可能是最大的加速器,因为人工智能不仅延伸了人的物理能力、生理的能力,同时也延展了人类的脑力。

这不仅仅是数字时代新的一步,实际上也是人类的终极目标。

图灵展望了这个终极目标,他提出该目标的时候,计算机还没出现。后来人类有了大型机、桌面电脑、互联网、云、手机等。所有这些创新,实际上都只是一个热身而已,人类的终极目标,是人工智能。

人工智能都已经存在几十年,有起有伏,为何现在又要重提人工智能?人工智能有什么新颖的地方呢?

二、AI 的三大创新

AI 这六十年来,有三个创新点在不断加速人工智能:

  • 无处不在的传感器。

  • 大规模并行计算的发展,尤其是云计算的发展。

  • 算法的突破。

这些创新出现后,使得现在的人工智能无处不在。其实搜索引擎背后也有 AI 做支持,同时信用卡防欺诈、个人定制的新闻流、智能家居控制等等也均涉及到人工智能。

当下微软正在不断拓展人工智能方面研究的深度和广度,其中利用 AI 保护电子邮件帐户不要受到垃圾邮件的困扰,也借此优化翻译产品,而众所周知的微软小冰、小娜等则是典型的 AI 落地产品。

三、微软人工智能的最新进展

“当然,AI 的道路仍旧很长。人工智能目前是我个人主攻的方向,我已做好准备,迎接新一波人工智能潮流,而微软也为此准备了 25 年之久。”

盖茨在 25 年前建立了微软研究院,当时他设想未来应该有一个通用型人工智能:计算机可以看、听、说话甚至理解人的思想。微软在二十多年前启动了三大研究组:自然语言处理组、语音组、计算机视觉组。

在过去这么多年当中,微软吸引了全球最顶尖的人才到全球各地的实验室来迎接挑战。包括最近微软收购了 Maluuba,这是一支世界顶级的人工智能研究团队,其中前 Maluuba 顾问、深度学习领域中的杰出人物 Yoshua Bengio 此后将担任微软的特聘顾问。

那么微软在人工智能方面到底有哪些进展?

微软在计算机视觉方向的进展

在 CV 方面,微软有着二十多年的研究积累,而且已经接近人类的水平。

微软最近赢得了多项图像识别大奖,包括 ImageNet 竞赛等。能在大赛包揽多项大奖的很多成就都是通过深度神经网络来实现,其中有一个 152 层级的 Deep Residual Networks,它可以使得图像识别的精度不断提升,正确地识别 1000 多种物体的类别,并能达到 90% 的准确率。

更加让人激动的是,这些图像识别能力已落地为产品,包括今年会在中国上市销售的 Hololens。再比如说应用到 Uber 中可用识别工具来确认驾驶员的身份。

微软在语音和语义方向的进展

现在计算机已经可以像人一样去看,除此之外,它们也能够听懂人的话。沈向洋说:

几年前我还觉得计算机没有办法像人一样识别人的语言。然而现在微软已经成了一家能够让计算机听懂人说话的公司,其中微软拥有一个存在了 25 年的数据集。

目前整个世界有 6500 多种语言,任何一个人都不可能在一辈子当中学习 6500 多种语言 。

“可以试想一下,对人类而言,如果我们有非常棒的机器翻译产品,所有人在交流过程中就没有语言障碍了。前段时间,我们迈出很大一步,上线了微软全新翻译器,它可以同时支持用户与 100 多个说 9 种语言的人交流。

这就是人工智能的能力,AI 与机器翻译结合后,潜力是空前的,现在微软也在利用深度学习进一步加强翻译的能力。

沈向洋提到,研究者们必须用人工来对语音数据打标签,这需要大量的人工成本,而有了强化学习后,两台计算机课互相交流、互相教学。这里面有一个反向传播,它们可以学习把语言 A 翻成 B,然后再反过来输出结果。这使得不需要那么的人工,而且最终训练出来的翻译准确性非常高。这是亚洲研究院主攻的研究方向,而且在未来会有非常大的潜力。

四、人工智能的关键:知识图谱

当下,计算机已经能取代了人的部分工作。他们能看、能听,而且可以用语言来描述周围的世界。

但是除了做感知层面的研究外,还要做认知层的研究。这就需要把概念和想法连接起来,了解它们之间的关系。“概念与想法的连接”如果放在人类日常生活中,就可以理解为“常识”。

对人来说,构建常识图谱并不难,但是对计算机来说却是极具挑战性的任务。

过去这么多年中,微软一直在完善知识图谱。微软的 Bing 搜索引擎里有 60 亿的个物体和产品,这之间都有一定的关系。与此同时,微软还有 Office365 和 LinkedIn 这样的办公软件去完善知识图谱:把工作中的知识配合语音、语义、图像识别能力,创造出人工智能助理,帮助用户完成生活和工作上的服务。

五、人工智能的难题:认知建模

尽管在这方面取得一些成就,但人工智能只能实现普通的智能。在通用工作方面,AI 还不能和一个人类甚至是儿童进行比较。

婴儿必须要面临这样一个任务:在他来到这个世界上的时候,必须经过思考,需要对一些输入做出反映:比如微笑、触摸、发出声音,以及把他的不舒服,或者是饥饿的感觉传达出来。这是通过不断的试错完成的。这些孩子们如果一旦感受到“饿”的话,就学会了哭,这是一个了不起的成就。他也能够把他妈妈的声音和表情与自己的饥饿联系起来。随后他能够和妈妈进行沟通,能够解读并且了解他妈妈的面部表情,这对人来说是很自然而然的。

但是这对于人工智能来说却很难,对人类这些行为进行建模更难。那么 AI 该如何学习?

微软英国剑桥大学研究院有一个非常好的想法:在对 AI 进行测试时,可采用通用的世界,或者是数字化的世界来进行测试。这个数字化的世界好比真实世界一样,在测试时研究者能够对整个环境进行控制。

为此,微软推出 Malmo 项目,研究者可以通过《我的世界》游戏去测试人工智能算法。


在《我的世界》游戏中,玩家可以创造房屋建筑,甚至可以创造属于自己的都市和世界。这款游戏不仅可以单人娱乐,还可以多人联机。开发者们在该游戏中测试算法,十分有利于 AI 对“世界”感知和认知能力的建立。使他们不必开发机器人去操控实体对象。微软希望通过 Malmo 去加强通用人工智能的开发,包括指导人工智能程序学习,展开对话,做出决策,以及完成复杂的任务。

微软剑桥实验室研究员卡塔·霍夫曼(Katja Hofmann)表示,Malmo 可用于“强化学习”,即人工智能程序通过反复尝试和试错去学习,最终做出正确的选择,开发者也可以开发能相互交流的机器人。以下是该项目的视频链接:

http://www.yicai.com/live/5202745.html  ,从第 22 分 10 秒开始。

沈向洋指出:

我们坚信 AI 对所有人都是适用的我们非常兴奋能够与其他合作伙伴开展合作,来解决人工智能相关问题。我们已经取得了很大的成就,但要建立一个通用型 AI 还有很多的事情要做。

这些未完成的事情还包括计算机来了解人类,而非以往让人去学习和了解计算机。

让计算机去了解人类,这其实是一种双向的沟通,对计算机而言并不容易。这种和人类进行沟通的产品,我们把之称作“对话型 AI”,对话型 AI 是微软下一步要做的工作,即人类与机器展开交互。

六、机器如何与人类进行友好的交互 :让机器拥有 EQ 和 IQ

我们的构想是能够让计算机适用于所有人,用户不再需要去了解计算机和产品的操作方式,而是计算机去了解人类,而不是我们去了解它。

如果一个计算机能够和人进行沟通、和其他计算机进行沟通,那他们与人以及设备就能进行合作。

为了让这种对话型 AI 变为现实,微软关注一个很基本问题:HI 到底意味着什么,AI 到底意味着什么?

人类在进行每次沟通对话时,会有语音、语调、手势、面部表情等,也有讽刺、幽默以及夸张等不同的修辞。一个非常成功的 AI 必须要有非常好的情商,尤其是对话型 AI。

50 多年前,MIT 一位非常有名的教授发明了最早的数字助理设备,那个时候人们非常想和这个产品进行互动。现在人类已经取得了很大的进展,尤其从生产效能方面,微软有足够的 IQ 帮助人们更快、更容易地完成每天的工作。与此同时,微软也在 EQ 方面开展了很多工作,包括聊天机器人。在这个领域当中,很多人现在可能还没有考虑这样的话题,但微软已在进行不同的试验,并且在全球不同的市场上开展了这样的项目。

有了 EQ 和 IQ,人工智能才可以使这些计算变得真正个性化。

它们能够了解人们的日常,而且用户并不仅仅只和一个设备展开连接和交互,用户无论去哪儿,只要有需求,随时都可以与多个设备进行连接。

七、AI 让计算机拥有人的一些能力,同时也让人更强大

AI 不仅会让计算机变得更加智能,同时也会增强人类的势能。

AI 逐渐拥有人的一些能力,同时它会让人拥有“超能力”,应对各种各样的挑战。以教育为例,要掌握英语口语,人需要面对面进行沟通,但是老师可能同时和很多不同的学生进行沟通,他分给每个学生的精力非常有限。而 AI 却不会遇到这种问题。

微软不久前推出一个叫微软小英的产品,它是一个“英语老师”,可以通过微信公众号关注。小英刚上线不久就已有 8 万多用户,他们和小英一起练习改进英语水平。

AI 也可以帮助残障人士。微软研究人员对字词预测型键盘非常感兴趣,利用机器学习和自然语言处理技术帮助用户提高输入速度,根据历史输入记录,在输入内容时预测下一个词。该项目可帮助那些不能说话的人士。

雷锋网 AI 科技评论也曾报道过,微软在 2016 年收购了输入法公司 SwiftKey。SwiftKey 利用人工智能技术预测用户输入内容的输入法应用,其最著名的用户是史蒂芬·霍金。在霍金的眼镜上面有一个红外线开关,可以监测其脸颊传感器,让他在计算机上选择自己需要的字母。这款输入法甚至可以用一种特殊的语言模型帮助霍金讲话和写字,得益于 SwiftKey 的技术,极大地提升系统学习、预测字母和单词的能力。

演讲最后,沈向洋说到:

AI 的未来现在才刚刚开始,我对此充满希望。正如 Alan Kay 所说:我们对未来进行最好的预测就是发明未来。作为第一代 AI 从业者,发明未来就是我们想要做的事。

雷锋网

进了高通的“黑匣子”,2017年魅族要开始聚焦

2016年魅族有三件大事,实现盈利、建立Flyme生态 、与高通和解。

魅族副总裁白永祥告诉雷锋网,实现盈利让魅族迎来了转折点,Flyme用户增长也是实现盈利的重要原因,而与高通和解则为魅族解决了未来的不确定性因素。

2017魅族新春年会上,黄章提出了年度口号:“踏踏实实做产品,老老实实做营销。”

而就在这场年会的前几日,魅族在北京举办了一场新年媒体沟通会,在与记者的交流中,李楠不止一次地告诉记者,2017年魅族要跟着黄总的口号走“踏踏实实做产品,老老实实做营销。”

巧合的是,在小米年会上,雷军也再次表示小米成长太快但积累不足,要放慢速度开始补课。

可见,虽然在 2016 年仍然较快节奏的市场策略下,魅族实现了盈利,但随着市场环境与友商市场策略的变化,魅族也迅速复盘调整了步伐。

在这次媒体沟通会上,李楠还公布了一份 2016 年的成绩单:

手机销量 2200 万台,其中海外销量 200 万台;

Flyme 用户量达 5000 万以上;

线下渠道稳步增长,现在共有 2300 家专卖店,17000 个形象销售店,形象销售网点超过 60000 个。

可以看到,虽然 2200 万的总销量与 2016 年初时定的 2500 万台目标有着一定的差距,但实现盈利似乎成为了无法反驳的理由。 

以下是媒体沟通会当天魅族副总裁白永祥(老白)、李楠与记者的对话,雷锋网在不改变其愿意的情况下,对原文有删改。 

2017年要聚焦

记者:魅族 2016 年发布了 14 款新品,节奏很快,今年的打法还一样吗?

李楠:2016年的发布会和产品很多,2017年一个很重要的就是聚焦,将会发布更好的产品,开更好的发布会。市场反馈好的产品我们保留下来,反馈不好的我们就砍掉,但是产品的品质要进一步提升,价格也会提升。

记者:对于2016年的策略魅族自己是怎么复盘的?

李楠:我们开了很多会,封闭式的复盘全年的问题,跟同行业的,以及跨行业的一些品牌进行比较,历史上有很多商业案例,回去看一看就知道哪里出了问题,应该从哪里进行改变。

记者:去年供应链的状况,大家都在进行产能收缩,导致供应不足,今年会有变化吗?

李楠:应该说我们能看到供应链今年下半年比上半年有很大的改善,明年我们预期会更好,的确会有一些成本,压力还是存在的。但我们更聚焦了,所以供应链的压力也会变小。

记者:可否介绍下魅族线下渠道的情况?

李楠:魅族零售渠道比较强的是一二三线城市,今年加入了各省的省包,还有国代入股,还有KA,未来魅族会更好地联合运营商、省包、国代和KA的力量,向四、五、六线城市去渗透,我们是联合所有大的合作伙伴去做整个渠道的扩展和深入的渗透。

记者:2015年魅族是亏损的,2016年实现了盈利,2015年亏损和2016年盈利的原因分别是什么?

老白:2016年盈利了,一方面证明了魅族在经营上,在公司的运作上,战略层面,运作层面,规划,预算,库存的管控等等层面,都变得更加理性和成熟。另一方面的原因是2016年基础毛利率有所上升,销售量也有所上升,卖了2200多万台,就算在加大成本的情况下,例如售后服务,我们比2015年增长 20%-30% 的费用,更好的做服务这条线。此外,还有很重要的多一点就是Flyme,魅族移动互联网的运营部门,提供了较可观的毛利,ARPU值也有增加。所以最终取得了盈利的结果,这是魅族的一个转折点。

记者:魅族去年的销量是2200万台,但我们去年年初的时候的计划是2500万台,我们怎么评价去年的销量?

李楠:经营目标的变化,2016年发生了几件事情,第一,整个资本市场遇冷,整个资本市场的变化让整个行业的判断出现了一个转折,2016年因为资本市场的变化,当然2500万是当时定的年度销量目标,但是能否正常的合理的盈利,这是优先于量的,达成盈利是更大的目标。目前对未来整个销量没有特别强烈的预期,持续稳定的赚钱是魅族继续扩大规模的前提。

记者: 2016年2200万的销量中,线上和线下渠道的销售比例分别是多少?

李楠:线上线下三七的比例,线下是七成,魅族在互联网上可以很强势,但是线下渠道建设也不可忽视。

记者:售后服务方面,2016年比2015年增长了20%-30%,但2016年关于售后方面的传和声音变小了,我们具体做了哪些是事情? 

李楠:2015年的售后是快速的搭建的过程,我们会出很多点,做很大的投入,上很多的新业务。2016年的时候这些都搭完了,进入持续的运转过程中,所以虽然从新闻层面而言好像变少了,但是我们提供的所有服务还在持续优化,用户满意度也很高。

进了高通的“黑匣子”,但对结果满意

记者:跟高通谈了半年多,是怎么达成协议的?对于双方来说结果是平等的吗?在产品方面有哪些划? 

老白:魅族跟高通聊了很久,大家其实在下面非常友好。高通对这件事也确实做出了比较大的努力,秦堃博士不辞辛苦的来珠海聊了四五次,和我们进行了闭门沟通。和解协议的细节需要保密,但是可以说几点,第一,魅族和高通的和解是在一个平等谈判的基础上。这个和解既是高通接受的,同时也是魅族能接受的,更重要的是魅族的董事会对于这个和解还是满意的。历史问题得到了好的解决,在以后的经营里,我们也不会由此造成负担。

这个问题解决后,我们也希望需要跟高通的产品部门建立一些联系,处理一些小的事情。而高通在这方面一直以来都是很积极的。这段时间暂时还没有实质性的动作,就算我们选择了高通的某些平台,这也是一个需要时间的过程,开发新产品是需要时间的。所以,我们乐观一点的预计,至少到今年的Q4才会有搭载高通芯片的产品。

李楠:高通跟所有厂家签订的任何协议全都没有公布过,很诚实的说,我们不知道所有的厂家是不是一样,因为我们谁的协议都没有见过,我们也不能说。我们之前提到的“黑匣子”,就是说这个事,我们也进了这个“黑匣子”。高通协议的公平性,这个问题不是我们可以回答的。

记者:魅族现在硬件团队的人员分配上,联发科和三星这边的比例是怎样的?与高通和解后,2017 年这个比例会是什么样子?2017 年的旗舰产品会用哪家的芯片?

老白:大家可能看到,跟高通和解之后,魅族成为了全国唯一一家既有高通,又有三星,MTK 的平台。开发三星的厂商除了魅族在国内几乎没有。跟高通和解之后,魅族的工程师摩拳擦掌的很想干点什么,有几方面,一方面,他们对高通的认可,还有一些人是当年华为过来的工程师,对高通平台是熟悉的。我们不会有一个非常清晰的三星,MTK 和高通工程师的配比,可以告诉的是,由于一些力量加入,我们现在的工程团队是完全有力量做好三星、高通和 MTK 的各个产品线。

李楠:魅族年底之前不会有任何高通平台的产品,而且三星全网通也不可能定,魅族 Q1、Q2、Q3 的旗舰机型主要还是用 MTK 的平台。

海外市场销量主要来源于线下

记者:跟高通和解后,接下来海外市场会怎么做?海外市场200万销量里面是通过哪些渠道卖出去的?

李楠:去年才开始真正投入海外市场,而且这一年的时间,我们还面临着高通的官司等问题,所以我们还有很大空间可以做,相信明年海外市场会有更大的利好。去年海外市场的销量占总销量的 10%,主要来源于线下。

记者:刚才提到,与高通和解有助于魅族在西欧市场发力,那印度市场、美国市场方面魅族有什么计划?   

李楠:西欧方面,意大利是一个重设计的国度,对我们的品牌设计高度的认可,所以高通问题解决之后,我们希望在意大利市场会有一个好的结果,不一定是量上的,而是品牌影响力上的。印度市场是大家都在做的市场,我们不会做巨大的投入,但也会全力去拓展。美国市场,运营商很强势,跟中国完全不一样,而魅族在中国的市场说明我们特别善于在公开市场做 2C,更善于说服消费者,魅族的 DNA 就是这样。不过我们可能会选择小的运营商作为突破口,培养我们这方面的能力。

记者:有利于海外市场的发展也是促使魅族也是与高通和解的原因吗?   

老白:跟高通和解,解决了一部分不确定性的问题,对用户、股东、公司都有好处,工程师也很愿意,尝试。有更好的产品线,意味着我们可以更好的掌控供应链。外界讨论这是不是魅族的需求?其实无所谓,双方都有各自的利益诉求。黄总说大家把该解决的事情解决掉,回到产品上来,踏踏实实为用户提供更好的产品,所以我们达成平等谈判结果的和解。

李楠:我补充一点,外界这种看法很大的问题在于,第一,魅族是第一个跟高通打官司的手机公司,第二,中国所有手机品牌里面,魅族是第一个不依靠高通做到 2000 万规模的。大家知道2017年芯片发展会有突破,有可能是 MTK 先出 10 纳米的旗舰级芯片,三星也可能今年出全网通。从这些层面来看,魅族都不是最着急和高通和解的,而恰恰是因为我们有这些筹码和能力,最终能够在平等谈判基础上和高通在年底达成更好的和解,而且双方很满意。所以,和解最终一定是实力的比较。雷锋网

雷锋网

CB Insights发布最佳AI企业Top 100,医疗健康公司都在做什么?

最近知名研究机构CB Insights公布了一份"AI 100"名单,其中列出了100家在过去几年中在人工智能技术应用有突出表现的公司,其中包括自动驾驶、机器人、物联网和医疗等领域的公司。

据雷锋网了解,入选的中国公司有:碳云智能、Rokid机器人、出门问问和优必选等。包括碳云智能在内,医疗健康领域共有11家公司。

从这些公司所做的事来看,医学影像分析和药物发现是人工智能在医疗上重点征服的领域。这或许是因为视觉是人工智能较为成熟的领域;而药物开发又是一个漫长的过程,往往长达10年,如果应用人工智能,或许能大大缩短这一过程。雷锋网对上榜的公司介绍如下:

综合健康数据分析

CloudMedx

这家公司有一个临床AI平台,可以便捷和大规模地将神经网络算法用于健康领域。平台的基础是一个综合且不断增长的医学知识网络,也正是它让临床应用变得可能。另外,医疗健康领域中还有大量未处理的数据,公司的自然语言处理技术可以深入理解临床文本,利用机器学习提示患者风险,如疾病的严重程度和再入院等。这些信息都是通过传统方式无法得到的,也让真正以患者为中心的精确护理成为了可能。

CloudMedx通过结合机器学习和大数据分析,为慢性疾病提供实时健康洞察,提升治疗结果。

碳云智能

碳云想利用不断增长的健康数据,通过先进的数据挖掘和机器分析技术,提供个性化的健康分析和健康预测。他想从生命开始就观察、研究和指导一个人的健康。现在已经有不少公司在与它合作,包括研究机构、制药厂、体检中心、医院、保险公司和健康管理公司。

拓展阅读:参见雷锋网《碳云智能想做的,是规划生命路线》一文

医学影像

Zebra

这家公司正在建一个医疗影像分析平台。该平台提供基于云的完全托管的研究和开发环境,包括访问结构化数据集,脱敏数据研究,存储,GPU计算力和众多研究工具。整套解决方案还能让研究团队协同工作。

对这家公司,雷锋网也做过详细介绍:《怀疑自己有病?把医学影像传给Zebra试试

Enlitic

这家公司较为知名,它是一家致力于改进医疗诊断的深度学习公司。公司算法是由包括知名数据科学家、机器学习从业人员和医学专家的跨学科团队设计的,可以提供更快、更准确的医疗诊断。

Enlitic的技术会分析和学习大量非结构化医疗数据,包括放射和病理图像、实验室结果、基因组学、病历和电子健康记录。利用数百万记录,Enlitic的深度学习技术可以帮助放射科医生提高准确性,降低成本,并提升早期检测,从而改善结果。

Lunit

这家公司主要开发视觉感知技术,根据其自身的数据驱动标准,解释医学图像并显示异常区域。它在ImageNet 2015大规模视觉识别挑战赛的初创团队中获得了最高排名,也因此得到了国际关注。它还赢得了2016年的肿瘤增殖评估挑战(TUPAC)第一名,排在后面的是IBM和微软。

基于深度学习的专业知识,它主要做胸部X光检查,乳房X线检查,以及乳房组织病理切片的自动分级。

药物发现

twoXAR

这是一家软件驱动的药物发现公司。它用计算平台来确定潜在的候选药物,通过临床前研究降低风险,并通过行业合作把候选药物推广到临床。该平台迄今已经应用到了80多种疾病,合作的研究机构包括斯坦福大学,芝加哥大学和西奈医院,并已经为关节炎、多发性硬化症和癌症等发现了有前途的新药物。

Atomwise

与twoXAR一样,这家公司想想用人工智能发现新的潜在药物。

它为基于结构的药物设计,构建了首个深度神经网络。公司正在帮研究人员解决诸如癌症、多发性硬化症和糖尿病等慢性疾病,埃博拉和疟疾等易被忽视的全球性疾病,抗生素抗性细菌等复发性疾病,以及肉毒杆菌神经毒素这样的生物恐怖威胁。

Atomwise训练的深度3D卷积神经网络,可以自主学习空间和化学特征,并预测哪些分子可能是有效的。 神经网络会被应用于整个药物发现流程,以优化最初的潜在有效药物,并对它们进行调整,以避免毒性问题。公司可以每天分析数百万分子,这比其他物理测试技术快几个数量级,能让找到治愈方式的时间缩短几个月,甚至是数年。

BenevolentAI

这家公司想解决这样一种问题:人类不可能单独处理所有可能推动科学研究的信息,毕竟现在每30秒就有一篇科学论文被发布,以至于只有一小部分科学信息可以形成“可用的”知识。

所以它想用AI和深度学习技术,分析大量的复杂科学信息。这家公司想改变知识创造的方式,它为那些动态可用的知识开发了一个大型的结构化“数据湖”,可与人类专家协同使用。

这家公司对AI的第一个应用,是在生物科学中加速药物发现。它还想扩展到其他大型全球科学行业,如兽医,营养品和材料科学。

基因组数据分析

Deep Genomics

这家公司成立于2015年,其构建的计算系统可以改善诊断、治疗和了解疾病的方式。要让基因组测序所得结果真正有用,关键障碍是难以将个体遗传改变与影响健康的生理结果相关联。Deep Genomics希望改变这种状况。

它的技术来自十多年的学术研究,整合了机器学习和基因组生物学。他们的任务是开发一个集成的计算系统,它可以学习、预测和解释DNA的变化(无论是天然的,还是治疗性的),并改变关键的细胞过程。他们开发的新机器学习方法,可以在大规模数据集中找到模式,并推断出细胞如何读取基因组并生成生物分子的计算机模型。以这种方式,这家公司提供了对遗传变异的因果解释,它适用于任何变体和任何疾病。

Freenome

Freenome开发的软件,能理解血浆中游离DNA(cfDNA)随时间推移的变化模式。通过研究正常cfDNA的变化,Freenome开发了早期癌症检测方式,它在前列腺癌、肺癌、结肠直肠癌和乳腺癌中,胜过现有的血液检测方法。

此外,公司还使用深度学习模型来区分疾病亚型,如去势敏感性和支势抵抗性前列腺癌。总而言之,Freenome的软件能在同一平台进行疾病诊断和个性化治疗推荐。Freenome目前融资550万美元,投资人包括A16Z,Founders Fund和DCVC。

公司联合创始人兼CEO GabrielOtte曾表示,公司的系统可不断调整识别基因组数据模式的能力,从而区分癌症和非癌症,以及癌症亚型。

移动医疗

babylon

这家公司提供的是移动设备端的个人医疗服务。它可以让用户在几分钟内安排与医生见面,在手机上面对面聊天,以找出身体状况,得到正确的建议。

在这家公司的应用上,还可以通过聊天功能检查任何症状,咨询医疗问题,另外还能预订一些检测工具。这家公司的目标是改变医疗健康的管理方式。

医学影像公开课预告:

雷锋网