月度归档:2017年06月

在汽车领域默默发力的全志,带来了怎样的车联网战略?

雷锋网按:今年是全志科技成立的第十年。全志在 2015 年上市之后,跨入了 2.0 阶段。到今天为止,全志在产品领域已经覆盖到个人、家庭、车载等领域。

在今年全志科技的生态大会上,全志科技 CTO 丁然表示,十年来,全志将高清与互联作为基础技术。五年前全志开始部署视频编码技术,编码技术的进步也会造就了新的产品形态,包括行车记录仪、车载中控等等。据他透露,从 2010 年到 2016 年,全志的研发投入翻了 3 倍。研发人数也从 100 人增加到了 750 人。

丁然认为,人的感知需求会呈现三个趋势:智能化,数字化,网络化。

他表示,今天视频技术面临第二次数字化革命:从数字到数据。它的本质就是数据的结构化,只有数据结构化了才能实现从人的感知到机器的感知。当机器能够感知的时候,才能够进行数据分析,进行视频检索,甚至智能决策,从而提供更加智能化服务。

具体在 AI 方面,全志主要进行机器视觉和物体识别技术的研究,可以应用到车载 ADAS 应用中:能够对车道变更等预警,并且具有高度适应性,能够适应白天、黑夜、雨天等不同的环境。


在车载业务领域,全志是国内最早投入车载电子市场的少数芯片厂商之一。

在今年的全志生态大会上,全志车联网事业部总经理栗雪利总结其在车载市场成果:全志在后装市场基本占据半壁江山,产品形态涵盖后视镜、车机、行车记录仪等产品。同时,栗雪利表示全志在前装也有新的突破:吉利、一汽、众泰相继成为全志的合作伙伴。

关于全志的车联网战略,围绕的是可视化、智能化、联网化。栗雪利表示全志的新技术、新产品也是为这「三化」服务。

其中,可视化的主要产品形态是数字仪表盘。数字仪表盘所做的就是将固定场景的界面变成一个可定义的界面。自从数字表盘数字化之后,它可以根据不同的应用场景展示不同的应用界面,大大降低了用户的认知难度。

在芯片方面,全志的路线图是逐步推出 T3 芯片、T7M 芯片和 T16 芯片。与之对应的则是算法:流媒体 1.0 支持前视 ADAS 算法,流媒体 2.0 支持前视 ADAS、后视盲区检测以及后视行人检测;流媒体 3.0 支持前视 ADAS、后视盲区检测、后视行人检测、后视运动物体检测、后视障碍物识别和三摄像头融合。

据雷锋网了解,今在 10 月,全志将推出下一代 T7(完全按照 AEC-Q100 设计的芯片),在明年年底,他们还将推出一款高性能版本的芯片。

而全志推出 T7A 芯片——它的亮点是将 ADAS 算法加速,使用内制的 EVE 核引入模型,用自动的带入的模型自动进行特征提取,达到降低 CPU 和 GPU 的工作量,降低功耗和降低运行速度的作用。

栗雪利介绍,在机器学习系统下完成了 LDW 和 FCW 两个功能,今年年底将推出 TCW 功能,到 2019 年会转到神经网络算法做新的功能。

除了 ADAS 技术外,全志两处的第二项新技术是多屏异显。栗雪利表示 T7 的芯片可以做到双屏甚至是三屏互动。在软件框架方面,全志与 QNX 深度合作,通过使用后者的 Hyperwiser 技术构建全志的 Hyperwiser 平台。

栗表示,T7 现有的产品,仪表盘、后视镜,HUD,一颗芯片基本上都可以承担起这些产品的运算任务。

在知乎上,有人问了这样一个问题:全志能否研发无人驾驶需要的芯片?有人答:汽车类芯片相当有门槛,投资周期长,不是很符合全志「快+灵活多样」的风格。

全志到底有没有开发适用于无人驾驶的芯片我们并不清楚。但栗雪利回答了另外一个问题:全志的芯片越来越便宜了,外界质疑全志能有多少毛利?能不能养活得起自己?能不能持续发展?栗雪利答:我们的成本是设计出来的,用低成本技术实现高科技功能。

雷锋网推荐阅读:

自动驾驶市场群雄割据,这份复杂的公司关系图一定得理清

雷锋网

工信部:明日起手机预装软件必须可卸载

雷锋网6月30日消息,根据工信部的要求,明天(7月1日)起,手机厂商正式执行《移动智能终端应用软件预置办和分发管理暂行规定》。

该《规定》于去年12月发布,主要要求生产企业和互联网信息提供者应确保除基本功能软件外的移动智能终端应用软件可卸载。对于已被卸载的预置软件在移动智能终端操作系统升级时不被强行恢复;而且未经用户同意不得擅自在移动智能终端中安装应用软件,并提示用户终端在销售渠道等环节被装入应用软件的可能性、风险和应对措施。

其中,“基本功能软件” 指的是保障移动智能终端硬件和操作系统正常运行的应用软件。主要包括四类:一是操作系统基本组件:如系统内核应用、虚拟机应用、网络浏览引擎等;二是保证智能终端硬件正常运行的应用:如蓝牙、GPS、指纹传感器应用等;三是基本通信应用:如短信、拨号、联系人等;四是应用软件下载通道:如应用商店等。

另外,工信部还在这份《规定》中强调,提供移动智能终端应用软件未经明示且用户同意,不得实施收集使用用户个人信息、开启应用软件、捆绑推广其他应用软件等侵害用户合法权益或危害网络安全的行为。

如果有违反规定的,通信主管部门依据职权责令改正,依法进行处罚,并将生产企业、互联网信息服务提供者违反本规定受到行政处罚的情况记入信誉档案,向社会公布。对涉嫌违法犯罪的应用软件线索,各单位应及时报告公安机关。

实际上,手机预装软件已经形成一条完整产业链条,对于手机厂商来说是收入的一部分,对于软件公司来说则是刷量的重要途径之一。

生活日报报导,2015年初,上海市消保委对手机多项性能开展了比较试验,发现手机除系统软件外,均不同程度地预装了各类软件,最多的达到71个,少的也有近30个。

根据比较试验结果,OPPO X9007和三星SM-N9008S手机不可卸载软件数量位列前两位。其中,OPPO手机总共预装了71个软件,其中不可卸载软件数量达47个,是所有受试手机中最多的。三星手机为44个,且所有预装软件均不可卸载。据此,上海市消保委对广东欧珀移动通信有限公司和天津三星通信技术有限公司提起公益诉讼。

虽然在此之后很多厂商收敛了一些,但是这种预装各种App而且不可卸载的现象依然广泛存在。希望工信部的这份《规定》,能够真正执行到位。

雷锋网

专访科大讯飞执行总裁胡郁:关于硬件合作方选择、砍掉伪需求AI产品线,我想谈几点

近日,由MIT Technology Review评选的全球50大最聪明企业榜单出炉。在今年的榜单中,英伟达、亚马逊、英特尔、IBM、苹果、腾讯、阿里巴巴、百度等全球多家知名企业均榜上有名。科大讯飞首次上榜名列全球第六,在同期上榜的中国公司中位居第一。

就在第二天,科大讯飞也在深圳举办了智能硬件新品发布会,全新产品MORFEI麦克风、二麦DSP芯片降噪方案及光学麦克风在会场中正式亮相。

会后,雷锋网与科大讯飞执行总裁、消费者BG总裁胡郁进行了一场对话。胡郁谈到自己对市场上多个AI企业开放语音交互方案这一趋势的看法、选择硬件厂商合作方的标准以及统筹人工智能产品线的经验与感受。

雷锋网:从科大讯飞研究院院长到现在统筹整个消费级产品线的消费者BG总裁,在如此大跨度下,您个人经历了哪些自我转型?

胡郁:这个过程中,转型其实还蛮大。最重要的一点就是思考方式的转变,不能像过往一样单从技术角度去思考问题,而是更多要从商业模式、商业生态角度切入进去考虑。

除此之外,期间我也对技术的本质也有了新的认知:现在我自己不仅要考虑把技术打磨到多先进,还要从宏观角度去考虑我们重点研究的技术能够给客户带来什么,能给最终用户带来什么样的体验。这是职责转型中的最大差别。

第二方面是需要协调的层面和范围不一样,以前做技术时,我对战略的考量主要是在想整合哪些技术资源,但自从负责消费者产品线后,整个战略如何设定?采用什么样的商业模式和产品?这些层面和覆盖范围上的工作,与过往完全不同。

第三个就是跑客户、出差的时间明显增多不少,各个层面的事情都要去统筹。

雷锋网:根据您管理To C产品线的经验,这过程中有哪些AI产品和功能是真实的需求,哪些是伪需求?

胡郁:首先,真需求一定是用来满足用户刚需行为的功能。虽然Echo现在卖的很好,但调查后发现,大家真正用得比较多的工具不过是设个提醒、查个天气等等。之前亚马逊大力推的Echo语音购物功能并没有做起来,为什么?当用户用语音交互的形式去买东西时,会发现里面各个环节和场景挺麻烦,还不如直接在屏幕操作来的方便。

为什么我最近一直在强调语音交互要和视觉呈现的原因,因为用户在面对没有视觉呈现的情况下,你获得的信息不够,这时候很难完成一些复杂的操作。所以有些功能和场景都是我们自己凭空想出来的,直到真正投入实际使用时却发现用户的思维与行为习惯并不是产品设计的那样。

那么真需求是什么?是要能接地气的,知道最终用户需求,特别是能满足现在80后、90后需求的功能和产品。把握这些人使用消费级AI产品的习惯,是我们讯飞乃至整个行业现在比较欠缺的。

所以我在这一点上,采用了以下方法:

为什么讯飞现在要跟很多开发者合作,因为开发者来自各个行业,不同人懂得不同的产品。他们所处的场景和所做的业务面很广,一些开发者开发的东西,虽然覆盖的受众范围可能不是很大,但经过实际使用后发现其实都是刚需。通过跟开发者合作,我们能够看到哪些功能和需求是实在有用的。

第三方开发者本身就是一个大群体,从另一个角度可以理解为他们就像你的同事一样在帮你想需求、想场景、想落地,。一个公司的能力有限,尤其是To B型企业它很难去深入了解多元化的群众,而开发者却可以真正接触用户,接触产品,从而提出一些有价值的东西。

雷锋网:你们在现有的产品中,有砍掉过哪些伪需求功能?

胡郁:其实灵犀语音助手中的伪需求案例还是蛮多,我们曾尝试过用语音的方式购票,但后面发现行不通,因为购票不仅仅要涉及到订票的过程,还要查询其他情况和历史记录等一系列的事情,碰壁后,我们后续也决定这类功能就不要再去做了。

雷锋网:上周腾讯公布了语音解决方案“小微”,据说百度在下个月也会对DuerOS进行大升级。在这种大环境下,讯飞下半年的战略优先级是加大力度打磨技术和产品呢,还是说去扩大商务合作范围,多谈一些大的硬件厂商?

胡郁:我的想法主要还是要打磨技术和产品。

其实现在市场上有很多语音交互开放平台,但关键点在于你有没有让开发者和最终用户感受到超过门槛的体验。以这次发布会为例,虽然新技术、新产品在现场演示过程中表现力很酷,我们的很多技术在行业内确实比较优秀,但真正要达到操作起来非常方便这一水准,我认为还是有些差距的。

所以我一直觉得首先要去打磨产品、打磨体验,讯飞还有很多事要去做。

其次是,我们要找合适的合作伙伴。不是每个合作伴都有耐心跟你一点点去磨产品、磨技术、磨体验,讯飞要找到一些能够耐得住性子的合作伙伴,把我们的技术用到最好。

合作伙伴在精而不在多,也不在于有多大,而在于互相双方能够很好地去配合。只有选好合作伙伴才能把产品思路和路线摸索出来,最终给消费者提供最好的体验,同时用这种方式去发展更多合作伙伴。然后再根据用户和合作方反馈,去反哺、优化我们的技术。

雷锋网:那么在跟重要硬件厂商合作时,你们主要看重对方的哪些要素?最近DuerOS和HTC战略合作,看到竞争对手和大厂合作,你们有没有一些战略和行动上的举措?

胡郁:我们2014年就跟华为签了战略合作,把语音交互技术应用在华为手机中。根据我们这么多年的合作经验来看,语音交互系统在不同产品中爆发,是分时间段的。

不是说你做了什么很前沿的方案,跟哪个知名厂商合作,它就能做起来。语音交互系统在手机产品中的应用,现阶段并不能排在最前面。

根据我们的观察,现在的优先级是电视、机顶盒和冰箱,再到手机、机器人,最后才是VR。与硬件厂商的合作重点应该以产品类型为轴,而不是以厂商大小为轴。

科大讯飞以前也跟不少大公司签了战略合作协议,但具体的推进力度,还是要按照对方产品属性与AI可完美结合的Timing来,先集中精力推动最有可能取得突破产品线。如果你有观察的话,会发现我们最近跟运营商在机顶盒等方面的合作动作很大。因为现在就是这类产品与AI相结合的最佳时机。

雷锋网

被IBM”包养“,6年拿到8000万美元的Pathway Genomics如何用AI改变医疗?

《2016—2017年度人工智能+医疗市场分析及趋势报告》数据显示,预计到2025年,人工智能应用市场总值将达到1270亿美元。其中,医疗行业将占市场规模的五分之一。在”AI+医疗“成为时代趋势下,国内外的企业需要如何搭上这趟”顺风车“?或者,本文的主角会给你一些启发。

雷锋网了解到,Pathway Genomics 创建于2008年。该公司总部在加州圣迭戈,是一家获临床实验室标准(Clinical Laboratory Improvement Amendments, CLIA)和美国病理学家协会(College Of American Pathologists,CAP)认证的临床实验室,已在全球40多个国家为医生及其患者提供可采取针对性治疗方案、精确的基因信息,以改善或维护健康和良好状态。

IBM提供资本和技术加持 Pathway发展迅速

Pathway Genomics 似乎从它诞生的第一天起,就成为资本的”宠儿“。从2008年到2014年的6年时间里,IBM为 Pathway Genomics 投资金额达到8000多万美元。2014年, IBM 投资逾10亿美元为超级计算机沃森(Watson)创建了一个新的业务集团,为了让触角能伸到快速发展中的 SMAC (社交,移动,分析,以及云)领域,IBM进行了一系列的收购和投资行为,而 Pathway Genomics 则成为了其中一员。当年11月12日,IBM Watson 对外正式宣布投资 Pathway Genomics 应用程序 Pathway Panorama 。

该应用主要基于生物临床和医学期刊的数据向用户提供正确的答案。例如,消费者可以根据他们的 DNA 向该程序提问,例如“我今天应该有多少运动”,“星期一可以喝多少咖啡?”等。认知应用程序基于数百万个与医疗相关的循证数据、生命体征(可穿戴)、DNA、电子健康记录和其他信息进行回答并提供选项。

2016年CES大会上, IBM 宣布与 Pathway Genomics 建立合作关系。 Pathway Genomics 公司在大会上披露了该公司的 OME app 的测试版,据其官网介绍,这是世界上第一个使用人工智能( AI)和遗传学的精准健康和健康移动应用程序,将遗传学、测试结果、健康记录、可穿戴产品、一般报销信息和许多其他数据结合在一起,为用户提供个性化建议。

在医疗产业中都有哪些动作?

据雷锋网了解,2014年1月,在第32届摩根大通保健大会上, Illumina 推出两款新的测序平台:HiSeq X Ten和NextSeq 500。同年3月, Pathway Genomics 公司宣布收购 Illumina NextSeq 500系统,将其加入 NGS 测序仪家族,强化公司已有的实验流程。

NextSeq 500是一台新的台式高通量测序仪,不仅具有高通量测序能力和台式测序仪即载即开(load-and-go)的简便性,而且是唯一一个在人类全基因组测序中可一次性高覆盖运行的 NGS 系统。

除买下了 Illumina NextSeq 500, Pathway Genomics 自身的业务面也很广,覆盖了液体活检、癌症风险、心脏健康、遗传性疾病、体重控制、以及特定的药物反应,包括用于疼痛处治和精神卫生的药品等各项内容。总体而言,可以归拢为三大业务体系:

  • 检测乳腺癌等高危基因试剂盒

也提供了其他的遗传性癌症检测给个人和/或有癌症家族病史的家庭。这些测试选项包括目标板、全基因面板和大量反射性的测试选项。具体如下:

BRCATrue(综合分析BRCA1 和BRCA2基因)

BRCATrue Ashkenazi Jewish (3-Site)(分析3种常见德系犹太人突变基因)

BRCATrue Hispanic (8-Site)(分析墨西哥和拉美裔人口经常性的8种致病突变)

ColoTrue(分析14种高危大肠癌致病基因)

LynchSyndromeTrue(综合分析5种Lynch综合征相关基因)

  • 药物基因组学检测(Pharmacogenomics)

药物基因组学检测将得出哪些基因会导致个体产生不同的疼痛反应,心理健康差异及心血管药物的不同反应。产品具体如下:

Cardiac DNA Insight(试验各种心脏相关的疾病遗传风险,包括8种影响心血管循环系统的药物)

Mental Health DNA Insight(能鉴别影响精神类药物代谢和疗效的遗传变异)

Pain Medication DNA Insight(鉴别哪些基因将影响常用处方止痛药的止痛效果)

(General Health & Wellness)基本健康服务

  • 液体活组织检查(Liquid Biopsy)

公司研发的 Cancer Intercept 测试是为体细胞突变的检测设计的突变面板,主要涉及乳腺癌、卵巢癌、肺癌、直肠癌, 黑色素瘤的检测。这些测试必须由一名医生来做,可以用来检测已经被诊断出患有癌症或者潜在待确诊的疑似病人,一般2-3周内会出结果。产品具体如下:

Cancer Intercept Detect

Cancer Intercept Monitor

越来越多的公司加入了这场AI技术革命

过去6年,Pathway Genomics 从IBM获得的投资达8000多万美元,这也使其成为行业内全球资本状况优秀的医疗初创公司。雷锋网查阅有关资料得知,在人工智能、智慧医疗等领域初尝甜头的其实并不只是 Pathway 一家,专注于人工智能辅助诊断工具 Enlitic 、帮助用户按时用药的智能健康服务公司 AiCure 、提供虚拟助手 BabylonHealth 等公司,都是这个行业里的佼佼者。

GE Healthcare 首席执行官、首席数据官指出,在未来20年内, AI 对提高诊断效率和诊断质量的作用会越来越明显。在 Frost&Sullivan 的2016年研究报告中,到2021年,医疗保健行业的 AI 市场预计将达到66亿美元,增长率为40%。越来越多的国内外企业也在用自己的方式来参与这场 AI 技术革命。

雷锋网

90%的医疗大数据产品是伪需求?刚需在哪里?谁来买单?

雷锋网消息,近日,中电数据服务有限公司主办的“数据风口  生态联盟”健康医疗大数据国家试点工程(福州)生态峰会在福州举行,中电数据召集红杉资本中国基金、IBM、药明康德、戴尔等20家数字医疗市场的大玩家出席,共同成立健康医疗大数据国家试点工程(福州)生态联盟。

前不久,一篇《90%的大数据产品是伪需求,所以没人买单》的文章让不少业内人自我怀疑起来,为此,会议当天,主持人向与会嘉宾抛出这个话题,而他们一致认同的是:医疗大数据产品一定有刚需,医院、政府、药厂、个人等都可以成为需求方,而谁来买单的问题,则仁者见仁,智者见智了。

何谓“需求”?有人买单?

“所谓90%有点标题党的感觉,90%怎么得出的?为什么不是50%?”中电数据董事长李世锋说道,需求肯定存在,不过一般说的“需求”是基于商业的定义,即有人买单。他认为,目前对于大数据的探索目的是产生真正的价值,进而有人买单。“同时,这也意味着大数据发展潜力无穷,今天中电数据召开的生态峰会,恰恰是如何从不同的维度、不同的层次、不同的用户理解和不同的用户需求出发,把他们变成真正有效的需求,这可能比谁来买单更有意义。”

需求很大,做好了就有人买单

飞利浦大中华区战略与新业务发展总经理梁建球说道,“医疗大数据需求很大,关键是我们能不能做好。”他认为各方面都有需求。

比如政府,目前来讲,政府在健康医疗方面的财政支持是绝对不够的,如今中国医疗资源分布不平衡、人才缺乏对于国家来讲都是很头痛的事情,目前慢病管理和健康管理形成很大的压力,我们曾做过统计:超过85%的医疗费用花在5%的急重症上。那通过医疗大数据,能不能用更高效的方式减少对于慢病管理、健康管理的支出呢?还有病人。我们曾做过分析,发现中国癌症病人接受治疗后,5年后的存活率远远低于美国,这其实是医疗水平和规范化的问题,而大数据对此能有所帮助。

中国长城高级副总裁周在龙称,最终谁会买单,这肯定有一个过程。但目前政府是非常关注医疗大数据方面的,“你有没有这种能力,能让政府或者能让国家相关部门下决心大力支持?这个阶段只要是我们围绕自我生态、技术生态等等问题把它做好,能够提供可靠的数据,那我觉得买单的事情就不用愁了。”

有刚需,这些人可能会买单

“医疗大数据产品对于每个普通民众而言都是刚需,而买单的问题很简单,只要有市场。”戴尔公司副总裁大中华区战略发展部总经理吴海亮说道。

药明康德执行副总裁、首席商务官杨青认为,“对于新药研发和精准医疗而言,大数据一定是刚需”,因此,药厂以及药厂相关的利益关联方应该是愿意买单的。

IBM大中华区副总裁、沃森健康事业部总经理郭继军称,医疗大数据产业其实是B2B2C的产业,目前来看,中间的B是直接买单的,C是最终买单的。

就目前来看,中间的B,目前我们看到的有4大板块:第一是医院,第二是政府,比如政府有疾控,他们给老百姓提供疾病的健康的管理的需求;第三是药厂,因为药需要跟医疗大数据结合;第四是保险公司,他们需要通过医疗信息优化运营。

如果从紧急性维度看,他说道,医疗健康大数据服务有三大层次,第一层次是疾病管理;第二是慢病管理;第三是健康管理。从当下看,最紧急的是疾病管理,发展空间最大的是健康管理。“我们会从疾病入手,然后逐渐进入到慢性管理和健康管理里面去。”

目前仍处于应用探索阶段,数据源更重要

联想数据中心集团公共服务行业高级总经理胡少奇认为,关于谁买单的问题,有三个维度,第一是基于不同的需求,比如基因分析由个人来买单;第二是新药研发方面;第三是治疗方面,可以政府买单,走社保、医保,也可以医院买单,最终受益者是患者。

但是,“其实我不是特别关心谁付钱的问题,更关心数据端的问题。”胡少奇说道,目前相对来说,数据还是比较初期的,讲的更多的是大数据在医疗行业的应用,目前,BAT是数据巨头,比如阿里巴巴的经营数据与医疗数据结合,构成一个人的生命全周期数据。

更多关于雷锋网人工智能升级传统机构的文章,请关注雷锋网AI商业化垂直微信公众号:AI掘金志(ID:HealthAI)。

雷锋网

传 VPN 应用明日起将全面禁止,安卓、苹果无一幸免

雷锋网 6 月 30 日消息,据外媒 BoingBoing 报导,自 7 月 1 日起,中国的安卓和苹果应用商店将不再允许 VPN 应用,目前还还无法确认该消息的真实性。

不过,此前 VPN 服务提供商 Green 已经宣布,从 7 月 1 日起,将停止服务。通知如下:

“接上级监管部门通知,我们必须很遗憾地告诉大家:Green将于2017年7月1日起停止服务。由此给各位造成的不便,我们深表歉意!”

其实,Green 停止服务早有预示。

雷锋网此前曾报导,今年 1 月 22 日,工信部发布通知,宣布即日起至 2018 年 3 月 31 日,在全国范围内对互联网网络接入服务市场开展清理规范工作。要求各通信管理局要对本辖区内提供 IDC、ISP、CDN 业务的企业情况进行摸底调查,杜绝非法经营行为。

工信部在通知中列出了多种违规问题,其中一个是:“未经电信主管部门批准,不得自行建立或租用专线(含虚拟专用网络VPN)等其他信道开展跨境经营活动。基础电信企业向用户出租的国际专线,应集中建立用户档案,向用户明确使用用途仅供其内部办公专用,不得用于连接境内外的数据中心或业务平台开展电信业务经营活动。”

这则消息如同一颗重磅炸弹,瞬间引爆整个网络。

随后,工信部信息通信管理局负责人就此问题作出了回答和解释。该负责人表示,

《通知》关于跨境开展经营活动的规定,主要的依据是《国际通信出入口局管理办法》(原信息产业部令第22号),规范的对象是未经电信主管部门批准,无国际通信业务经营资质的企业或个人,租用国际专线或VPN,私自开展跨境的电信业务经营活动。


外贸企业、跨国企业因办公自用等原因,需要通过专线等方式跨境联网时,可以向依法设置国际通信出入口局的电信业务经营者租用,《通知》的相关规定不会对其正常运转造成影响。

不过,个人用户的使用需求并没有包含在内。据雷锋网了解,在过去的几个月里,除了 Green 之外,其他 VPN 服务商,包括Netfits、VPN Master Pro、Ponhon、Snap VPN 和 SkyX 等,也已经被迫停止服务或者从应用商店消失。

最后,且用且珍惜。


雷锋网

用虚拟试衣积累亚洲最大女性身材数据库后,好买衣想用AI做每个人的专属时尚顾问

曾经,虚拟试衣和人形机器人一样,是人类一直都有但又难以实现的梦想。不过这也意味着,一旦实现,它们会极大地改变我们的生活,同时为革新者带来巨大的回报。

这样的“诱惑”也促使柴金祥从学界投身创业。2000年,在微软亚洲研究院工作的他发表了研究院的第一篇SIGGRAPH(计算机图形学的顶级会议)论文;之后,他赴美留学获得卡内基梅隆大学计算机博士学位,并在TAMU获聘终身教授。而现在,他是虚拟试衣创业公司好买衣的联合创始人兼CTO。

好买衣成立于2013年8月,成立以来,它已经和多家天猫TOP 50大牌女装开展了合作,为其提供在线虚拟试衣服务;另外,好买衣独创的免尺测量技术,已经积累了480万的真实用户输入的身材数据;去年,好买衣还入选了雷锋网承办的CCF – GAIR的TOP 25榜单。在6月举行的亚洲消费电子展(CES Asia)上,好买衣还宣布将与C&A合作,在今年下半年推出人工智能(AI)线下体验店,建设全渠道解决方案。

成立以来,好买衣先后获得了来自联想之星和治平资本的天使轮和A轮融资,并在2015年获得了宽带资本领投的1500万美元B轮融资。日前,雷锋网新智造采访了柴金祥,了解了好买衣不一样的虚拟试衣路线。

用大数据的方法解决虚拟试衣的问题

柴金祥的主要研究领域是人体动画和动作捕捉,前者研究游戏、电影中和人相关的三维动画制作,后一个领域则研究对人体动作的实时捕捉,近年来大热的用Kinect摄像头捕捉人体姿势,就是他的方向之一。

这些研究方向和虚拟试衣有着密切的联系,柴金祥告诉雷锋网新智造,一直以来,都有研究人员和商业公司尝试虚拟试衣,而从历史上来看,虚拟试衣主要有两种技术路线:

第一,用传统的动画的方式来做;这也是游戏、动画片里常用的方式,一件衣服,首先由美工手动建模,将衣服的形状、颜色、纹理做出来,另外,由于这件“衣服”要穿在不同人的身上,还要进行仿真。

这是虚拟试衣最经典的做法,但也有很多弊端:首先,效果不够真实;其次,也是最重要的,这种做法的成本很高,手工建模对美工的要求很高,而且,仅渲染一件衣服可能就需要一周的时间。服装的换季节奏很快,这种做法根本无法落地。

第二,用AR的方式,即将衣服的图片“贴”在人体的图片上;图片能保证衣服的效果更真实,这种做法的成本也更低,但“贴图”也意味着虚拟试衣的效果大打折扣。

有没有新的方法,能同时弥补两种传统方法的不足呢?

好买衣的做法是借助计算机图形学和计算机视觉,后者已经是人工智能的范畴。

虚拟试衣涉及对衣服和人体的三维建模:对衣服,好买衣利用计算机图形学和计算机视觉的方法,先对衣服的各个角度拍照,然后通过算法将其建模出来。柴金祥告诉雷锋网新智造,目前,衣服的拍摄已经是标准化流程,一套衣服几分钟就可以拍完。

为了保证试衣效果,对人体进行三维建模同样重要,现在不少创业公司使用Kinect深度摄像头捕捉人体姿势的方案。不过,好买衣使用了不一样的方案:结合人体身材数据库中的模型,加上用户的主动输入调整,自动生成任意身材的三维模型,这个过程中不使用尺子、相机、深度摄像头等任何辅助设备。

好买衣将这个方案称为“免尺测量”,柴金祥告诉雷锋网新智造,为了更好的效果和用户接受度,好买衣进行了三个阶段的尝试,第一个阶段,好买衣推出了一个叫“尺码相机”的app,用户用手机拍三个不同姿势的照片,系统就能将人体的三维数据建模出来,但是,因为下载和操作的成本比较高,这个app最终没能被用户接受,“100个用户可能只有1个去下载使用”;随后,好买衣尝试了大数据预测的方式,用户可以输入身高、体重和三围,系统集合数据库中已有的模型进行建模,但在实际过程中发现,有不少女性用户是不知道自己的三围的;最后,好买衣才探索出了现在的模式,用户仅需输入身高、体重和内衣的罩杯,并配合从十多个身材标签(tag)中的选择进行建模,这些标签诸如“有没有肚腩”、“肚腩大不大”、“大腿粗不粗”等,几十秒的时间,系统就能把人的身材模拟出来。

另外,好买衣还充分考虑到了C端用户的使用习惯,允许用户上传自己的正面头像,系统即可自动识别、定位和提取五官,通过三维重建合成技术将用户真实的五官重建至虚拟三维人脸模型上。用户还可以个性化定制自己喜欢的发型、发色、脸型、肤色。

不管是依靠图片建模,还是免尺测量,调校算法都是非常重要的工作。柴金祥告诉雷锋网新智造,从好买衣成立到推出现在的产品,花了两、三年的时间。2017年3月,天猫开启的新风尚活动中,好买衣提供的虚拟试衣也成了女装会场的最大亮点,“和天猫的合作,也意味着我们的效果获得了认可。”

专属时尚顾问:AI根据身材、相貌推荐合适的衣服

现在,在虚拟试衣之外,好买衣还决定做一件更加人工智能的事:做每个人的专属时尚顾问,即通过用户的身材和相貌,主动推荐合适的衣服。

和虚拟试衣一样,穿搭推荐涉及衣服和人两个方面,柴金祥告诉雷锋网新智造,对前者,好买衣使用了深度学习算法,经过大量由人工标注的数据训练后,现在,系统已经可以自动给建模好的衣服模型打上各种标签,如面料、款式、风格、细节等。这种做法可以顺利开展,得益于好买衣为衣服建模的标准化流程。建模后结构化的数据,可以直接用于优化深度学习算法。

人的因素则设计身材和相貌,虽然是一位纯粹的研究人员,柴金祥已经对衣服穿搭有了一套心得,“比如一个人下半身短一些,大腿比较粗,那穿A字裙就比较合适,它的腰线比较高,会显得腿比较长。穿搭实际上就是扬长避短。”

但是对机器算法来说,根据身材和相貌推荐衣服还有很大的难度,其中最大的困难在于,这些“知识”或者说经验,很少有系统的、成文的体系。

好买衣的优势是已经有了大量的身材和穿搭数据,在天猫app中,好买衣和大量TOP 50的女装品牌达成了合作,提供在线试衣服务。柴金祥告诉雷锋网新智造,目前,使用这个功能,主动输入身材数据并进行穿搭体验的用户,已经达到了480万。这对根据身材推荐衣服有很大的帮助。

(好买衣合作的部分品牌)

人的脸型、相貌同样对穿搭有讲究,不过,这更是一个更难系统化的问题,好买衣计划的做法是和国内的顶级造型穿搭团队合作,将他们的经验变成行之有效的算法。

和虚拟试衣相比,时尚顾问还不够成熟,柴金祥给它打了60分,虽然还要比较长的路要走,但是可以想到,和真正的时尚顾问相比,AI顾问有着难以比拟的优势,“时尚顾问脑海里不可能有1万件服装推荐,我们的系统更powerful。”

在未来的市场策略上,好买衣也将从专注虚拟试衣转变为关注全渠道解决方案,一方面,为线上商店提供虚拟试衣服务;另一方面,和品牌方合作打造线下体验店,试衣镜将是一个很好的教育市场的产品,它还可以和手机配合,双屏互动,通过扫码的方式,既可以去线下商店直接购买线上试过的衣服,也可以在手机上继续获得试衣镜中的体验。

“线上虚拟试衣,可以帮助品牌方减少退货,并提高用户体验;线下线上联动,能够激活品牌用户的活跃度和会员数。”未来,好买衣还希望接入到服装产业链更深的层次,个性化定制、预售,甚至生产,都可以在虚拟试衣的帮助下变得更科学,“为什么衣服只有4个码?为什么不能做20个码,50个码?”

雷锋网

只需 130 行代码,用 GAN 实现二维样本的小例子

雷锋网按:此前雷锋网曾编译了一篇英文教程,详细介绍了如何基于 PyTorch 平台用 50 行代码实现 GAN(生成对抗网络),详情参见:《GAN 很复杂?如何用不到 50 行代码训练 GAN》。近期,针对文中介绍的“50 行代码 GAN 模型”,有开发者指出了局限性,并基于此模型给出了改进版本,也就是本文将要介绍的“130 行代码实现 GAN 二维样本”。本文原载于知乎专栏,作者達聞西,雷锋网经授权发布。

50行GAN代码的问题

Dev Nag 写的 50 行代码的 GAN,大概是网上流传最广的,关于GAN最简单的小例子。这是一份用一维均匀样本作为特征空间(latent space)样本,经过生成网络变换后,生成高斯分布样本的代码。结构非常清晰,却有一个奇怪的问题,就是判别器(Discriminator)的输入不是2维样本,而是把整个mini-batch整体作为一个维度是batch size(代码中batch size等于cardinality)那么大的样本。也就是说判别网络要判别的不是一个一维的目标分布,而是batch size那么大维度的分布:

d_input_size = 100   # Minibatch size – cardinality of distributions

class Discriminator(nn.Module):

    def __init__(self, input_size, hidden_size, output_size):

        super(Discriminator, self).__init__()

        self.map1 = nn.Linear(input_size, hidden_size)

        self.map2 = nn.Linear(hidden_size, hidden_size)

        self.map3 = nn.Linear(hidden_size, output_size)


    def forward(self, x):

        x = F.elu(self.map1(x))

        x = F.elu(self.map2(x))

        return F.sigmoid(self.map3(x))

D = Discriminator(input_size=d_input_func(d_input_size), hidden_size=d_hidden_size, output_size=d_output_size)

for epoch in range(num_epochs):

    for d_index in range(d_steps):

        # 1. Train D on real+fake

        D.zero_grad()


        #  1A: Train D on real

        d_real_data = Variable(d_sampler(d_input_size))

        d_real_decision = D(preprocess(d_real_data))

        d_real_error = criterion(d_real_decision, Variable(torch.ones(1)))  # ones = true

        d_real_error.backward()  # compute/store gradients, but don't change params


        #  1B: Train D on fake

        d_gen_input = Variable(gi_sampler(minibatch_size, g_input_size))

        d_fake_data = G(d_gen_input).detach()  # detach to avoid training G on these labels

        d_fake_decision = D(preprocess(d_fake_data.t()))

        d_fake_error = criterion(d_fake_decision, Variable(torch.zeros(1)))  # zeros = fake

        d_fake_error.backward()

        d_optimizer.step()  # Only optimizes D's parameters; changes based on stored gradients from backward()


    for g_index in range(g_steps):

        # 2. Train G on D's response (but DO NOT train D on these labels)

        G.zero_grad()


        gen_input = Variable(gi_sampler(minibatch_size, g_input_size))

        g_fake_data = G(gen_input)

        dg_fake_decision = D(preprocess(g_fake_data.t()))

        g_error = criterion(dg_fake_decision, Variable(torch.ones(1)))  # we want to fool, so pretend it's all genuine


        g_error.backward()

        g_optimizer.step()  # Only optimizes G's parameters


不知作者是疏忽了还是有意为之,总之这么做的结果就是如此简单的例子收敛都好。可能作者自己也察觉了收敛问题,就想把方差信息也放进来,于是又写了个预处理函数(decorate_with_diffs)计算出每个样本距离一批样本中心的距离平方,作为给判别网络的额外输入,其实这样还增加了输入维度。结果当然是加不加这个方差信息都能勉强收敛,但是都不稳定。甚至作者自己贴出来的生成样本分布(下图)都不令人满意:

如果直接把这份代码改成二维的,就会发现除了简单的对称分布以外,其他分布基本都无法生成。

理论上讲神经网络作为一种通用的近似函数,只要capacity够,学习多少维分布都不成问题,但是这样写法显然极大增加了收敛难度。更自然的做法应该是:判别网络只接受单个二维样本,通过batch size或是多步迭代学习分布信息。

另:这份代码其实有130行。

从自定义的二维分布采样

不管怎样Dev Nag的代码还是提供了一个用于理解和试验GAN的很好的框架,做一些修改就可以得到一份更适合直观演示,且更容易收敛的代码,也就是本文的例子。

从可视化的角度二维显然比一维更直观,所以我们采用二维样本。第一步,当然是要设定一个目标分布,作为二维的例子,分布的定义方式应该尽量自由,这个例子中我们的思路是通过灰度图像定义的概率密度,进而来产生样本,比如下面这样:

二维情况下,这种采样的一个实现方法是:求一个维度上的边缘(marginal)概率+另一维度上近似的条件概率。比如把图像中白色像素的值作为概率密度的相对大小,然后沿着x求和,然后在y轴上求出marginal probability density,接着再根据y的位置,近似得到对应x关于y的条件概率。采样的时候先采y的值,再采x的值就能近似得到符合图像描述的分布的样本。具体细节就不展开讲解了,看代码:

from functools import partial

import numpy

from skimage import transform


EPS = 1e-6

RESOLUTION = 0.001

num_grids = int(1/RESOLUTION+0.5)


def generate_lut(img):

    """

    linear approximation of CDF & marginal

    :param density_img:

    :return: lut_y, lut_x

    """

    density_img = transform.resize(img, (num_grids, num_grids))

    x_accumlation = numpy.sum(density_img, axis=1)

    sum_xy = numpy.sum(x_accumlation)

    y_cdf_of_accumulated_x = [[0., 0.]]

    accumulated = 0

    for ir, i in enumerate(range(num_grids-1, -1, -1)):

        accumulated += x_accumlation[i]

        if accumulated == 0:

            y_cdf_of_accumulated_x[0][0] = float(ir+1)/float(num_grids)

        elif EPS < accumulated < sum_xy – EPS:

            y_cdf_of_accumulated_x.append([float(ir+1)/float(num_grids), accumulated/sum_xy])

        else:

            break

    y_cdf_of_accumulated_x.append([float(ir+1)/float(num_grids), 1.])

    y_cdf_of_accumulated_x = numpy.array(y_cdf_of_accumulated_x)


    x_cdfs = []

    for j in range(num_grids):

        x_freq = density_img[num_grids-j-1]

        sum_x = numpy.sum(x_freq)

        x_cdf = [[0., 0.]]

        accumulated = 0

        for i in range(num_grids):

            accumulated += x_freq[i]

            if accumulated == 0:

                x_cdf[0][0] = float(i+1) / float(num_grids)

            elif EPS < accumulated < sum_xy – EPS:

                x_cdf.append([float(i+1)/float(num_grids), accumulated/sum_x])

            else:

                break

        x_cdf.append([float(i+1)/float(num_grids), 1.])

        if accumulated > EPS:

            x_cdf = numpy.array(x_cdf)

            x_cdfs.append(x_cdf)

        else:

            x_cdfs.append(None)


    y_lut = partial(numpy.interp, xp=y_cdf_of_accumulated_x[:, 1], fp=y_cdf_of_accumulated_x[:, 0])

    x_luts = [partial(numpy.interp, xp=x_cdfs[i][:, 1], fp=x_cdfs[i][:, 0]) if x_cdfs[i] is not None else None for i in range(num_grids)]


    return y_lut, x_luts


def sample_2d(lut, N):

    y_lut, x_luts = lut

    u_rv = numpy.random.random((N, 2))

    samples = numpy.zeros(u_rv.shape)

    for i, (x, y) in enumerate(u_rv):

        ys = y_lut(y)

        x_bin = int(ys/RESOLUTION)

        xs = x_luts[x_bin](x)

        samples[i][0] = xs

        samples[i][1] = ys


    return samples


if __name__ == '__main__':

    from skimage import io

    density_img = io.imread('batman.jpg', True)

    lut_2d = generate_lut(density_img)

    samples = sample_2d(lut_2d, 10000)


    from matplotlib import pyplot

    fig, (ax0, ax1) = pyplot.subplots(ncols=2, figsize=(9, 4))

    fig.canvas.set_window_title('Test 2D Sampling')

    ax0.imshow(density_img, cmap='gray')

    ax0.xaxis.set_major_locator(pyplot.NullLocator())

    ax0.yaxis.set_major_locator(pyplot.NullLocator())


    ax1.axis('equal')

    ax1.axis([0, 1, 0, 1])

    ax1.plot(samples[:, 0], samples[:, 1], 'k,')

    pyplot.show()

二维GAN的小例子

虽然网上到处都有,这里还是贴一下GAN的公式:

就是一个你追我赶的零和博弈,这在Dev Nag的代码里体现得很清晰:判别网络训一拨,然后生成网络训一拨,不断往复。按照上节所述,本文例子在Dev Nag代码的基础上,把判别网络每次接受一个batch作为输入的方式变成了:每次接受一个二维样本,通过每个batch的多个样本计算loss。GAN部分的训练代码如下:

DIMENSION = 2



generator = SimpleMLP(input_size=z_dim, hidden_size=args.g_hidden_size, output_size=DIMENSION)

discriminator = SimpleMLP(input_size=DIMENSION, hidden_size=args.d_hidden_size, output_size=1)



for train_iter in range(args.iterations):

    for d_index in range(args.d_steps):

        # 1. Train D on real+fake

        discriminator.zero_grad()


        #  1A: Train D on real

        real_samples = sample_2d(lut_2d, bs)

        d_real_data = Variable(torch.Tensor(real_samples))

        d_real_decision = discriminator(d_real_data)

        labels = Variable(torch.ones(bs))

        d_real_loss = criterion(d_real_decision, labels)  # ones = true


        #  1B: Train D on fake

        latent_samples = torch.randn(bs, z_dim)

        d_gen_input = Variable(latent_samples)

        d_fake_data = generator(d_gen_input).detach()  # detach to avoid training G on these labels

        d_fake_decision = discriminator(d_fake_data)

        labels = Variable(torch.zeros(bs))

        d_fake_loss = criterion(d_fake_decision, labels)  # zeros = fake


        d_loss = d_real_loss + d_fake_loss

        d_loss.backward()


        d_optimizer.step()     # Only optimizes D's parameters; changes based on stored gradients from backward()


    for g_index in range(args.g_steps):

        # 2. Train G on D's response (but DO NOT train D on these labels)

        generator.zero_grad()


        latent_samples = torch.randn(bs, z_dim)

        g_gen_input = Variable(latent_samples)

        g_fake_data = generator(g_gen_input)

        g_fake_decision = discriminator(g_fake_data)

        labels = Variable(torch.ones(bs))

        g_loss = criterion(g_fake_decision, labels)  # we want to fool, so pretend it's all genuine


        g_loss.backward()

        g_optimizer.step()  # Only optimizes G's parameters


    …


和Dev Nag的版本比起来除了上面提到的判别网络,和样本维度的修改,还加了可视化方便直观演示和理解,比如用一个二维高斯分布产生一个折线形状的分布,执行:

python gan_demo.py inputs/zig.jpg

训练过程的可视化如下:

更多可视化例子可以参考如下链接:

http://t.cn/Ro8aNJz

Conditional GAN

对于一些复杂的分布,原始的GAN就会很吃力,比如用一个二维高斯分布产生两坨圆形的分布:

因为latent space的分布就是一坨二维的样本,所以即使模型有很强的非线性,也难以把这个分布“切开”并变换成两个很好的圆形分布。因此在上面的动图里能看到生成的两坨样本中间总是有一些残存的样本,像是两个天体在交换物质。要改进这种情况,比较直接的想法是增加模型复杂度,或是提高latent space维度。也许模型可以学习到用其中部分维度产生一个圆形,用另一部分维度产生另一个圆形。不过我自己试了下,效果都不好。

其实这个例子人眼一看就知道是两个分布在一个图里,假设我们已经知道这个信息,那么生成依据的就是个条件概率。把这个条件加到GAN里,就是Conditional GAN,公式如下:

示意图如下:

条件信息变相降低了生成样本的难度,所以生成的样本效果好很多。

在网络中加入条件的方式没有固定的原则,这里我们采用的是可能最常见的方法:用one-hot方式将条件编码成一个向量,然后和原始的输入拼一下。注意对于判别网络和生成网络都要这么做,所以上面公式和C-GAN原文简化过度的公式比起来多了两个y,避免造成迷惑。

C-GAN的代码实现就是GAN的版本基础上,利用pytorch的torch.cat()对条件和输入进行拼接。其中条件的输入就是多张图片,每张定义一部分分布的PDF。比如对于上面两坨分布的例子,就拆成两张图像来定义PDF:

具体实现就不贴这里了,参考本文的Github页面:

http://t.cn/Ro8Svq4

加入条件信息后,两坨分布的生成就轻松搞定了,执行:

python cgan_demo.py inputs/binary

得到下面的训练过程可视化:

对于一些更复杂的分布也不在话下,比如:

这两个图案对应的原始GAN和C-GAN的训练可视化对比可以在这里看到。

应用样例

其实现在能见到的基于 GAN 的有意思应用基本都是 Conditional GAN,下篇打算介绍基于 C-GAN 的一个实(dan)用(teng)例子:

提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服

本文完整代码

http://t.cn/Ro8Svq4

雷锋网

HTC 和联想 Daydream 一体机将基于高通 VRDK 参考设计

雷锋网曾报道,在今年五月的Google I/O大会上,Google表示将联合HTC和联想打造Daydream VR一体机。关于Daydream VR设备,Google透露的细节并不多。但现在,雷锋网了解到,HTC和联想VR的硬件基础,都是高通的VRDK。

VRDK是高通开发的虚拟现实开发套件,其可为消费者电子产品制造者开发VR设备提供基础。VRDK本身就是一个相当强大的移动头显设备,支持2560*1440 AMOLED显示屏,支持内置式位置追踪,这种技术依靠多种传感器和两个摄像头识别周围3D场景。VRDK头显是一款面向消费电子产品厂商的参考设计,高通旨在为基于高通骁龙VR硬件的VR头显制造商提供基础。当Google开发第一代Daydream头显时,就将VRDK作为自己的硬件平台基础。后来,HTC和联想相继在VRDK的基础上开发自己的VR设备。

(VRDK参考原型)

在今年的Google I/O大会上,Google展示了Daydream VR一体机的原型。相关人士透露:其使用的是相对老旧的硬件,很有可能是VRDK的旧版本,使用的是高通骁龙820芯片。现在,高通表示 HTC Vive和联想的独立头显将会使用VRDK的新版本,将使用高通骁龙835芯片。相比骁龙820芯片,骁龙835芯片更具现代化,适用于一系列的移动设备,如智能手机和平板电脑,而高通表示这款芯片同时也是专门为VR打造。

本周,高通透露了新版本VRDK的更多细节。

首先,Ximmerse为VR应用构建了高精度、无漂移、低时延的3DoF控制器。同时,博世Sensortec拥有BMX055绝对定向传感器,具有回旋追踪功能,其包括加速器、螺旋仪磁力计,提供“精确和高频惯性测量”,即意味着更准确和更低时延的运动跟踪。为了实现位置追踪,VRDK搭载两个摄像头,使用OmniVision OV9282图像传感器,OmniVision集成了OV9282,它是1MP高速快门图像传感器,可用于特征跟踪,能以120Hz的频率捕捉1280 x800分辨率图像,或以180Hz的频率捕捉640 x 480分辨率图像。

虽然OmniVision和Bosch是Daydream独立头显的重要部件。但殊不知,这种强大跟踪功能背后的算法,全部由Google开发。

据外媒RoadtoVR预测:HTC和联想Daydream头显能够以90Hz的频率支持2560 x 1440 AMOLED屏幕,不过目前制造商尚未透露是否能够支持。关于镜片,其透露的细节就很少了。但是到目前为止,高通只透露了VRDK使用的非涅尔式镜片,表示其可支持100度视场。

VRDK非常强大,可谓多种VR设备提供支持。但有一个问题,这些设备搭载的都是VRDK,采用的都是高通的硬件和底层技术,那会不会失去了自己的独特性呢?答案是否定的。厂商可以根据VRDK制作自家的VR头显,而这些设备在外观设计上可以跟VRDK有很大的区别。厂商可以选择应保留VRDK哪些硬件和功能,并可能添加自己的设计,以区分其他同样基于VRDK的头显。这就跟两部Android手机同样基于骁龙芯片,但外观截然不同一样。

上图就是提供了两种头显的设计方案:同样基于VRDK,但外观不同。

现在,随着VR设备的大受欢迎,VR头显设备的硬件和软件都愈加成熟,越来越多的厂商加入到VR开发大军中来,VR也越来越成为人们的心头好。未来会发展如何,我们拭目以待。

Via: RoadtoVR 雷锋网编译

雷锋网

20秒色情小电影,骗了宅男6个亿

有些事情,大家都希望时间越长越好。

在你心疼盘里的小电影被 8 秒教育短片替换时,有人打起了 20 秒色情小电影的主意。

事情是这样的……

—-讲正事专用分割线—-

纯洁的宅男小王有天正在宿舍上着网,突然一不小心点开了一个弹窗,oh,漏!他看到勾人心弦、血脉喷张的一幅画面……

然后,他冷静地看了看周围,默默拿起了耳机……

这是一个显示为2小时时长的大片!

想想都很激动,接下来满满都是学习新姿势的两个小时呢!

纳尼,心潮澎拜了20秒后,接下来,就是提示付费充值的对话框。

小王暗道一声“卧槽,这都可以”,然后根据提示的步骤充值,结果也只能多看20秒。

要继续观看,还得充值。

这似乎是个无底洞,即使用户花费了高额的费用,这类APP或者网站也不会提供完整的不可描述的内容。

小王只能选择暗自咒骂,默默接受被骗的事实。因为即使找到客服联系方式,想获得退款也是极其困难的。

色情诱导诈骗团伙就是在这样的情况下,悄悄骗走了许多用户的钱。

宅客频道也曾经报道过这一案例:上了个“假”黄网,误入了7亿黑产的大门

“色情诱导诈骗”是一种年收入过亿的“生意”,一点也不夸张。因为,其背后暗藏一个规模化、组织化、产业链完善的流水性作业程序。甚至,有些黑产团伙会披着科技公司的外壳,表面上做着正经业务,私下里干着见不得人的勾当。

在 2017年4-6月期间,与此相关的 3 个大型公司化运营色情诱导诈骗团伙及其黑色产业链,共计抓获犯罪嫌疑人120余人,冻结涉案资金超过6000万元,初步查明涉案金额达6亿元。目前,犯罪嫌疑人因涉嫌诈骗、非法入侵计算机信息系统罪和破坏计算机信息系统罪被刑事拘留。

“色情诱导诈骗”黑色产业链的每一个环节,都是经过精心设计、有规模、系统化运作的。

—-讲“色情诱导诈骗”黑色产业专用分割线—-

一、内容剪辑,游走于灰色地带

APP或者视频网站的技术开发门槛很低,有经验的程序员可以用几天时间完成开发。而且,这类开发本身是一个开放的市场,可以公开购买。在某电商平台以“诱导 源码”为关键字,只需要数十元即可买到源代码。

黑产团伙的运营者通常具备一定的“法律意识”。

为了保证网站的生存周期,或者APP在上架应用市场时能通过审核,同时规避“淫秽物品”的法律界定,其展示出来的内容都是经过精心剪辑的边角料。

比如,武汉雷胜科技公司,设有研发部、市场部、编辑部、财务部、客服部等,其中编辑部就主要负责色情诱导视频APP、网站内容的编辑和添加,还雇佣了律师对视频和图片内容进行审核,确保内容能够通过审核、上架。

警方在扣押武汉雷胜科技公司的服务器时,查处其中存放的百部电影短片、数万张图片,但都很难直接鉴定为“淫秽物品”。

▲武汉雷胜科技公司服务器存储内容

二、企业“三证”黑市,服务收款环节

色情诱导诈骗的支付环节也有成熟的运作流程与渠道。由于支付平台的开放性,只需拥有一套完整的三证及对应的银行卡账户,就能从支付平台或渠道商处申请获得支付接口。通过认证后,商户可以通过私人账户收款。

完整的公司三证信息及银行卡账户很难申请吗?不!

正因为游犯罪暴利的诱惑,成套的公司“壳”资料早已在黑市上流转。有人专门收集企业信息和虚假注册,企业“三证”信息以层层代理的模式在黑市上面贩卖,用于注册电商企业店、申请支付接口等。

在该色情诈骗案件中,警方打掉两个专门虚假注册公司、贩卖三证资料的团伙。该团伙短短3个月内贩卖了近千份资料,提供给诈骗团伙申请支付接口所用,一套三证的售卖价格约为1000-1500元,也就是说,该团伙非法牟利数百万元。

即使第三方支付平台设立了各种风控识别模型,对色情诈骗的支付场景做了种种限制。但色情诈骗团伙仍然不断变换作案模式,如准备多个支付接口,或开发短时间切换接口的平台逃避风控打击。

三、捆绑与劫持,推广花样百出

有了平台、内容和收款渠道,黑产团伙接下来需要考虑的就是推广环节。参与这一环节的角色众多,包括广告主、广告联盟、网站主(流量商)等。

广告主——负责寻找推广资源,主要根据客户的需求,拿钱办事。

网站主(流量商)——拥有流量的人,通常是批量网站的拥有者,能修改页面投放广告主的广告;也可能是非法获取的Webshell或者流量劫持。

广告联盟——集合了各种网络媒体资源组成的联盟,通过联盟平台帮助广告主实现广告投放,并进行广告投放数据监测统计。

色情诱导诈骗的广告投放和推广引流手法,更是花样百出。

大连警方打掉的北京某科技有限公司,其技术部制作色情付费APP,定制软件推广网址,研发运维“海*网”黑产平台等工作;其客服部负责发布广告招募站长推广色情付费软件。站长接单后,通过收量或者黑客技术非法入侵网站,加挂非法推广链接进行推广,随后从“海*网”黑产平台获利。截至案发时,该公司制作色情视频APP链接3400余个,发展挂链站长3400余个。

武汉警方打掉的雷胜科技有限公司,则采用编写木马程序,通过客户端、视频网站广告挂马,利用浏览器漏洞在PC端植入木马程序,静默安装软件推广获利。同时,该公司还涉嫌通过入侵教育类网站,修改网站内容链接用以推广色情诈骗类网站和APP,也即著名的“涉黄教材”案。

▲教材中被篡改为色情网址的链接

此外,色情诱导诈骗还会通过色情网站、直播聊天室、交友平台、APP捆绑、路由器及运营商劫持等多种途径进行推广。

四、不仅扣费,还会窃取个人信息

色情诱导诈骗除了通过诱导付费对用户的财产造成损失外,还会通过暗装扣费、恶意推广、捆绑木马等方式侵害用户财产,甚至非法窃取公民个人信息。

通常,色情APP在安装过程中会获取各种权限,其中就包含发送短信权限。一旦程序获取此权限后,就可以向特定SP号码发送短信进行扣费。 

▲暗装扣费

色情APP也可能捆绑恶意推广业务,一旦安装,会不断推送并安装其他大量恶意程序,严重影响手机的性能,甚至非法获取用户个人信息,造成其他损失。央视3.15晚会曾曝光过恶意扣费和推广手法。

▲恶意推广

色情APP同时也是最大的手机病毒源。

据《2017年Q1安卓Root类恶意病毒发展趋势研究报告》显示,Root类病毒藏身大尺度色情应用、仿冒切水果、疯狂动物园等热门游戏。其中色情应用约占Root类病毒的98%。

待用户下载安装后,恶意程序自动提权获得Root权限,随后通常会进行恶意扣费、恶意推广和盗取数据等行为,部分具有极强的破坏性,会篡改用户设备信息和破坏系统。

顽固木马通常具有极强的防卸载能力,一般的手机安全软件都无法彻底清除。

重点关注:欺骗宅男感情和钱财的黑产难逃法网

不得不说,色情诱导诈骗黑产团伙的法律知识真不是浪得虚名,制作团队剪辑出来的诱导性视频总能游走在法律关于“淫秽物品”的界定边缘之上而不过线,以此规避“制作、传播淫秽物品罪”的追究。

殊不知,整个黑产链条的每一个环节,无一不在法律的规制之中:

色诱诈骗团伙通过虚构商户身份获取支付接口,利用非法渠道进行推广,同时虚假宣传以牟取巨额非法利益的行为,构成刑法第264条的诈骗罪,诈骗金额超过50万元即可达到“数额特别巨大”标准,可能判处十年以上有期徒刑甚至无期徒刑。

此外,全黑产链条各个环节的参与者,除了可能构成诈骗的共犯之外,还可能分别构成以下犯罪:

1、在“APP开发与内容剪辑”环节中,为色诱诈骗提供网页制作等技术支持的不法分子可能构成《刑法》第287条之一“非法利用信息网络罪”。

2、在“收款渠道”环节中,提供虚假企业注册信息的不法分子可能构成《刑法》第280条第2款“伪造公司、企业、事业单位、人民团体印章罪”。

3、在“非法推广”环节中,不法分子为了巨额的不法利益可谓无所不用其极:

其中专门为恶意推广编写木马程序的不法分子可能构成《刑法》第285条第3款“提供侵入、非法控制计算机信息系统的程序、工具罪”;

通过恶意推广安装色情APP获取短信权限进行恶意扣费的,可能构成盗窃罪;使用网页挂马等非法手段进行推广的流量主可能构成《刑法》第285条第2款的“非法获取计算机信息系统数据、非法控制计算机信息系统罪”;

进行流量劫持的网站主可能构成《刑法》第286条“破坏计算机信息系统罪”;通过联盟平台进行广告投放的广告联盟可能会构成《刑法》第287条之二“帮助信息网络犯罪活动罪”。

另外,色情APP在捆绑恶意软件推广业务时,还可能同时构成侵犯公民个人信息罪。

总之,法律对于这群欺骗宅男感情和钱财等权益的黑产团伙,自然是不能放过的。

注:腾讯守护者计划安全团队协助警方侦破此案,本文由腾讯守护者计划安全团队供料,雷锋网编辑。重要的事情说三遍,雷锋网、雷锋网、雷锋网。

雷锋网