|新一代信息技术 信息基础设施建设 互联网+ 大数据 人工智能 高端信息技术核心产业
|高端制造 航空航天 轨道交通装备 海洋工程装备 新材料
|生物产业 生物医药 生物农业 生物能源
|绿色低碳 清洁能源汽车 新能源 节能技术 环境保护
|数字创意 数创装备 内容创新 设计创新
您的位置:首页 > 广告 > 独家内容
【独家|系列报道】这些AI技术值得关注
2017-07-14 15:07
来源:中国战略新兴产业

本刊记者 卜文娟 编辑整理

  全球科技巨头都对语音识别领域虎视眈眈,对此也都是投以重金。语音识别技术发展多年,在众多领域已经被广泛运用。国外上有苹果的Siri、谷歌的Google Assistant、亚马逊的Alexa等产品;国内有科大讯飞、云知声、盛大、捷通华声、搜狗语音助手、紫冬口译、百度语音等产品。
  市场研究公司Gartner已将人工智能列为2017年技术和产业发展的第一战略性技术,并预计2017年全球将有超过60%的大企业开始应用人工智能技术。
  据美国《纽约时报》网站5月27日报道,中国多年来一直羡慕地看着西方发明驱动这个数字时代的软件与芯片,如今,它也成了人工智能领域的一个重要玩家——有人认为这或许会是未来最重要的技术。专家们普遍认为,中国距离美国只有一步之遥。
  人工智能,发展速度之快,已经深入到我们的日常生活中,为我们的生活带来诸多便利。中国在人工智能领域已经取得阶段性成功。
  艾媒咨询数据显示,2016年中国人工智能产业规模增长率达到43.3%,突破100亿元,预计2017年达到152.1亿元,并于2019年增长至344.3亿元。人工智能的快速发展离不开技术的支持。本期就让我们通过语音识别、人脸识别以及视觉识别三种技术,管窥我国人工智能的发展之快。
  全球科技巨头对语音识别领域虎视眈眈
  随着移动互联网和人工智能的发展,基于语音的交互已经越来越重要、也越来越普及。《2017年度互联网趋势报告》认为,语音是最有效的计算输入形式,将成为人机交互的新范式。相比打字,语音交互的优势明显,人每分钟平均可以说150个单词,打字只能打40个。同时语音交互既简单又方便,一个麦克风即可解决,尤其适合物联网的场景。语音应用的三大场景是家里、车里、随手,更快更方便就是用户价值所在。
  全球科技巨头都对语音识别领域虎视眈眈,对此也都是投以重金。语音识别技术发展多年,在众多领域已经被广泛运用。国外上有苹果的Siri、谷歌的Google Assistant、亚马逊的Alexa等产品;国内有科大讯飞、云知声、盛大、捷通华声、搜狗语音助手、紫冬口译、百度语音等产品。
  报告中的数据显示,谷歌语音搜索量较2008年增长了35倍以上,较2010年增加了7倍以上。在美国,安卓平台上语音搜索占比高达20%。而科大讯飞发布的全球首个提供移动互联网语音交互能力的讯飞开放平台,截至2017年4月,日服务量超35亿人次,合作伙伴达到30万家,用户数超10亿。
  在这个节点,国内企业也把越来越多的注意力放在了智能语音助手上。也许,智能语音助手将成为下一个“风口”。腾讯AI Lab副主任俞栋表示,如今语音识别的四个前沿方向,包括更有效的序列到序列直接转换的模型、鸡尾酒会问题、持续预测与适应的模型以及前后端联合优化。
  其中,科大讯飞已经为超过6万个App,8.9亿终端用户提供了智能语音交互服务,据相关数据显示,科大讯飞在中文语音技术市场当中已经占据了70%以上市场份额,拥有20万开发者。科大讯飞开发的讯飞听见智能会议系统已实现普通话转写准确率95%以上,讯飞输入法可以支持昆明话、上海话、东北话、闽南话、合肥话等近21种方言识别。
  百度方面,去年第四季度,百度宣布已将Deep CNN(深层卷积神经网络)识别技术应用于声学模型的构建中。据称,这使得识别精度较之前提升了10%。紧接着,2016年11月22日,百度宣布旗下的百度语音在“安静条件下”的识别准确率达到了97%。
  华为方面,在今年的国际消费电子展(CES)上宣布计划给旗下的Mate 9手机美国版支持Alexa。华为智能语音助手瞄准苹果Siri、亚马逊Alexa、谷歌Google Assistant等竞争对手,将支持中文,面向国内用户。
  多个场景已使用人脸识别
  在生物识别领域,除了指纹识别,人脸识别和虹膜识别也是较为成熟的生物识别技术,其识别速度快捷、流畅,且应用广泛。而在中国,人脸识别开始越来越普遍。
  人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术。
  虽然隐私问题伴随着其发展,但是仍无法阻碍人脸识别在多个场景中的应用。
  今年青岛在高考上就首次用上了人脸识别技术保障高考安全。使用集人脸识别、指纹验证、身份证读取于一体的认证设备进行考生身份验证,让企图替考的考生“不能为”。验证一个考生的时间约为15秒,具体的流程是首先读取考生二代身份证信息,然后验证指纹,最后对考生进行现场拍照,与报名时的照片进行人脸识别的比对验证。
  其实,不单单是考试场景中的应用。在沈阳,人脸识别系统试运行的地铁站内,6组高清摄像头被分别架设在“乘客的必经之路”等重要位置,只要有人在设置好的摄像头下经过,将被连续拍摄20至30张不同角度的照片,与数据库进行比对,一旦相似度评分超过83分,系统会自动报警,据悉,系统运行了27小时后就抓到了两名网络通缉犯;在西藏,拉萨贡嘎机场、日喀则和平机场、林芝米林机场等所有民航机场均已完成安检口人脸识别系统安装并投入使用,旅客需经得起“测颜”才能顺利登机。拉萨贡嘎机场安检站副站长拉巴德吉透露,此前通过安检员肉眼识别比对旅客有效身份证件,非常耗时,现在人脸识别系统投入使用后,人均检查时间约为2秒,大大降低了核查时间,提高了旅客的过检速度;在济南,据济南市交警支队科研所副所长李勇介绍,在经十路舜耕路路口东口安装了两套行人、非机动车闯红灯自动抓拍设备,一套人脸识别抓拍系统上线了,路口安装的显示屏将会实时投送动态,一旦闯红灯就可以在显示屏上看到。
  而在日前举办的贵阳数博会上,支付宝蚂蚁金服给大家带来了一项炫酷的生物识别黑科技——刷脸支付,并证实“刷脸支付”正在从实验室走向现实商用,据悉,“刷脸支付”有可能不久之后就会在支付宝合作伙伴的门店上线。  

  在“刷脸支付”的实际应用场景中,支付宝会先通过活体检测算法进行检测(判断采集到的人脸是活体信息而不是照片伪造、视频伪造或者其他软件模拟生成的),再通过人脸识别算法识别身份。因此不会出现拿着别人的照片或视频就能冒用的情况。
  蚂蚁金服生物识别负责人陈继东表示,支付宝有着活体检测和人脸识别算法,并结合多因子交叉验证和安全风控策略进行决策,能够保障账户安全。
  支付宝蚂蚁金服总裁井贤栋表示,刷脸支付会越来越成为一种趋势,更多人的生活,用生物识别特质进行便捷支付,未来相信人们出门什么都不用带,就可以无时无刻,随时随地非常放心安心的支付了。 
  视觉市场增速将保持在20%以上
  时至今日,机器视觉技术的应用范围还在逐步扩大,已由起初的电子制造业和半导体生产企业,发展到了包装、汽车、交通和印刷等多个行业。
  从工业机器人、安防监控和工业检测再到虚拟现实、自动驾驶汽车、机器人、智能城市和物联网等,机器视觉在应用领域的存在感越发增强。全球互联网巨头加速布局更看中了该行业无限广阔的应用前景。
  国外知名巨头在机器视觉行业的布局尤为迅猛。苹果收购了印度机器视觉公司Tuplejump;英特尔收购了俄罗斯计算机视觉公司Itseez用于无人驾驶;就连亚马逊公司也收购了一支欧洲顶级机器视觉团队用于无人机领域研究。
  纵观我国产业发展历程,中国机器视觉相关产业起步较晚,经过多年发展,国际知名品牌纷纷在中国开展业务,中国本土的企业也逐渐兴起,出现了一批具有一定实力的机器视觉研发生产企业。
  根据前瞻产业研究院发布的《机器视觉产业发展前景与投资分析报告》数据显示,2015年机器视觉市场规模达3.5亿美元,占全球8.3%,增速达22.2%,位居全球首位,中国已成为继美国和日本之后的全球第三大机器视觉市场。2016-2020年,中国机器视觉市场增速预计将保持在20%以上,将达到十亿美元级的市场空间。
  在6月10日举行的云栖大会·上海峰会上,阿里云正式发布了“图像识别”和“人脸识别”两款视觉智能服务,将视觉智能技术分享给更多的开发者。阿里云的人工智能ET采用了世界领先的深度学习技术,在全球权威机器视觉算法测评平台KITTI中,ET的成绩稳居世界第一。它可以实现对通用图片的识别,准确度达到96%以上。水果、蔬菜、交通工具、植物、动物等上千种物品的对于ET而言都不是问题。ET还可以识别出物体所在的场景,比如在室内或者草地、天空。据了解,阿里云的视觉识别服务还包括视频分析、视觉设计、工业诊断、医疗诊断等。孵化成熟后,这些产品将陆续推向市场。
  英特尔首席工程师/高级研究总监、英特尔中国研究院认知计算实验室主任陈玉荣曾表示,当今,视觉识别技术无处不在,且成本越来越低廉。这得益于视觉识别技术在深度学习方面的不断突破。其中一个主要的推动力是视频内容在互联网所占比例越来越高,大量的互联网数据都是视频内容。预计到2019年,互联网内容中的77%将由视频组成,视觉媒体公司的数量将会继续增加,视觉内容数量也会持续增加。

本文系原创文章,首发于2017年7月1日《中国战略新兴产业》,为“喧嚣过后的人工智能如何落地?”系列报道中的一篇。如需转载,请预先与杂志社联系,并在转载时标注文章作者及来源。
关注微信公众号:

关于我们 | 联系我们 | 广告刊例 | 订阅服务 | 版权声明

地址(Address):北京市西城区广内大街315号信息大厦B座8-13层(8-13 Floor, IT Center B Block, No.315 GuangNei Street, Xicheng District, Beijing, China)

邮编:100053 电话:010-63691650 传真:010-63691514 Post Code:100053 Landline:86-010-63691655 Fax:010-63691514

Copyright 中国战略新兴产业网 京ICP备09051002号-3 技术支持:wicep