您的位置:首页 > 资讯 > 行业动态 > 正文

从技术端和应用端把握服务机器人高景气发展趋势

2017-01-16 07:22 性质:转载 作者:华强电子网 来源:华强电子网
免责声明:中叉网(www.chinaforklift.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
2015 年全球专业服务机器人市场规模46 亿美元,个人/家庭服务机器人市场规模22 亿美元,2016-2019 年有望迎来持续快速增长。IFR...

  2015 年全球专业服务机器人市场规模46 亿美元,个人/家庭服务机器人市场规模22 亿美元,2016-2019 年有望迎来持续快速增长。IFR(International Federation of Robotics,国际机器人联盟)将服务机器人划分为专业服务机器人和个人/家庭服务机器人。根据IFR统计,全球专业服务机器人市场2010-2015 年CAGR 为5.1%,个人/家庭服务机器人市场同期CAGR 为33.6%。IFR 预测,2016-2019 年,全球专业服务机器人市场将累计销售231亿美元,个人/家庭服务机器人市场为242 亿美元。据此测算,2016-2019 年,专业服务机器人市场CAGR 为9.4%,个人/家庭服务机器人市场CAGR 为45.0%。
  技术端:机器人智能性达到商用水平,API 与模块化加速产品研发迭代
1 深度学习大幅推进服务机器人的智能性
  深度学习是人工智能发展的重要里程碑,推动语音交互和图像识别领域的快速发展。从1956 年达特茅斯会议开始,人工智能发展已历经3个阶段。(1)第一阶段:推理期(1956-1960s)。这一阶段的主题是将逻辑推理能力赋予计算机系统,主要成就是开发出自动定理证明系统等;(2)第二阶段:知识期(1970s-1980s)。这一阶段研究人员致力于将人类的知识总结出来并交给计算机系统,主要成就是开发出了专家系统;(3)第三阶段:学习期(1990s 至今)。研究者试图让计算机自己学习知识,这一阶段的重要突破是深度学习的提出和发展。Hinton 在2006 年提出了深度学习算法,2012 年Hinton 的团队利用深度学习算法在ImageNet 上大放异彩。随后深度学习获得业内广泛关注,同时吸引IT 巨头的持续巨额投入,进而推动了语音识别、图像识别、自然语言处理等领域的高速发展。
  语音交互正在成为服务机器人人机交互的主流技术之一。人机语音交互的方式更类似于人与人之间的交流模式,目前服务机器人产品大都采用语音交互模式。国内服务机器人主要采用科大讯飞、百度、思必驰、云之声等企业提供的语音交互模块。苹果、谷歌、微软、亚马逊、Facebook、IBM 等IT 巨头都已经布局各自的语音识别技术。

表1:巨头与初创型企业扎堆语音识别领域
  得益于深度学习技术,语音识别取得长足发展,目前在某些领域已经接近甚至超过人类。从1970 年开始,语音识别技术发展迅速,机器识别单词数量呈指数式增长。目前,各主流语音识别平台的单词识别准确率均已超过90%。2016 年10 月,微软语音识别技术在行业标准Switchboard 语音识别任务测试中,实现5.9%的错误率,已经达到专业速记员的水平。
  图像识别能力已达到人类水平。图像识别能力同样是服务机器人人机交互领域的重要组成部分。2012 年,Hinton 的团队利用GPU 训练神经网络模型,将错误率由26%大幅降低至15%。此后,错误率逐年下降,到2015 年,微软亚洲研究院计算机组的错误率已经低至3.6%,而人眼识别错误率为5.1%。
2 API 和模块化提升服务机器人产品的开发和迭代速度
  API 和模块化提升服务机器人产品的开发和迭代速度。服务机器人的智能模块包括感知交互、认知决策、定位导航、运动控制等,技术跨度范围极大。服务机器人初创企业一般最多只能对其中某一个模块有深入研究,甚至许多初创企业只做平台集成。在这样的背景下,人工智能技术的API 接口开放和核心零部件的模块化,无疑大大降低了服务机器人厂商产品开发和迭代的难度。目前,在服务机器人核心技术环节涌现出一批优秀的企业,推动服务机器人集成产业走向成熟,使得服务机器人集成商可以将精力投入到产业化应用和商业模式的探索中。
  人工智能API 让服务机器人厂商能够借助外部力量实现产品的智能性。目前已有大量的开放的人工智能API(Application Programming Interface,应用程序接口),范围包括(1)机器学习和预测,(2)图像识别,(3)文本分析、NLP 和情感分析,(4)机器翻译,(5)语音识别。互联网巨头也开始加入开放人工智能API 的阵营中。2015-2016 年,谷歌陆续推出Google Cloud Vision API 和Google Cloud Speech API,其可被应用于软件或设备中。
  连接上这两个API 的设备可以将图片和语音上传到谷歌云端,经过云端处理后,会返回需要识别的图像和语音内容。微软开放的API 包括表情识别、语音识别、视频识别等。人工智能API 接口开放大大降低了服务机器人厂商实现产品智能性的难度。


表2:大量的人工智能API 降低了服务机器人厂商实现产品智能性的难度

上一页1234

网友评论
文明上网,理性发言,拒绝广告

相关资讯

关注官方微信

手机扫码看新闻