刚才说的视觉感知方面我们有了一些进展,因为我们要面向这种智能家居,只是视觉感知还是不够的,我们在语音和语义方面也有不错的进展,比如说我们的一个系统部的同事打造了多姿多卡进行了系统打造。当前云识别的错字率能降到1%的情况下,它能比较好地支持比如说语音的输入,比如说语音的搜索和基于语音的对话。另外一个也是今后学习的方向,就是语音的唤醒,因为对于这种智能硬件,像手表、智能摄像头还有其它智能设备,语音唤醒是非常重要的。
当前生产出来的模型大概是千分之一的不通过率的情况下,能达到百分之一的及时率,对于这种产品的应用已经有很好的铺垫。
同时除了这一块之外,在大数据方面公司也有很好的积累和铺垫。比如说我们企业安全部的同事,他们用堆栈式的服务,他们对于这种网络上的网络流可以进行协议的识别和应用的识别,比如说你在网站上随意截取到一个网络流,是不是可以预测出它是用什么样的协议发送的,是不是可以预测出它是用什么样的运程发送的。这种基于互联网的信息是非常有价值的。
人工智能特别是基于深入学习的人工智能,可能现在训练的平台的出现已经变得非常普及了,公司的技术从0到1的转变是非常可能的,但是公司人工智能或者技术的发展最关键的是怎么样能让技术有一个比较好的壁垒。360最近有两个重点,第一个重点是我们要重点发展端上的智能,因为这种端上的量肯定要比云上的量高很多,而且有各种端出现。
要发展端上的智能化有两种方式,第一种方式是你可以用编译的专用的芯片,我们要想想在中国的这种大环境,这种智能硬件低价的大环境情况下,如果用这种编译的专译芯片当然是一种方式,但是总的来说它肯定会让产品的价格有大幅度提升。我们认为这种编译的专译芯片绝对不应该是唯一途径,也就是说应该让端上的技能真的建立一个技术壁垒的话,你要在算法上真正意义上降低计算量。
打比方说1×1的卷积,它就能帮助你去设计这种高效的网络。首先比如说最近的微软的产品,如果256级做3×3的卷积就是9的量级,如果你能用1×1把256做成64家,就有4×4的降低,这对于端上是非常有价值的。
另外一方面在这种有损失的情况下怎么样减少计算量,在工业级上应用的可能比较少,但是在端上微损是可以接受的。
另外一方面其实这种端上的小的模型,可能它的精度上会有损失,但是如果你的企业的运用有很多的大数据的话,那么大数据在某种程度上就能密度这种精度的损失。当然,这些信息绝对不会成为技术壁垒,真正的技术壁垒是有什么方向不减少技术的情况下有精度的提升。这也是我们360研究院在极力发展的方向,这是非常高技术壁垒的方向,但是我觉得对于中国的这种特定的环境下是非常重要的,也就是说奔跑在CPU上的编译绝对是以后端上非常重要的发展方向。
另外一个非常重要的方向,是怎么样让人工智能的系统具备自学习的能力。一方面对很多的应用,你真的是没有办法标注,比如说做自动驾驶,一般的企业来说没有办法真正搜集到各种场景下的数据。如果你的系统在运行的过程中能够自我自主地学习、自主地搜集这些信息的话,那么它的性能肯定就可以逐步增强。但另外一个方面来说,在端上我们只能有轻量级的计算,如果我们能自主学习的话,之后就可以保证在端上可以达到计算,因为个性化服务不是服务所有的人,这样的话小模型就有比较好的针对性。
另外自主学习完全有自主性,一方面当一辆车在路上行驶的时候,我可以根据上下文推导出哪些是人,哪些是车,车辆检测,特别是家里的机器人,这个机器人可能一开始应用的时候负担家里所有的,但是如果逐步积累一些位置检测出一个人,如果能把这些样本当做了增益样本的话,那么机器人的这种性能就会更加自主地增强。我们的目的是希望最终这些物联网的产品有自学习的功能,最后变成懂我的互联网的产品,而不是互联网的产品到你家里之后,就变成一个Fix的东西。
最后做一个小的总结,在360这种大安全的策略上,现在人工智能技术已经逐步地运用到公司的很多产品中,同时也进一步证明了人工智能这种技术有很多新的产品的形态正在打磨,我也敬请大家期待360有更多的人工智能的产品服务于普通的老百姓。谢谢大家!
2022-09-14 09:46
2022-09-13 10:12
2022-02-02 05:12
2022-02-02 05:10
2016-04-16 06:03
2016-04-16 06:02
2016-04-16 06:00
2016-04-16 05:55
2016-04-15 06:27