【猎云网(微信:ilieyun)北京】4月13日报道(文/西龙)
今天,猎云网"2017人工智能产业创业创新峰会"在北京四季酒店隆重召开。此次峰会的主题为“精·识·致·用”,分别诠释为精准大数据,智能识别,产业结合,生活应用。上百位人工智能领域著名学者、顶级专家和知名投资人参与,共同探讨当今AI的发展创新与变革,将产业与人们的实际应用相结合,为人工智能的普及奠定可行性的基础。
云知声CEO黄伟发表了关于“人工智能如何促进产业化驱动”的主题演讲。在他看来,人工智能一定跟行业需求结合,一定打通数据和应用的闭环,只有这样数据和技术才能形成双轮驱动。
而对于人工智能,他表示,“其实人工智能这个概念提出来已经61周年,那么前两次为什么失败了?当然我们有很多解释。比如说当年产业环境不成熟,我们没有数据我们没有处理能力,我们没有好的算法”。
但是他认为第三次人工智能的高潮和前两次不一样。“一个外在的表现是什么?过去两次人工智能的高潮都是学术体系在主导,或者是学术界的集体自嗨。这次不一样,这次热潮是工业界引导”。
“有人问我人能不能和机器谈恋爱?我觉得我有生之年是不可能的,那种强人工智能,通用人工智能离我们很久远”。
在黄伟看来,当技术能力达到一个临界点,意味着颠覆的机会到了。比如说语音识别,语音识别的准确率已经超过人耳,视觉方面,人脸识别也超过了眼睛。“最近几年,我们在机器翻译、视觉、语音识别、自然语言理解,几乎所有的领域取得的突破,比过去二十年三十年都要大”。
黄伟在演讲
以下是黄伟的演讲实录,内容经猎云网整理:
人工智能如何促进产业化驱动?其实从AlphaGo这个事儿之后,这个热潮到今天为止已经一年多,一年期间我们不仅看到行业内部,也看到资本市场甚至大爷大妈都在做人工智能,今天大家一见面,如果嘴巴里没有一个人工智能这个词你感觉已经Out了。但是过去一年我们生活发生了什么改变?好像也没有什么。其实人工智能这个概念提出来已经61周年,那么前两次为什么失败了?当然我们有很多解释。比如说当年产业环境不成熟,我们没有数据我们没有处理能力,我们没有好的算法。
但是有一个共同特点是什么?是人工智能在过去的两次高潮和低谷的时候没有满足需求。我们的期望值和现实能力之间是有巨大差别的,市场对能力的期待总是有时间窗口,在一个时间之内达不到,公众的热情就会散去,所以我想谈的就是,人工智能如果不能落地的话,那就真的是幻影。这一年我们作为从业者如履薄冰、战战兢兢,有人问我人能不能和机器谈恋爱?我觉得我有生之年是不可能的,那种强人工智能,通用人工智能离我们很久远。
这张图简明扼要的列出了人工智能的要素。第一是大数据,第二是机器学习算法,第三是我们今天拥有的,历史上不可比拟的计算能力。这三个要素相当于一个火箭飞向太空,需要有燃料,有耐高温的平台还有大引擎,三个缺一不可。深度学习出现之前,统计学习垄断着机器学习这个领域。统计学随着数据规模的增加,它的性能会有一个饱和度,就是不再增加了。但是深度学习恰恰可以增加,它可以把CPU、GPU以及超算能力非常完美的结合在一起,但是深度学习是一个黑盒子,我们知道它好用但是不知道为什么好用?我相信深度学习往下走,依然会遇到它的天花板。
前面我泼了冷水,大家觉得人工智能是不是没有什么期待?但是第三次人工智能的高潮和前两次不一样。一个外在的表现是什么?过去两次人工智能的高潮都是学术体系在主导,或者是学术界的集体自嗨。这次不一样,这次热潮是工业界引导。比如我们参加,无论是视觉、音频的国际学术会议,你会发现最好的讲解者都是来自谷歌、亚马逊顶尖的工业界。今天看到谷歌研发TPU,英伟达的股价翻了好几倍。那么芯片的目的就是用标准化的,非常低成本的方式来满足需求,所以这是和前两次非常大的不同。
那么之所以不同是因为深度学习、增强学习这些新技术出现,再结合互联网、IOT能够让我们获得海量数据,使得我们在机器翻译、视觉、语音识别、自然语言理解,几乎所有的领域里面我们可能最近几年取得的突破,比过去二十年三十年都要大。比如说语音识别,语音识别的准确率已经超过人耳,视觉方面,人脸识别也超过了眼睛。那么当技术能力达到一个临界点,意味着颠覆的机会到了。
所以我们可以看到在很多领域,比如识别、医疗、券商、互联网大数据、教育、银行保险等各个领域,其实机器学习不是说简单的提高效率,我们甚至可以改变整个行业。我们一般会需要速记,但是以后不需要了,因为今天的讲话会实时生成文字,那么意味着速记这个行业被颠覆了。还有很多领域,比如把机器学习用在金融和投资方面,它可能取得比我们交易员更好的一个交易结果。
这个图是过去61年里面人工智能的发展,一个大的脉络图,我们可以看到前两次的高潮、寒冬、高潮、寒冬,其实一个很有意思的事情是什么?我们今天都知道深度学习有一个大神,就是Hinton教授。我想说一点,我们云知声在2012年12月底的时候,我们把基于深度学习的引擎上线,做了第一个插件,上线一周激活用户超过五万,可能很多用户当年用过深度学习,你们感觉到了吗?没有。到AlphaGo事件之后我们看到很多大学很多机构都在说深度学习,其实深度学习对我们的改变,就是从2006年Hinton教授开始做深度学习,微软第一次把深度学习用在工业领域里,我们还是领先的,我们2012年把深度学习工业化上线。直到今天深度学习几乎改变我们所有行业。
前面听了几个嘉宾的讲话,我今天用一些话跟大家讲,我希望今天让大家明白什么是人工智能?什么是感知认知和表达决策。什么感知?图像识别是把图像IP化。认知,比如自然语言,还有决策、推理,这些都是和人的思维接近,但是又很难做的。还有一点是表达,我们用例子来举例。比如语音识别,感知就是从识别开始的。认知就是我来理解你文字里面到底什么意思?表达是什么?我通过推理让机器自己组织语言然后把这个表达出来。
视觉方面是什么?比如摄像头我监控这个区域,我通过感知技术来识别每个人的面孔,然后把它ID化,如果ID跟黑名单匹配,那么说明这个人是一个嫌疑犯,这时候表达是什么?公安局来抓人,这就是表达,其实就是这么一个过程。当然这里包含的点非常非常多。这是我们在过去几年里面我们的技术框架的大概进展,我们刚成立之后我们第一代版本我们用的并不是深度学习,是统计学习。就是非常传统的统计学习,当时我们比较好的一点是我们几乎当时在国内,基于统计我们把性能做好极致,我们用友商四分之一过程五分之一的数据量,达到比对方更好的性能指标。统计学习是一个环节一个环节套一起,我学生时代就是做语音识别,所以以前的经验起了很多帮助。深度学习就是你有数据有GPU,可以得到很好的数据。
我们当时在国内应该是领先这个行业,基本上国内领先这个行业,我们率先发出一个基于深度学习的引擎。今天我们已经3.0版本,不光是感知层面而且是认知层面,识别精度、识别速度都比过去有非常大的提升。这是算法层面,另外就是计算能力。其实技术的PK,某种意义也是一个竞赛。你不可能指望一个团队用非常少的数据非常少的计算单元能得到和巨头能够匹配的性能,这是不可能的。所以说在过去五年里,其实我们不光在算法方面,在优化迭代和超算能力,在数据量方面做了很多储备。比如说在2015年我们发布了我们的操作平台,在当时那个时间我们链接接近两百个GPU,这个数量级可以跟国内行业巨头去PK的,去年9月份我们发布了分布式操作系统,一个是硬件一个是软件,可以非常好的结合在一起。
另外一点是作为一家创业公司,我们很早意识到数据的价值,公司成立三个月我们发布完全免费的开放语音平台。到今天云知声的语音云服务已经接入超过一亿台设备,这个为云知声往后面的发展做了非常好的数据方面的储备。那么人工智能和商业是良性循环,人工智能一定跟行业需求结合,一定打通数据和应用的闭环,只有这样数据和技术才能形成双轮驱动。这是为什么我们先从行业切入的主要原因。
人工智能其实是一个很炫的东西,很虚,它是一种能力,是一种赋能,和行业结合,它一定需要一个载体。我们当时在国内提出云端芯的概念,今天看到几乎所有大公司小公司都接触这种概念都这么做,我们通过一种芯片的能力提供给大家。这是我们的商业逻辑,一纵一横,一纵就是我们一定在一个领域里面,从技术层面,无论是云端服务、终端服务还是芯片,从软件到硬件打通,形成技术壁垒。一横,我们希望把准化的技术和服务能够同时覆盖若干领域。今天我们主要是两大方向,一个是智慧生活一个是智慧服务。智慧生活我们是以智能家居、车载为主,智慧服务是以教育、医疗为主。
这是过去一两年我们取得商业上面的进展,我们知道亚马逊的Echo让大家了解这是未来一个标准化的形态。我们看到很多故事但很少看到落地,今天我们在国内做到,这些都是量产车没有是概念车。这是从去年开始我们和格力、美的,国内所有的家电巨头,在今年所有厂商都拿到云知声的产品,这些都是已经量产的设备。类似这样的产品我们做了一个方案把它提供给厂商,你可以认为每个空调设备都是这样的,去年一个技术出货量就是20万台。
右边是我们从2014年底我们做车载,我们开始切入后方车载,车载就是AI服务+AI UI,在后端云知声的方案有接近70%的市场份额。下面可以看一下两个视频。
(播放视频)
第一段是空调控制,大家看到很简单,但是实际上很难。为什么很难?因为刚才类似于Echo的识别,只是用现有的芯片,这是今天在工业界的最高标准。后面是类似Echo,比如多轮对话、打断对话。我再强调一下AI和产业结合,成本是你必须考虑的问题。比如做一个特别复杂的云端系统,我只要拼数据拼资源,这是比较容易做到的。但是有限资源的情况下面达到这样的效果是必须难的。
另外是智慧生活,我们首先从医疗切入。我们去年和协和医院我们把语音技术应用在医院的病历录入里面,很多人不知道这个东西怎么用?我们可以看一下使用场景。
(播放视频)
可以看到医院里面医生的工作环境比较恶劣,一个房间里面很多医生还有病人。第二个,如果我们见过会议记要系统,说的都是人话,但是医生讲的都是大量专业名词,这是非常难的。目前为止云知声是国内唯一一家把语音系统在医疗行业里面实际落地,今天我们从去年7月份之后,我们目前在国内已经落地了30多家三甲医院,今年国内有一百多家医院使用云知声的系统。这个系统第一极大的提升医生效率,使得协和医院病人录入时间从三个小时节约到一个小时之内。
我们以前很多是用复制的方式,但是这样会产生大量的错误,有80%是来自拷贝。我们讲医疗大数据,哪儿来的数据?一个医院今天有一万病人,9800都是复制过来的,我们有大数据吗?没有,但是通过这种方式我们每天可以产生大量的真实数据。协和医院已经全面部署,大家可以看到很多科室协和医院用这种方式给大家录病历了。
我们怎么用技术和行业结合,让社会看到人工智能的威力,另外一点通过技术和商业结合,使得数据和技术之间能够形成一个正向反馈。今天我们每天可以源源不断的获得大量医学上面的数据,一方面使得云知声在这个领域技术门槛越来越高,另外一方面使我们可以给用户提供更好的服务。
我们今天做的所有工作我们使得每个设备变得更加智能化,类似我们从09、2010年我们将功能机向智能机过渡,但这个单机智能到最后一定会过渡到点滴智能,每个设备有感知能力有认知能力,而且设备之间有互相学习能力,只有这样才是真正的万物互联。这是今天我们从业者我们努力的方向我们想做的事情,我觉得这些方向如果我们真的能够,不是在云端我们每天去讲故事,而是我们真正把它落地,这个方面我们可以脚踏实地的往下走。这就是我的分享,谢谢大家!