中国电子视像行业网

晶晨半导体市场总监 康立伟先生分享《芯片技术前沿动态》

    虽然芯片制造涉及数百种技术、上千种材料,但在行业人士的共同努力下,中国在芯片制造技术上的突破如今已经正式开始。下面,让我们有请晶晨半导体市场总监 康立伟先生,为我们带来《芯片技术前沿动态》的分享,让我们用热烈的掌声欢迎康总!

        康立伟:大家好,首先感谢组织方提供这么一个机会,能够跟各位一起来交流和分享,我是来自于mlogic晶晨半导体的,我跟大家分享三部分内容,分别是我们是谁,我们正在做什么,将来我们要做什么,主要围绕这三个主题,我们将来要做什么,如何迎接我们整个人工智能这个时代,我们作为芯片公司,能够为大家提供什么然后助力整个产业的发展。

        我们公司是晶晨半导体,是1995年成立的,22年来主要是围绕着音视频编解码这个领域的发展,现在大概有500多个人,我们的主要产品是这些,现在我们公司一共有三条产品线,一条是机顶盒OTT产品线,大家一听说晶晨就说机顶盒,目前在这个产品的占有量是第一的。还有是智能电视机主控,现在在国内还有一些海外的电视机品牌里都在使用我们的主控。盒子像小米、阿里还有一些国内的运营商的机顶盒,在座的各位可能在座的机顶盒很有可能一大部分芯片是我们出的。2016年我们专门成立了一条产品线叫智能家居产品线,这条产品线就是类似于WIFI音响的产品还有一些视频的产品,这个是我们在做什么。

        今天的主题是人工智能的风口,现在随着人工智能尤其是深度神经网络算法,给我们整个行业带来一个翻天覆地的变化,实际上归根到底就是两个方面,一个就是我们的自然语言处理,另外一部分是图像识别、语音交互,像智慧医疗智慧交通我个人的理解基本上是围绕这两个领域,因为围绕这两个领域有一些技术上的提升。语音交互跟大家契合最紧的就是智能服务机器人,我们做售后服务的时候,在聊天的大部分都是机器人,不是真人,这个大家都知道。另外一个是,2017年可以说是一款现象级的产品,小米阿里都发布了WIFI音响,我们也会说一下我们的思考。另外是视频的东西,这个更容易理解了,因为这个神经网络算法最显著的第一个是分类,另外一个是标注,所以在我们的视频包括一些人脸识别还有一些图像识别方面,对于一些特征分析取得的进步会非常大,我们原来更多的是一些基础的人脸识别,可以想像你后面可以提取更多的特征出来,穿什么衣服,戴没戴眼睛有没有头发,很容易识别出来了,这些技术的进步带来我们更好的产品的体验,那我们就着重说一下今年市场情况还不错的WIFI音响的产品,不管是谷歌还是亚马逊还有国内的产品都发布了WIFI音响。它的卖点就是四类,就是听音乐,刚需,语音交互,另外一种就是智能控制,控制家内的家电,还有一个智能提醒功能,设置闹钟,还有一部分是其他的比如购物,打车,外卖,这些产品的卖点实际上归根结底就是一个基础的语音交互。

        音响只是一个品类,现在越来越多的产品品类,包括电视,人机交互,电视里面包括一些智能家居里,还有一些机器人、灯,很多的产品品类归根结底对于我们芯片公司来说,第一个是要有个麦克风,能够拾音,另外要有喇叭输出给你做交互,围绕这些基本应用,对我们芯片公司来说主要总结了三点,第一个麦克风,它有很多种类,有模拟的有数字的,数字的里面有各种接口的,PDMTDM,我们的芯片选择了PDM作为接口,第一数字麦克风抗干扰性比较强,因为在我们的产品里,产品种类各种各样,麦克风走线也是长短不一,数字麦克风比模拟麦克风抗干扰性要强,对于我们原厂语音识别,做算法的公司肯定对这个深有体会,会使语音识别下降很多。还有就是设计简单。这个是我们对麦克风入口的理解,另外一块是CPU的性能,我们要做原厂语音,需要有很多的算法要在CPU里面跑,本地降噪的算法包括换道引擎都需要在CPU里跑,算法复杂度不一样,引擎的模型也不一样,这些都会影响整个产品最终的体验,还有就是一些因为我们毕竟要拿它来听音乐,还有一些高的音乐视频文件还有一些复杂的网络协议,所以需要CPU。另外就是高级程度,不可能是一个芯片打天下,拿原来的平板电脑的芯片或者原来OTT的芯片做一个芯片出来,这个成本肯定是不划算的,里面有很多用不到的东西在里面,但是现在业界很多产品都是用原来的芯片在做,确实存在这样的问题,这是我们的认知,在成本上第一个Linux base,原来很多的服务还是用(英文)系统,配合是比较完善的,大家为了快速出一款产品就用(英文)来做,后来的发展我个人认为一定是Linux base的,因为不管语音助手是什么样的产品都理解为语音助手,最终的产品形态可能不一样,最终语音助手不像我们一个产品线,不像我们现在用的手机,将来要装很多APP在里面,所以你这个系统的可扩展性要求比较高,这种产品往往很多都是在云端交互的,所以要用Linux base,另外系统集成度要高,低成本,这个是我们从总体的芯片的概念说的。

        神经网络算法对智能终端的影响,因为都是在后台做的再反馈出结果,终端你听到的都是在云端处理过的结果。对于我们芯片公司的认知,是能不能把这些神经网络的东西放到本地做,这样做了以后对这个产品能带落什么东西,这是我们思考的,一方面对音频跟视频分了两部分,音频就是语音助手这一类,不管是在电视里还是在音响里面空调里面,这种语音助手的产品,第一个神经网络的东西归根结底说白了最简单的东西就是使语音唤醒引擎更高效,就可以在单独的模块里跑,不再在CPU里跑,包括响应速度都会有比较大的提升;另外可以完成固定词条本地语音识别,现在大部分的语音都是在云端做,然后再反馈回来。如果我们加了神经网络的东西,可能我们本地的一些语音常用的一些词条,比如说开机关机,开灯关灯这些常用词条本地就可以识别就可以执行指令操作下去,所以对整个产品体验会有提升;还有是本地提取特定声音特征,再是降低系统功耗,功耗这块一会儿还会有一个介绍。食品类的东西,前面那个嘉宾在手机上做VR显示,基于本地的图像,首先要有本地的图像进来,如果加上神经网络这些东西,这个效率就会比在手机CPU里跑效率会提升很多,一些特征就会很快的提取出来。还有就是对芯片的功耗都会有一个非常大的帮助。

        以语音助手为例这个是主控发展方向,低功耗,高效率加本地识别,低成本。多级的待机机制,作为一个语音助手必须要24小时工作的,包括市面上见到的很多产品,实际上它并没有进行待机,CPU一直在跑,功耗会增加,也会影响产品寿命,我们就提出多级待机的概念,比方晚上睡觉了,周围的环境包括家里的环境是很安静的,系统会进行深度睡眠,深度的待机。另外一种情况有声音,过了一个小时或者两个小时这个可以设,如果没有声音也可以待机进行监听状态,还有一种是正常的工作,这个就需要我们应建立分模块地实现这些功能,将来把这些接口开放给做产品的这些厂家,就可以实现这个功能,这个是从待机方面来说。另外一块就是专用的模块干专门的事,因为我们语音助手这些产品很多东西帮助降噪的东西还有模型都是统一放在CPU跑,效率非常低,像模型可以放在神经网络里跑,效率就会高,对功耗都会有比较大的提升,也会带来产品体验的提升。

        要降低功耗就是芯片制成,制成要好。再就是芯片更高的集成度,挂个电源可能就直接可以工作了,这个是我们认为新一代智能语音助手芯片的一个大概发展方向。

        这个是我们公司智能家居的产品,从2016年开始,到现在我们已经发布了三款芯片,A111A112A113A113产品是为类似于智能音响开发的芯片,2018年我们还有更新的产品规划出来。

        这个是我们现在已经发布的用我们芯片做的产品,包括这个小米WIFI音箱非常亲民,这个用的是A112的芯片,包括一些机器人,我们统称为智能语音助手,第四季度陆续还有一些产品包括海外的产品也用我们的芯片发布。

        作为芯片公司真的是非常苦,也是希望跟产业链里的各位同仁能够做一个深度的合作,为我们中国或者全球的智能发展做一些贡献,谢谢!