中国电子视像行业网

科大讯飞AI研究院副院长 王士进先生分享智能终端的创新技术和应用

    2017年人工智能领域表现最突出的就是科大讯飞。语音技术是人工智能的入口,而科大讯飞又是语音技术的领头羊,因此备受资本市场追捧。接下来,让我们有请科大讯飞AI研究院副院长 王士进先生,与我们分享智能终端的创新技术和应用。让我们用热烈的掌声欢迎王总!

        王士进:非常高兴能够在这个论坛里给各位来宾分享一下科大讯飞关于人工智能一些技术的进展以及人工智能的实践经验,我们也是认为人工智能真正要跟应用、产业、行业结合才是一个真正有用的技术。人工智能从1956年提出来到现在有60多年的时间,经过两次的黄金期和低谷期,第三次产业浪潮过来以后,无论是从技术发展和应用的深度和广度还是影响各个行业来说,我们认为人工智能这个时代确确实实已经到来了。

        2017年不仅仅是中国,中美日韩都把这个列为自己的目标,强化学习基于深度学习列为第一大技术突破,并且在很多行业有应用。关于人工智能技术我们称之为三个阶段,第一个阶段称之为运算的智能,第二阶段感知智能,第三阶段认知智能。对于感知,是希望计算机模拟我们的听觉和触绝,可以通过文本通过目标人一小时的语音,能够非常逼真的把目标人的声音模拟出来,在很多硬件的交互里会非常有帮助。第二部分是语音识别,能够把我们语音的内容识别出来,从广意上来说包含更大范畴的东西,不仅仅是语音内容,谁说的,说了什么语音,他说的时候是高兴还是不高兴,这样在语音交互在机器人家居场景里都会有帮助,这个是讯飞从2011年开始上语音,在去年的时候整体项目进展,从60%做到95%,这里有两点贡献,第一点是深度学习的算法在突飞猛进,第二是移动互联网使得大量的数据可以得到学习。这个是我们在去年参加的2016年谷歌组织的Challenge的比赛,将来在应用的时候就是在真正的原厂噪音比较大的时候组织一些算法,就是基于这种产品进行的测试,科大讯飞在这个比赛里也获得了第一名的成绩,同时我们把语音识别合成技术和翻译的技术进行了结合,我们参加了20132015NIST的比赛都取得了非常好的名词。我们从2014年开始起,我们在人工智能方面也做了很多的工作,我们在2014年承担了科技部类人答题这个项目,希望通过人工智能的进展,我们当时定了一个小目标就是能够参加北京文科考试能够考上一本,这里有很多知识怎么构建推理方面的工作,用这个工作我们作很多行业里做了很多工作,我们在很多行业里通过这种认知学习顶尖的行业的专家知识,同时学习我们这个行业复杂的数据从而能够达到一流专家或者普通专家的水平。

        我们认为AI+时代改变世界的因素,第一个是行业专家,行业大数据,通过整体的技术能力改造包括我们的教育、医疗、城市、家庭等很多场景。比如教育,第一点自动阅卷,能够把考生语音输入的或者是原来书写的能够通过语音识别或者手写识别进行识别后,能够模拟老师怎么判分怎么批改,机器学习这些经验从而实现精准的评判,所以说我们无论在几个省的高考里还是我们的验证里,我们都发现这样的技术会超过人工专家的水平。我们把整个学习过程的数据能够做一个常态化的采集,并且围绕着采集,刚才电视里有很多推荐的内容,其实在教育里也有很多,怎么围绕全过程的过程对学生进行精准画像,同时围绕老师、学生、家长,怎么去做整体的精准推荐,比如老师讲课时,怎么通过这样的信息使得他的课堂效率更高,怎么用更好的时间做他最需要做的习题不用被题海战术困扰。再就是医疗,2016年发现通过WATSON学习很多的案例,对很多案例做了非常好的判断。现在我们也做了很多的工作,我们跟北大口腔医院进行合作,使得我们电子病历的录入更加方便。再是前两个月我们在卫计委的支持下跟安徽省立医院,现在改名为科大附属医院成立了国内首家智慧医院,我们做了很多事情,其中有一个事情是辅助读片,通过我们计算机去学习行业中专家怎么读CT,通过这些片子发现人工专家因为精力和时间不能做到的事情,所以我们也做了很多的协作,我们也和协和,在北京的301,在安徽的省立都进行了一些合作,我们的机器人还学习了原来领域里的一些之包括教科书和真实案例,我们的机器人会参加今年了职业医师考虑,10月底会放榜,预计会取得职业医师考试的资格,通过这个考试,使全科医生使用AI有非常好的帮助。我们在安全领域也有很好的应用,比如我们在去年到今年有非常多的事情就是讲有很多电话诈骗,使很多人会有很多的损失,现在我们和很多地方的公安部门合作,通过一别意图识别,内容识别,同化分析,声纹识别会达到很准确的程度。

        同时在公检法也有很好的应用,最近提倡法制治国,无论是从公平性还是从公开性来说,我们学习历来包括法条包括很多法官判定的经验,给基层的法官检察官和相关的办案人员提供相关的辅助,使得他们可以更准确地做判断。同时我们也把这个能力在开放平台做了输出,截止5月份统计,目前我们大概有45万左右的团队在做,每天的交互次数大概有40多亿次。同时无论是把我们的语音能力都做了很多的开放,现在在我们这个平台上也有很多的智能硬件,这里面我们在2014年在我们的平台上构建了AIUI,我们称之为互联网LT时代怎么做更好的人机交互。第一怎么做更好的识别,第二交互的方式使得人机可以更便捷的交互。第二使用科大讯飞一些领先的认知技术,使得交互过程中机器可以更懂你。我们也做了一些产业化定制化的动作,在教育、医疗和家居生活场景里很重要的东西,我们做了很多定制内容,包括可以上传自己需要的内容,我们可以通过识别方式建筑这样的模式,同时里面还有海量的资源会有标签会和个人的标签进行碰撞进行精彩的推荐。我们还有自定义和个性化的能力,包括自定义的问答,很多自定义的技能,平时还允许有第三方,使得我们这个平台有越来越多的开发者和服务商加入进来。

        我们现在在生活场景里已经有了很好的支持,比如在酒店,比如说在酒店的大堂还是在宾馆的房间里还是在智能家里,通过智能交互方式都会有非常好的交互,同时我们还提供会议的转写,无论是会议还是报告,都可以迅速准确地把我们讲的内容变成文字,如果有多余的需求,可以同时翻译成我们所需要的几种类型的语言,这样使得我们无论是会议还是报告,可能这种记录和撰写会更加方便。

        同时在我们开放平台上有很多机器人的开发厂商都在使用我们语言和语音的相关技术,目前有超过30多家合作伙伴在做类似的开发工作,包含了整个AIUI提供的能力,包括整个规划的内容。无论是这种机器人还是音响还是翻页机,使用我们这个技术,都可以做到,无论是远场近场还是噪音都很好的理解。

        今年我们还发布了粒子空间,使得双创的团队可以以整块的方式使用科大讯飞的技术,使用科大讯飞这么多年在行业里积累的资源去进行更好更快的创业。

        总的来说人工智能来的很快,但是我想说的是人工智能可能比我们想象的来的更快,无论是从不同的一些包括德勤的机构做调研,大家都认为将来在很多的领域里都会出现类似的情况,类似于工业革命时代,我们很有可能在脑力也会产生深层次的革命,使得原来人不愿意做的重复性的劳动,因为个人情绪或者其他因素或者时间因素所不能做的事情,都有可能被机器帮助或者取代。

        谢谢大家!

       

        主持人:感谢王总带来的精彩分享!讯飞将核心技术做到了世界领先,多次获得国家级和世界级奖项,“AI+应用”全面开花。不仅对中国,乃至对全世界都是巨大的贡献。