中国电子视像行业网

苹果发论文详解Hey Siri背后的人工智能技术

     

    苹果本月在《机器学习期刊》(Machine Learning Journal)发表一篇文章,详细解释了“Hey Siri”语音激活指令的工作方式。

    虽然很多技术文章的内容过于深奥,不适合普通读者阅读,但这篇文章却包含了一些有趣而且易于理解的内容。

    苹果解释称,iPhoneApple Watch的麦克风会“把你的语音转化成一系列瞬时信号波形样本,速度达到每秒1.6万。”然后再由设备上的探测器决定你是否准备用语音激活Siri

    为了方便用户在不同的环境下激活Siri,但又不至于大幅增加错误率,苹果还会设定一个可变阈值来判断你是否试图激活Siri

    Hey Siri”依靠iPhone内部的协处理器来收听触发指令,不需要进行物理互动,也不会耗费太多电量。而Apple Watch对待该指令的方式却有所不同,因为它需要在屏幕点亮的情况下使用。苹果解释道,通过这种方法,“Hey Siri”大概只使用约5%的计算资源。

    事实上,只有当Apple Watch的动作协处理器探测到抬腕姿势时,“Hey Siri”探测器才会运行。

    最后,苹果为什么选择“Hey Siri”作为触发指令?事实上,早在Hey Siri功能出现之前,就有一小部分用户按下按钮的同时说“Hey Siri”。而苹果也在美国英语识别模型最初的训练集中使用了“Hey Siri”,还将其作为一个常规语音识别样本来使用。