IT博客汇
首页
精华
技术
设计
资讯
扯淡
权利声明
登录
注册
人机语音交互场景中的低延迟流式语音识别技术
美团技术团队
发表于
2023-04-13 00:00:00
love
0
美团语音交互部针对交互场景下的低延迟语音识别需求,提出了一种全新的低出字延迟流式语音识别方案。本方法将降低延迟问题转换成一个知识蒸馏过程,极大地简化了延迟优化的难度,仅通过一个正则项损失函数就使得模型在训练过程中自动降低出字延迟。在实验测试集上,本方法能够获得最高近 200 毫秒左右的平均出字延迟降低。