微软扩展了AI驱动的Satin 编解码器的部署

微软扩展了AI驱动的Satin 编解码器的部署

Satin将部署到Teams会议

微软宣布对Skype for Business推出的著名的Silk音频编解码器进行修改。Silk解决方案出现在十多年前,提供了通过VoIP在互联网上传输语音的技术。当时VoIP使用的编解码器是G.722,它需要64Kbps的速度来传输宽带音频。Silk改变了这一格局,只需14kbps就能提供宽带质量。

现在,我们进入了新的通信十年,用户可以使用从5G,到高速宽带的一切服务。然而,微软用户群中仍有部分用户受限于较低的连接速度。这些团队经历了严重的丢包和网络中断。根据微软的说法,在今天,可用比特率的利用率仍然很重要,就像在拨号世界一样。这就是微软Satin的作用。

Satin AI驱动的音频编解码器可以为未来的音频提供更多功能。

更强大的音频编解码器体验

即使在数据包丢失很大的情况下,Satin仍可提供出色的音频,它可以以6kbps的比特率提供超宽带语音。基于AI的编解码器以较低的比特率提供了出色的质量,因此Microsoft可以使用更多可用带宽来确保通信的弹性。

微软指出,该团队以数十年的算法经验和先进的机器学习技术构建了新的编解码器。 Satin能够在现代环境中重新定义超宽带音频,从而使音频性能达到新的水平。微软在有关新编解码器的博客文章中解释说,Satin使用对语音产生,声学和建模的深刻理解来对信号的稀疏表示进行编码。

Satin还仅在低频频带中编码和传输特定参数,以进一步降低所需的比特率。通过深度神经网络,Satin可以根据接收到的低频段参数在解码器上估算高频段参数。 Microsoft团队已对Satin编解码器进行了全面测试,并优化了体验,以确保将计算复杂度降低40%。这意味着编解码器可以轻松地在所有设备上运行。

发现Satin的潜力

Satin的A/B测试显示,在较低的比特率下,Satin用户的通话时长比Silk明显增加。众包的线下主观测试也发现,Satin的平均意见分明显高于Silk。

令人印象深刻的是,Satin编解码器在补偿丢包问题上也有独特的定位,因此丢掉一个数据包不会影响后续数据包的质量。这样的特性确保了Satin可以处理一次一两个数据包的重大损失。

目前,Satin人工智能增强型编解码器已经被用于所有Skype和微软Teams的双方通话,微软表示,它很快就会出现在Teams会议上。