公告
设置
定位中··· -
Meta 的 AI 驱动音频编解码器压缩率十倍于 MP3
更新于 2022-11-02 23:25:33
Meta/Facebook 宣布了 AI 驱动的新音频编解码器 EnCodec,压缩后的大小仅为 MP3 文件格式的十分之一。Meta 表示这项技术能显著改善低带宽下的语音声音质量。Meta 同时在预印本平台 arxiv 上发表了论文《High Fidelity Neural Audio Compression》。新的方法由三部分组成,首先编码器将未压缩数据转换成低帧率的潜在空间(latent space)表示;量化器 quantizer 随后压缩表示到目标大小,同时跟踪最重要信息以用于未来重建原始信号;解码器最后用单 CPU 上的神经网络将压缩后的数据实时转变成音频。研究人员表示他们是第一个实现将神经网络技术应用于压缩 48 kHz 立体声。

赞助商广告