发布者认证信息(营业执照和身份证)未完善,请登录后完善信息登录
 终于知道比 MP3 小 10 倍,Meta 开源全新音频压缩技术 EnCodec - 最新消息 - 三农网
Hi,你好,欢迎来到三农网
  • 产品
  • 求购
  • 公司
  • 展会
  • 招商
  • 资讯
当前位置: 首页 » 资讯 » 小编走市场 找商家、找信息优选VIP,安全更可靠!
终于知道比 MP3 小 10 倍,Meta 开源全新音频压缩技术 EnCodec - 最新消息
发布日期:2023-09-24 18:37:41  浏览次数:9

最新消息 11 月 6 日消息,meta 在一篇博客中公布了全新的开源音频压缩技术 EnCodec,号称压缩文件大小比 MP3 格式小 10 倍。

据介绍,meta 旗下基础人工智能研究 (FAIR) 团队在 AI 驱动的音频超压缩领域取得了成功,构建了一个由三部分组成的系统,并对其进行端到端训练,以将音频数据压缩到目标大小,然后可以使用神经网络对这些数据进行解码。

与 64 kbps 的 MP3 相比,meta 的新技术 EnCodec 实现了大约 10 倍的压缩率,而且没有质量损失。

EnCodec 的三部分包括:

编码器:获取未压缩的数据并将其转换为更高维度和更低帧率的表示(representation)。

量化器:将这个表示压缩到目标大小,通过训练量化器给想要的大小(或大小集),同时保留最重要的信息来重建原始信号。这种压缩表示是存储在磁盘上或通过网络发送的,相当于计算机上的 .mp3 文件。

解码器:将压缩信号转换回与原始信号尽可能相似的波形,有损压缩的关键是识别人类无法感知的变化,因为在低比特率下完美的重建是不可能的。为此,EnCodec 使用鉴别器来提高生成样本的感知质量,创建了一个类似猫捉老鼠的游戏,其中鉴别器的工作是区分真实样本和重建样本。压缩模型试图通过推动重建的样本在感知上与原始样本更加相似来生成样本来欺骗鉴别器。

最新消息了解到,meta 表示,该技术尚未涵盖视频,但目前已在计划中,其目标是改进视频会议、流媒体电影以及在 VR 中与朋友玩游戏等的音频体验。

论文地址:点此查看

GitHub 开源页面:点此查看

VIP企业最新发布
全站最新发布
最新VIP企业
背景开启

三农网是一个开放的平台,信息全部为用户自行注册发布!并不代表本网赞同其观点或证实其内容的真实性,需用户自行承担信息的真实性,图片及其他资源的版权责任! 本站不承担此类作品侵权行为的直接责任及连带责任。

如若本网有任何内容侵犯您的权益,请联系 QQ: 1130861724

网站首页 | 实时热点 | 侵权删除 | 付款方式 | 联系方式 | 法律责任 | 网站地图 ©2022 zxb2b.com 三农网,中国大型农产品交易电商平台 鄂公网安备42018502006996 SITEMAPS | 鄂ICP备14015623号-20

返回顶部