谷歌开放大规模音频数据集AudioSet,助力AI音频算法研究

jopen 7年前
   <p style="text-align:center"><img alt="谷歌开放大规模音频数据集AudioSet,助力AI音频算法研究" src="https://simg.open-open.com/show/71e9b6f8517b8a71f76bb414045d14f2.jpg" /></p>    <p>在 Google Cloud Next 云技术大会之前,谷歌通过开发者博客公布了一个可以媲美图像识别领域 ImageNet 的大型音频数据库 AudioSet。据称,该数据库包含了 632 个音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段(来自 油Tube 视频),覆盖范围包括人声、动物声、各种乐器与音乐流派,以及日常生活环境的声音等。总体量为:2100 万标注视频、5800 个小时的音频,以及 527 种类型的标注声音。</p>    <p>论文:<a href="/misc/goto?guid=4959002217038734449" rel="nofollow">https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45857.pdf</a> </p>    <p>详情:<a href="/misc/goto?guid=4959002217147670065" rel="nofollow">https://research.google.com/audioset/</a> </p>    <p>来自: <a href="/misc/goto?guid=4959002214973847351" id="link_source2">雷锋网</a></p>