我国研究团队在智能语音的部分关键核心技术和应用上取得重要进展

国际声学、语音与信号处理会议(ICASSP)期公布的比赛结果显示,来自猿辅导人工智能实验室的研究团队在“M2VoC(多说话人多风格音色克隆大赛)”中获得子赛道第一名。这表明该研究团队在智能语音的部分关键核心技术和应用上取得重要进展。

作为2021年声学、语音和信号处理国际会议(ICASSP)信号处理挑战旗舰任务之一,多说话人多风格音色克隆大赛吸引了来自全球百余家知名高校和企业研究团队的参与,目标是为音色克隆、语音识别等前沿技术提供创新探索的台。

本次比赛分为少样本赛道和极少样本赛道两大任务。在极少样本赛道方面,针对每个说话人不同的说话风格和5个可用的音色克隆样例进行校验和最终测试,对参赛技术团队有着很高的技术要求。

据了解,此次在极少样本开集赛道获得第一名的研究团队来自猿辅导人工智能实验室。研究团队成员杨明祺介绍,智能语音是人工智能技术的重要组成部分, 在经济社会中有着非常多应用场景,此次在语音合成技术方面取得实质进展,未来能够被进一步应用到教育、医疗等行业和领域中,推动我国人工智能技术的发展。

国际声学、语音与信号处理会议(ICASSP)是全世界最大的、最全面的信号处理及其应用方面的会议,也是IEEE(电子技术与信息科学工程师协会)的重要会议。ICASSP涵盖了音频和声学信号处理,图像、视频和多维信号处理,物联网的信号处理等多个技术方向。

关键词: 智能语言