En

新闻博览

2009年07月01日
科大讯飞语音实验室在2009年国际语种识别评测大赛上再创佳绩

 在刚刚结束的“2009 NIST Language Recognition Evaluation”国际语种识别评测大赛上,我校科大讯飞语音联合实验室宋彦、戴礼荣研究团队提交的参赛系统在各项评测中取得了优异的成绩:在方言对测试中综合指标排名第一,在通用测试中综合指标排名第二。这是该实验室在连续获得Blizzard Challenge英文语音合成国际大赛冠军以及2008 NIST说话人识别评测大赛桂冠后,取得的又一重大荣誉。这表明中国科学技术大学不仅在语音合成技术研究上处于国际领先水平,而且在说话人识别、语种识别等语音识别技术研究上也处于国际领先地位。

 

 语种识别是指识别出所给定的一段任意语音所属的语言种类,是语音识别技术的重要方向和应用领域。该技术方向通过语音信号提取语音中代表语言种类的相关特征,采用统计模式识别方法识别出语言的种类。它包含了一系列语音识别领域最重要的核心技术,其中包括能够处理各种信道和噪声环境的鲁棒性处理技术,区分性语音与语言模型建模技术,高效与高性能的语音识别技术,语音与语言统计模型自适应技术等。因此语种识别技术方向也反映了语音识别领域的最新技术水平。语种识别技术可以广泛应用于军事、国家安全和各产业领域,具有重要应用价值。

 

 作为国际上规模与影响力最大,由美国国家标准技术署(NIST)举办的语种识别评测大赛,历届都是国际一流的科研机构和企业角逐语种识别技术桂冠的竞技平台。2009年NIST语种识别评测相比往年语种规模更大,测试范围达到23个语种,测试规模增加了7倍,其信道环境更加复杂 ,同时还设置了8对高混淆方言对的评测任务,这种方言对的评测任务难度大,挑战性高。

 

 本届大赛的参赛单位包括美国麻省理工大学(MIT),意大利都灵理工大学(LPT),法国科学研究中心(LIMSI),捷克布尔诺科技大学(BUT),香港中文大学,台北科技大学,清华大学,中科院声学所、自动化所等在内15家国内、外著名语音研究机构。

 

 在时间紧、对手强的竞争压力下,科大讯飞语音联合实验室凭借创新的思路,针对超过1.7T的海量语音数据提出了一种独特的训练、开发数据集构建方法和统计模型建模策略,并在声学空间上采用基于多信道的因子分析子空间拼接算法实现复杂信道的鲁棒处理,在语音学空间中采用区分性训练技术和自适应技术实现了高阶语言模型的鲁棒建模,提交了USTC-iFLYTEK语种识别系统。本届比赛以实际检测代价(ActDCF)、最小检测代价(minDCF)和识别等错误率(EER)为主要的测试指标。USTC-iFLYTEK系统在通用语种测试中各项指标综合排名第二;同时,在更具挑战性的8组方言对测试中,有6组方言对测试性能均远远超过了其他参赛单位,综合排名第一。

 

 科大讯飞语音联合实验室是中国科大和科大讯飞公司联合建立的研究机构,在国家863计划和国家自然科学基金委等的长期支持下,专门致力于语音及语言技术的研究与应用,是国际语音界著名研究机构之一。实验室在中英文语音合成、口语评测技术方面一直处于国际领先水平。此次在语音识别研究上的重大突破是实验室继2006、2007、2008年蝉联国际权威英文合成大赛Blizzard Challenge第一名,2008年获得NIST说话人识别评测大赛桂冠后,取得的又一标志性胜利,进一步巩固了国内研究机构在国际语音技术研究前沿领域的领先地位;同时也从总体上更好的说明科大讯飞语音联合实验室已经在语音合成、语音识别、口语评测等语音关键技术领域上逐步积累了处于国际领先水平完全自主知识产权的核心技术成果,对推动语音技术在各行业深入应用将起到积极促进作用。

 

                                             (信息学院)

相关新闻
5月13日,全国人大常委会副委员长、农工党中央主席、中国红十字会会长陈竺率农工党中央调研组来校,就“...