用户接口工作站FC-TPSU-2430
-
≥ 1个¥10.00
用户接口工作站 FC-TPSU-2430
用户接口工作站 FC-TPSU-2430
用户接口工作站 FC-TPSU-2430
Pulsafeeder NP510010-001 NP510011-001
Hayssen 67076B0088
Honeywell 51303979-400
Ibg 75422
Dezurik 425939T
Emerson KL4501X1-BG1
Teledyne 1903-2200-01
Allen Bradley 1496-N1
Baldor PX70FBX
Omron CPM2C-S110C-DRT
Valenite ESU-13098
Valenite ESU-7761
Intermec CV60
Valmet LS M2
Loctite 982903
14B616
Clyde Bergemann 131631
Honeywell 30371716-001
Teledyne 31AXMR2433
Gai-tronics GTF04051
Dow 334423
Toshiba OIS45E
Consolidated 7013 TG P/4
Phoenix Contact 5652596
Federal Products EAS-2104-W4
Enerpac CAPT-122
Comark D452125-01
Cooper 02C7GR
Enerpac WSL221
Asco WPKF8215C53
Royal Products 10825
Carr Lane CM-197-23
Eci 30500 105-130v-ac
Westinghouse 1C31227G01
Nsk N1011BTKRCC1P4
Forkardt M14044A E2514AW29
Nus Instruments PIDA700
Omron CQM1-CPU11
Sew Eurodrive MAS51A030-503-02
Diamond Power Conval 10959600AB
Diamond Power Conval 10959600AA
Rice Lake RL35023-N5-1K
Teklogix 8055/8060
Century 7-14-rpp
P305 6in
Clyde Bergemann 5464
Kennametal S64052
KEH-157982 5254978
Asco 67417
Velan L99002
Kennametal S40465
Northman 297867-GCH
Westinghouse 5X00105G01
本文将对抗样本用于语音识别和关键词检出中深度神经网络声学模型的训练过程中,以用来提高声学模型的鲁棒性。在模型训练过程中,使用基于快速符号梯度方法来产生对抗样本作为原始训练样本的扩充,与传统的基于数据变换的数据扩充方式不同,本文所提出的方法是一种模型和数据相关的方法,在模型训练过程中,根据模型的参数和当前训练数据动态地生成对抗样本。在本文中,对于语音识别任务,我们在Aurora-4数据库上进行了实验,我们提出的方法能够显著地提高模型对噪声和信道的鲁棒性,而且,我们将本文所提出的数据扩充方式和教师/学生学习策略结合,在Aurora-4数据库上,我们可以得到23%的相对词错误率下降。在关键词检出任务中,我们所提出的方法也明显地降低了基于注意力机制的唤醒模型的误唤醒率和误拒绝率。
关键词:鲁棒语音识别,关键词检出,对抗样本,快速符号梯度法,数据扩充
2.前言
近年来,随着深度学习(DeepLearning,DL)的兴起以及深度神经网络(DeepNeuralNetworks,DNNs)在声学模型上的成功应用,自动语音识别(AutomaticSpeechRecognition,ASR)[1][2]和关键词检出(KeywordSpotting,KWS)[3][4]得到了快速发展。各种网络结构,例如CNN,RNN和LSTM等,都成功应用在声学建模中。基于DNNs的声学模型在实际应用中,表现出了良好的噪声鲁棒性,因为其特殊结构以及多层非线性变换,让其具有较强的建模能力。即便如此,基于DNNs的ASR和KWS系统,仍然还会受到噪声、混响以及信道等因素的影响[6],造成识别性能地下降。为了解决这些问题,大量的工作在不同的方面被提出来,比如数据扩充[7]、单/多通道语音增强、特征变换,还有一些有效的学习策略,比如教师/学生(Teacher/Student,T/S)学习[8]、对抗训练[9]等。在本文中,我们主要集中在数据扩充的方法,来提高ASR和KWS系统的鲁棒性。
当训练数据和测试数据之间存在分布的不匹配时,声学模型的性能将会大打折扣。为了弥补这种不匹配的问题,数据扩充是一个非常有效而且被广泛采用的方法,数据扩充的目的是通过对干净数据添加噪声、混响等干扰,产生干净数据的带噪副本,模拟真实的带噪数据,提高训练数据的多样性,然后将其用于模型训练。这种训练方式,被称作多场景训练。此外,T/S学习也是一种常用的提高模型鲁棒性的方法,它可以在有监督或者无监督的场景下进行使用,T/S学习需要并行的数据分别训练T模型和S模型。
为了提高模型对于噪声的鲁棒性,本文提出来一种使用对抗样本来进行数据扩充的方法。对抗样本(AdversarialExamples)的概念是在[10]中计算机视觉任务上被提出来,研究者们发现,对于一个已经被完全训练好的图像识别网络,如果对一个可以被正确分类的图像,进行一些非常细微的像素级别的扰动,即使扰动是人眼难以察觉的,模型也将会将扰动后的图像错误分类,这种被错误分类的样本被称作对抗样本。对抗样本的存在,说明现有的模型对某些极小的扰动非常的敏感!在计算机视觉领域,对抗样本吸引的研究者的广泛兴趣。近,对抗样本的研究也扩展到语音信号领域,[12]提出来一种对端到端语音识别模型的定向攻击方法:给定一段语音,产生一段人耳不可感知的扰动,扰动后的语音可以被识别成任何目标文本。同样地,在KWS系统中,我们很自然地把误唤醒(Falsealarmed,FA)或误拒绝(Falserejected,FR)的样本当成对抗样本!当系统遇到与关键字完全无关的样例时,仍然会存在错误唤醒的现象,或者当输入明显是关键字时,系统会错误地拒绝。由于复杂的声学环境和许多其他不可预测的原因,触发FA和FR的样例往往是不可重现的。正是因为如此,这种不可重现的属性使得进一步提高KWS性能变得很困难。
之前基于对抗样本改进模型鲁棒性的工作,主要是为了提高模型对对抗样本的鲁棒性。而在我们本文的工作中,我们的目的是通过使用基于对抗样本地数据扩充来提高模型对于正常的带噪声数据的鲁棒性,而不仅是针对对抗样本。在训练阶段,快速符号梯度法(FastGradientSignMethod,FGSM)[11]被用来动态的生成对抗样本,与其他方法相比,FGSM方法比较。对于每一个mini-batch的训练数据,对抗样本生成之后,模型参数将会使用对抗样本进行更新。另外,在ASR任务中,我们还将提出的基于对抗样本的数据扩充方法和T/S学习结合,发现两个方法带来的增益可以相互叠加。
本文章节安排如下:第2章详细介绍FGSM生成对抗样本的方法;第3章介绍对抗样本在声学模型训练中的应用;第4章将会给出实验设置以及实验结果;第5章对全文进行总结。
承诺一:1、全新原装进口
承诺二:2、准时发货
承诺三:3、售后服务质量
流程一:1、客户确认所需采购产品型号
流程二:2、我方会根据询价单型号查询价格以及交货期,拟一份详细正规报价单
流程三:3,客户收到报价单并确认型号无误后订购产品
流程四:4、报价单负责人根据客户提供型号以及数量拟份销售合同
流程五:5、客户收到合同查阅同意后盖章回传并按照合同销售额汇款到公司开户行
流程六:6、我公司财务查到款后,业务员安排发货并通知客户跟踪运单