环境噪音检测十篇

发布时间:2024-04-26 05:49:23

环境噪音检测篇1

关键词:极低信噪比环境;基音频率;进化算法;遗传算法;粒子群算法

中图分类号:tn912.3?34文献标识码:a文章编号:1004?373X(2017)11?0046?07

evolutionaryalgorithmbasedfundamentaltonefrequency

detectioninlowSnRenvironment

ZHanGXiaoheng1,2,LiYongming2,Xiewenbin2

(1.ChongqingRadio&tVUniversity,Chongqing400052,China;2.CollegeofCommunicationengineering,ChongqingUniversity,Chongqing400030,China)

abstract:afrequency?domaindetectionmodelwasconstructed.thefundamentaltonefrequencyisextractedascharacteristicvalue.themodelparameter(optimizationfactor)isintroducedintothedetectionmodel,forwhichtheglobaloptimizationiscarriedoutwithevolutionaryalgorithm(ea)togettheglobaloptimumofthefundamentaltonefrequency,andobtainabetterbalanceinoptimizationaccuracyandtimecost.tworepresentativeeas(geneticalgorithm(Ga)andparticleswarmoptimization(pSo)algorithm)areusedtoperformthealgorithmdesign.theproposedalgorithmiscomparedwiththeotherrepresentativealgorithms.thecomparisonresultsshowthattheproposedalgorithmcanimprovethedetectionrecognitionrategreatlyinthenoiseenvironmentsofdifferenttypesanddifferentdegrees,especiallyinthevery?lowSnRenvironment.

Keywords:very?lowSnRenvironment;fundamentaltonefrequency;evolutionaryalgorithm;geneticalgorithm;pSo

0引言

基音频率是语音信号最为重要的参数之一。准确有效地检测基音频率对很多语音技术起着极为关键的作用,如说话人检测、跟踪、语音分离及识别等。尽管基音频率检测已经研究多年,并取得了一系列成果,但相关算法大都适用于高信噪比环境,而实际应用中,大多数语音都处于复杂恶劣的噪声环境中。因此,针对低信噪比环境,特别是-5dB以下的基音频率检测算法的研究,对实现性能优良、实用的语音处理技术,取得实效应用有着重要的现实意义[1?4]。

基音频率检测的有效性依赖于语音信号谐波结构的完整性,噪声叠加造成谐波结构被破坏,而随着信噪比的下降最终难以分辨一个完整的谐波周期。因此低信噪比下实现优良的检测性能具有较大难度[5?9]。

由于语音信号参数随时间变化缓慢,相邻多个语音帧信号参数会保持一定连续性,因此典型的基音频率检测算法可以分为两个阶段[10]:第一个阶段找出基音频率的多个可能候选值,或者计算基音频率值落在不同频率区间的概率。第二阶段一般依赖Dp[11]或Hmm[12]算法,从多个候选值选出最终的基音频率值。这些算法大都利用了相邻语音帧数据之间的相关性找出最优的基音频率序列值,从而使得整体的后验误差概率最低。但这类利用数据间强相关性的算法本身也会导致一定错误。此外,该类算法对相关性的过高要求在现实中常常难以得到较好满足。

为了抑制噪声,目前研究的方法一般分为参数化方法和非参数化方法两类[13]:参数化算法采用统计方法对谐波结构进行建模,其典型的代表算法有Gmm[14]算法;非参数化算法一般从频域的谐波结构或者时域的周期特性入手,通过对频域或时域峰值的检测得到基音频率,其典型的代表算法有Rapt[15]算法和Yin[16]算法,但这类方法在信噪较高时比较有效,而当信噪比较低时其峰值特性很容易湮没在噪声之中从而使得难以检测出基音频率。

近年在该领域有一些研究成果出现,如HSaC?SamSF[17]算法对谐波进行自相关运算,然后作对称性相加求和来寻找基音周期,该算法充分利用语音的谐波特性,并通过DCt相关运算及对称累加运算抑制噪声;tapS?Ca[18]算法对频域信号进行相关运算,并利用稀疏矩阵对其进行重建,该算法利用短时谱的自相关运算抑制噪声,在高信噪比环境利用最小均方误差法求取稀疏矩阵,在低信噪比环境下利用Gmm法对误差信号进行建模,从而得到最优稀疏矩阵。peFaC[13]算法是最近提出的性能优良的基音频率检测算法,其通过对信号的对数谱进行压缩以求取峰值信号,充分利用噪声统计特性及幅度谱的压缩抑制噪声,具有极低信噪比环境下较好的抗噪声干扰能力,且在-20~20dB信噪比下均性能良好。基于人工神经网络的基音频率检测算法[10]也利用了peFaC算法的特征提取优势,并进一步采用深度神经网络进行建模,但相比peFaC算法仅在-10dB信噪比以上得出性能优良的结论。

总的来说以上算法都是在经典的参数化及非参数化方法上做了一定程度的改进,但仍然很难改变无法精确有效描述复杂噪声环境中语音信号的缺陷。由于语音信号具有多次谐波特性,基音频率这一重要参数可通过特征波形的峰值表达。因此,本文针对参数化方法与非参数化方法的各自不足,充分利用peFaC对语音信号进行基音频率特征提取,构造基音频率特征波形,通过对特征波形的峰值求取实现基音频率的提取。但是当语音信号被噪声污染时,信号的谐波特征被破坏,特征波形的峰值与基音频率就存在一定的误差。当信噪比恶化时,该误差就会明显增大,严重影响了峰值对基音频率的表达。基于此,本文引入优化因子对特征波形进行校正以抵消噪声带来的畸变。该优化因子的精确取值能最大程度地抑制噪声带来的畸变影响,从而消除特征波形峰值与基音频率的误差。

本文将优化因子最佳取值问题转换为最优化问题,尝试利用进化算法来获取其全局最优解。进化算法的优势在于其可解决复杂的非线性及多维空间寻优问题,通过构造含有优化因子的适应度函数,从而能动态寻找出最佳基音频率值所对应的优化因子的值。

1基于进化算法面向极低信噪比环境的基音频

率检测方法(LSnR_pFD_ea)

本文提出的基音频率估计算法,即低信噪比下基于进化算法的基音频率估计(LSnR_pFD_ea)主要包括特征提取模块、基于进化算法的优化因子搜索模块及基音频率提取模块三部分。图1为该算法主要流程。

如图1所示,首先提取语音的频域特征,此频域特征称为基音特征波形,其峰值用来表达基音频率值,然后设计一个多维变量称为优化因子,对基音频率特征波形的峰值进行有效调整,使得调整后的峰值能够表达的基音频率是真实基音频率值的最佳逼近。本文的特征提取方式基于peFaC,包括短时傅里叶变换,频域对数化,规整化,再进行频域卷积得到基音特征波形即图中的特征值。接着,通过优化因子搜索模块,利用基音特征波形与优化因子共同构造适应度函数,利用进化算法结合训练语音搜索到最佳优化因子。最后,对测试集语音提取其特征值,基于搜索得到的最佳优化因子对该特征值进行优化,优化完成后再通过动态规划(Dp)得到语音的基音频率。

1.1特征提取模块

特征提取模块主要包括如下步骤:

(1)语音帧信号首先通过短时傅里叶变换映射到频域。代表第帧的功率谱密度,对数频域的功率谱密度采用表示,其中规整化后的功率谱密度为:

(1)

式中:代表长程平均语音谱;而代表平滑后平均语音谱。

(2)规整化的频谱通过如下扩展峰值的滤波器增强其谐波特性。其中滤波器定义如下:

(2)

其中的选取满足而设置为1.8且设置为10。

(3)通过对规整化的功率谱密度进行卷积得基音特征波形接下来的基音检测方法一般可先从中选取较大的几个峰值对应的频率值作为候选基音频率值。

(4)然后通过Dp等规划算法得到基音频率值的最佳估计值。

当信噪比恶化时,特征波形的峰值被严重破坏,使得候选值均极大地偏离真实值,也就无法得到准确的估计值。为减小候选值与真实值的误差,本文提出了优化因子策略,即使用优化因子计算优化后的基音特征波形从中选取新的峰值对应的候选基音频率值,使得最终的基音频率估计值与真实值的误差最小。

1.2优化因子搜索模块

1.2.1优化函数分析

图2表示了优化因子在基音频率检测中的作用。其中图2(a)为不含噪声的语音帧经过特征提取之后的输出;图2(b)为SnR=-10dB下语音帧经过特征提取之后的输出;图2(c)为图2(b)经过优化因子处理后的波形,若选取幅值最大的3个峰值作为基音频率候选值,通常最大峰值对应的基音频率值成为估计值的概率是最大的,如果后续不作Dp规划,则最大峰值对应的基音频率值就是基音频率估计值,如果要作Dp规划,最终的估计值要在候选值,三个值之中选取。从图中发现,图2(a)中基音频率候选值与图2(b)中基音频率候选值的误差很大,特别是最大峰值对应的频率值误差极大,这是低信噪比环境下噪声干扰的结果。

若要提升基音频率估计精度,减小估计误差,可通过优化因子处理,如图2(c)所示。通过将区间segment的幅度做一定程度的提升,则该区间峰值对应的频率就会成为候选基音频率,而免遭错误遗漏。优化因子取值的不同可以使波形在不同区间的幅度进行放缩。通过进化算法来搜索最优因子,从而使图2(a)与图2(c)的基音频率候选值误差最小。图2是某一类语音帧的情况,由于不同语音帧的基音频率候选值有所不同,而受到噪声污染后基音特征波形的畸变也明显有所不同,因此每个语音帧的理想优化因子也不尽相同,事实上针对每一帧语音数据找出其对应的理想优化因子是没有意义的,因为优化因子数量十分庞大而无法使用,其次优化因子与语音帧的关联性也无法得到有效建立。但肯定能找出一个合理的优化因子,相对于每一帧语音数据来说虽不一定最优,但相对于所有帧语音数据来说,总体误差最小。基于以上分析,优化因子的取值就被转化为一个求解最佳优化因子的最优化问题。由于优化因子是高维向量,加上不同维的取值都有一定精度,优化因子的可能取值是海量的,即候选解空间较大。此外,优化因子和峰值与基音频率间误差的关系并非线性相关,因此候选解空间将存在多个局部极值点。鉴于进化算法全局寻优的特性,本文基于Ga[19]和pSo[20]算法分别求解该优化问题。

Ga和pSo算法都涉及确定适应度函数的问题,用于基音频率检测的优化因子的适应度函数分为如下两种情况:

(1)不使用Dp动态规划

由于不使用Dp动态规划,优化后的基音特征波形最大峰值对应的频率值为基音频率估计值,其与真实基音频率值的误差。

因此适应度函数即小于5%的概率。

(2)使用Dp动态规划

表示时刻语音帧基音特征波形的峰值幅度,表示与之相关联的频率,则选择较小峰值的代价其中为最大峰值幅度;基音频率候选值的选择率其中为相邻语音帧的时间偏移量,则跃迁到的代价为其中为在训练语音库中的均值;时刻语音帧基音频率候选值与基音频率中值的相对误差为,其中可通过时刻最大峰值幅度对应的基音频率候选值及相邻帧的值估计得到,若相邻帧不是浊音帧则跳过。综上,时刻语音帧的第个基音频率候选值跃迁到时刻语音帧的第个基音频率候选值的总代价为三者之和:其中为限制的最大值,而表示各参数相关权重。

将总代价最小时选择的峰值频率作为基音频率估计值,因此适应度函数为:

即小于5%的概率。

1.2.2优化算法?进化算法

(1)Ga算法

本文采用二进制遗传算法,其主要流程如下:

步骤1:二进制编码;

步骤2:随机产生二进制种群;

步骤3:计算其对应的适应度函数值

步骤4:计算种群适应度之和

步骤5:计算每个的选择概率

步骤6:计算每个的累加概率

步骤7:竞争法进行选择操作;

步骤8:对新一代种群进行单点随机交叉运算;

步骤9:单点随机变异操作;

步骤10:第一代计算完毕,返回继续计算步骤3,直到达到满意的结果为止。

(2)pSo算法

本文采用粒子群算法的主要流程如下:

步e1:根据优化因子的维度与取值范围确定粒子群的参数;

步骤2:初始化粒子群,其中粒子的信息可用两个维向量表示,第个粒子的位置(即优化因子)可表示为:

其中与为每一维的取值上下限,速度可表示为其中与均为取值范围在0~1之间的随机数;

步骤3:计算每个粒子的适应度;

步骤4:根据进化方程更新及粒子位置速度:

步骤5:是否满足终止条件,否则返回继续计算步骤3,直到达到满意的结果为止。

2实验结果与分析

2.1实验条件

2.1.1数据说明

本文采用timit标准数据库测试算法性能。训练集包含20男20女,每人3句话。噪声训练集为noiSe?92,包含white,babble,car三种噪声。纯净语音与噪声相混合,信噪比SnR分为9个不同的等级:-20dB,-15dB,

-10dB,-5dB,0dB,5dB,10dB,15dB,20dB。测试集包含10男10女,每人3句话。标准基音频率使用praat工具从纯净语音中提取。

以两种标准方式测试估计结果:基音频率识别率(DR)。DR是针对浊音而言,计算误差不超过5%的概率,为浊音帧数,为其中计算误差不超过5%的帧数,计算式如下:

2.1.2参数设置

优化因子的维度为10,每一维的取值范围均在0.5~1.5之间。当使用Ga算法时,基因总数为100,搜索下限为0.5,上限为1.5,交叉概率为0.8,变异概率为0.1,迭代次数为30;当使用pSo算法时,种群大小为20,粒子初始速度为0.01,最大速度为1,粒子群维度为10,取值范围在0.5~1.5,认知加速度为2,社会加速度为2,惯性权重为1,退化因子为1,迭代次数为60。

2.2两种进化算法的效果对比

图3为不同迭代次数下,两种进化算法的检测效果。两种算法共同的规律是随着信噪比的提高,收敛速度会加快。随着迭代次数的增加,检测率变化越来越缓慢或者根本不发生变化。这说明信噪比越低优化的空间越大,因此信噪比越低,特征波形的结构受噪声影响越大。再对比Ga与pSo算法,Ga算法仅在信噪比为-20dB下的识别率有较为明显的变化,其他信噪比下几乎没有变化。从最终的识别率来看,相同信噪比下pSo的识别率要高于Ga,因此说明pSo算法在搜索最佳优化因子上更加有效。因此,后续实验中,主要采用基于pSo的基音检测算法进行效果对比。为了便于说明,基于Ga的基音检测算法记为LSnR_pFD_Ga,基于pSo的基音检测算法记为LSnR_pFD_pSo。

2.3不同类型噪声环境下的检测效果对比

图4为三种类型的噪声环境下,本文LSnR_pFD_pSo算法与三种主流算法J&w,Yin,Rapt的识别效果对比。

由图4可见,对于不同类型的噪声(白噪声,babble噪声,car噪声),本文算法均优于其他算法。此外,信噪比越低,本文算法的改进效果越明显。例如,-5dB以下,本文算法的识别率提高了10%~20%,而在-20dB时,其提升程度可以达到20%~50%。这说明本文算法非常适合低信噪比环境下的基音频率检测。

2.4Dp对基音频率检测的影响分析

图5为本文算法与peFaC算法针对采用Dp与否进行的效果对比。比较采用Dp与不采用Dp计算的三种噪声(白噪声,babble噪声,car噪声)在不同信噪比下的平均识别率,采用Dp算法并用pSo优化后的识别率是最好的,不采用Dp而使用pSo优化的识别率并不如使用了Dp的peFaC效果好,但比未采用Dp和pSo优化的效果好很多。这说明Dp对基音频率检测算法具有明显的正面作用,本文算法也不例外。为了最大限度地发挥本文算法效率,建议采用Dp。

图4基音频率识别率比较

2.5进化算法参数影响分析

图6为基于不同参数设置,在不同信噪比下(白噪声,babble噪声,car噪声)LSnR_pFD_pSo算法的平均识别率。图6(a)为种群规模设置不同带来的影响。图6(b)为粒子飞行初始速度设置不同带来的影响。

由图6(a)可见,随着种群规模的增大,识别率有所增加但不明显,当种群规模由20增加至200,-5dB以下识别率平均提升了2%左右。鉴于种群规模与计算复杂度的关系,因此需要结合具体情况,通过统计实验设定合适的种群规模。此外,还发现种群规模对识别率的正面作用在低信噪比下更明显。由图6(a)可见,在信噪比为-20dB,200的种群规模较20的种群规模提高效果为25%左右。由图6(b)可见,粒子初始速度与识别率为负相关关系,当其较大时,识别率会变差。具体来说,当粒子速度由0.01增至0.05时,-5dB以下识别率平均下降3%。这个结果的可能原因是初始速度太大将影响搜索的精细程度,较容易错过最优解。由于初始速度过小将增加计算代价,因此也需要结合具体情况,通过统计实验来设定合适的初始速度。

2.6相关算法的时间代价对比

表1为不同算法基于同一运算平台的平均时间代价。计算机平台为intelCpU2.6GHz,算法分别为pSo,Ga,peFaC,Rapt,Yin,“算法时间代价”是指当前算法在装有matlab软件的计算机平台上处理1s语音数据运行的平均时间代价。

由表1可见,LSnR_pFD_pSo,LSnR_pFD_Ga和peFaC算法的时间代价一致,均为0.175s。这个时间代价并不包含进化算法的训练时间,这是由于一旦训练完成后,几种算法的实时检测过程所需时间代价几乎无差别。本文算法与Yin算法的时间代价也相当,比paRt算法明显降低。根据多次实测表明,本文算法工作所需时间代价完全满足实时性要求,现实可行。

3结论

极低噪声环境下的基音频率检测是一个非常有用但具有较大难度的科研问题,迄今为止,一直没有得到很好的解决。针对目前新提出的抗噪性能较好的基音检测算法的不足,本文引入最佳优化因子来消除噪声带来的畸变影响。通过把最佳优化因子取值问题转化为最优化问题,引入进化算法加以求解,显著提升了低信噪比环境下基音频率检测性能。实验结果表明,面对不同类型不同信噪比的噪声环境,本文算法均取得了较为显著的改进效果,且信噪比越低,改进效果越明显。针对下一步工作,本文拟考虑进行更大噪声环境的实验及对进化算法的改进以提高最佳优化因子的搜索效率和基音频率检测的泛化性能。

参考文献

[1]RamaKRiSHnanaG,aBHiRamB,pRaSannaSRm.Voicesourcecharacterizationusingpitchsynchronousdiscretecosinetransformforspeakeridentification[J].Journaloftheacousticalsocietyofamerica,2015,137(6):469?475.

[2]woHLmaYRm,peRnKopFF.model?basedmultiplepitchtrackingusingfactorialHmms:modeladaptationandinference[J].ieeetransactionsonaudio,speechandlanguageprocessing,2013,21(8):1742?1754.

[3]HanK,wanGDL.aclassificationbasedapproachtospeechsegregation[J].Journaloftheacousticalsocietyamerica,2012,132(5):3475?3483.

[4]RaoKS,maitYS,ReDDYVR.pitchsynchronousandglottalclosurebasedspeechanalysisforlanguagerecognition[J].internationaljournalofspeechtechnology,2013,16(4):413?430.

[5]SHaRmaD,naYLoRpa.evaluationofpitchestimationinnoisyspeechforapplicationinnon?intrusivespeechqualityassessment[C]//proceedingsof2009europeanSignalprocessingConference.Glasgow:ieee,2009:2514?2518.

[6]SHimamURat,KoBaYaSHiH.weightedautocorrelationforpitchextractionofnoisyspeech[J].ieeetransactionsonspeechandaudioprocessing,2001,9(7):727?730.

[7]SHaHnaZC,ZHUwp,aHmaDmo.RobustpitchestimationatverylowSnRexploitingtimeandfrequencydomaincues[C]//proceedingsof2005ieeeinternationalConferenceonacoustics,Speech,Signalprocessing.philadelphia:ieee,2005:389?392.

[8]SHaHnaZC,ZHUwp,aHmaDmo.arobustpitchestimationalgorithminnoise[C]//proceedingsof2007ieeeinternationalConferenceonacoustics,Speech,andSignalproces?sing.Honolulu:ieee,2007:1073?1076.

[9]wUm,wanGDL,BRownGJ.amultipitchtrackingalgorithmfornoisyspeech[J].ieeetransactionsonspeechandaudioprocessing,2003,11(3):229?241.

[10]HanKun,wanGDeliang.neuralnetworkbasedpitchtrackinginverynoisyspeech[J].ieeetransactionsonaudio,speechandlanguageprocessing,2014,22(12):2158?2168.

[11]GoSaina,SHaRmaG.asurveyofdynamicprogramanalysistechniquesandtools[J].advancesinintelligentsystemsandcomputing,2014,327:113?122.

[12]JinZ,wanGDL.Hmm?basedmultipitchtracingfornoisyandreverberantspeech[J].ieee/aCmtransactionsonaudio,speechandlanguageprocessing,2011,19(5):1091?1102.

[13]GonZaLeZS,BRooKeSm.peFaC:apitchestimationalgorithmrobusttohighlevelsofnoise[J].ieee/aCmtransactionsonaudio,speechandlanguageprocessing,2014,22(2):518?530.

[14]mCLaCHLanG,peeLD.Finitemixturemodels[m].newYork:wiley?Blackwell,2000.

[15]taLKinD.arobustalgorithmforpitchtracking(Rapt)[R].amsterdam:elsevier,1995:495?518.

[16]DeCHeVeGnea,KawaHaRaH.Yin,afundamentalfrequencyestimatorforspeechandmusic[J].Journaloftheacousticalsocietyamerica,2002,111(4):1917?1930.

[17]SHaHnaZC,ZHUwp,aHmaDmo.pitchestimationbasedonaharmonicsinusoidalautocorrelationmodelandatime?domainmatchingscheme[J].ieeetransactionsonaudio,speechandlanguageprocessing,2012,20(1):322?335.

[18]FenGHuang,tanLee.pitchestimationinnoisyspeechusingaccumulatedpeakspectrumandsparseestimationtechnique[J].ieeetransactionsonaudio,speechandlanguageprocessing,2013,21(1):99?109.

环境噪音检测篇2

关键词:隐马尔可夫模型;语音激活检测;Baum-welch算法;噪声库;阈值

中图分类号:tn912.3

文献标志码:a

文章编号:1001-9081(2016)11-3212-05

0引言

语音激活检测(VoiceactivityDetection,VaD)[1]算法可以区分出语音信号中的语音段和背景噪声段,在语音增强[2]、语音编码[3]和语音侦听[4]等领域有着广泛的应用。在语音增强方面,利用VaD检测出背景噪声信号,计算输入信号信噪比并对其进行降噪处理,达到提高语音质量的目的。在语音侦听过程中,为减少设备节点耗能,采用VaD算法可实时检测出当前语音的语音段。在语音编码中,目前多种语音编码国际标准采用了VaD技术,如国际电信联盟电信标准分局(internationaltelecommunicationUnion,itU-t)的G.729B、第三代合作伙伴计划(thethirdGenerationpartnerproject,3Gpp)的自适应多速率编码(adaptivemulti-Rate,amR)等。amR和G.729B标准中的VaD算法首先提取语音帧的特征参数值,然后将其与某一阈值进行比较,判断出该帧是语音帧还是噪声帧。这种判决方法具有算法简单、实时性好等优点,但在复杂噪声环境下的检测效果不太理想。由于基于统计模型的VaD算法,如基于隐马尔可夫模型(Hiddenmarkovmodel,Hmm)的VaD算法能够很好地描述语音信号的短时平稳性及其状态转移过程,在低信噪比环境下判决结果较为理想,成为当下研究的热点。在目前基于Hmm的VaD算法中,也存在如下几个问题:1)现有算法通过对语音信号和背景噪声信号进行训练,分别生成对应的隐马尔可夫模型,然后利用Viterbi算法进行语音激活检测,使其在低信噪比下具有较好的判决效果;但在训练噪声模型时,由于采用单一噪声信号进行训练,算法的噪声跟踪能力不佳,如果实际应用环境存在多种噪声源时,算法判决准确率不高。2)现有算法提取语音特征参数维度高,致使算法复杂度增加,难以满足VaD实时判决。3)除此之外算法判决结果易受概率密度函数影响,也导致噪声跟踪能力不强。文献[6]对基于Hmm的VaD算法进行了改进,采用了一种能很好逼近最大似然比的似然比检验(LikelihoodRatiotest,LRt)值的阈值计算方法,在一定程度上克服了Hmm噪声跟踪能力不佳的缺点,但在复杂噪声环境下检测的准确率还有待提高。

为解决基于Hmm的VaD算法噪声跟踪能力不佳的问题,本文提出了一种基于Hmm的语音激活改进算法,首先采用Baum-welch算法对具有不同特性的噪声进行训练,生成相应的噪声模型,建立噪声库。对语音信号进行VaD检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型,提高改进算法的噪声跟踪能力。同时,为了保证语音信号的实时处理,降低了算法提取语音特征参数的复杂度,但也降低了语音信号帧间的相关性,因此对判决阈值动态提取方法进行改进,改进之后除了增加语音帧间的相关性之外,还提高了VaD检测的准确率。

图3为一段女声语音的LRt曲线图、采用文献[6]和改进算法计算出的阈值曲线,语音内容为“他去无锡市,我到黑龙江”(汉语普通话),语音持续时间为3.8s,总帧数为190。由图3可以看出,文献[6]算法计算所得阈值能够较好地逼近LRt值,但在两个音节之间停顿部分(图3中68帧~73帧左右的位置)的语音帧的阈值却高于LRt值,使其容易被误判为背景噪声帧。而改进的阈值计算方法降低了语音帧的门限阈值,在一定程度上弥补了文献[6]的不足。

6)VaD标志输出。

若当前帧的LRt值小于阈值,则判定为背景噪声帧,即VaD_flag=0;反之则VaD_flag=1。

3实验和结果分析

对基于Hmm的VaD改进算法在VisualStudio2010开发环境中,用浮点C语言编程实现。为了验证改进后VaD算法的性能,本章在不同噪声环境下测试VaD算法的误判率pc、虚警率pe及准确率三种性能指标,并对算法性能进行评估。

实验中,选取《SJ20852-2002军用通信系统音质moS评价测试语音数据库》中的30条女声和30条男声作为训练样本。噪声源来自noiSeX-92噪声数据集[9],该数据集中噪声分类如表1所示。通过在测试语料中加入不同信噪比的噪声来模拟通话时的噪声环境,采用英国剑桥大学工程学院开发的隐马尔可夫模型工具包对其进行训练,生成隐马尔可夫模型,建立待测语音噪声库。其中,SJ20852-2002数据库包含三名男性和三名女性说话人的语音信号,采样率为8kHz,16bit均匀量化。

图4是采用改进的VaD算法对选自SJ20852-2002数据库的某一段安静环境下的语音信号进行处理得到的检测结果以及LRt和阈值曲线。语音内容为“司令员说话真干脆,文艺要为工农兵服务”(男声汉语普通话),持续时间为5.95s,总帧数为297帧。图4(b)为采用改进算法所得出的LRt曲线及其阈值,其中实线为改进算法求得的LRt曲线,虚线为改进阈值计算方法计算所得阈值,当LRt值大于阈值时,VaD_flag=1;反之VaD_flag=0。由图4可知,改进算法在安静环境下,对语音信号拥有良好的检测效果。

为了更好地验证改进算法在噪声环境下的性能,随机选取SJ20852-2002数据库中16条男声与16条女声作为测试样本(每条语音信号持续时间约10s),噪声则选取noiSeX-92噪声数据集里收录的8种实际应用中的噪声。在不同信噪比的不同噪声环境下以VaD检测的准确率指标对改进算法的性能进行评价,并将测试结果与amR中的VaD算法(amR-VaD)、文献[6]中的VaD算法、G.729中的VaD算法(G.729-VaD)进行比较分析。

由测试结果可知:在平稳噪声环境中,改进的VaD算法的判决准确率高于amR中的VaD算法和文献[6]中的VaD算法与G.729标准中的VaD算法;在非平稳含基频噪声环境中,其他三种判决算法随着信噪比的降低,判决准确率明显下降,而改进算法的判决准确率下降幅度较小,且判决准确率高于其他三种算法;在非平稳不含基频的噪声环境中,改进算法的准确率高于其他三种算法,尤其是在枪声等脉冲噪声环境下,改进算法的判决准确率明显高于其他三种算法。由此可知,改进VaD算法的噪声跟踪性能优于amR的VaD算法、文献[6]中的VaD算法以及G.729的VaD算法,具有较好的鲁棒性。

表2为各种噪声环境下VaD检测误判率、虚警率测试结果对比,选取noiSeX-92噪声库中平稳窄带噪声中的m109噪声、平稳宽带噪声中的white噪声,非平稳含基频噪声中的babble噪声以及非平稳不含基频噪声中的factory1噪声作为测试噪声。

从表2中可以看出,amR中的VaD算法判决的虚警率较大,甚至在非平稳噪声环境下,虚警率高达29.99%;G.729中的VaD算法误判率与虚警率均较高,稳定性较差;文献[6]中的算法在噪声环境下的误判率较高但虚警率较低,说明噪声对其判决的影响较大;而改进算法在这四类噪声环境下误判率和虚警率均较低,尤其是低信噪比环境下的误判率远低于文献[6]中的算法。以上分析说明,改进算法能够在保证一定误判率的情况下,降低虚警率。

4结语

针对现有Hmm的VaD算法噪声跟踪能力不佳的缺点,提出并实现了一种基于Hmm的VaD改进算法。改进算法对不同的噪声采用Baum-welch算法进行训练生成Hmm,在VaD检测时,语音信号提取的特征参数作为Hmm的观测序列,自适应地匹配噪声库中的噪声模型和语音模型求得对应隐藏状态的最优概率,计算LRt值。在不同噪声环境下,对不同信噪比的语音信号,采用误判率、虚警率和准确率指标进行VaD性能测试,结果表明,改进VaD算法的噪声跟踪性能、检测准确率均优于amR标准、G.729标准和文献[6]中的VaD算法。

参考文献:

[1]KoLaJ,eSpY-wiLSonC,pRUtHit.Voiceactivitydetection[R/oL].[2016-01-20].http://ece.umd.edu/merit/archives/merit2011/merit_fair11_reports/report_Kola.pdf.

[2]oUKHeRFeLLaHm,BaHoURam.FpGaimplementationofvoiceactivitydetectorforefficientspeechenhancement[C]//proceedingsofthe2014ieee12thinternationalnewCircuitsandSystemsConference.piscataway,nJ:ieee,2014:301-304.

[3]BeRiteLLiF,CaSaLeS,RUGGeRiG,etal.performanceevaluationandcomparisonofG.729/amR/fuzzyvoiceactivitydetectors[J].ieeeSignalprocessingLetters,2002,9(3):85-88.

[4]张金榜,尹冬梅.基于统计模型的语音激活检测算法改进[J].微型机与应用,2015,34(12):14-16.(ZHanGJB,YinDm.animprovedvoiceactivitydetectionalgorithmofthestatisticalmodel-based[J].microcomputer&itsapplications,2015,34(12):14-16.)

[5]SUHY,KimH.multipleacousticmodel-baseddiscriminativelikelihoodratioweightingforvoiceactivitydetection[J].ieeeSignalprocessingLetters,2012,19(8):507-510.

[6]ZHoUB,LiUJ,peiZ.noise-robustvoiceactivitydetectorbasedonfourstates-basedHmm[J].appliedmechanicsandmaterials,2013,411/412/413/414:743-748.

[7]RonaoCa,CHoSB.Humanactivityrecognitionusingsmartphonesensorswithtwo-stagecontinuoushiddenmarkovmodels[C]//proceedingsofthe201410thinternationalConferenceonnaturalComputation.piscataway,nJ:ieee,2014:681-686.

[8]肖佳林,赵聿晴,王英.基于Hmm与SVm的语音活动检测[J].计算机工程,2014,40(1):203-208.(XiaoJL,ZHaoYQ,wanGY.VoiceactivitydetectionbasedonHmmandSVm[J].Computerengineering,2014,40(1):203-208.)

[9]李嘉安娜.基于噪声环境下的语音端点检测方法研究[D].广州:华南理工大学,2015:7-40.(LiJan.Researchofvoiceactivitydetectionmethodinnoiseenvironment[D].Guangzhou:SouthChinaUniversityoftechnology,2015:7-40)

[10]CHanGJH,KimH.multipleacousticmodel-baseddiscriminativelikelihoodratioweightingforvoiceactivitydetection[J].ieeeSignalprocessingLetters,2012,19(8):507-510.

环境噪音检测篇3

关键词:语音识别;端点检测;预处理

1引言

端点检测就是把给出的一段语音找出该信号的起点和终点。预处理在语音识别系统中起着至关重要的作用,决定着识别率的高低,其中端点检测的作用是对不必要的噪声直接除去,减少存储空间,提高计算机运算的效率以及减少运算量。更重要的是端点检测可以增加语音识别的精确度,对语音段噪声进行特征识别,进而除去噪声所占有的能量尽量确保语音识别过程不受噪声的干扰。对于藏语语音的端点检测采用传统的方法即短时平均过零率和短时能量。在背景噪声较小的情况下,短时能量比较准确,但当背景噪声较大时,短时平均过零率可以获得较好的检测结果。因此一般的识别系统,其前端的端点检测过程都是将这两个参数结合用于检测语音的。

2语音系统中端点检测的方法

语音信号是时域上的非平稳信号,所以处理平稳信号的数字信号处理技术是不能直接使用了。但是在一段较短时间范围内(10ms-30ms)语音信号的特性基本相对稳定,即语音信号具有短时平稳性,也就是短时性。

2.1预加重

(1)在处理不同的对象时,语音识别系统就会有相应的处理方法,语音信号的特性决定了处理方法和模式基本相同,因此对于所有藏语语音单音节的处理就具有了解决方案,本文以单音节‘’为例进行端点检测。

首先确定语音信号的频率范围,一般的语音信号都在300-3400Hz之间,采样过程取采样频率为8kHz,160个采样点为一帧,80个采样点为步长。对输入的藏语单音节‘’的数字语音信号进行预加重,增加了高频分辨率而且便于分析。本文采用传递函数为H(z)=1-αz-1的一阶FiR高通数字滤波器来实现预加重,其中α为预加重系数,0.9

3双门限端点检测

基于短时能量和短时过零率共同决定端点的方法,短时能量能分辨出清音和浊音,短时平均过零率能分辨出清音和静音。一般的对参数设两个门限值,设置的第一个低门限值用来粗略估计语音信号是否进入语音阶段,第二个门限值则确定语音信号进入语音阶段。

要通过多次实验确定检测的高低门限,根据当时的信噪比环境结合共同确定检测的高低门限。信噪比的差异是由于语音的开始和结束由于时间上的差异造成的,所以门限选择的复杂性也就产生了。

具体步骤是把一个语音信号分成四个阶段:静音、开始、过渡、结束四个阶段。在编程过程中为了决定下一个是什么阶段就设置一个量来辨别当下的状态。整个过程是在静音阶段开始超过门限,则进入语音段,而后低于门限进入结束。判断是以门限值为根据,最短语音作为辅助来提高整体精度。为了防止一些突发性的噪声,我们设置的最短语音和最短静音就可以起到很好的作用。

在matLaB环境下双门限语音端点检测,对于语音信号的样本,是采用麦克风采集的语音信号‘’,保存方式是以wav格式存储。开始语音端点检测之前,预处理采集到的语音信号,包括分帧,加窗等。本文用汉明窗,通过窗函数特性为(1-0.93Z-1)的滤波器进行预加重。而后设置参数,设置语音帧长,帧移,FFt,门限阀值设置等。在环境比较安静的条件下采集语音,为了更加有效的得出仿真结果,加随机幅度序列与原始语音信号匹配,这样提高了噪声信号的短时能量,以及过零率,基于短时能量和过零率的语音端点检测结果如图2所示,基本可以反映有效的检测效果。如果加高斯白噪声以降低信号的信噪比,得出的结果就不能够进行有效的检测了。

4结语

语音端点检测是语音识别中至关重要的部分,决定着识别的效果,而且减少了大量的计算。本文对于藏语语音的端点检测算法进行了研究,选择了两种不同特征参数的算法,并在matLaB下进行了仿真,其主要成果如下:

(1)首先进行了传统的基于短时能量和过零率的语音端点算法研究,进行了实验仿真。

(2)选择了藏语单音节进行了研究,在不同噪声的环境下进行了仿真实验。

(3)根据同一语音信号分别在不同算法下进行了仿真实验比较,评述了每一种端点检测算法的优点和缺点。实验证明藏语语音的端点检测同样可以得到很好的结果。

参考文献

[1]胡光锐,韦晓东.基于倒谱特征的带噪语音端点检测[J].电子学报,2000,28(10):95-97.

[2]张仁志,崔慧娟.基于短时能量的语音端点检测算法研究[J].电声技术,2005(07):52-54.

[3]刘庆升,徐霄鹏,黄文浩.一种语音端点检测方法的探究[J].计算机工程,2003,29(03):120-121.

[4]江官星,王建英.一种改进的检测语音端点的方法[J].微计算机信息,2006(05S):138-139.

[5]陈玉忠,俞士汶.藏文信息处理技术的研究现状与展望[J].中国藏学,2003(04).

[6]陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(02):171-176.

[7]刘华平,李昕,郑宇等.一种改进的自适应子带谱熵语音端点检测方法[J].系统仿真学报,2008,20(05):1366-1371.

[8]徐大为,吴边,赵建伟等.一种噪声环境下的实时语音端点检测算法[J].计算机工程与应用,2003,39(01):115-117.

[9]刘晓明,覃胜,刘宗行等.语音端点检测的仿真研究[J].系统仿真学报,2005,17(08):1974-1976.

[10]李晔,张仁智,崔慧娟等.低信噪比下基于谱熵的语音端点检测算法[J].a(a+1),2005(10):1.

[11]严剑峰,付宇卓.一种新的基于信息熵的带噪语音端点检测方法[J].计算机仿真,2006,22(11):117-119.

[12]朱淑琴,裘雪红.一种精确检测语音端点的方法[J].计算机仿真,2005,22(03):214-216.

[13]陈四根,和应民.一种基于信息熵的语音端点检测方法[J].应用科技,2001,28(03):13-14.

环境噪音检测篇4

关键词:高速铁路;噪声;监测;方案

中图分类号:tB53文献标识码:a

高速铁路简称“高铁”,是指通过改造原有线路(直线化、轨距标准化),使最高营运速率达到不小于每小时200公里,或者专门修建新的“高速新线”,使营运速率达到每小时至少250公里的铁路系统。高铁交通的建设对地区的经济将生产显著的积极影响,具有明显的社会效益,但同时也带来不少的环境问题,环境污染也日益加剧,噪声污染就是环境污染的一种。

从物理学的角度看,噪声是声源做无规则振动时发出的声音;而从环境保护的角度看,凡是妨碍到人们正常休息、学习和工作的声音,以及对人们要听的声音产生干扰的声音,都属于噪声。为了正确反映高铁交通环境噪声污染水平,为噪声污染治理提供科学的依据,在整个高铁环境噪声监测工的作中,需要建立细致严密、完备周到的监测方案,保证其结果的代表性、科学性与准确性。

1监测依据

依据《铁路边界噪声限值及其测量方法》(GB12525-1990)、《铁路沿线环境噪声测量技术规定》(tB/t3050-2002)的要求,并结合高铁实际运行的特点进行监测。铁路边界噪声监测测量时段选择在上午,监测时间不小于1h,测量时段内车流密度不小于相应昼间的平均车流密度,通过的列车数量不小于6列;对于车流密度较低的线路(测量时段内通过的列车小于6列),可以分段测量列车通过时的暴露声级,计算昼间和夜间的等效声级,计算公式如下:

式中:Leq-昼间或夜间的等效声级;n-昼间或夜间通过的列车数量;t-昼间或夜间的时间,单位为秒(s);Lae,i-昼间或夜间通过的第i列列车的暴露声级。

声屏障降噪效果监测是利用列车通过时段的等效声级插入损失值进行分析与评价。

2监测实施方案

2.1测量仪器

采用HB6288B、HS5670B型声级计,测量仪器均经检定合格,测量前后用检定过的nD9声源校正器进行校正。

2.2测量人员

现场测量人员经培训合格,持证上岗。

2.3监测点的选择

为准确测量高铁运行过程中的噪声影响,监测点选取要求具有代表性,且不能受到外界噪声干扰。此次监测选取的两监测点均为路堤路段,其中监测点a铁路沿线设置了绿化带,高铁沿线集中的敏感区段,设置有2.5~3.5m高的直立路堤吸声式声屏障,符合铁路降噪设置实际情况,且便于监测仪器设备的运输。

2.4监测点的设置原则

铁路边界噪声监测点设置在铁路边界即距铁路外侧轨道中心线30m处;声屏障的降噪效果监测点分布在铁路一侧,有声屏障距铁路外侧轨道中心线30m、60m处各设一监测点,无声屏障距铁路外侧轨道中心线30m处设一监测点。监测点距铁路边沿无障碍物,所有仪器的传感器高度距地面1.5m。

2.5噪声监测量值选择

监测点B为日常监测,监测1h等效声级。监测点a监测量值设为30s等效声级,因运行在该线路上的大部分列车是CRH2型,车速为250~300km/h,这种车是8辆编组,中间车长25m,两端的头车车长25.7m,列车总长度为201.4m。列车通过测点过程中可测时间约为30s,其中列车由远及近接近测量点的时间为12s左右,列车由近及远远离测点的过程为18s左右。

2.6监测现场说明

选择在晴朗无风的天气进行,所有仪器的传感器加装风球。测试过程中无鸣笛,无突发非铁路噪声源干扰。测试时本底噪声为50dB(a)左右,同时记录每小时列车通过列数、测点与轨道之间的地面覆盖状况、树木、灌木、草地等。

3监测结果

3.1铁路沿线边界噪声监测

为了解掌握该线路所产生噪声大小及特点,2011年7月1日、2012年7月5日在监测点B开展铁路沿线边界噪声监测,距铁路外侧道中心线30m处设监测点,监测结果见表1。

分析表1可知,在2011年7月1日和2012年7月5日的两次检测结果中,1小时的等效等级别分别是61dB(a)、60dB(a),与现象的铁路边界噪音判定相关标准要求相符,即规定中明确指出,噪声的标准平均峰值(L10)应该是64dB(a)、63dB(a),而起平均中值(L50)和本底值(L90)则应分别是54dB(a)、53dB(a)和50dB(a)、51dB(a)。

3.2声屏障降噪效果监测

在2012年9月28日于距离高速铁路噪音监测点a30m和60m的地方进行的有声屏障和无声屏障降低噪音测试结果如表2所示。

分析表2可知,列车在通过有声屏障和无声屏障时其Leq有较大的区别,也就是在有声屏障环境下通过的30s内其Leq是在71.9~76.1dB(a)这个范围之内,而在无声则是在80.8~90.6dB(a)这个范围内。两种不同情况的Leq最大值分别为81.5dB(a)和95.5dB(a)。另外,在无声屏障的60m地方列车通过时的Leq又是在72.1~86.4dB(a)这个范围内。并且无声屏障在距外侧轨道中心线大约30m的地方它的噪声最大降低值为4~8dB(a),而有声屏障降低值而为7~13dB(a)。

4讨论

(1)由于我国目前针对高速铁路验收以及噪声评价的标准还没有一个确切的规范政策出台,所以目前对这一方面内容的评价大多是依照铁路边界噪音的相关规定进行判定。这个规定内的判定标准一般是不把昼夜间的鸣笛现象考虑在内,不考虑最大声级Lmax,而只是将等效声级Leq看做最主要判定标准。但是,研究结果显示,高速铁路上产生的噪音中对居民产生最大影响的主要是来自最大声级Lmax,最大声级Lmax主要是对人们正常睡眠以及学习和工作产生非常严重的影响,所以也就是说这个专门针对铁路边界噪音的规定标准不符合高速铁路噪声评价要求。

(2)一般而言,铁路噪声的评价本身就不是一项单独的工作,而是具有综合性性质的工作,这一评价过程中不仅仅要考虑到铁路边界的噪声最大和最小限值,同时还需要考虑到居民聚集地的声音环境评价相关标准。也就是说,在实际检测过程中有可能出现检测结果低于铁路边界的噪声最大和最小限值,但是却超过居民聚集地的声音环境指标标准最大值的现象,也就是已经严重影响到居民的正常生活和工作。目前,对铁路边界噪音的相关测量以及判定标准是我国现在执行的、最为有限的一个标准。但是同样,针对居民区的声音环境质量标准的制定也是以确保居民区声音质量为根本出发点而设计的标准。所以,也就是说,无论铁路边界噪音的最大标准值是多少,铁路边界实际的噪音值也不应该超过居民区的这个声音环境质量标准值。这两个标准值之间是有较大的不同,但是若两者能够较好的协调,那么将能够实现更好为人们服务的目的。

(3)高速铁路的的声音屏障降噪效果的评价量一般有两个,即昼夜连续a声级插入损失值以及列车通过时的稳定插入损失值。高速铁路之所以设置声音屏障工程的根本目的就是为了尽可能消除和减小列车运行产生的噪音。但是,当我们在这个屏障中使用昼夜连续a声级作为主要的评价量时,就会出现测量过程中有其他生源进入评价范围,影响插入损失值的问题。所以,相比较而言,使用列车运行时的声级插入损失值作为声音屏障的评价量则相对比较符合实际。本研究就使用列车运行计算评价量方式,实践结果显示,这种评价方式除了可以有效避免其他噪声源影响的问题,同时又能够为测量人员创造良好的测量环境,提高测量效率。本测试在测试a声屏障降噪效果时,在不同的测试位置和距离均有明显差异,即在距离外车道中心线大约30m的地方测试结果是能够降低大约7~13dB(a)的噪音。而在路堤声屏障为3.5m高左右地位测试,测试结果显示该地方能够降低大约3.6~6.5dB(a)噪音。出现这种现象的原因可能是铁路周围有绿化带,所以将一部分噪音给隔离和消除。

结语

总之,进行高速铁路交通环境噪声监测的目的是为了客观真实地反映环境噪声污染水平,从而为高速铁路环境噪声污染治理提供科学的依据。因此,必须针对高速铁路的具体特点采取合理的环境噪声监测实施方案,合理确定监测点位,正确选择监测仪器,不断提高监测人员的业务技术水平,确定好监测时间。只有这样才能准确掌握铁路交通环境噪声现状,分析其变化趋势和规律,为环境噪声治理提供科学的监测依据,从而保障铁路沿线居民的声环境质量。

参考文献

环境噪音检测篇5

关键词:端点检测特征参数短时能量双门限法

中图分类号:tn912文献标识码:a文章编号:1003-9082(2016)01-0006-01

一、引言

目前,对自动语音识别在一般非噪杂环境下的研究已经达到了一定程度。为进一步提升其识别效果,我们让其应用于噪杂的环境中,研究其识别效果。其中,文献[1]提出了批处理模式算法可以精确的检测到端点,使得计算复杂度少了很多。文献[2]中主要是设计了一个滤波器,为了提高精度和鲁棒性的检测,将滤波器加入到自动语音识别中,从而达到所需要的效果。文献[3]对于孤立词识别系统的描述,利用LpC分析未知单词,K-最近邻(Knn)决策规则,动态时间规整每个未知单词的参考模板,以此来得出结果。

从端点检测的提出到现在,已经研究出一些方法实现。端点检测通常是对其特征参数的研究,包括一些语音信号最基本的信息,如特征信息、语义信息等等。采用本文研究方法效果最好,但此方法并不能直接有效的确定出语音信号的始端和尾端,只是可以模糊的判断出语音的大概位置。找到了大概位置之后就可以将一段语音的清音和噪音分离开,这样才能较为精确地确定语音的起点和终点的位置。

二、基于短时能量的端点检测

短时能量通常适用于SnR(Signal-to-noiseRatio,简称SnR)较高的噪声环境下的语音信号,高SnR噪声环境下的检测正确率较高。通常,噪声环境下利用短时能量算法进行检测所需要的计算量也比较小。短时能量的定义如下:

其中,。

图1语音信号的短时平均能量实现图

如图1所示,窗口加权短时能量就是将语音信号进行平方运算,然后通过线性滤波器低通滤波进而输出。低通滤波主要为了减少外来的噪声的影响以及大部分共振峰的影响。语音信号的平方在一个冲激响应为的线性滤波器的作用下输出的就是短时能量。所以,窗函数的选择对短时能量的性质起着决定的作用,有两个方面的原因,一方面是使用哪种类型的窗函数,另一方面是窗长度设置多长最合适。若窗的长度设置相对较短,随着时间的变化导致短时能量发生剧大变化,所以就无法得到平滑的能量函数。通常情况下,窗长设置为几个基音周期的数量级。

三、短时平均过零率

短时平均过零率中过零就是指语音波形与坐标轴的交点,在离散信号序列上的表现就是相邻的两个采样值是异号,也就是单位时间内与坐标轴相交的点数。简单来说,在语音信号的分析当中,通常把短时平均过零率看作是一类特征参数。其定义如下:

其中,sgn[x]是取符号函数,它的定义为:

从定义中我们看出,短时平均过零率实际就是离散型信号采样点的符号的变化的次数,为了使过零的计算更加的准确,我们使用了滤波器对原始信号进行带通滤波。对于短时平均过零率的算法流程分以下三个步骤,第一,要对语音信号序列划分成成对的,我们所要做的就是通过查看符号的正负变化,来记录其过零的情况,如果涉及到符号的正负变化,则记录一次过零现象。第二,对于离散信号得到的序列要进行一阶差分运算来实现奇异点检测。第三,对其进行低通滤波。

由于一般情况下浊音通常具有较低的过零率,而清音则具有较高的过零率,所以在某种程度上,短时平均过零率能够反映出频率的高低,所以通常用来清浊音的初步判断。简单来说,就是短时能量更适合浊音的检测,短时平均过零率更适合清音的检测,所以对于一般的发音,仅仅用其中一种方法来检测是远远不能达到我们所需要的效果。因此,将两者结合起来对端点进行检测将会达到很好的结果。

四、双门限法端点检测

双门限端点检测算法通俗来说,就是在一段语音信号上通过上、下设置两个限制来进行端点的检测。通过以上研究,我们得到短时能量对于信号的浮动比较敏感,所得到的数值又计较小,可以将其设置成低门限。而计算短时平均过零率得到的数值比较大,只有信号足够强的时候才可以超越,所以将其设置为高门限较为合适。这就是本文主要讲的设置了两个参数的“双门限法”端点检测算法。

五、结束语

本文使用matlab软件对双门限端点检测法进行编程和仿真,实验语音采用的是男声藏语拉萨话,在安静的环境和带有噪声的环境下分别作出了分析。实验证明,短时能量及短时平均过零率更适合在有噪声的环境下进行端点检测,同时说话人的情感对检测结果也有一定的影响。

参考文献

[1]LiQ.RobustendpointDetectionandenergynormalizationForReal-timeSpeechandSpeakerRecognition[J].ieeetrans.onSpeechandaudio,2002,10(3):146-157.

[2]CHLee,QpLi.methodandapparatusforperformingreal-timeendpointdetectioninautomaticspeechrecognition[J].US,2004.

环境噪音检测篇6

北京市朝阳区通惠家园的16户业主因居住环境噪音超标,向朝阳区人民法院起诉,要求北京城市开发集团有限公司、北京首创股份有限公司、北京市路政局、北京地铁集团有限责任公司消除噪音,赔偿损失。

16户业主诉称在入住北京城市开发集团有限公司负责建设的朝阳区通惠家园小区后,深受环境噪声的侵扰,身心受到很大的损害。噪音来自北京首创股份有限公司负责经营的京通快速路主路、北京市路政局管理的京通快速路辅路和由北京地铁集团有限公司负责经营的八王坟至通州段地铁。经委托有关部门进行环境噪音检测,结果显示环境噪音严重超标。16位业主分别起诉,要求四被告立即消除环境噪音污染,赔偿损失1万元,并支付171元的检测费用。

目前,此案正在进一步审理之中。

环境噪音检测篇7

噪音是一类引起人烦躁、或音量过强而危害人体健康的声音。从物理学观点看,是不同频率和不同强度的声音的无规律的杂乱组合。从生理学观点讲,凡是使人们讨厌的、烦躁的和不需要的声音都叫噪声。噪声的来源主要有四种,它们是交通噪声、工业噪声、生活噪声和商业活动噪声。噪音污染是指所产生的环境噪声超过国家规定的环境噪声排放标准,并干扰他人正常工作、生活和学习的现象。根据发生噪声的性质可以分为交通噪声、工业噪声、建筑施工噪声、生活噪声等。其中建筑施工产生的噪音对市民的影响比较大。噪声对环境是一种污染,必须加以控制。

1噪音污染对人类健康造成的危害

1.1损害听力

据有关检测表明,噪声损伤人类听觉,人短期处于噪声环境时,即使离开噪声环境,耳朵也会造成短期的听力下降,但当回到安静环境时,经过较短的时间即可以恢复,这种现象叫听觉适应。当人连续听摩托车声,8小时以后听力就会受损;若是在摇滚音乐厅,半小时后,人的听力就会受损。噪声对语言交流也产生干扰,噪声对语言交流的影响,来自噪声对听力的影响。这种影响,轻则降低交流效率,重则损伤人们的语言听力。

1.2引起多种疾病

噪声除了损伤听力以外,还会引起其他人身损害。噪声可引起多种疾病,我国对城市噪音与居民健康的调查表明:在强声下,高血压的人会不断增多。某一地区的噪音每上升一分贝,高血压发病率就增加3%。噪声还可引起心脑血管疾病的发生。噪声可以引起心绪不宁、心情紧张、心跳加快和血压增高。噪声还会使人的唾液、胃液分泌减少,胃酸降低,从而易患胃溃疡和十二指肠溃疡。一些工业噪声调查结果指出,劳动在高噪声条件下的钢铁工人本文由http://收集整理和机械车间工人比安静条件下的个人循环系统发病率高。

1.3影响睡眠,造成疲倦

噪声会对睡眠产生严重的干扰,人类有近1/3的时间是在睡眠中度过的。睡眠是人类消除疲劳、恢复体力、维持健康的一个重要条件。但较强的环境噪声会使人不能安眠或被惊醒,在这一方面,老人和病人会对噪声干扰更为敏感。当睡眠不足后,工作效率和健康都会受到严重影响。

1.4影响人的情绪

身处噪音污染严重的环境中,会影响人的神经系统,使人急躁、易怒和不安。长期生活在噪声超标的环境中,人会烦躁不安,精神紧张,影响人的情绪,严重时还会危害人体健康。

随着我国第三产业的不断发展壮大,噪声污染正在成为城市环境的主要污染之一。同其它污染一样不但影响一个地方的幸福指数,影响人们正常的工作和休息,产生各种相关疾病,噪声的存在还会影响一个城市地方的对外形象,会对这个地方的投资环境带来负面影响,因此必须采取措施加以治理。

2治理噪音污染的措施

2.1强化宣传

通过网站、宣传栏、横幅和传单等宣传手段,加强了对环保法律法规、《城市区域环境噪声标准》的宣传教育,加强对职工的思想教育,不得喧哗和大喊大叫,环保部门应派人员深入工地、歌厅等噪声污染源宣传环保知识,宣传噪声污染处罚条例等环保法律法规,倡导商家

转贴于

文明经商习惯,有效提高企事业单位法人、员工和学生及市民等的环保意识。

2.2加强管理

有关部门应严格工程建设项目审批制度,加强了建设项目的督察管理,拆除噪声源,对所有商业门店安置的音响或喇叭一律拆除。利用科技手段实现城市噪音进行检测与监控;各工程项目要按规定到市环保部门办理噪音审批手续,并按审批的噪音指标进行施工,合理安排施工时间,将噪音较大的机械安排在非休息时间,从而减轻噪音扰民。砼振捣尽量采用小功率机械,楼层砼浇灌尽量减少在夜间施工。对施工现场的施工机械加强维修保养或安装消声装置等减少机械噪音。加强对社会生活噪声的污染防治,清除学校、医院、办公等敏感区域的噪声污染源点,确保功能区噪声达标。加强了。交通噪声污染治理,划定高噪声车辆进入市区的时间和路线,最大限度地降低在城区主要路段的交通噪声,设立禁鸣啦叭标志等。

2.3加强巡查

环保相关部门定期不定期对建筑工地进行检查,发现超过施工噪音标准的单位均及时依法进行严格惩处并令其整改。相关部门应及时制定地方法律法规,完善执法依据,完善各项制度,明确管理职责,建立联合执法机制。开展经常性的检查,确保长期有效的治理效果。

2.4严管重罚

环境噪音检测篇8

中图分类号:X4文献标识码:a文章编号:1009―914X(2013)35―623―01

大型加热炉、输油泵、发电机、鼓风机和空压机等会产生大量的噪声源,经现场检测输油泵区等场所噪声高达89.7dB(a)生产作业场所噪声,存在于加热炉、输油泵、发电机、鼓风机和空压机等。作业人员在产生噪声的岗位日接触时间为2∽12小时。生产性噪声达到一定强度时成为有害因素,对人体危害突出表现在对听觉器官和听力损伤上。职业性听力损伤,亦称职业性耳聋,属法定职业病之一。此外,生产性噪声对某些接触者的神经系统、心血管系统、生殖系统和消化系统也将产生一定的损害。生产性噪声危害的发生和程度主要决定于噪声强度、接触噪声时间、噪声的频率及频谱特性、接触者的敏感性等职业病隐患。

一、噪声对于人体的危害主要体现在生理和心理两个方面

生理上面的危害主要有:

1、损害听力。

噪声会严重影响听觉器官,甚至使人丧失听力。有关资料表明:当人连续听摩托车声,8小时以后听力就会受损;若是在摇滚音乐厅,半小时后,人的听力就会受损;若在80分贝以上的噪音环境中生活,造成耳聋的可能性可达50%。

2、损害视力

耳朵与眼睛之间有着微妙的内在“联系”,当噪声作用于听觉器官时,也会通过神经系统的作用而“波及”视觉器官,使人的视力减弱。研究指出,噪声可使色觉、色视野发生异常。调查发现,在接触稳态噪音的80名工人中,出现红、绿、白三色视野缩小者竟高达80%,比对照组增加85%。

3、有害于人的心血管系统。

我国对城市噪音与居民健康的调查表明:地区的噪音每上升一分贝,高血压发病率就增加3%。

4、影响人的神经系统,使人急躁、易怒。

科学研究发现,噪音可刺激神经系统,使之产生抑制,长期在噪音环境下工作的人,还会引起神经衰弱症候群(如头痛、头晕、耳鸣、记忆力衰退、视力降低等)。

5、影响睡眠,造成疲倦。

噪声对睡眠的危害:突然的噪声在40分贝时,可使10%的人惊醒,达到60分贝时,可使70%的人惊醒。

从心理方面来说,噪声首先会引起睡眠不好,注意力不能集中,记忆力下降等心理症状,然后导致心情烦乱,情绪不稳,乃至忍耐性降低,脾气暴躁,最后产生高血压、溃疡、糖尿病等一系列的疾病。心理学上将这种病症称为心身疾病,意指由心理因素引起的身体上的疾病。

二、噪声危害的预防

由于目前对噪声性聋的治疗尚缺乏特别有效的方法,所以关键问题是预防,根本措施是全社会进行噪声污染源的治理。具体地讲,噪声性聋的预防应从以下几个方面入手:

(1)宏观控制:国家有关部门制订噪声卫生标准,噪声控制的有关法律、法令和法规,为治理噪声和预防噪声性耳聋提供法律和技术保证。我国在这方面极为重视,先后制订了《中华人民共和国环境噪声污染防治条例》、《工业、企业噪声卫生标准》和《城市区域环境噪声标准》等。

(2)噪声源控制:控制噪声强度,改善工作和生活环境,是防治噪声危害最根本、最有效、最积极的方法。环保机构和噪声源单位应对环境和车间的噪声进行定期监测,将噪声强度控制在国家标准所许可的范围之内。

(3)个人防护:切实做好个人防护,处于噪声较大的环境中时,必须按照劳动保护的要求坚持使用防护用具,如防噪声耳塞、耳罩和耳帽等。而大多数在作业场所工作的员工职业病防治意识和能力较为薄弱。同时不定期地检查个人防护用品配备情况,如有过期、损坏及时维修及更换,切实维护劳动者合法权益,保障劳动者健康,促进和谐社会建设

(4)听力监测:在较强噪声环境中工作者,应定期进行听力监测,及早发现听力下降;已有感音神经性耳聋者,应避免在强噪声环境中工作。

三、预防噪声的具体措施

生产性噪声达到一定强度时成为有害因素,对人体危害突出表现在对听觉器官和听力损伤上。职业性听力损伤,亦称职业性耳聋,属法定职业病之一。此外,生产性噪声对某些接触者的神经系统、心血管系统、生殖系统和消化系统也将产生一定的损害。生产性噪声危害的发生和程度主要决定于噪声强度、接触噪声时间、噪声的频率及频谱特性、接触者的敏感性等因素,因而要预防其危害需从以上几方面着手,主要措施如下:

1.改造声源、降低噪声。通过技术革新,把发声物体改造为不发声或发小声的物体是根本措施。

2.对噪声传播途径采取措施降低噪声强度。

具体又可分为:把高噪声机器与低噪声机器分开布置;采用消声器或用消声、吸声、隔声材料阻隔声源。

3.加强个人防护。最常用的方法是配戴耳塞、耳罩、防声帽。

4.定期进行健康监护体检,筛选出对噪声敏感者或早期听力损伤者,并采取相应措施。

环境噪音检测篇9

关键词:声学事件检测;鲁棒性特征提取;行车噪声环境;动态自适应;mFCC

中图分类号:tp391.4文献标识号:a文章编号:2095-2163(2014)02-

anacousticfeatureextractionapproachbasedonfrequencyselectivityofhumanauditoryunderdrivingnoisyenvironments

peiXiaozhong,ZHenGtieran,HanJiqing

(SchoolofComputerScienceandtechnology,Harbininstitudeoftechnology,Harbin150001,China)

abstract:thispaperpresentsanacousticfeatureextractionapproachbasedonweightingmelfilterbanks.Byextractingtheformantinformationofaudiosignal,thismethodusesdynamicadaptivemethodforweightinghigh-frequencypartofthemelfilterbanktoachievethepurposeofsimulatingtheauditoryfrequencyselectionmapping.ComparedtotheconventionalmFCCfeature,theproposedfeatureismoresuitableforthefastacousticeventdetectionunderdrivingnoisetaskandmakesupthepoorrobustnessofthetraditionalmethodswhichisresultingwiththelowresolutionofmelfilterbankatthehigh-frequencypart.theexperimentsshowthattheproposedfeaturehelpstoimprovethedetectionrateofacousticeventsinthelowSnRdrivingenvironment.

Keyword:acousticeventDetection;Robustacousticfeatureextraction;drivingnoisyenvironments;Dynamicadaptive;mFCC

0引言

声学事件检测(acousticeventDetection,aeD)就是检测当前环境中发生的特定目标声学事件,然后把检测出的声学事件转换为人类或者智能设备可以理解的信号,为人类或者智能设备的决策提供信息。在声学事件检测研究中,研究者们做出了大量的贡献。目前研究主要聚焦在提取适合检测任务要求的声学特征表示和声学事件的分类算法方面。在声学特征方面,研究者们尝试了各种声学特征,如:梅尔倒谱系数(mel-frequencycepstralcoefficients,mFCC)[1]、线性预测倒谱系数(Linearpredictioncepstralcoefficients,LpCC)[2]、基频(pitch)[3]、频谱质心(Spectralcentroid)[4]等。在声学事件的分类方法中,研究者们也尝试了各种不同的方法,包括基于支持向量机(SupportVectormachine,SVm)方法、隐马尔科夫模型(Hiddenmarkovmodel,Hmm)方法、人工神经网络(artificialneuralnetwork,ann)方法等。近几年来,SVm方法[5]和Hmm方法[6]成为最主流的声学事件分类方法。

在本文的研究工作中,将会尝试在行车噪声环境下,检测车辆周边发生的各种目标声学事件。由于行车中的声学环境较为复杂,当车辆行驶速度较快或者路况较差等情况存在时,噪声频谱污染就较为严重,传统的声学特征,例如:mFCC在中高频部分的滤波器分布较为稀疏且处此滤波环境下,而中高频部分噪声较强时,目标声学事件的检出率即会显著下降。

对强噪问题,研究者们通常采用降噪模式来增强目标声音信号的方法,如:高斯模型假设下的维纳滤波增强算法[7]、基于听觉掩蔽效应的增强算法[8]、谱减法[9]等。综合评析可知,基于高斯模型的滤波方法计算复杂度较高;基于听觉掩蔽效应的语音增强算法则不能充分地模拟人耳对于声音的感知;而在降噪中普遍使用的谱减法却存在“音乐噪声”的问题,导致降噪后声音信号的频谱破坏较为严重,使得提取出的特征不能很好地刻画声音信号的目标声学事件的频谱特性。

耳蜗是人类接收和处理外界声音信号的主要器官,在提取可辨性的声音特征,以及对背景噪声的鲁棒性方面均表现出高强的能力。耳蜗生理学研究成果表明,耳蜗的这种能力主要来自于以下几个方面:基底膜的频率分析功能、外毛细胞/覆膜的主动选择性增益功能等[10]。其中,基底膜的主要功能是将接收到的声音信号分解为各个频率上的振动峰值,并将相应的振动传递给外毛细胞和内毛细胞;外毛细胞/覆膜则主要依据接收到的振动对特定频率处的能量进行选择性增益,影响相应位置处的内毛细胞发放强度。

针对传统声学事件检测方法存在的问题以及人耳中耳蜗的听觉感知特性,本文提出了一种模拟人耳听觉感知的基于共振峰的mel滤波器组的加权算法,通过模拟人耳的听觉感知特性,加强了mel滤波器组对中高频的分辨能力,并采用加权后的mel滤波器组提取FmFCC(Formant-mFCC,FmFCC)系数。实验证明,FmFCC对噪声有更好的鲁棒性,并且在目标声学事件信号较弱时,也不会增加误识率。

1共振峰的提取

声音信号的倒谱可以通过先对信号做傅里叶变换、取模,得到信号的频谱密度,然后求频谱密度的对数,最后求反傅里叶变换得到。根据参数模型功率谱估计的思想,可以将声音信号看作一个输入序列激励一个全极点的系统而产生的输出,系统的传递函数为:

……………………………(1)

其中,为常数,为实数,为模型的阶数。

由于频率响应反映了被分析信号的频谱包络,因此用来代替频谱密度,对求对数后,做傅里叶反变换求出的LpC倒谱系数,也被认为包含了信号频谱的包络信息,因此将其看作是对原始信号短时倒谱的一种近似。

的冲击响应为。欲求的倒谱,根据同态分析法,因为是最小相位的,所以一定可以展开成级数的形式,即的逆变换是存在的,可得:

……..….(2)

因此,只要计算出线性预测系数,就可以求出倒谱,通过对倒谱进行搜索,找到每一个共振峰所在的频率,记为,其中表示共振峰的个数。

2mel滤波器组的加权

2.1模拟频率选择性增益功能

人耳的选择性增益功能对人耳耳蜗的听觉感知至关重要,人耳的选择性增益机制主要包括:频率相关的增益区间和增益函数。考虑到人耳覆膜的行波振动范围有限,因此其频率增益区间仅局限于中心频率附近[11];增益函数在频域的对数尺度上近似于高斯函数,在共振峰频率处的增益幅度最大,而在共振峰频率两侧的增益幅度迅速衰减。这即导致共振处的频率振幅能量在急剧增加的同时,两侧的频率振幅能量急剧降低,表现出人耳的频率选择性增益功能。

下面给出一种方法把LpC谱估计法提取出的共振峰的信息应用到mel滤波器组中,从而弥补mel滤波器组在中高频分辨率不足的问题。

考虑到在频率的对数尺度上,耳蜗的频率增益曲线类似于高斯密度函数,在共振峰处,耳蜗的频率增益最大,而在共振峰所在频率的两侧,耳蜗的增益幅度迅速衰减,根据以上分析,设计了如下函数来模拟耳蜗基底膜与覆膜之间的频率选择增益函数:

……(3)

其中,表示第个子带的频率中心,表示第个子带的宽度,表示mel滤波器组中包含的mel子带的个数;表示检测到的第个共振峰的频率,表示第个共振峰的振幅在个共振峰的振幅总和中所占的振幅能量的比例,该比例用来表示第个共振峰的强弱;是一个指示性函数,如果共振峰的频率在以为中心,以为宽度的第个mel子带中,则返回1,否则返回0。

2.2mel滤波器组的加权

通过对每一帧中共振峰所处的mel子带对应的mel滤波器系数进行加权,突出共振峰所在的mel子带的频率,从而模仿人耳覆膜的频率选择映射,由此即弥补了mel滤波器组在中高频分辨率较低的不足,同时也增强了传统mFCC对噪声的鲁棒性。这符合人耳的听觉感知机理,如在众多嘈杂的背景环境噪声中,要想别人听清楚自己说话,必须提高声音的分贝,掩盖其他背景声音。

根据mel滤波器组中每一个mel子带在对数频率中的分布范围,对目标声学事件(鸣笛)的每一帧数据在对数频域上进行划分,通过对分帧后的每一帧数据利用LpC倒谱估计的方法来提取其中的共振峰信息。图1中虚线为加权前的滤波器组系数,实线即为加权后的滤波器组系数;通过观察可以看出:第7、9、11、13、14、16个mel滤波器明显得到了增强,解决了传统的mel滤波器的中高频分辨率低的问题。

图1加权前后的滤波器组

Fig.1Filterbankofweightsbeforeandafter

3基于加权后的mel滤波器组的FmFCC特征提取

首先对采集的声音信号进行预加重、分帧、加窗等预处理,然后对每一帧的数据使用LpC倒谱法提取共振峰的信息,接下来根据提取的共振峰信息以及mel频域子带的划分确定当前数据帧的每一个mel滤波器的加权系数,从而获得加权后的mel滤波器组,此后对每个滤波器的输出进行指数压缩,再对经过指数压缩的能量谱进行离散余弦变换,并经过升半正弦倒谱提升,最终得到FmFCC特征。

4实验结果与分析

根据本文提出的加权mel滤波器组进行车载系统的鸣笛声学事件的检出实验。在实验中,搭载声学事件检测系统的车辆分别在不同的速度和不同的路况下对测试数据进行采集,测试数据中长鸣笛(每一个长鸣笛时长大于1.5秒),包括100个,短鸣笛(每一个短鸣笛时长小于1秒),包括为100个,笛语(由不同的长、短鸣笛序列组成)25个。基线系统使用的特征是传统的mFCC,而实验系统使用的是加权后的mel滤波器组提取的特征,具体的实验结果如表1所示。

通过分析表1可以获知,与传统的mFCC特征相比,加权后的FmFCC特征有着更高的召回率和更低的误识率,因此FmFCC更适应于行车噪声环境下的声学事件检测。

表1加权前后的检测系统性能对比

tab.1Comparisonofdetectionsystem’sperformanceofweightsbeforeandafter

ae

指标长鸣笛短鸣笛笛语

基线系统实验系统基线系统实验系统基线系统实验系统

R(召回率)75%86%72%80%63%75%

D(误识率)5.7%5.9%9.7%9.7%31.3%31.5%

响应时间(s)125ms139ms125ms139ms150ms169ms

加权前后的mFCC特征鲁棒性对比结果则如图2所示。通过图2可以看出,随着车内噪声的不断加强,传统的mFCC的准确率明显下降,而本文提出的FmFCC却只有少许下降,说明了FmFCC对噪声有较强鲁棒性。

图2加权前后的mFCC特征鲁棒性对比

Fig.2ComparisonofmFCC’srobustnessofweightsbeforeandafter

5结束语

本文提出了一种基于人耳频率选择特性的加权滤波器组的FmFCC特征,使用LpC倒谱法提取共振峰的信息,模拟人耳的频率选择特性对mel滤波器组进行加权,提取FmFCC系数。加权mel滤波器组提取的FmFCC系数已经应用到行车噪声环境下的快速声学事件检测系统中。实验表明,在一定程度上提高了系统的准确率,降低了系统的误识率,并有效增强了传统mFCC对噪声的鲁棒性。

参考文献:

[1]meSaRoSa,HeittoLat,eRonena.acousticeventdetectioninrealliferecordings[C]//18theuropeanSignalprocessingConference,aalborg:proceusipco(2010),2010:1267-1271.

[2]RUVoLop,FSSeLi,moVeLLanJ.alearningapproachtohierarchicalfeatureselectionandaggregationforaudioclassification[J].patternRecognitionLetters,2010,31(12):1535-1542.

[3]poRteLoJ,BUGaLHom,tRanCoSoi.non-speechaudioeventdetection[C]//ieeeinternationalConferenceonacoustics,SpeechandSignalprocessing,taipei:[s.n.],2009:1973-1976.

[4]wiCHeRnG,XUeJ,tHoRnBURGH.Segmentation,indexing,andretrievalforenvironmentalandnaturalsounds[J].ieeetransactionsonaudio,Speech,andLanguageprocessing,2010,18(3):688-707.

[5]YeLamoSp,RamiReZJ,GoRRiZJm.SpeecheventdetectionusingSupportVectormachines[J].internationalConferenceonComputationalScience,2006,4:356C363.

[6]LoJKam,pLeVam,JUHaRJ.modificationofwidelyusedfeaturevectorsforreal-timeacousticeventsdetection[C]//55thinternationalSymposiumeLmaR.Zadar:ieeeCommunicationsSociety,2013:199-202.

[7]Cappeo.eliminationofthemusicalnoisephenomenonwiththeephraimandmalahnoisesuppressor[J].ieeetrans.Speechaudioprocess.,1994,2(2):345C349.

[8]ViRaGn.Singlechannelspeechenhancementbasedonmaskingpropertiesofthehumaauditorysystem[J].ieeetrans.Speechaudioprocessing,1999,7(2):126-137.

[9]BoLLS.Suppressionofacousticnoiseinspeechusingspectralsubtraction[J].ieeetransactiononacoustic,speechandsignalprocessing,1979,27(2):113-120.

环境噪音检测篇10

文献标识码:B文章编号:1008-925X(2012)07-0143-02

摘要:

文章简要分析了建筑施工噪音的危害,并阐述了建筑施工噪声污染的来源,最后探讨了建筑施工噪声污染的控制对策。

关键词:施工噪音;控制对策;机械噪声

1引言

建筑施工噪声是指在建筑施工过程中产生的对周围居民正常工作和生活造成干扰的声音。由于施工中要使用大量的动力机械,频繁的运输材料和构件,挖掘、打洞、搅拌、切割、振捣等工序,难免对产生各种噪音污染,进而影响人们的正常生活,引发各种纠纷案件。噪声污染作为一种无形的污染,具有暂时性、局部性和多发性的特点,如果人体长期处于高噪声环境下而未采取防护措施,那么必将给人的听力造成不可挽回的损伤,乃至职业性耳聋。噪音污染还可对人体的神经系统、消化系统和心血系统等产生不良的影响。鉴于以上原因,如何在城市建设过程中降低建筑施工噪声,减轻对市民的干扰,创造一个安静、清洁、舒适的环境,保证人们正常的工作秩序和生活秩序,就成为建设单位和施工单位亟待解决的问题,也是环境管理部门面临的难题。

2建筑施工噪声污染的来源

噪音是建筑施工中常见的问题,也是居民反应最强烈的问题,通常建筑施工噪声占环境噪声源的5%,而各种施工机械又是建筑施工中的噪音污染的主要来源。施工现场产生噪声的设备和活动有以下的几个施工阶段:

土石方施工阶段:运输车辆、推土机、挖掘机、装载机等;

打桩阶段:打桩机、振捣棒、混凝土搅拌车等;

结构施工阶段:混凝土搅拌车、振捣棒、电锯、搭拆钢管脚手架、支拆模板、模板修理、外用电梯等;

装修及机电设备安装阶段:拆脚手架、石材切割、外用电梯、电锯等。

3建筑施工噪声污染的控制对策

3.1相关部门加大对建筑施工的审批力度。

应将建筑施工噪声管理纳入制度化轨道,重点做好建筑施工工程登记、注册和申报审批工作。各工程施工单位都必须到环保部门登记注册,如实地说明工程建设的阶段性情况,使环保部门掌握项目的工程规模、工程期限、周围人口居住情况,尤其是要说明容易产生噪声的工程设备的安置地点,让环境保护部门预测各施工阶段可能产生环境噪声污染范围和污染程度。对在城市市区噪声敏感建筑物区域内,要求不得在夜间从事产生环境噪声污染的建筑施工作业,对需要夜间施工的工程进行严格的审批,应协调好与周围居民的关系,制定有效降低噪声的措施,经环保部门审查批准后方可开工。

3.2加大对建筑施工噪声的现场监测和监督。

环保部门应加强管理监督,限制其施工时间及高噪声施工机械,采取抽查方式监测其场界噪声,将施工噪声控制在允许范围之内。针对建筑施工噪声集中的特点,环保部门应专门成立施工噪声检查小组,不定期检查辖区范围内的建筑施工工地,尤其是要重点加强对居民稠密区的工程的检查。对现场检查中发现的问题,要采取有力地措施进行查处,促进施工单位进行噪声防治。可根据施工期噪声对环境污染范围、强度向建设单位预征施工场界噪声排污费,以便补偿对周围居民及社会环境造成的损失。

施工场地周围的居民和团体有权提前了解施工可能带来的噪声污染情况,并提出意见,施工单位应听取民众意见,接受公众监督;在对待群众投诉问题上,施工单位要不断总结,查找自身不足,并认真采取措施,抓好整改落实,环保部门对于施工噪声污染严重并且不予以整改的,要根据相关法律进行严肃处理,保证施工噪声污染防治措施的有效实施,保障群众的合法权益。

3.3加大建筑施工噪声防治的宣传力度。

在建筑施工噪声管理过程中,要经常对施工单位进行有关环保政策、法规的宣传,传达有关噪声管理的规定,加强施工队伍的教育,提高其环保意识和社会公德,让他们意识到施工噪音的危害,了解降低施工噪音所带来的环境效益、经济效益和社会效益,促使他们自觉遵守相关环保法规,并进行噪声治理,努力降低施工噪声污染。

3.4合理控制施工现场的机械噪声。

由于建筑施工噪声主要来自各类施工机械,尤其是我国施工机械生产技术比较落后,使得许多施工设备的噪声都比国外同类产品的高,这需要机械制造厂商重视机械工艺改进。应推行清洁生产,必须采用先进的施工技术和低噪声的施工机械,对环境噪声污染严重的落后施工机械予以淘汰,并采取一定的技术措施降低施工噪声,创造良好的施工环境,以实现对周边城市环境的保护。

对土方中的挖掘机、拖拉机、推土机等大型设备,要想消除其噪声比较困难,但可合理安排台班作业,避免在夜间或中午人们休息时采用这类机械设备进行作业,施工时可在工作区域周边搭设隔音防震墙等办法来减轻施工噪声对周边居民的影响。

产生噪声较大的钢管切割机和电锯等小型设备,在模板支护和脚手架搭设方面使用较多,可通过优化施工方案来减弱其噪音,如为避免对钢管和模板的切割,可采用定型组合模板和脚手架等。在制作模板支护和脚手架时,可移至房屋地下室等隔音处进行施工,以避免对周边的干扰。

混凝土施工机械的噪音也较大,对于城区重点区域要避免使用混凝土搅拌机,选择采用商品混凝土。混凝土振捣时,振动棒因其自身的工艺原理,噪音较大,应采用和易性较好的、可以减少震捣时间和次数免震自密实混凝土,在工作的施工层周围搭设隔震板等设施,并合理安排工作时间,消除振动棒噪音污染。混凝土输送泵车由于功率大,噪音也较大,但它是高层建筑输送混凝土的重要动力,必要时采用围护隔震措施来减轻其噪音污染问题。

总之,可运用消声、吸声、隔声、隔振等技术来降低施工机械噪声。如纤维材料、颗粒材料、泡沫材料等吸声材料吸收噪声的频率较宽,可在打桩机、搅拌机等高噪声施工机械附近设置吸声屏,能降低噪声15dB(a)。采用阻性消声器、扩散消声器、抗性消声器、缓冲消声器等消声方法,可有效降低通风机、压风机等产生空气动力性噪声源的施工机械的中高频噪声源。

4结语

随着我国经济建设步伐的加快,各项建筑工程也在在如火如荼的开展,但建筑施工不能以噪声扰民为代价。建筑施工单位要积极采取措施,合理安排施工工序和作业时间,采用先进的施工机械设备和施工技术工艺,严格按施工程序办事,配合环保部门,做好施工噪音污染的防治工作,努力将施工噪声对周围群众的影响降到最低,真正做到文明施工。

参考文献

[1]林新发,浅谈建筑施工中的环境问题及建议[J.]科技咨询导报.2007,(29)