小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

幾種語音端點檢測方法簡介

 霞客書齋 2018-09-22

幾種語音端點檢測方法簡介

2011年第11期福建電腦

67

幾種語音端點檢測方法簡介

邢亞從

(蘇州市職業(yè)大學江蘇蘇州215000)

【摘要】:語音的端點檢測在語音的編碼、語音識別、語音增強、說話人識別中起著非常重要的作用,直接影響著后續(xù)工作的正確率。本文在雙門限檢測法的基礎上,介紹了基于自相關極大值和基于小波變換的端點檢測方法,闡述其優(yōu)缺點。

【關鍵詞】:語音端點檢測、過零率、小波變換、自相關極大值端點檢測是語音識別中非常重要的一步。所謂語音端點檢測,就是從一段給定的語音信號中找出語音的起始點和結(jié)束點。在語音識別系統(tǒng)中,正確、有效的進行端點檢測不僅可以減少計算量和縮短處理時間,而且能排除無聲段的噪聲干擾、提高語音識別的正確率。研究表明[1],即使是在安靜的環(huán)境下,語音識別系統(tǒng)一半以上的錯誤可能主要來源于端點檢測。除此之外,在語音合成、編碼等系統(tǒng)中,高效的端點檢測也直接影響甚至決定著系統(tǒng)的主要性能。因此,端點檢測的效率、質(zhì)量在語音處理系統(tǒng)中顯得至關重要,廣泛開展端點檢測實現(xiàn)手段方面的研究,有一定的現(xiàn)實意義[2]。1、雙門限檢測法

語音端點檢測方法可采用測試信號的短時能量或短時對數(shù)能量、聯(lián)合過零率等特征參數(shù),并采用雙門限判定法來檢測語音端點,即利用過零率檢測清音,用短時能量檢測濁音,兩者配合。首先為短時能量和過零率分別確定兩個門限,一個是較低的門限數(shù)值較小,對信號的變化比較敏感,很容易超過;另一個是比較高的門限,數(shù)值較大。低門限被超過未必是語音的開始,有可能是很短的噪聲引起的,高門限被超過并且接下來的自定義時間段內(nèi)的語音超過低門限,意味著信號開始[5]。

算法過程如下:

(1)在開始階段要做預加重和分幀的處理,講語音信號分成一幀一幀的,分幀處理有利于對語音信號進行準確的分析,并且能夠提高識別率,這時再分別求出每幀的短時能量和短時過零率。

(2)接著要設置初始化參數(shù),比如最大靜音長度,這是一個經(jīng)驗值,用來判斷語音段是否結(jié)束,論文中是根據(jù)大量的語音樣本的長短設置的一個經(jīng)驗值。另外,短時能量和短時過零率的門限也要設置初始值等。

(3)判斷當語音在靜音段或者是過渡段時,如果語音信號的短時能量值大于短時能量的高門限,或者語音信號的短時過零率大于短時過零率的高門限,那么就確認進入了語音段,如果短時能量的值大于短時能量的低門限或者過零率的值大于過零率的低門限,那么語音處于過渡段,否則,語音仍就處于靜音段。

(4)當語音信號在語音段時,判斷如果短時能量的

值大于短時能量的低門限或者短時過零率的值大于短時過零率的低門限,那么語音信號仍然處于語音段。

(5)如果靜音長度小于設置的最大靜音長度,那么就表明語音還尚未結(jié)束,還在語音段,如果語音的長度小于最小噪聲長度,那么認為語音太短,此時是噪聲,同時判斷語音處于靜音段;否則語音就進入結(jié)束段。2、基于自相關極大值的語音端點檢測方法

在端點檢測中,如果所處理的語音信號是非平穩(wěn)的隨機過程s(n),可以采用短時自相關函數(shù),它的定義為

它的歸一化自相關函數(shù)定義為

這里之所以要將自相關函數(shù)歸一化是為了在語音端點檢測過程中不用考慮信號絕對能量的大小所帶來的影響。我們知道語音是由濁音和清音兩部分組成的。濁音語音是0~10ms內(nèi)可以被看作為一個準周期信號,而清音信號接近于隨機噪聲。由于語音的絕大部分能量都集中在濁音語音部分,因此語音可以在10~20ms內(nèi)被看作為一個準周期信號,那么它的歸一化自相關函數(shù)也呈準周期性,而高斯白噪聲信號的歸一化自相關函數(shù)的分布較為平均和分散,不具有準周期性。

為了突出帶噪語音信號的歸一化自相關函數(shù)的準周期性和高斯白噪聲信號的歸一化自相關函數(shù)分散性,可以利用一個低通濾波器除去波形上的高頻毛刺。這樣我們就可以清晰地看到帶噪語音信號自相關函數(shù)所具有的準周期性。圖1(a)為帶噪語音信號的歸一化自相關函數(shù)經(jīng)過低通濾波后的典型波形。圖1(b)為高斯白噪聲信號的歸一化自相關函數(shù)經(jīng)過低通濾波后的典型波形。我們看到帶噪語音信號的自相關函數(shù)的能量將集中在基音周期的各個整數(shù)倍點上,在這些點附近將出現(xiàn)極大值,并且此函數(shù)在零點處必將出現(xiàn)最大值。而高斯白噪聲信號的自相關函數(shù)卻不具有準周期性,它的歸一化自相關函數(shù)的能量在零點之外較為平均和分散。從圖1中我們可以清晰地看到帶嗓語音信

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多