Research Article

The Journal of the Acoustical Society of Korea. 30 November 2018. 499-505
https://doi.org/10.7776/ASK.2018.37.6.499

ABSTRACT


MAIN

  • I. 서  론

  • II. 지연 신호의 수치 모델링

  •   2.1 이상적 모델

  •   2.2 이상적 모델로부터 얻은 두 수신 신호 간 임펄스 응답

  •   2.3 희소 신호 추정 적용 가능성

  • III. 시간 지연 추정 알고리즘 제안

  •   3.1 수정된 모델

  •   3.2 로그-합 규준화과 완전 최소 자승법을 사용한 알고리즘

  • IV. 모의실험 결과

  • V. 결 론

I. 서  론

서로 떨어져 설치된 두 개의 센서에 도달하는 신호의 상호 지연 시간을 추정하는 것은 무선 통신이나 로봇 공학 등에서의 목표물 위치 추정 문제나 추적 및 동기화에 이르기까지 다방면에서 쓰이고 있다.[1-8] 일반적인 두 수신기에 도달하는 신호의 모델은 다음 식과 같이 표현된다.

$$\begin{array}{l}x_1(k)=\alpha_1s(k-\tau_1)+n_1(k),\\x_2(k)=\alpha_2s(k-\tau_2)+n_2(k)\end{array}$$ (1)

여기서 s(k)는 미지의 신호원이고, n1(k)과 n2(k)는 평균이 영인 백색 잡음이고, 신호원과는 통계적으로 서로 독립이다. 계수 𝛼1과 𝛼2는 원 신호와 두 수신기 입력 사이의 신호 크기 차이를 나타내기 위한 계수이다. 이 모델로부터 지연 시간 추정이란 위 식의 ‘τ = τ12’값을 구하는 것을 의미한다. 이를 구하는 여러 방법 중에는 비 파라메터적 방법과 파라메터적 방법으로 나눌 수 있다.

비 파라메터적 방법에서는 두 수신 신호 사이의 상호 상관을 구하여 그 상관 값이 최대가 되는 시점을 구하는 방법인 일반 상호 상관(Generalized Cross Correlation, GCC ) 방법이 대표적이다.[9] 이 GCC 방법은 Carter 등에 의해서 집대성 되어서 비 파라메터적 시간 지연 추정 분야에서 대표적 방법으로 받아들여지고 있다.[9] 파라메터적 방법에서는 두 수신 신호들 사이의 관계를 일종의 유한 임펄스 응답(Finite Impulse Response, FIR) 필터로 보고 이 필터의 계수를 구하는 방법 이다.[4-8] 대표적 비파라메터 방법인 GCC 기반 방법 중 GCC-PHAT(Generalized Cross Correlation - Phase Transform)은 잡음이나 반향환경에서 좋은 특성을 가지고 있다고 알려져 있다.[10] 파라메터적 방법 중에선 Benesty가 제안한 적응 고유 값 분해 방식 알고리즘이 잡음이나 반향환경에서 좋은 특성 나타내며 특히 GCC-PHAT보다 더 나은 성능을 나타낸다고 알려져 있다.[11]

기존의 파라메터적 방법에서 필터 모델을 위해 사용하는 Eq. (1)과 같은 모델에서 확인할 수 있듯이 추정할 필터 모델에서 유의미한 계수가 유일한 일종의 희소성(sparse) 채널이라는 것을 알 수 있다. 보통 사용되는 필터 모델링 법은 이와 같은 사실까지 고려하지 않고 있으나, 필터 모델을 이용할 때 이 사실까지 이용한다면 의미가 있는 시도일 것이다. 최근에는 압축 센싱 방법[12]을 연구하는 분야에서 희소성 시스템 임펄스 응답 추정 기법이 연구되고 있다. 그 중에 l1 정규화된 LMS(Least Mean Square) 방식 희소성 시스템 임펄스 응답 추정 기법도 제안되었다.[13]

본 논문에서는 시간 지연에 사용되는 두 개의 수신 센서에 서로 다른 독립 부가 잡음이 부가되는 현실적인 상황을 모델에 포함한 시간 지연 추정 기법을 제안한다. 또 시간 지연을 추정 할 때 실제 시간 지연 값이 전체 대상 시간 지연 영역에서 극히 일부에 존재한다는 희소성이라는 정보를 하나 더 사용함으로써 더 나은 시간 지연 추정 성능을 내는 알고리즘을 제안한다. 이를 위하여 본 논문에서는 완전 최소 자승법과 로그-합 규준화를 사용한 시간 지연 추정 알고리즘을 제안하고, 이것과 GCC-PHAT 및 Benesty의 적응 고유치 분해법[12]과 비교 실험을 통하여 여러 신호 대 잡음비에서 시간 지연 추정 성능을 비교한다. 또 가상의 실내 잔향 음장 하에서도 추정 성능을 비교한다.

II. 지연 신호의 수치 모델링

이 장에서는 시간지연 신호 모델링에 자주 쓰이는 두 가지 모델을 설명한다. 그 첫째는 이상적인 모델이고, 둘째가 실제 환경을 좀 더 고려한 모델이다.[11]

2.1 이상적 모델

전통적인 시간지연추정 문제에 많이 쓰이는 간단한 신호 모델은 다음과 같다. 두 채널에서 각각 수신된 신호를 xi(k),i = 1,2,라 한다면, 그 신호의 수치 모델은 다음과 같다.

$$x_i(k)=\alpha_is(k-\tau_i)+n_i(k),$$ (2)

여기서 𝛼i는 원 신호, s(k),가 i번째 채널에 도달할 때의 감쇠 계수이고, τi는 원 신호가 i번째 채널에 도달할 때까지의 전파시간이다. 또 ni(k)는 i번째 채널에 부가된 잡음이다. 이 모델에서 s(k), ni(k)는 영 평균이고, 상호상관이 없고, 시간에 따라 통계적 성질이 변하지 않는 가우시안 신호이다. 두 채널간의 상대적인 시간 지연은, τ12 = τ12이다.

2.2 이상적 모델로부터 얻은 두 수신 신호 간 임펄스 응답

원 신호원과 두 수신 채널까지의 시간 지연을 수식으로 다룬 Eq. (1)을 수신된 두 신호만으로 다시 쓰면 다음과 같다.

$$x_2(k)=\alpha_{12}x(k-\tau_{12})+n(k),$$ (3)

여기서 𝛼12는 1번 채널에 대한 2번 채널의 이득 값이고, τ12는 1번 채널 대비 2번 채널의 시간 지연 값이다. 일반적으로 시간 지연 추정 알고리즘은 1번 및 2번 채널에 수신된 신호간의 시간 지연을 구하는 것이므로 바로 τ12를 구하는 것이라고 할 것이다. 이런 관계를 이용하면 시간 지연 추정을 Fig. 1과 같이 시스템 인식으로 표현할 수 있다.

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F1.jpg
Fig. 1.

Time delay estimation modeling by system identification approach.

그러나 Fig. 1은 항상 1번 채널에 수신된 신호에 비해서 2번 채널에 수신된 신호가 늦다는 가정이 들어간 것이므로 1번 채널에 고정적인 시간 지연, τfix를 부가하도록 모델을 수정하면 1번 채널에 비해서 2번 채널에 수신된 신호가 늦는 경우뿐만 아니라 앞선 경우도 처리할 수 있다. 단 고정적으로 부가하는 지연 시간 값으로 추정할 수 있는 지연 시간의 범위가 -τfix에서 τfix까지로 고정된다.

2.3 희소 신호 추정 적용 가능성

앞 절에 두 수신 채널 간 신호의 시간 지연 추정을 시스템 추정의 시각으로 생각할 때, 두 수신 신호간의 시간 지연을 Fig. 2와 같은 임펄스 응답으로 모델링할 수 있고, 시간 지연 추정을 위해서 Fig. 2와 같은 임펄스 응답을 추정한 후 그 결과로부터 시간 지연 값을 얻을 수 있다.

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F2.jpg
Fig. 2.

Time delay channel model between two received signals.

Fig. 2에 그려진 임펄스 응답을 보면 전체 중에서 극히 일부만이 의미 있는 값을 갖는 특징을 갖고 있다는 것을 알 수 있다. 이런 특징을 지닌 신호를 희소(sparse)신호라고 한다.[14]

이런 신호를 Fig. 1과 같은 모델 하에서 추정할 경우에 일반적인 신호 추정에 많이 사용하는 목적함수인 l2 정규화 최소 자승법을 적용할 경우,

$$min_h\parallel x_2-h^Tx_1\parallel^2.$$ (4)

일반적으로 Eq. (4)와 같은 식을 사용하는 경우는 잡음의 영향으로 참 값 외에 많은 유사 해를 추정할 수 있다고 알려져 있다. 따라서 희소성을 이용할 수 있는 요소를 알고리즘에 부가한다면 좀 더 좋은 결과를 기대할 수 있다.

III. 시간 지연 추정 알고리즘 제안

3.1 수정된 모델

실제로 두 수신 센서에 도래하는 신호는 항상 잡음이 부가 된다. 따라서 Fig. 1을 수정하여 Fig. 3과 같은 모델을 만들어야 한다. 모델이 Fig. 3과 같이 변경될 경우 시스템 인식 기법을 사용하여 미지의 시간 지연량을 구할 때, 일반적으로 많이 사용하는 최소 자승법보다는 더 좋은 추정 결과를 낳는 새로운 방법의 이용이 필요하다. 예로 입력과 출력에 모두 잡음이 존재하는 경우에 좋은 결과를 내는 완전 최소 자승법의 도입이 필요하다.[15]

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F3.jpg
Fig. 3.

Corrected time delay estimation system diagram for added noise sensors.

3.2 로그-합 규준화과 완전 최소 자승법을 사용한 알고리즘

Fig. 3의 모델을 Fig. 4처럼 변경하여 그로부터 시간 지연을 구하기 위해서는 다음 식을 만족하는 해를 구하여야 한다.

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F4.jpg
Fig. 4.

Time delay estimation system diagram for added noise sensors.

$$\widetilde{x_1^\tau}(k)g_2=\widetilde{x_2^\tau}(k)g_1,$$ (5)

여기서 xi~는 잡음이 섞인 수신 센서 입력 신호를 나타낸다. 그리고 xi~(k)=xi(k)x1(k-1)xi(k-M+1)T,, i = 1,2는 i번째 수신 센서에 도래하는 신호 M개로 이루어진 벡터이다. 그리고 T는 전치 벡터를 의미한다. 두 수신 신호의 전달 함수는 gi=[gi,0gi,1gi,M-1]T, i = 1,2,로써 나타낸다. 전달 함수 gi의 최대치 위치의 상대 거리로부터 시간 지연량을 구할 수 있다. Eq. (5)와 양변에 잡음이 존재한다는 것을 모두 고려하여 해를 추정하기 위해서 3.1절에서 언급한 것과 같이 완전 최소 자승법을 사용한 다음과 같은 목적함수를 구성한다.

$$\underset w{min}J(w,\lambda)=w^TRw+\lambda(1-w^Tw),$$ (6)

여기서 w=[g2T-g1T]T,R=E{zzT}이고, z=[x~1Tx~2T]T이다. Eq. (6)의 해는 행렬 R의 최소 고유치에 해당하는 고유 벡터가 되고 그 크기는 1인 것을 알 수 있다. 그리고 Eq. (6)은 다음과 같은 Rayleigh 비로 나타낼 수도 있다.[15]

$$\underset w{min}J(w,\lambda)=\underset w{min}\frac{w^TRw}{w^Tw}.$$ (7)

그리고 2.3절에서 검토한 시간 지연의 희소성을 위 식에 함께 반영하기 위해서 로그-합 규준화 항을 부가한 새로운 목적함수를 만든다.[16]

$$J^`(k)=\frac{w(k)^TRw(k)}{w(k)^Tw(k)}+\alpha\sum_{i=1}^{L+1}\log(1+\left|w_i(k)\right|/\varepsilon`).$$ (8)

위 Eq. (8)의 해를 구하기 위해여 구배법을 이용하여 재차 갱신식을 만들어 보면 다음과 같다.

$$w(k+1)=w(k)-\mu\nabla J`(w(k)),$$ (9)

여기서 μ는 스텝 계수이다. 목적함수에 대한 구배항을 풀어서 쓰면 다음 식과 같다.

$$w(k+1)=w(k)-\mu\frac{\left\|w(k)\right\|_2^2Rw(k)-(w(k)^TRw(k))w(k)}{\left\|w(k)\right\|_2^4}-\eta\frac{sgn(w(k))}{1+\varepsilon\left|w(k)\right|},$$ (10)

여기서 =1/`이고 η=μα이다. 마지막 항은 희소성을 조절하는 항이다. 여기서는 탭의 크기가 1/ε과 비슷하거나 작은 탭은 그 크기를 더욱 줄여 0에 수렴하도록 만들고, 그 반대의 경우는 줄이는 영향이 미미하게 하는 동작을 한다.[17] 위 Eq. (10)을 매 샘플마다 갱신하는 모습으로 간단하게 바꾸면 다음과 같은 식으로 표현할 수 있다.

$$w(k+1)=w(k)-\frac\mu{\left\|w(k)\right\|_2^2}\left[z(k)z(k)^Tw(k)-\frac{e(k)^2w(k)}{\left\|w(k)\right\|_2^2}\right]-\eta\frac{san(w(k))}{1+\varepsilon\left|w(k)\right|},$$ (11)

여기서 e(k)=z(k)Tw(k)이다.

IV. 모의실험 결과

제안된 알고리즘의 성능을 확인하기 위해서 두 가지의 모의실험과 한 가지의 실 신호를 사용한 비교 실험을 한다.

MC-NMF 분석을 위한 스펙트로그램 데이터를 얻기 위하여 133 ms 길이의 Hamming 윈도우를 25 % 중첩하여 단시간 푸리에 변환(short-time Fourier transform)을 적용하였으며, Eq. (21)에서 표적 반향음이 존재하는 구간을 판정하기 위한 문턱값 η은 다음과 같은 값을 사용하였다.

첫 번째 비교실험을 위한 신호발생을 위해서 첫 번째 채널 신호 x1(k)은 백색 가우시안 불규칙 신호로 발생 시켰다. 두 번째 채널 신호는 x1(k)과 10 샘플 뒤진 신호로 모델 하였다. 즉, x2(k) = x1(k−10) 이다. 각 신호 x1(k)과 x2(k)에는 두 백색 가우시안 잡음, n1(k)과 n2(k)가 각각 부가되었다. 이들 부가 잡음들은 서로 상관관계가 없도록 하였다.

두 번째 비교실험을 위한 신호 열은 신호 중 하나인 x1(k)은 1차 AR과정인 신호로써, s0(k) = 0.7s0 (k-1) + w(k),인 관계식을 만족시키는 것으로 사용하였다. 이로써 음원이 유색 신호원의 성질을 갖도록 하였다. 나머지 스펙은 첫 번째 비교 실험 때와 같도록 하였다. 그리고 각 실험에서 부가 잡음 신호는 원하는 신호 대 잡음비가 되도록 크기를 변화 시켰다. 각 모의 실험에서는 신호 대 잡음비를 -10 dB부터 20 dB 사이에서 달라지도록 하였다.

각 각의 비교 실험에서 제안한 방법, GCC방법,[9] 적응 고유치 분해법[12]을 동등하게 비교하였다. 본 실험에서 사용한 GCC는 잡음에 비교적 강인한 것으로 알려진 GCC-PHAT을 사용하였다. 세 가지 방법을 각 신호 대 잡음비에 대해서 100회씩 반복 시행하여 결과를 얻었다. 추정 성능 비교를 위해서 참 지연 값과 추정 지연 값 사이의 차이를 지연 시간 추정 오차라고 하고, 이 지연 시간 추정의 평균 자승 오차(mean square error)를 각 신호 대 잡음비에 대해서 그래프로 그렸다.

Fig. 5는 첫 번째 실험의 결과를 비교한 그림이다. 이 그림으로 볼 때 제안된 방법이 약 -5 dB 이상에서 GCC-PHAT 방법에 비해서 약 5 dB 이상 10 dB정도 성능 개선을 보인다. 그리고 적응 고유치 분해법에 대해서는 3 dB 이상 7 dB정도의 개선 효과를 보인다.

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F5.jpg
Fig. 5.

Performance comparison in case of white gaussian signal source (-o-: proposed algorithm, -x-: GCC-PHAT, -□-: Adaptive eigenvector decomposition method).

Fig. 6은 두 번째 실험의 결과를 비교한 그림이다. 이 그림으로 볼 때 유색 신호원에 대한 시간 지연 추정 성능은 제안된 알고리즘, GCC-PHAT 방법, 적응 고유치 분해 방법 대부분의 경우 신호 대 잡음비 -5 dB 이상에서는 거의 안정되게 개선된 성능을 나타낸다. 자세히 설명하면 -5 dB 근처에서는 세 알고리즘이 1 dB ~ 2 dB 차이로 비슷한 성능을 보이다가 0 dB 이상에서는 제안한 알고리즘이 약 10 dB 정도의 성능 향상을 보임을 알 수 있다. 반면에 GCC-PHAT 방법과 적응 고유치 분해 방법은 그 성능 차이를 확인할 수 없다.

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F6.jpg
Fig. 6.

Performance comparison in case of colored signal source (-o-: proposed algorithm, -x-: GCC-PHAT, -□-: Adaptive eigenvector decomposition method).

마지막으로 잔향 환경 하에서 각 알고리즘의 성능을 비교하였다. 이를 위하여 가로, 세로, 높이가 각각 5 m, 4 m, 2 m인 방을 가정하였다. 그리고 그 방의 잔향 시간은 T60 = 250 msec와 T60 = 610 msec로 각각 설정하였다. 그리고 가상의 방에서 음원을 (2 m, 2 m, 1.7 m)에 위치시키고 수신용 센서를 (1 m, 1 m, 1 m)과 (1.5 m, 1 m, 1 m)에 설치한 경우를 가정하였다. 이런 가상의 환경에서 음원에서 각 수신 센서까지의 전달함수를 발생하기 위해서 이미지 방식으로 계산하였다.[18] 이런 가상 환경에서 신호를 발생 시킬 경우 두 수신 센서 간의 시간 지연은 16 kHz의 표본화 속도에서 -12.18 샘플의 지연 시간을 나타낸다. 이런 가상의 잔향성 방 환경 하에서 앞서의 세 가지 방법을 사용하여 시간 지연 추정 실험을 하고 그 결과를 히스토그램을 이용하여 보였다. Figs.7과 8에서 역삼각형 표시는 참 값을 나타내는 표시이다. 다음 두 그림에 나타난 결과 히스토그램을 통해 보면 짧은 잔향 시간 환경뿐만 아니라 비교적 긴 잔향 시간 환경에서도 제안한 알고리즘이 다른 두 비교 대상 알고리즘에 비해 우수한 결과를 냄을 알 수 있다.

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F7.jpg
Fig. 7.

Comparison of TDE in T60 = 250 ms and SNR = 10 dB. (a) proposed algorithm (b) GCC[9] (c) adaptive EVD[12].

http://static.apub.kr/journalsite/sites/ask/2018-037-06/N0660370615/images/ASK_37_06_15_F8.jpg
Fig. 8.

Comparison of TDE in T60 = 610 ms and SNR = 10 dB. (a) proposed algorithm (b) GCC[9] (c) adaptive EVD[12].

V. 결 론

두 수신 센서에 도래한 신호들 간의 시간 지연을 추정하기 위한 새로운 방법으로, 두 센서에 부가되는 독립 잡음과 희소 신호처리 방법을 함께 적용한 추정법을 제안하였다. 이 방법은 기존의 시간 지연 추정 방법들이 두 센서 사이의 지연 채널 모델이 고려하지 않은 두 수신 센서의 부가 잡음을 고려하면서 동시에 시간 지연 값이 희소채널과 유사하다는 점을 적극적으로 이용하고자 하는 방법이다. 본 논문에서는 로그-합 규준화와 완전 최소 자승을 근간으로 하는 추정 알고리즘을 만들고 기존에 쓰던 대표적인 시간 지연 추정법인 GCC을 적용한 경우와 적응 고유치 분해법과 서로 비교하였다. 그 결과 백색 가우시안 신호 및 유색 신호원의 두 실험에서 공통적으로 추정 성능이 향상되는 결과를 얻었다. 또 시뮬레이션을 이용한 가상의 잔향성 실내 음장 환경에서도 제안한 방법이 우수함을 확인하였다.

Acknowledgements

본 연구는 국방과학연구소의 지원을 받아 수행되었음(UD160015DD).

References

1
E. Tiana-Roig, F. Jacobsen, and E. Grande, "Beamforming with a circular microphone array for localization of environmental noise sources," J. Acoust. Soc. Am. 128, 3535-42 (2010).
10.1121/1.3500669
2
J. Shin, H. Park, and E. Chang, "An ESPRIT-based super-resolution time delay estimation algorithm for real-time locating systems" (in Korean), J. KICS. 38, 310-317 (2013).
10.7840/kics.2013.38A.4.310
3
J. Shin, S. Myong, E. Chang, and H. Park, "A super-resolution time delay estimation algorithm for spread spectrum signals" (in Korean), J. KICS, 37, 119-127 (2012).
10.7840/KICS.2012.37A.2.119
4
J. S. Lim and W. Hong, "An adaptive time delay estimation method based on canonical correlation analysis" (in Korean), J. Acoust. Soc. Korea, 32, 548-555 (2013).
10.7776/ASK.2013.32.6.548
5
P. Feintuch, N. Bershad, and F. Reed, "Time delay estimation using the LMS adaptive lter-dynamic behaviour," IEEE Trans. Acoust. Speech Signal Process. 29, 571-576 (1981).
10.1109/TASSP.1981.1163608
6
K. Ho, Y. Chan, and P. Ching, "Adaptive time-delay estimation in nonstationary signal and noise power environments," IEEE Trans. Signal Process. 41, 2289-2299 (1993).
10.1109/78.224240
7
H. So, P. Ching, and Y. Chan, "A new algorithm for explicit adaptation of time delay," IEEE Trans. Signal Process. 42, 1816-1820 (1994).
10.1109/78.298289
8
S. Dooley and A. Nandi, "Adaptive subsample time delay estimation using Lagrange interpolators," IEEE Signal Process. Lett. 6, 65-57 (1999).
10.1109/97.744626
9
G. Carter, Coherence and Time Delay Estimation: An Applied Tutorial for Research, Development, Test and Evaluation Engineers (IEEE press, NY, 1993) pp. 1-28.
10
M. Brandstein and H. Silverman, "A practical methodology for speech source localization with microphone arrays," Comput., Speech Lng. 11, 91-126 (1997).
11
J. Benesty, "Adaptive eigenvalue decomposition algorithm for passive acoustic source localization," J. Acoust. Soc. Am. 107, 384-391 (2000).
10.1121/1.428310
12
R. Baraniuk, "Compressive sensing," IEEE Signal Process. Mag. 25, 21-30 (2007).
13
J. S. Lim and W. Hong, "Adaptive time delay estimation using l1 constraint," Proc. J. Acoust. Soc. Kr. Suppl.1(s) 32, 272-275 (2013).
14
H. Lee, S. Park, and S. Park, "Introduction to compressive sensing," Mag. IEIE. 38, 19-30 (2011).
15
A. Cichocki and S. Amari, Adaptive blind signal and image processing (John Wiley and Sons, Chichester, England, 2002), pp. 67-78.
10.1002/0470845899
16
J. S. Lim and H. S. Pang, "Reweighted l1 regularized TLS linear neuron for the sparse system identification," Neurocomputing, 173, 1972-1975 (2016).
10.1016/j.neucom.2015.08.020
17
Y. Chen, Y. Gu, and A. Hero, "Sparse LMS for system identification," Proc. ICASSP 2009, pp. 3125-3128, Taipei, Taiwan, Apr. (2009).
18
Image-source method, http://www.eric-lehmann.com/,2018.
페이지 상단으로 이동하기