Improved generalized cross correlation-phase transform based time delay estimation by frequency domain autocorrelation

Jun-Seok Lim; MyoungJun Cheong; Seongil Kim

doi:10.7776/ASK.2018.37.5.271

Preview

Research Article

The Journal of the Acoustical Society of Korea. 30 September 2018. 271-275
https://doi.org/10.7776/ASK.2018.37.5.271

Improved generalized cross correlation-phase transform based time delay estimation by frequency domain autocorrelation

주파수영역 자기상관에 의한 위상 변환 일반 상호 상관 시간 지연 추정기 성능 개선

Jun-Seok Lim¹^∗

MyoungJun Cheong²

Seongil Kim²

임 준석¹^∗

정 명준²

김 성일²

¹세종대학교 전자정보통신공학과

²국방과학연구소

^{∗Corresponding Author}

License:

ABSTRACT

There are several methods for estimating the time delay between incoming signals to two sensors. Among them, the GCC-PHAT (Generalized Cross Correlation-Phase Transform) method, which estimates the relative delay from the signal whitening and the cross-correlation between the different signal inputs to the two sensors, is a traditionally well known method for achieving stable performance. In this paper, we have identified a part of GCC-PHAT that can improve the periodicity. Also, we apply the auto-correlation method that is widely used as a method to improve the periodicity. Comparing the proposed method with the GCC-PHAT method, we show that the proposed method improves the mean square error performance by 5 dB ~ 15 dB at the SNR above 0 dB for white Gaussian signal source and also show that the method improves the mean square error performance up to 15 dB at the SNR above 2 dB for the color signal source.

Keywords

Time delay estimation

GCC-PHAT (Generalized Cross Correlation-Phase Transform)

Auto-correlation

Bearing estimation

두 개 센서에 도래하는 신호 간의 시간 지연을 추정 방법에는 여러 가지가 존재한다. 그중에서 두 센서에 입력되는 서로 다른 신호간의 상호 상관과 신호 백색화로부터 상대적인 지연을 추정하는 GCC-PHAT(Generalized Cross Correlation-Phase Transform) 방법은 안정적인 성능을 내는 전통적으로 유명한 방법이다. 본 논문에서는 GCC-PHAT의 연산 과정 중에서 주기성을 이용하여 잡음을 제거할 수 있는 부분을 파악하였다. 그리고 파악된 부분에 자기상관을 적용하였다. 제안한 방법을 기존의 방법과 비교하여, 백색 가우시안 신호원인 경우 신호 대 잡음비 0 dB 이상에서 평균 자승 추정 오차 5 dB ~ 15 dB까지의 향상이 있음을 보이고, 유색 신호원에서도 신호 대 잡음비 2 dB 이상에서 평균 자승 추정 오차가 성능 개선되어 15 dB까지의 성능 개선 효과가 있음을 보인다.

키워드

시간 지연 추정

위상 변환 일반 상호 상관기

자기 상관

방위 추정

MAIN

I. 서 론
II. 상호 상관 기반 시간 지연 신호 추정 기법 요약
2.1 시간 지연 신호의 수치 모델링
2.2 GCC-PHAT 기반 시간 지연 추정 방법
III. 주파수 영역 자기 상관을 이용한 GCC-PHAT 개선
IV. 시뮬레이션
IV. 결 론

I. 서 론

두 개의 수신 신호 간의 시간 지연 추정은 소나 같은 수중 음향 신호처리 분야뿐만 아니라 여러 가지 통신 및 음성 처리 시스템 등에서 주요 신호원의 위치 파악을 위한 수단으로 사용하고 있다.^[1-3] 그밖에 지능형 서비스 로봇 에서도 로봇이 공공장소나 가정에서 주위 상황을 인지하고 판단하여 주의집중을 수행할 수 있게 하기 위하여 시간 지연 추정 기술이 응용되고 있다.^[4]

현재 음원 추적 기술은 시간영역 및 주파수영역에서 연구가 많이 진행되고 있다. 대표적으로 널리 사용되는 방법에는 강도 차이를 이용한 방법,^[5] GCC-PHAT(Generalized Cross Correlation-Phase Transform)를 비롯한 TDOA(Time Difference of Arrival) 방법^[6,7] 및 빔포밍 (beam-forming) 방법^[8] 등이 있다. 신호 강도 차이를 비교하는 방법의 경우 비교적 신호 대 잡음비가 좋은 경우에 좋은 결과가 나오는 경향이 있고,^[5] 빔포밍을 이용하는 경우는 정확한 추정을 위해서 매우 좁은 빔폭을 갖는 빔형성이 필요하여 사용하는 배열의 크기가 커야할 경우가 생긴다.^[2] 반면에 TDOA을 이용한 방법은 필요 센서 수도 상대적으로 적고, 계산도 간단한데 비해서, 비교적 정확성이 좋아 가장 널리 쓰이고 있고 있다. 그중에서 GCC-PHAT은 상관도를 이용하는 TDOA중에서 잡음이나 반향환경에서 좋은 특성을 보이고 있다.^[9]

본 논문에서는 GCC-PHAT보다 더 향상된 추정 성능을 갖는 수정된 알고리즘을 제안한다. 향상된 성능을 위해서 GCC-PHAT내부에서 주기성을 띠는 부분을 파악하고 이 주기성이 시간 지연과 밀접한 관계가 있음도 파악하였다. 그리고 그 주기성을 유지하면서 부가된 잡음을 줄이는 방법의 하나로 자기 상관을 취하도록 하였다. 그리고 시뮬레이션을 통해서 음원이 백색 신호원인 경우와 음원이 유색 신호원일 때 신호 대 잡음비를 달리하면서 시간 지연 추정 성능을 비교하였다.

II. 상호 상관 기반 시간 지연 신호 추정 기법 요약

2.1 시간 지연 신호의 수치 모델링

전통적인 시간지연추정 문제에 많이 쓰이는 간단한 신호 모델은 다음과 같다. 두 수신 채널에서 각각 수신된 신호를 x_i(k), i = 1,2,라 한다면, 그 신호의 수치 모델은 다음과 같다.

$$x_i\left(k\right)=\alpha_is\left(k-\tau_i\right)+n_i\left(k\right),$$

(1)

여기서 α_i는 원 신호, s(k),가 i번째 채널에 도달할 때의 감쇠 계수이고, τ_i는 원 신호가 i번째 채널에 도달할 때까지의 전파시간이다. 또 n_i(k)는 i번째 채널에 부가된 잡음이다. 이 모델에서 s(k), n_i(k)는 영 평균이고, 상호상관이 없고, 시간에 따라 통계적 성질이 변하지 않는 가우시안 신호이다. 두 채널간의 상대적인 시간 지연은, $\hat{τ} = τ_{12} = τ_{1} - τ_{2}$ 이다.

2.2 GCC-PHAT 기반 시간 지연 추정 방법

GCC-PHAT는 백색화 가중치를 사용하는 상호상관 방법이다. 주파수 영역에서 두 센서의 신호들의 상호 상관을 구한 후에 백색화 가중치를 곱하는 과정을 더하여 신호의 스펙트럼의 영향을 배제하는 효과를 갖는다. GCC-PHAT 기반의 시간 지연 추정 과정을 Fig. 1에 나타내었다.

http://static.apub.kr/journalsite/sites/ask/2018-037-05/N0660370502/images/ASK_37_05_02_F1.jpg

Fig. 1.

Diagram of GCC-PHAT.

Fig.1의 GCC-PHAT 방법을 간략히 기술하면 다음과 같다. 두 개의 마이크에서 받은 신호 x₁(k)과 x₂(k) 사이의 상호상관도는 다음 식에 의해 얻어진다.

$${R_{X_1X_2}\left(\tau\right)=\frac1{2\pi}\int_{-\infty}^\infty W\left(\omega\right)X_1\left(\omega\right)X_2^\ast\left(\omega\right)e^{i\omega\tau},}$$

(2)

여기서 X_i(ω)는 x_i(k) 를 주파수 변환한 신호이다. 또 W(ω)는 주파수축에서 구한 가중 함수로써 X₁(ω)X^*₂(ω)의 역수에 해당한다.^[7] 이 가중 함수를 PHAT(phase transform) 가중함수^[8]이라고 부른다. PHAT은 시간지연을 추정함에 있어서 각 주파수의 상대적인 중요성을 결정하는 주파수에 종속된 가중치 된 함수이며, 식은 다음과 같이 표현된다.

$${W\left(\omega\right)=\frac1{\left|X_1\left(\omega\right)X_2^\ast\left(\omega\right)\right|}\cdot\;}$$

(3)

위와 같은 가중치를 곱한 후에는 신호의 지연 정보가 들어 있는 위상만 남고 크기는 언제나 1로써 일정하게 유지된다. 일종의 백색화가 일어난다. 따라서 좀 더 충실한 시간 지연 정보 추정이 가능해진다. Eq. (2)를 통해서 구해진 R_x1x2(τ)를 통하여 두 센서 사이의 최종적인 지연 시간은 다음 식과 같이 구해질 수 있다.

$${\widehat\tau=arg\;max\;R_{X_1X_2}\left(\tau\right).}$$

(4)

Fig. 2는 이상적인 경우에 상호 상관을 그림으로 나타낸다. 가로축의 τ₁₂는 지연시간을 나타내며 세로축은 α₁₂는 지연 시간에서의 R_x1x2(τ)의 값을 나타낸다. 센서 사이의 지연시간은 R_x1x2(τ)값이 최대를 나타내는 가로축의 값이다.

http://static.apub.kr/journalsite/sites/ask/2018-037-05/N0660370502/images/ASK_37_05_02_F2.jpg

Fig. 2.

Ideal cross-correlation result between two delayed received signals.

III. 주파수 영역 자기 상관을 이용한 GCC-PHAT 개선

Fig. 1에서 X_W(ω) = W(ω)X₁ (ω) X₂^*(ω) 라고 할 때 이 X_W(ω)의 역 푸리에 변환으로부터 얻은 시간 지연 값이 Fig. 2와 같이 임펄스성 신호로 표현된다면 X_W(ω)은 다음 식과 같음을 알 수 있다.

$$\begin{array}{l}X_W\left(\omega\right)=\;e^{-j\omega\tau_{12}}=\cos\;\left(\omega\tau_{12}\right)-jsin\left(\omega\tau_{12}\right).\\\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;=\cos\left(2\pi\tau_{12}f\right)-jsin\left(2\pi\tau_{12}f\right)\end{array}$$

(5)

위 식을 주파수 축과 시간축의 의미를 바꿔서 재해석 해 본다면 f 영역에서 주파수 τ₁₂인 주기 신호로 재해석할 수 있다. 이 경우 Fig. 2와 같은 결과는 Eq. (5)의 신호를 역푸리에 변환하여 얻는 결과 값으로 해석 할 수 있다. 그러므로 실제 신호를 다룰 때 X_W(ω)에 잡음이 부가되는 경우를 생각해 볼 때 부가된 잡음이 주기성이 없는 백색잡음이라면 Fig. 3 하단에 추가된 작은 네모 안에서와 같이 X_W(ω)의 자기 상관을 구함으로써 주기성을 살리면서 잡음의 영향은 줄일 수 있다.^[10]

$${R_{XX}\left(p\right)=\frac1N\sum_{\omega=0}^{N-1}X_W\left(\omega+p\right)X_W\left(\omega\right)^\ast,}$$

(6)

여기서 주파수(ω)가 N개의 샘플로 이루어져있다고 가정한다. 그리고 이때에 FFT(Fast Fourier Transform)를 써서 디지털 푸리에 변환하는 경우를 대비하여 위상을 unwrapping^[10]하는 과정이 필요할 수 있다. 이런 추가된 자기 상관 이후에는 Fig. 3과 같이 일반 GCC-PHAT처럼 역 푸리에 변환을 취한다. 위에 언급한 두 과정을 더한 새로운 GCC-PHAT를 그림으로 나타내면 다음 그림과 같다. 그리고 이후 서술의 편이를 위해서 제안된 알고리즘을 AC-GCC-PHAT(Auto-correlation GCC-PHAT)라고 한다.

http://static.apub.kr/journalsite/sites/ask/2018-037-05/N0660370502/images/ASK_37_05_02_F3.jpg

Fig. 3.

Diagram of the proposed algorithm.

IV. 시뮬레이션

모의실험을 위해서 두 수신 채널을 위한 신호 열을 두 종류로 발생시킨다.

첫 번째 비교실험을 위한 신호발생을 위해서 첫 번째 채널 신호 x₁(k)은 백색 가우시안 불규칙 신호로 발생 시켰다. 두 번째 채널 신호는 x₁(k)과 10 샘플 뒤진 신호와 1 샘플 뒤진 신호로 모델 하였다. 즉, x₂(k) = x₁(k-10) 과 x₂(k) = x₁(k-1)이다. 각 신호 x₁(k)과 x₂(k)에는 두 백색 가우시안 잡음, n₁(k)과 n₂(k)가 각각 부가되었다. 이들 부가 잡음들은 서로 상관관계가 없도록 하였다. 그리고 신호 대 잡음비는 -10 dB부터 10 dB까지로 변화시켰다.

두 번째 비교실험을 위한 신호 열은 1차 AR과정인 신호로써, s(k) = 0.7s(k-1) + w(k),인 관계식을 만족시키는 것으로 사용하였다. 이로써 음원이 유색 신호원의 성질을 갖도록 하였다. 나머지 스펙은 첫 번째 비교 실험 때와 같도록 하였다. 그리고 신호 대 잡음비는 0 dB부터 10 dB까지로 변화 시켰다.

각 각의 비교 실험에서 제안한 AC-GCC-PHAT 방법과 함께 GCC-PHAT방법^[7]을 동등하게 비교하였다. 두 방법을 각 신호 대 잡음비에 대해서 100회씩 반복 시행하여 결과를 얻었다. 추정 성능 비교를 위해서 참 지연 값과 추정 지연 값 사이의 차이를 지연 시간 추정 오차라고 하고, 이 지연 시간 추정의 평균 자승 오차(mean square error)를 각 신호 대 잡음비에 대해서 그래프로 그렸다.

Fig. 4는 첫 번째 실험의 결과를 비교한 그림이다. Fig. 4로 볼 때 백색 광대역 신호원에 대해 시간 지연에 상관없이 약 –4 dB 이상에서부터 향상된 성능을 보인다. 추정 오차 향상 정도는 신호 대 잡음비 0 dB에서 PHAT-GCC방법에 비해서 5 dB 향상되었고, 10 dB에서 약 15 dB 정도의 성능 개선을 나타내고 있음을 알 수 있다.

Fig. 5는 두 번째 실험의 결과를 비교한 그림이다. Fig. 5로 볼 때 유색 신호원에 대해서도 시간 지연에 상관 없이 2 dB 이상에서 향상된 성능을 보인다. 추정 오차 향상 정도는 신호 대 잡음비 2 dB에서 PHAT-GCC방법에 비해서 2 dB정도 향상된 것을 시작으로 해서 신호 대 잡음비 5 dB에서는 PHAT-GCC방법에 비해서 7 dB정도 향상되었고, 10 dB에서 PHAT-GCC방법에 비해서 15 dB 정도 성능 개선을 나타내고 있음을 알 수 있다.

앞의 두 실험을 통해서 제안한 방법이 기존의 GCC-PHAT 방법에 비해서 상대적으로 우수한 시간 지연 추정 결과를 얻을 수 있음을 알 수 있다.

http://static.apub.kr/journalsite/sites/ask/2018-037-05/N0660370502/images/ASK_37_05_02_F4.jpg

Fig. 4.

Performance comparison in case of white gaussian signal source (―×―: GCC in 10 step delay, ―○―: proposed algorithm in 10 step delay, ―▽―: GCC in 1 step delay, ―☆―: proposed algorithm in 1 step delay).

http://static.apub.kr/journalsite/sites/ask/2018-037-05/N0660370502/images/ASK_37_05_02_F5.jpg

Fig. 5.

Performance comparison in case of colored signal source (―×―: GCC in 10 step delay, ―○―: proposed algorithm in 10 step delay, ―▽―: GCC in 1 step delay, ―☆―: proposed algorithm in 1 step delay).

V. 결 론

두 센서에 수신된 신호가 시간 지연을 추정하기 위한 GCC-PHAT방법의 구성 단계 중에서 시간 지연과 관련 있으면서 주기성을 띄는 부분을 개선하여 새로운 시간 지연 추정법을 제안하였다. 그 결과 제안한 시간 지연 추정법이 기존의 GCC-PHAT 기반 시간 지연 추정 방법에 비해 우수한 추정 결과를 산출함을 알 수 있었다.

Acknowledgements

본 연구는 국방과학연구소의 지원을 받아 수행되었음(UD160015DD). 본 논문은 출원 심사 중인 특허(10-2018-0070988)의 내용을 포함하고 있음.

References

H. R. Park and J. H. Shin, “Eigen-analysis based super-resolution time delay estimation algorithms for spread spectrum signals” (in Korean), J. KICS, 38, 1013-1020 (2013).

10.7840/kics.2013.38A.12.1013

J. H. Shin, H. R. Park, and E. Chang, “An ESPRIT-based super-resolution time delay estimation algorithm for real-time locating systems” (in Korean), J. KICS, 38, 310-317 (2013).

10.7840/kics.2013.38A.4.310

J. Lim, Y. Pyeon, and M. Cheong, “GCC-PHAT (generalized cross correlation - phase transform) based time delay estimation using BPD (basis pursuit denoising)” (in Korean), J. KICS, 42, 1857-1862, (2017).

10.7840/kics.2017.42.9.1857

J. Huang, T. Supaongprapa, I. Terakura, F. Wang, N. Ohnishi, and N. Sugie, “A model based sound localization system and its application to robot navigation,” Robotics and Autonomous Systems, 27, 199-209 (1999).

10.1016/S0921-8890(99)00002-0

D. Barton and S. Sherman, Monopulse Principles and Techniques (Artech House, Boston, 2011), pp. 71-103.

J. Choi, J. Lee, S. Jeong, K. Kwak, S. Chi, and M. Hahn “Multimodal sound source localization for intelligent service robot,” Proc. of International Conference on Ubiquitous Robots and Ambient Intelligence, 105-105 (2006).

C. H. Knapp and G. C. Carter, “The generalized correlation method for estimation of time delay,” IEEE Trans. Acoustic. Speech Signal Processing, 24, 320-327 (1976).

10.1109/TASSP.1976.1162830

M. Brandstein and D. Ward, Microphone Arrays: Signal Processing Techniques and Applications (Springer-Verlag, New York, 2001), pp. 157-180.

10.1007/978-3-662-04619-7

M. Brandstein and H. Silverman, “A practical methodology for speech source localization with microphone arrays,” Comput., Speech Lng., 11, 91-126 (1997).

S. Mitra, Digital Signal Processing: A Computer-Based Approach 2^ndEdt. (McGraw-Hill, Seaol, 2001), pp. 92-118.

The Journal of the Acoustical Society of KoreaISSN:1225-4428(Print) 2287-3775(Online)한국음향학회

Preview

Improved generalized cross correlation-phase transform based time delay estimation by frequency domain autocorrelation

ABSTRACT

MAIN

Fig. 1.

Fig. 2.

Fig. 3.

Fig. 4.

Fig. 5.

Acknowledgements

References