• Research Article

    Acoustic parabolic equation model with a directional source

    방향성 있는 음원이 적용된 음향 포물선 방정식 모델

    Lee, Keunhwa, Na, Youngnam, Son, Su-Uk

    이근화, 나영남, 손수욱

    The acoustic parabolic equation method in the ocean is an efficient technique to calculate the acoustic field in the range-dependent environment, emanating ...

    해양에서 음향 포물선 방정식은 거리 의존 환경에서 단일 음원으로부터 음장을 계산하는데 효율적인 방법이다. 그렇지만 실제 문제에서는 종종 방향성 있는 음원을 사용해야하는 필요성이 ...

    + READ MORE
    The acoustic parabolic equation method in the ocean is an efficient technique to calculate the acoustic field in the range-dependent environment, emanating from a point source. However, we often need to use the directional source with a main beam in the practical problem. In this paper, we present two methods to implement the directional source in the acoustic parabolic equation code easily. One is simply to filter the Delta function idealized as an omni-directional point source. Another method is based on the rational filtering of the self-starter solution. It has a limitation not to separate the up-going and the down-going wave for the depth, but would be useful in implementing the mode propagation. Numerical examples for validation are given in the Pekeris environment and the deep sea environment.


    해양에서 음향 포물선 방정식은 거리 의존 환경에서 단일 음원으로부터 음장을 계산하는데 효율적인 방법이다. 그렇지만 실제 문제에서는 종종 방향성 있는 음원을 사용해야하는 필요성이 있다. 본 논문에서는 포물선 방정식 모델에 손쉽게 방향성 있는 음원을 적용할 수 있는 두 가지 방법을 제안한다. 첫 번째 방법은 전 방향음원의 수학적 모델인 Delta 함수를 필터링 하는 것이다. 두 번째 방법은 포물선 방정식의 self-starter 해에 유리함수 필터를 적용하는 방법이다. 후자의 방법은 깊이 방향에 대해 상향 및 하향 음파를 분리하지 못한다는 단점이 있으나 모드 전파를 구현하는 데는 유용하다. 검증을 위한 수치 예제가 Pekeris 환경과 심해 환경에서 주어졌다.

    - COLLAPSE
    January 2020
  • Research Article

    Robust frame synchronization algorithm in time-varying underwater acoustic communication channel

    수중 음향통신에서 채널 시변동성에 강인한 프레임 동기 알고리즘

    Ko, Seokjun, Kim, Wan-Jin

    고석준, 김완진

    In this paper, we propose a frame synchronization algorithm for robust to the combined effects of large Doppler fluctuations and extended, time-varying ...

    본 논문에서는 채널 시변동성에 강인한 송수신 모델을 제안하고, 송신기의 특성을 반영한 디지털 변조 신호를 프레임 동기화 기법을 통해 수신 신호의 성능을 향상시킨다 ...

    + READ MORE
    In this paper, we propose a frame synchronization algorithm for robust to the combined effects of large Doppler fluctuations and extended, time-varying multipath in the underwater acoustic communication. From the algorithm, we can recover a high timing error which is occurred from an acoustic propagation delay and uncertainty of oscillator between transmitter and receiver. In order to verify the performance of the synchronization algorithm, the lake trial results are used. The lake experiments are performed in a Gyeongcheonho located in Mungyeong-si, Gyeongsangbuk-do. We can see that the start position of frame is adjusted after the frame synchronization while the receiver moving.


    본 논문에서는 채널 시변동성에 강인한 송수신 모델을 제안하고, 송신기의 특성을 반영한 디지털 변조 신호를 프레임 동기화 기법을 통해 수신 신호의 성능을 향상시킨다. 제안하는 동기화 기법을 통해 송신기와 수신기 사이의 프레임 시점의 불일치 및 음파 지연에 의해 발생되는 정도가 큰 타이밍 오차를 복구한다. 수중환경 채널 및 수중음향통신을 위한 타이밍 및 위상 동기화 성능 확인을 위해 경상북도 문경시에 위치한 경천호에서 호수실험을 수행하였으며, 제안하는 프레임 동기화 기법을 적용하였다. 수신기가 고정 상태인 경우는 처음에 예상했던 프레임 시작 위치와 프레임 동기 이후 변동이 거의 없었으나 이동 중일 때는 다중 경로 전달 과정으로 인한 인접 신호 사이의 간섭으로 인하여 프레임의 시작 위치가 프레임 동기화이후 보정이 되는 것을 확인 할 수 있었다.

    - COLLAPSE
    January 2020
  • Research Article

    High-intensity focused ultrasound beam path visualization using ultrasound imaging

    초음파 영상을 이용한 고강도 집중 초음파 빔 시각화

    Song, Jae Hee, Chang, Jin Ho, Yoo, Yang Mo

    송재희, 장진호, 유양모

    In High-Intensity Focused Ultrasound (HIFU) treatment, effective localization of HIFU focus is important for developing a safe treatment plan. While Magnetic Resonance ...

    고강도 집중 초음파(High-Intensity Focused Ultrasound, HIFU) 치료에서 HIFU 초점의 효과적인 위치 파악은 안전한 치료 계획을 개발하는 데 중요하다. 자기 공명 영상 ...

    + READ MORE
    In High-Intensity Focused Ultrasound (HIFU) treatment, effective localization of HIFU focus is important for developing a safe treatment plan. While Magnetic Resonance Imaging guided HIFU (MRIgHIFU) can visualize the ultrasound path during the treatment for localizing HIFU focus, it is challenging in ultrasound imaging guided HIFU (USIgHIFU). In the present study, a real-time ultrasound beam visualization technique capable of localizing HIFU focus is presented for USIgHIFU. In the proposed method, a short pulse, with the same center frequency of an imaging ultrasound transducer below the regulated acoustic intensity (i.e., Ispta < 720 mW/cm2), was transmitted through a HIFU transducer whereupon backscattered signals were received by the imaging transducer. To visualize the HIFU beam path, the backscattered signals underwent dynamic receive focusing and subsequent echo processing. From in vitro experiments with bovine serum albumin gel phantoms, the HIFU beam path was clearly depicted with low acoustic intensity (i.e., Ispta of 94.8 mW/cm2) and the HIFU focus was successfully localized before any damages were produced. This result indicates that the proposed ultrasound beam path visualization method can be used for localizing the HIFU focus in real time while minimizing unwanted tissue damage in USIgHIFU treatment.


    고강도 집중 초음파(High-Intensity Focused Ultrasound, HIFU) 치료에서 HIFU 초점의 효과적인 위치 파악은 안전한 치료 계획을 개발하는 데 중요하다. 자기 공명 영상 유도 HIFU(Magnetic Resonance Imaging guided HIFU, MRIgHIFU)는 HIFU 초점을 영상화하여 치료 중에 초음파 경로를 시각화 할 수 있지만 초음파 이미징 유도 HIFU (Ultrasound imaging guided HIFU, USIgHIFU)에서는 어려움이 있다. 본 연구에서는 USIgHIFU에 대해 HIFU 초점을 영상화할 수 있는 실시간 초음파 빔 시각화 기법을 제시 하였다. 제안 된 방법에서, 음향 강도(Ispta < 720 mW/cm2) 아래의 이미징 초음파 변환자의 동일한 중심 주파수를 갖는 짧은 펄스가 HIFU 변환기를 통해 전송되고, HIFU 빔 경로를 시각화하기 위해 수신 신호는 동적 수신 포커싱 및 후속 에코 처리를 거쳤다. 소 혈청 알부민 젤 팬텀을 이용한 생체 외 실험으로부터, HIFU 빔 경로는 낮은 음향 강도 (Ispta = 94.8 mW/cm2)에서도 명확히 영상화 할 수 있었고 HIFU 초점은 손상이 생성되기 전에 성공적으로 시각화하였다. 이 결과는 제안 된 초음파 빔 경로 시각화 방법이 USIgHIFU 치료에서 원치 않는 조직 손상을 최소화하면서 실시간으로 HIFU 초점을 영상화하는 데 사용될 수 있음을 나타낸다.

    - COLLAPSE
    January 2020
  • Research Article

    A study on the waveform-based end-to-end deep convolutional neural network for weakly supervised sound event detection

    약지도 음향 이벤트 검출을 위한 파형 기반의 종단간 심층 콘볼루션 신경망에 대한 연구

    Lee, Seokjin, Kim, Minhan, Jeong, Youngho

    이석진, 김민한, 정영호

    In this paper, the deep convolutional neural network for sound event detection is studied. Especially, the end-to-end neural network, which generates the ...

    본 논문에서는 음향 이벤트 검출을 위한 심층 신경망에 대한 연구를 진행하였다. 특히 약하게 표기된 데이터 및 표기되지 않은 훈련 데이터를 포함하는 약지도 ...

    + READ MORE
    In this paper, the deep convolutional neural network for sound event detection is studied. Especially, the end-to-end neural network, which generates the detection results from the input audio waveform, is studied for weakly supervised problem that includes weakly-labeled and unlabeled dataset. The proposed system is based on the network structure that consists of deeply-stacked 1-dimensional convolutional neural networks, and enhanced by the skip connection and gating mechanism. Additionally, the proposed system is enhanced by the sound event detection and post processings, and the training step using the mean-teacher model is added to deal with the weakly supervised data. The proposed system was evaluated by the Detection and Classification of Acoustic Scenes and Events (DCASE) 2019 Task 4 dataset, and the result shows that the proposed system has F1-scores of 54 % (segment-based) and 32 % (event-based).


    본 논문에서는 음향 이벤트 검출을 위한 심층 신경망에 대한 연구를 진행하였다. 특히 약하게 표기된 데이터 및 표기되지 않은 훈련 데이터를 포함하는 약지도 문제에 대하여, 입력 오디오 파형으로부터 이벤트 검출 결과를 얻어내는 종단간 신경망을 구축하는 연구를 진행하였다. 본 연구에서 제안하는 시스템은 1차원 콘볼루션 신경망을 깊게 적층하는 구조를 기반으로 하였으며, 도약 연결 및 게이팅 메커니즘 등의 추가적인 구조를 통해 성능을 개선하였다. 또한 음향 구간 검출 및 후처리를 통하여 성능을 향상시켰으며, 약지도 데이터를 다루기 위하여 평균-교사 모델을 적용하여 학습하는 과정을 도입하였다. 본 연구에서 고안된 시스템을 Detection and Classification of Acoustic Scenes and Events(DCASE) 2019 Task 4 데이터를 이용하여 평가하였으며, 그 결과 약 54 %의 구간-기반 F1-score 및 32 %의 이벤트-기반 F1-score를 얻을 수 있었다.

    - COLLAPSE
    January 2020
  • Research Article

    L1 norm-recursive least squares algorithm for the robust sparse acoustic communication channel estimation

    희소성 음향 통신 채널 추정 견실화를 위한 백색화를 적용한 l1놈-RLS 알고리즘

    Lim, Jun-Seok, Pyeon, Yong-Gook, Kim, Sungil

    임준석, 편용국, 김성일

    This paper proposes a new l1-norm-Recursive Least Squares (RLS) algorithm which is numerically more robust than the conventional l1-norm-RLS. The l1-norm-RLS was ...

    본 논문은 l1놈-Recursive Least Squares(RLS)에 수치 계산상 견실화를 더한 새로운 알고리즘을 제안한다. Eksioglu와 Tanc는 희소성 음향 채널 추정을 위해서 l1놈-RLS ...

    + READ MORE
    This paper proposes a new l1-norm-Recursive Least Squares (RLS) algorithm which is numerically more robust than the conventional l1-norm-RLS. The l1-norm-RLS was proposed by Eksioglu and Tanc in order to estimate the sparse acoustic channel. However the algorithm has numerical instability in the inverse matrix calculation. In this paper, we propose a new algorithm which is robust against the numerical instability. We show that the proposed method improves stability under several numerically erroneous situations.


    본 논문은 l1놈-Recursive Least Squares(RLS)에 수치 계산상 견실화를 더한 새로운 알고리즘을 제안한다. Eksioglu와 Tanc는 희소성 음향 채널 추정을 위해서 l1놈-RLS 알고리즘을 구현하였다. 그러나 이 알고리즘의 근간인 RLS 계산법 역행렬 계산에서 수치 계산상의 불안정성을 지니고 있다. 본 논문에서는 이런 불안정성을 낮추는 새로운 알고리즘을 제안한다. 그리고 제안한 방법을 사용했을 때 수치적 불안정성에 대한 성능이 개선되었음을 보인다.

    - COLLAPSE
    January 2020
  • Research Article

    LOFAR/DEMON grams compression method for passive sonars

    수동소나를 위한 LOFAR/DEMON 그램 압축 기법

    Ahn, Jae-Kyun, Cho, Hyeon-Deok, Shin, Donghoon, Kwon, Taekik, Kim, Gwang-Tae

    안재균, 조현덕, 신동훈, 권택익, 김광태

    LOw Frequency Analysis Recording (LOFAR) and Demodulation of Envelop Modulation On Noise (DEMON) grams are bearing-time-frequency plots of underwater acoustic signals, to ...

    로파/데몬 그램은 수동소나의 특성을 확인하기 위해 수중 음향 신호에 대한 방위, 시간, 주파수를 시각적으로 표현한 결과이다. 이러한 그램들은 기존의 압축 기법들을 ...

    + READ MORE
    LOw Frequency Analysis Recording (LOFAR) and Demodulation of Envelop Modulation On Noise (DEMON) grams are bearing-time-frequency plots of underwater acoustic signals, to visualize features for passive sonar. Those grams are characterized by tonal components, for which conventional data coding methods are not suitable. In this work, a novel LOFAR/DEMON gram compression algorithm based on binary map and prediction methods is proposed. We first generate a binary map, from which prediction for each frequency bin is determined, and then divide a frame into several macro blocks. For each macro block, we apply intra and inter prediction modes and compute residuals. Then, we perform the prediction of available bins in the binary map and quantize residuals for entropy coding. By transmitting the binary map and prediction modes, the decoder can reconstructs grams using the same process. Simulation results show that the proposed algorithm provides significantly better compression performance on LOFAR and DEMON grams than conventional data coding methods.


    로파/데몬 그램은 수동소나의 특성을 확인하기 위해 수중 음향 신호에 대한 방위, 시간, 주파수를 시각적으로 표현한 결과이다. 이러한 그램들은 기존의 압축 기법들을 적용하기 힘든 토널 성분과 같은 특징들을 포함하고 있다. 본 논문에서는 이진맵과 예측 기법으로 구성된 새로운 로파 및 데몬 그램 압축 기법을 제안한다. 먼저 각 주파수 빈에 대한 예측을 결정하는 이진맵을 생성하고, 프레임을 몇 개의 매크로 블록으로 구분한다. 각 매크로 블록에 대해 인트라 예측과 인터 예측을 적용하여 나머지를 계산한다. 그리고 이진맵에서 유효한 빈들에 대해 예측을 수행하고 엔트로피 부호화를 위해 나머지를 양자화 한다. 이진맵과 예측모드를 전송함으로써 복호기는 동일한 절차로 그램을 복원한다. 시뮬레이션을 통해 제안하는 알고리즘의 로파와 데몬 그램 압축 결과가 기존의 데이터 압축 기법에 비해 우수함을 확인한다.

    - COLLAPSE
    January 2020
  • Research Article

    Comparison of the sound source localization methods appropriate for a compact microphone array

    소형 마이크로폰 배열에 적용 가능한 음원 위치 추정법 비교

    Jung, In-Jee, Ih, Jeong-Guon

    정인지, 이정권

    The sound source localization technique has various application fields in the era of internet- of-things, for which the probe size becomes critical ...

    음원위치추정 기술은 사물인터넷 시대에서 다양한 응용 분야를 가지고 있으며, 이로 인해 마이크로폰 프로브의 크기가 중요하게 고려되고 있다. 음향 인텐시티 벡터를 이용한 음원위치추정 ...

    + READ MORE
    The sound source localization technique has various application fields in the era of internet- of-things, for which the probe size becomes critical. The localization methods using the acoustic intensity vector has an advantage of downsizing the layout of the array owing to a small finite-difference error for the short distance between adjacent microphones. In this paper, the acoustic intensity vector and the Time Difference of Arrival (TDoA) method are compared in the viewpoint of the localization error in the far-field. The comparison is made according to the change of spacing between adjacent microphones of the three-dimensional microphone array arranged in a tetrahedral shape. An additional test is conducted in the reverberant field by varying the reverberation time to verify the effectiveness of the methods applied to the actual environments. For estimating the TDoA, the Generalized Cross Correlation-Phase transform (GCC-PHAT) algorithm is adopted in the computation. It is found that the mean localization error of the acoustic intensimetry is 2.9° and that of the GCC-PHAT is 7.3° for T60 = 0.4 s, while the error increases as 9.9°, 13.0° for T60 = 1.0 s, respectively. The data supports that a compact array employing the acoustic intensimetry can localize of the sound source in the actual environment with the moderate reflection conditions.


    음원위치추정 기술은 사물인터넷 시대에서 다양한 응용 분야를 가지고 있으며, 이로 인해 마이크로폰 프로브의 크기가 중요하게 고려되고 있다. 음향 인텐시티 벡터를 이용한 음원위치추정 방법은 마이크로폰 사이의 간격이 좁을수록 유한차분오차가 작기 때문에 배열을 소형화 할 수 있다는 장점이 있다. 본 논문에서는 음향 인텐시티 벡터 및 도달시간차 방법을 통해 원거리 음장에서 음원의 위치 추정 시 발생하는 오차를 비교한다. 정사면체 형태의 3차원 마이크로폰 배열을 통해 마이크로폰 사이의 간격 변화에 따라서 오차를 비교하였다. 실제 환경에서 음원위치추정 방법의 유효성을 검증하기 위해 잔향음장 내에서 잔향시간을 변화시켜 추가 실험을 수행하였다. 도달시간차를 계산하기 위해 Generalized Cross Correlation-Phase transform(GCC-PHAT) 알고리즘을 적용하였다. 실험 결과, T60 = 0.4 s일 때 음향인텐시티법에 의한 위치추정 오차는 2.9°, 그리고 GCC-PHAT를 적용했을 때는 7.3° 이며, T60 = 1.0 s일 때 오차는 각각 9.9°, 13.0°이다. 이를 통해 일반 잔향장이 고려되는 실제 환경에서도 소형의 마이크로폰 배열을 통한 음향 인텐시티법은 음원의 위치를 추정하는데 유효하게 적용될 수 있음을 알 수 있다.

    - COLLAPSE
    January 2020
  • Research Article

    Changes in binaural beat strength to the difference of right and left hearing ability

    좌우 청력 차이에 따른 바이노럴 비트 세기의 변화

    Kim, Seong Chan, Choi, Min Joo

    김성찬, 최민주

    The binaural beat is a subjective beating phenomenon due to the frequency difference of sounds heard in both ears, sensed by the ...

    바이노럴 비트는 양이에 도달한 소리의 주파수 차이로 유발된 주관적인 맥놀이 현상이다. 물리적으로 맥놀이의 세기는 주파수가 다른 두 신호의 크기에 영향을 받는다. 따라서 ...

    + READ MORE
    The binaural beat is a subjective beating phenomenon due to the frequency difference of sounds heard in both ears, sensed by the human brain. The beating magnitude physically depends on the amplitudes of the two signals with slight different frequencies. Therefore, the binaural beat strength is expected to be affected by the difference in left and right hearing ability. In this study, 34 healthy subjects without hearing loss were chosen. They hear a pure tone sound (450 Hz) at 10 different Sound Pressure Levels (SPLs) (from 50 dB to 27.4 dB) through the one side of ears, while they hear the reference sound (440 Hz, 50 dB) through the other side of ears. Their subjective assessment using a semantic differential method reveals that the binaural beat strength decreases as SPL differences between the two sides of ears increases, if the difference is greater than 2.2 dB. The result suggests that the hearing loss difference between the two sides of ears should be less than 2.2 dB to maximize binaural beating effects.


    바이노럴 비트는 양이에 도달한 소리의 주파수 차이로 유발된 주관적인 맥놀이 현상이다. 물리적으로 맥놀이의 세기는 주파수가 다른 두 신호의 크기에 영향을 받는다. 따라서 바이노럴 비트는 좌우 청력의 차이에 따라 영향을 받을 것으로 예상된다. 본 연구에서는 청력에 따른 효과를 평가하기 위해, 정상 청력을 가진 34명의 피실험자가 한 쪽 귀에 기준음[440 Hz, 50 dB Sound Pressure Level(SPL)], 반대 측 귀에 주파수가 다른 제시음(450 Hz)을 SPL을 감소하며 들을 때, 주관적으로 느끼는 바이노럴 비트 의 세기의 변화를 Semantic Differential Method(SDM) 이용하여 평가하도록 했다. 실험 결과 피실험자가 느끼는 바이노럴 비트의 세기는, 좌우 소리의 SPL 차이가 역치(2.2 dB)보다 크면, 좌우 소리의 SPL 차이가 증가함에 따라 지속적으로 유의하게 감소하는 것으로 나타났다. 이러한 결과는 바이노럴 비트 효과를 최대로 하기 위해 좌우 청력 차이를 적절한 범위(예. 2.2 dB) 이내로 유지하는 것이 필요하다는 것을 시사한다.

    - COLLAPSE
    January 2020
  • Research Article

    Applying feature normalization based on pole filtering to short-utterance speech recognition using deep neural network

    심층신경망을 이용한 짧은 발화 음성인식에서 극점 필터링 기반의 특징 정규화 적용

    Han, Jaemin, Kim, Min Sik, Kim, Hyung Soon

    한재민, 김민식, 김형순

    In a conventional speech recognition system using Gaussian Mixture Model-Hidden Markov Model (GMM-HMM), the cepstral feature normalization method based on pole filtering ...

    가우스 혼합 모델-은닉 마코프 모델(Gaussian Mixture Model-Hidden Markov Model, GMM-HMM)을 이용하는 전통적인 음성인식 시스템에서는, 극점 필터링 기반의 켑스트럼 특징 정규화 ...

    + READ MORE
    In a conventional speech recognition system using Gaussian Mixture Model-Hidden Markov Model (GMM-HMM), the cepstral feature normalization method based on pole filtering was effective in improving the performance of recognition of short utterances in noisy environments. In this paper, the usefulness of this method for the state-of-the-art speech recognition system using Deep Neural Network (DNN) is examined. Experimental results on AURORA 2 DB show that the cepstral mean and variance normalization based on pole filtering improves the recognition performance of very short utterances compared to that without pole filtering, especially when there is a large mismatch between the training and test conditions.


    가우스 혼합 모델-은닉 마코프 모델(Gaussian Mixture Model-Hidden Markov Model, GMM-HMM)을 이용하는 전통적인 음성인식 시스템에서는, 극점 필터링 기반의 켑스트럼 특징 정규화 방식이 잡음 환경에서 짧은 발화의 인식 성능을 향상시키는데 효과적이었다. 본 논문에서는 심층신경망(Deep Neural Network, DNN)을 이용하는 최신의 음성인식 시스템에서도 이 방식의 유용성이 있는지 검토한다. AURORA 2 DB에 대한 실험 결과, 특히 훈련 및 테스트 환경 사이의 불일치가 클 때에, 극점 필터링 기반의 켑스트럼 평균 분산 정규화 방식이 극점 필터링을 사용하지 않는 방식에 비해 매우 짧은 발화의 인식 성능을 개선시킴을 보여 준다.

    - COLLAPSE
    January 2020