Research Article

The Journal of the Acoustical Society of Korea. January 2022. 70-75
https://doi.org/10.7776/ASK.2022.41.1.070

ABSTRACT


MAIN

  • I. 서 론

  • II. 실험 설계 및 분석 방법

  • III. 결 과

  • IV. 분석 및 결론

I. 서 론

생활 주변에 존재하는 복합음은 여러 기본 순음의 조합으로 이루어진다. 이 회화 주파수 대역에 존재하는 순음은 그 주변 주파수 대역과 상호작용을 일으켜서 복합음 인지에 영향을 준다. 잘 알려진 순음 탐지와 주변 잡음 간에 일어나는 차폐 현상은 그 대표적 사례이다. 이때 주변의 잡음 성분들이 비교 기준이되는 순음 주파수에 대해 동일한 영향을 주는 것이 아니라, 해당 주파수에 인접한 특정 대역이 더 강한 영향을 미친다. 이러한 특정 대역 범위가 여러 음 구성 성분을 인지하는 과정에서 중요한 역할을 하기에 오랜 기간 다수의 관련 연구가 진행되었다.[1,2,3] 이 제한적 주파수 대역 범위를 표시하는 것이 임계주파수대역(Critical Bandwidth, CB)이고 연관된 측정값들이 존재한다.[1,4,5,6] 준거가 되는 어느 순음에 대한 임계주파수대역은 동시에 존재하는 경우에 차폐 등으로 기준음의 인지에 영향을 주는 주파수 범위를 의미한다. 이를 다른 측면에서 살펴보면 임계주파수대역 밖의 음은 동시에 존재하는 경우에 기준음을 효과적으로 차폐하지 못하고 두 음을 동시에 인지하게 하는 자극으로 볼 수 있다.

임계주파수대역을 여러 측정 방법으로 결정할 수 있는데, 기본적으로 순음과 주변 주파수 대역 간의 신호 탐지 과정에서 일어나는 차폐 현상이나 신호대잡음비(Signal to Noise Ratio, SNR) 조정을 하여 그 범위를 측정할 수 있다.[3] 초기에는 신호 주파수 주변에 존재하는 대역 잡음으로 간단한 백색잡음을 선택했으나 주변 대역 폭을 조절하는 과정에서 나타나는 비트 현상과 off-frequency listening 문제로 대역소거잡음(Notched Band Noise, NBN)을 주로 사용한다.[3,7] 이 방식은 청각필터의 중심 주파수에서 체계적으로 소거 대역을 변화시킨 대역소거잡음을 사용하여 신호 탐지 역치를 구하고, 이를 이용하여 임계주파수대역을 측정하는 과정이다(Fig. 1).

https://cdn.apub.kr/journalsite/sites/ask/2022-041-01/N0660410110/images/ASK_41_01_10_F1.jpg
Fig. 1.

Notched band noise (NBN) used for critical band (CB) estimation for a 500 Hz tone.

NBN은 500 Hz 순음 주위에서 대역이 제거된 잡음을 의미한다. 이 제거 대역을 단계적으로 변화하면서 CB를 측정하게 된다. Fig. 1에서 점선으로 표시된 곡선은 500 Hz에서 피검자의 청각필터를 나타낸다.

특정 주파수를 중심으로 해서 정해지는 임계주파수대역은 해당 주파수가 주변 주파수들과 공존할 때 어떠한 반응 관계가 있는 지를 구체적으로 보여준다. 예를 들면 임계주파수대역에 포함되는 주변 주파수 성분은 영역 밖에 위치한 주파수 보다 차폐 효과가 더 강하다. 이러한 반응 관계는 여러 청각 인지 기능과 연관이 되고 그 임상적 활용 가능성이 높아서 광범위한 가청 주파수 대역까지 그 연구가 확장되고 있다.[8] 임계주파수대역에 의한 상호 반응 관계의 형성은 언어 습득에서도 중요하며 언어의 음향적 특성에 따라서 대역이나 영향이 다르게 나타날 수 있으나 여러 언어권을 대상으로 한 체계적인 연구가 아직 부족한 편이다.

임계주파수대역 측정 과정은 여러 단계로 구성된 측정 과정과 긴 검사 시간 때문에 자료 수집에 어려움이 있다. 현재까지 영어권의 임계주파수대역 자료만 일부 존재하고, 그 자료도 피검자수나 연령대가 상당히 제한적인 편이다. 한국어권 자료는 기초 자료 가 일부 존재하나,[9] 특히 임상에서 자주 측정되는 저주파수(500 Hz) 부근의 자료가 없는 실정이다. 난청인과 건청인 대다수에서 존재하는 이 저주파수에 관한 CB 정보는 이명훈련 등에서 임상적으로 대단히 중요한 활용도를 갖는 자료이다. 관련하여 이 저주파수 임계대역에 관한 기본 패턴부터 조사해보는 것이 필요하다고 판단된다. 이러한 기초 자료는 다양한 음향 환경에서 일어나는 한국어 의사소통 과정의 분석과 관련 청각 인지 기능 평가에 도움을 줄 수가 있을 것이다. 이러한 배경에서 본 연구에서는 한국어를 모국어로 하는 정상 남녀 성인을 대상으로 하여 이 저주파수 CB 범위를 측정하고 서구권 자료와 어떠한 차이가 있는지를 분석하였다. 가청 주파수 대역에서 순음 역치 검사 등 청각평가에서 자주 사용되는 500 Hz 저주파수를 기본 순음으로 선택하였고, 회화음 강도에서의 그 임계주파수대역 특성을 분석하였다.

II. 실험 설계 및 분석 방법

한국어를 모국어로 하는 정상 청력을 가진 남녀 대학생(20.2 ± 1.6세) 각 10명으로 구성된 총 20명을 피검자로 선정하였다. 전체 실험 과정은 한림대학교 생명윤리위원회(Instituional Review Bord, IRB)의 승인을 받아 진행하였다. 대상자는 순음청력 검사 결과에서 양측 귀 모두 250 Hz ~ 8000 Hz 범위에서 10 dB HL 이하의 정상 청력을 보이고, 어음인지도는 양 측 모두 100 %를 기록한 피검자로 선정하였다. 이들은 예비 과정을 거쳐서 단계별 세션으로 구성된 실험에 참가하였다.

순음과 대역소거잡음은 디지털 샘플링으로 전산 합성하였고(duration: 500 ms; inter-stimulus interval: 800 ms), 그 소거 대역 폭을 조정하면서(0 Hz ~ 400 Hz) 단계별로 정해진 신호대잡음비 수치를 유지하도록 조정하였다. NI DAQPad-6251 하드웨어(NI) 기반으로 구성된 음향 자극 시스템에서 음압이 보정된 헤드폰(ON303, Audio Technica)을 통하여 최종 자극을 제시하였다. 최종 자극음이 측정 회화 레벨로 설정된 60 dB HL 음압이 되도록 음압측정기(type 2236, B&K)로 출력을 보정하고 청력검사용 방음실에서 피검자 반응을 측정을 하였다. 자극 신호의 합성과 제시, 반응 수집과 분석 과정은 Reference [9]에서 사용된 방법과 자료를 참고하였다.

신호 순음과 대역소거잡음은 피검자의 주관적 반응의 편향성을 최소화하기 위하여 두대안강제선택(Two Alternative Forced Choice, 2AFC) 방식으로 무작위로 제시하였으며(Fig. 2) 순음 신호가 포함된 위치 응답을 정반응으로 하였다.[3,9]

https://cdn.apub.kr/journalsite/sites/ask/2022-041-01/N0660410110/images/ASK_41_01_10_F2.jpg
Fig. 2.

2AFC paradigm. N: notched band noise; S: 500 Hz signal tone; Front: first stimulus; Back: second stimulus.

Fig. 2에서 N은 대역이 소거된 잡음이고, S는 500 Hz 순음을 나타낸다. 전후 자극 간의 간격은 800 ms이다. 피검자는 무작위로 제시되는 이 전후 자극 쌍에서 500 Hz 순음이 포함된 구간이라고 인지되는 구간을 선택하게 된다.

임계주파수대역을 추정하는 여러 방법이 가능한데 본 연구에서는 추후 효율적 임상적 적용을 고려하여 그 과정을 상대적으로 간단하게 개선하였다. 우선 전/후 무작위로 제시되는 “대역소거잡음”과 “대역소거잡음 + 순음신호” 조합을 매 50회 반복하여 제시한 후에 반응의 적중률을 계산하여 75 % 수준에서 신호 탐지가 일어나는 신호대잡음비 역치를 판정하였다. 측정된 자료는 수평축을 대역소거잡음의 소거 대역 폭으로, 횡축을 신호대잡음비의 역치로 하는 임계인지역치그래프로 표시하였다. 임계주파수대역은 이 그래프에서 3 dB 아래의 지점으로 정의하였고 통과밴드와 전이밴드 구간별 회귀분석을 통하여 결정하였다.

예비 과정을 거쳐서 피검자가 평가 절차에 익숙하도록 하였고, 이 준비 과정에 약 2 h를 소요했다. 이 연습과정을 마친 후에 여러 세션으로 나누어진 본 과정을 시행했으며 세션 사이에 충분한 휴식 시간을 취했다. 휴식 시간을 제외하고 임계인지역치 그래프 측정에 평균적으로 약 5 h를 사용했다. 본 실험에 필요한 2AFC, 무작위 제시, 기록/분석 제어는 PLA 응용 패키지의 내부 모듈을 프로그램하여 사용하였다(PLA v3.0, ARICS ). 이 과정에서 얻어진 자료의 성별, 좌우측 귀에 대한 통계적 분석과 기존 영어권 자료와의 비교는 R 통계 패키지(v3.53)에서 반복 이변량 분산분석과 독립표본 t-검정으로 처리하고 유의수준 0.05에서 판정하였다.

III. 결 과

한국인 정상 성인 남녀 20명을 대상으로 좌우 양쪽 귀에서 개별 신호대잡음비 역치를 측정하고 그 임계주파수대역을 결정하였다. 그 예시로 실험에서 얻어진 개별 임계인지역치 그래프를 제시했다(Fig. 3).

https://cdn.apub.kr/journalsite/sites/ask/2022-041-01/N0660410110/images/ASK_41_01_10_F3.jpg
Fig. 3.

An exemplary critical perception threshold graph. Horizontal axis: notched bandwidth around 500 Hz; vertical axis: signal to noise ratio threshold in dB.

Fig. 3에서 점선으로 표시된 수평선과 CB는 3 dB 감소된 지점을 나타낸다. 이 임계인지역치그래프에서 소거대역잡음의 소거대역 폭이 늘어남에 따라서 간섭 반응에 의한 준거음 차폐 효과는 점차 작아지는 독립성이 나타났다.

대역소거잡음의 좁은 소거 대역 폭에서 비교적 평활한 신호대잡음비 역치 부분이 있고, 이후 소거 대역 폭이 커지면서 신호대잡음비 역치가 점차 하강하는 독특한 패턴을 보였다. 이 변화 부근에서 CB 경계치가 있는 것으로 추정하고 그 위치는 3 dB 아래 지점에서 결정하였다. 전체 대상의 임계인지역치 자료에서 소거 대역 별로 성별과 좌우측 귀 변인에 대한 반복 이변량 분산분석을 시행한 결과를 Table 1에 정리했다.

Table 1에서 BW는 500 Hz 주변의 대역소거 폭을 나타낸다. Gender는 남녀 성별 변수를 RL은 우측과 좌측 귀를 의미한다. Gender*RL은 성별과 좌우측의 상호작용을 표시한다. 이 분석에서 임계주파수대역과 관련된 특성은 남녀의 성별이나 좌우측 검사 귀의 영향을 받지 않았다. 그리고 성별과 좌우 귀 두 변인 간의 통계적으로 유의한 상호작용도 나타나지 않았다(p > 0.05).

Table 1.

Statistical analysis of gender and lateralization of the ear (N = 40, p > 0.05).

BW (Hz) 0 30 50 70 80 100 200 400
Gender F 0.110 0.123 0.160 1.261 2.550 1.244 0.998 2.427
p 0.742 0.728 0.692 0.269 0.119 0.272 0.324 0.128
RL F 2.028 0.005 0.360 0.050 0.079 1.980 1.904 0.070
p 0.163 0.944 0.552 0.824 0.780 0.168 0.176 0.793
Gender*RL F 0.020 0.493 0.360 0.866 0.079 0.431 1.531 0.070
p 0.888 0.487 0.552 0.358 0.780 0.516 0.224 0.793

이상의 내용을 종합한 평균 임계인지역치그래프 결과를 Fig. 4에 나타냈다.

https://cdn.apub.kr/journalsite/sites/ask/2022-041-01/N0660410110/images/ASK_41_01_10_F4.jpg
Fig. 4.

Averaged critical perception threshold graph. The curved line (*) denotes polynomial curve fitting for the transition region (N = 40, r2 = 0.952).

Fig. 4에서 (*)는 전이대역 부분의 곡선 피팅 결과를 나타낸 것이고, 그 값은 Eq. (1)로 표시되었다.

(1)
A=-20.783-0.018B-7.403×10-5B2.

Eq. (1)로 나타낸 모델은 전이대역에서의 특성을 나타내며 A는 신호대잡음비 역치, B는 소거대역잡음의 소거 대역 폭을 의미한다. 이 자료에서 회귀분석으로 측정한 저주파수 500 Hz에 대한 평균 임계주파수대역은 약 95 Hz였다.

IV. 분석 및 결론

본 자료에서 정상 청력을 가진 한국 젊은 남녀 성인의 회화 강도 수준에서 500 Hz 순음에 대한 평균 임계주파수대역 값은 약 95 Hz였다. 남녀 간의 성별 차이나 좌우측 귀에 대하여 통계적으로 유의한 차이는 없었다. 이 임계주파수대역 값을 대략적으로 유사한 조건의 영어권의 평균 자료[5]에서 얻은 79 Hz와 비교해보면 다소 넓은 것으로 결론된다(p < 0.05). 한국어와 영어권 피검자 사이에 기본 주파수에 대한 인접 주파수 대역이 미치는 범위와 영향에 차이가 있는 것으로 보이며 필요한 경우에 해당 언어권 자료를 사용하는 것이 적절할 것으로 사료된다.

분석된 저주파수 CB 값도 언어권 별로 다를 수가 있음을 보여주었다. 한국어에서는 영어권에 비하여 저주파수 에 대한 임계주파수대역 폭이 넓어 평균적으로 준거 주파수는 인접 주파수 대역 잡음에 의한 영향을 더 받는 것으로 보인다. 이것은 서구권과 비교하여 청취상의 장단점이라기 보다는 언어적 특성을 반영하는 것으로 생각된다. 즉, 한국어의 경우에 의사소통 과정에서 상대적으로 폭이 좁고 세밀한 임계주파수대역이 필요하지는 않은 것으로 추정된다. 이는 결국 반복되는 학습과정을 통해서 형성된 범주지각적 영향이 임계주파수대역에 반영된 것으로 볼 수가 있다. 음소의 음향적 특성을 세밀하게 구분하는 것이 필요한 경우에는 범주지각의 폭이 좁고 독립적이어야 하는데 500 Hz 대역 부근의 독립성이 한국어의 경우에는 영어권에 비해 그리 크게 요구되지 않는다고 판단된다. 이 임계주파수대역이 다양한 청각 인지 기능을 나타낼 수 있는 지표인 점을 고려하면 그 대역 형성에 언어적 학습과 기억이 관련되어 있을 가능성이 높아 언급된 특성은 이러한 점을 반영한 추가 실험과 확인이 필요할 것이다.[10]

복합음 구성 성분 주파수간의 간섭 반응은 중추 청신경계도 관련되는 과정임[3]을 고려하면, 임계주파수대역 관련 자료는 연령 등의 변인을 보정을 하여 비교하는 것이 더 정확할 것으로 생각된다. 상당수 서양권의 자료[4,5,6]는 3명 ~ 5명 정도의 성인을 대상으로 한 경우가 많다. 일부 자료[6]는 연령도 20대에서 50대까지 다양한 분포를 포함하고 있어서 정교한 직접 비교에는 어려움이 있다. 이는 주로 자료 수집 과정의 복잡함과 긴 검사 소요 시간에 기인한 것으로 효율적인 임상적 적용을 위해서는 측정 과정을 지금보다 더 간소화된 측정 절차로 개선해야 할 것으로 판단된다.

자료에 제시된 임계인지역치그래프에서 회화 영역 범위의 순음과 주변 대역간의 반응 관계의 정도를 정량적으로 파악할 수가 있었다. 이 자료에서 소거대역잡음의 소거 대역이 늘어남에 따라서 기준 주파수에 대한 차폐효과가 약화되었고, 이는 동일한 강도일 때 주변 잡음이 신호 주파수에서 멀어질수록 신호 탐지에 유리함을 의미한다. 이러한 관련 기초 자료의 축적은 향후 다양한 대역의 주변 잡음이 존재하는 음향 환경에서 한국어 어음 탐지 및 변별력을 이해하는데 유용한 정보를 제공할 것으로 생각된다.

Acknowledgements

본 연구는 다중소스모드과제(HRF201601012)의 지원을 받았습니다.

References

1
H. Fletcher, "Auditory patterns," Rev. Mod. Phys. 12, 47-65 (1940). 10.1103/RevModPhys.12.47
2
T. Dau, B. Kollmeier, and A. Kohlausch, "Modeling auditory processing of amplitude modulation. I. detection and masking with narrowband carriers," J. Acoust. Am. 102, 2892-2905 (1997). 10.1121/1.4203449373976
3
B. C. J. Moore, Introduction to the Psychology of Hearing, 6Ed (Emerald, Bingley, 2012) Chap. 3.
4
J. P. Egan and H. W. Hake, "On the masking pattern of a simple auditory stimulus," J. Acoust. Soc. Am. 22, 622-630 (1950). 10.1121/1.1906661
5
B. R. Glasberg and B. C. J. Moore, "Derivation of auditory filter shapes from notched-noise data," Hear. Res. 47, 103-138 (1990). 10.1016/0378-5955(90)90170-T
6
B. R. Glasberg and B. C. J. Moore, "Frequency selectivity as a function of level and frequency measured with uniformly exciting notched noise," J. Acoust. Am. 108, 2318-2328 (2000). 10.1121/1.131529111108372
7
R. D. Patterson, "Auditory filer shapes derived with noise stimuli," J. Acoust. Am. 59, 640-654 (1976). 10.1121/1.3809141254791
8
C. Jurado and B. C. J. Moore, "Frequency selectivity for frequencies below100 Hz: comparisons with mid frequencies," J. Acoust. Soc. Am. 128, 3585-3596 (2010). 10.1121/1.350465721218891
9
D. Lim and D. Yun, "Critical bandwidths of a basic tonal frequency for Korean normal young adults," Audiol. Speech Res. 12,139-143 (2016). 10.21848/asr.2016.12.3.139
10
N. M. Weinberger, R. Javid, and B. Lepan, "Long-term retention of learning-induced receptive-field plasticity in the auditory cortex," Proc. Natl. Acad. Sci. U S A. 90, 2394-2398 (1993). 10.1073/pnas.90.6.23948460150PMC46093
페이지 상단으로 이동하기