I. 서 론
우리나라의 대표적인 주거공간인 아파트에서 발생되는 소음관련 민원 중 바닥충격음에 대한 불만이 가장 많이 나타난다.[1] 환경부 산하 이웃사이센터에서는 민원 상담과 24 h 동안의 측정을 통해 이웃 간의 분쟁해결을 하고자 노력하고 있으나, 바닥충격소음으로 인한 민원 수는 매년 증가하고 있는 추세이다.[2,3] 이웃사이센터에서는 조사원이 24 h 동안 녹음된 소리를 듣고 음원 유형을 분류하여 층간소음 기준의 초과여부를 판단한다. 이러한 과정은 많은 시간이 소요되며 개인의 주관적인 판단을 수반하기 때문에 자동화가 필요하다. 공동주택에서 발생되는 소음원 중 저주파 대역의 음에너지가 지배적인 음원이 많기 때문에, 사람의 귀로는 정확하게 분류하기 어렵다. 이에 따라, 시간에 따른 주거소음원의 종류와 레벨을 자동분석 하기 위해서는 머신러닝을 활용한 classification이 필요하다.
한편, 환경소음분야에서는 Environmental Sound Classification(ESC)를 위한 데이터셋 구축[4]과 DCASE challenge[5]를 통해 Artificial Intelligence(AI)를 활용한 연구들이 진행되고 있다. 이를 통해 음향과 관련된 다양한 task(음향이벤트검출 등)에 대한 성능이 발전되고 있다. 건축물 소음 분야에서도 층간소음 분류를 위한 연구들이 일부 이루어졌으나, 각 연구마다 특정 층간소음 종류만의 데이터셋을 이용한 연구가 진행되었다.[6,7,8] 그러나, 층간소음 이외에 건축물의 실내공간에서 발생되는 다양한 주거소음원을 분류하는 연구는 미흡한 실정이다. 층간소음을 포함한 실내 주거 소음은 환경소음과는 다르게 건축물의 바닥슬래브와 벽 및 천장 등을 통해 전달되는 소음이다. 이는 건축물의 성능에 따라 전달되는 소음이 다르게 나타남을 의미하기 때문에 주거소음원의 데이터셋을 구축하기 쉽지 않다. 하지만, 주거소음원 민원을 해결하기 위해서는 주거소음원을 분류하기 위한 데이터셋 구축이 필요한 실정이다.
공동주택 건축물의 물리적 개선방안에 대한 많은 연구들이 진행되었다.[9,10,11,12,13,14] 하지만, 건축물의 물리적 개선에도 불구하고 오래전에 건설된 실내 환경에서 발생되는 주거소음원에 대한 불만은 지속적으로 나타나고 있다. 소음에 대한 주관적인 반응은 소음의 주파수 특성과 시간적 특성에 의해 다르게 나타나는 것으로 조사되었다.[15,16] Kim et al.의 연구[17]에서는 층간소음의 시간적 특성(충격, 변동, 정상음)에 따라서 주관적 반응이 다르게 나타났다. 따라서, 심리적인 관점에서 주거소음환경 개선을 위해서는 주거소음원의 주파수 및 시간적 특성에 대한 조사가 필요하며, 이러한 음향적 특성이 몇 개의 군집으로 분류되는지 조사할 필요가 있다. 따라서, 본 연구에서는 다양한 주거소음원을 대상으로 구축한 데이터셋을 바탕으로 주파수 특성과 시간적 특성을 통해 주거소음원을 군집화하였다.
본 연구는 공동주택에서 발생되는 주거소음원의 주파수 및 시간 특성을 분석하고, 머신러닝을 통해 주거소음원의 군집 분류를 진행하였다.
실제 거주지에서 발생되는 주거소음원은 거주자가 발생시키는 소음이 아닌 다른 세대로부터 전달되는 소음이 대부분이다. 이에 따라 측정 및 녹음을 통해서 소음원의 종류를 파악하는데 한계점(사람이 직접 소음원을 듣고 판단하는 과정 등)이 있는 것으로 판단된다. 따라서, 본 연구에서는 주거소음원을 분류함에 있어 1차적으로 음향 특성인 주파수와 시간을 기반으로 음원의 종류를 군집화하고자 하였다. 또한, 군집화 결과를 바탕으로 거주지에서 발생되는 주거소음원을 관리하는 하나의 방안으로 주거소음원의 군집 분류를 목적으로 진행하였다.
따라서, 본 연구의 연구 질문은 다음과 같다. 1. 주거소음원은 주파수 특성과 시간적 특성에 의해 몇 개의 군집화가 나타나는가? 2. 주거소음원의 군집을 자동으로 분류하기 위해 어떠한 음원의 파라메타가 적절한가?
II. 주거소음원 데이터셋
본 연구에서 사용된 주거소음원은 환경부 산하 층간소음 이웃사이센터에 접수된 민원 현황을 대상으로 데이터셋을 구성하였다. 2019년도 이웃사이센터 보고서[18]에 의하면 가장 민원이 많이 발생되는 소리는 어린이 달리기 또는 걷기(69.2 %)였으며, 그 외(12.6 %), 망치질 소리(4.2 %), 가구 끄는 소리(3.5 %) 등의 순으로 민원이 발생되는 것으로 조사되었다. 이를 바탕으로 최종 수집된 주거소음원은 Table 1과 같이 바닥충격음(14종, 528개), 공기전달음(4종, 105개), 급배수(3종, 42개) 및 설비소음(1종, 11개), 환경 소음(4종, 132개), 공사장 소음(20종, 240개)으로 총 46종류로 1,058개 이었다. 최종 수집된 주거소음원의 정보는 길이 30 s, sampling rate 44,100 ms, monoral wav로 구성되었다.
Table 1.
Dataset of residential sound in apartment buildings.
본 연구에서는 배경소음이 낮은 곳에서 주거소음원만을 녹음하여 주거소음원의 주파수 및 시간적 특성 분석을 진행하고자 실제 주택과 유사하게 시공된 LH 주택성능 연구개발센터의 실증 주택에서 진행하였다. 실증 주택 중 국내 공동주택에 가장 보편적으로 보급된 뜬바닥 구조(슬라브 두께: 210 mm, 완충재 30 mm, 경량기포콘크리트 40 mm, 마감모르타르 40 mm)와 평천장(석고보드 1장)의 형태를 가진 59 m2과 84 m2 면적의 세대에서 녹음하였다. 수음지점은 ISO10052 간편법[19]과 Jeong과 Ryu[20]을 참고하여 가진 세대의 직하층에서 소음계(NL-52, Rion)를 통해 거실의 중앙지점과 거실 내 발코니 쪽의 벽에서 75 cm 이격 한 모서리 지점인 총 2개 지점에서 수음하였다. 수음의 높이는 1.2 m였으며, 30 s 동안 녹음하였다. 본 연구에서 수집된 음원들은 거실공간에서 수음되는 주거소음원을 대상으로 수집되었다. 거실공간에서 수음되는 공기전달음의 경우, 옆 세대에서 발생되는 소리보다 상부세대에서 발생되는 주거소음원의 소리가 크기 때문에 상부세대에서 스피커(SRS-X7, SONY)를 통해 재생하여 녹음되었다. 바닥충격음의 경우 성인(몸무게: 70 kg, 75 kg, 80 kg, 85 kg, 나이: 평균 28세)과 어린이(몸무게: 17 kg, 22 kg, 24 kg, 나이: 평균 7세)가 가진하였다. 제자리 뜀의 경우 가진 층의 중앙에서 가진하였으며, 달리기와 걷기의 경우는 거실의 4개의 모서리와 중앙지점을 반복하여 가진하였다. 리모컨, 골프공, 숟가락 떨어뜨리는 소리는 거실의 중앙지점과 거실 내 발코니 쪽의 벽에서 75 cm 이격 한 모서리 지점에서 가진 높이(20 cm, 100 cm)를 다르게 하여 가진하였다. 망치질은 거실에서 내력벽과 비내력벽에서 모두 가진하였으며, 실내문 여닫는 소리는 거실과 붙어있는 안방문을 대상으로 녹음하였다. 의자끄는소리는 거실의 중앙에서 가진하였으며, 현관문 여닫는 소리는 상부세대의 현관문을 여닫는 소리를 녹음하였다. 공사장 소음, 교통 소음, 환경 소음, 실외기 소음은 공동주택 파사드 차음성능 필터링 값(1/3 옥타브 밴드 50 Hz ~ 5k Hz)[21]을 적용하였다.
모든 음원의 길이는 5 s로 동일하게 편집하였다. 공동주택에서 발생되는 주거소음원의 음압 레벨[22]을 참고하여 40 dBA ~ 50 dBA in Leq(2 dBA 간격)로 조정하였다. 각 음원은 AS-70(Rion) 프로그램을 통해 분석하였다. Fig. 1은 주거소음원이 주파수 특성과 시간적 특성으로 분석되는 과정을 나타낸다. 주파수 특성은 1/1 옥타브 밴드(31.5 Hz ~ 2k Hz)와 1/3 옥타브 밴드(25 Hz ~ 2,500 Hz)의 Leq와 Lmax값을 도출하였다. 시간적 특성은 5 s 동안 매 6 ms의 음압레벨 분석(time weighting: fast with 6 ms step, Integral time: 125 ms)을 통해 Leq값을 도출하였다. 본 연구에서는 주거소음원을 설명하는데 있어 보다 많은 데이터를 활용하기 위하여 AS-70(Rion) 프로그램에서 분석되는 최솟값(6 ms)을 활용하였다.
III. 주거소음원 군집화
3.1 방법
K-Means clustering은 주어진 데이터 집합을 유사한 데이터 그룹으로 나누는 대표적인 비지도 학습 머신러닝 알고리즘이다. 본 연구에서는 K-Means clustering[23]을 통해 주거소음원을 주파수 특성과 시간적 특성에 대해 군집화를 진행하였다. K-Means의 k의 개수는 각 군집의 중심점을 의미한다. k의 개수에 따라 군집이 여러 개로 나누어지게 되며, k 값을 결정하는 방법으로 엘보우 방법(Elbow method)과 실루엣 계수(Silhouette coefficient) 방법 등이 있다. 본 연구에서는 k의 개수를 와 엘보우 방법을 통해 선택하였다. 먼저, 각 옥타브 대역별 Leq와 Lmax값을 바탕으로 1차 군집화(주파수 특성에 대한 군집화)를 수행하고 비교하였다. 이후 각 주파수 특성에 기반한 군집의 시간적 특성에 대해 2차 군집화(시간적 특성을 통한 군집화)를 진행하였다. 본 연구에서는 주파수 특성이 음원분류의 활용성 측면에서 더욱 중요하다고 판단하여 먼저 군집화를 진행하고 시간적 특성을 통한 군집하를 이후에 진행하였다.
실루엣 계수[24]는 Eq. (1)에 의해 계산되며, a(i)는 개별 데이터의 동일 군집 내 다른 데이터들과의 평균 거리이며, b(i)는 가장 가까운 군집과의 평균 거리를 의미한다. 각 데이터에 대해 실루엣 계수를 구한 후 평균을 내어 전체 데이터의 실루엣 계수를 구하여 각 군집별로 평균값의 편차가 크지 않을 때 군집 성능이 좋은 것으로 판단한다.
엘보우 방법[25]은 Eq. (2)와 같이, 군집 내 중심점과 데이터 간의 거리를 제곱하여 합한 값을 계산하여 값이 작은 값을 사용한다. 여기서 k는 군집화 수이고 n는 데이터 수를 말하며, xi:는 i번째 데이터이고 cj는 j번째 군집의 중심을 말한다.
3.2 결과
3.2.1 주파수 특성 군집화
Fig. 2는 평가지수 1/1 옥타브 밴드별 Leq값을 사용하여 군집화하였을 때 k의 계수를 정하기 위한 실루엣 계수와 엘보우 방법을 나타낸다.
Table 2는 K-means clustering의 k를 결정하기 위해 사용된 실루엣 계수의 평균과 군집 간의 실루엣 계수 편차를 나타낸다. 본 연구에서는 2개 ~ 5개의 k 중 전체 평균 실루엣 계수 평균값과 개별 군집의 평균값의 편차가 가장 낮은 k 값을 사용하였다. 주파수 특성을 활용한 1차 군집화 결과, 모든 평가지수와 옥타브밴드에 대해 각각 3개의 군집(A, B, C)이 나타났다.
Table 2.
Mean and standard deviation of silhouette coefficient.
Figs. 3과 4는 1/1과 1/3옥타브 밴드별 평가지수 Leq 값과 Lmax값을 통해 나타난 1차 군집화(주파수 특성 기반) 결과를 나타낸다. 1/1과 1/3 옥타브 밴드별 평가지수 Leq값을 통해 나타난 군집은 3개인 것으로 나타났다. 3개의 군집별 주파수 특성은 Fig. 3과 4 같이 저주파 대역과 중・저주파 대역 간의 기울기가 비교적 높은 그룹, 중간그룹, 낮은 그룹으로 나타났다. Table 3은 평가지수 1/1 옥타브 밴드 Leq를 활용해 나타난 각 군집별 상위 5개의 음원을 나타낸다. 군집 1의 상위 5개 음원은 성인 달리기, 성인 제자리 뜀, 성인 걷기, 어린이 제자리 뜀과 어린이 달리기 순으로 나타났으며, 군집 1의 총음원은 1,175개로 나타났다. 군집 2의 총음원은 2,884개로 구성되어 있으며, 상위 5개 음원은 망치질, 도로교통소음 40 km, 의자 끄는 소리, 개 짖는 소리와 도로교통소음 60 km 순으로 나타났다. 군집 3에서의 상위 5개 음원은 건전지 떨어뜨리는 소리, 숟가락 떨어뜨리는 소리, 도로교통소음 80 km, 골프공 떨어뜨리는 소리와 리모컨 떨어뜨리는 소리 순으로 나타났으며, 군집 3의 총음원은 2,343개로 구성되었다.
Table 3.
Most of using spectral characteristic in residential noise (1/1 octave band, Leq).
Fig. 5와 Table 4는 주파수 특성으로 나타난 군집별 평균값과 각 평가지수와 주파수 대역별 음압레벨 비율 값을 나타낸다. 주파수 대역별로 평균값과 주파수 음압레벨 비율 값을 통해 군집별 차이를 조사하였다. 평가지수 1/1 옥타브 밴드 Leq와 Lmax값을 통해 나타난 각 평가지수의 평균 주파수 특성은 유사하게 나타났다. 군집 1의 평균 주파수 대역은 군집 2와 군집 3의 31.5 Hz ~ 125 Hz 평균 주파수 대역에서 높게 나타났으며, 250 Hz ~ 2k Hz 평균 주파수 대역에서 낮게 나타났다. 군집 2의 31.5 Hz ~ 125 Hz 평균 주파수 대역은 군집 1의 평균 주파수 대역보다 낮고, 군집 2의 평균 주파수 대역보다 높게 나타났다. 또한, 군집 2의 250 Hz ~ 2k Hz 평균 주파수 대역은 군집 1과 3의 평균 주파수 대역보다 높게 나타났다. 군집 3의 250 Hz ~ 2k Hz 평균 주파수 대역은 군집 1보다 높지만, 군집 2보다는 낮게 나타났다. 또한, 평가지수 1/3 옥타브 밴드 Leq와 Lmax값을 통해 나타난 각 평가지수의 평균 주파수 특성도 유사하게 나타났다. 군집 1의 평균 주파수 대역은 군집 2와 군집 3의 20 Hz ~ 100 Hz 평균 주파수 대역에서 높게 나타났으며, 250 Hz ~ 2.5k Hz 평균 주파수 대역에서 낮게 나타났다. 군집 2의 20 Hz ~ 100 Hz 평균 주파수 대역은 군집 1보다 낮게 나타났고, 군집 3보다 높게 나타났다. 또한, 군집 2의 250 Hz ~ 2.5k Hz 평균 주파수 대역은 군집 1과 3보다 높게 나타났다. 군집 3의 20 Hz ~ 100 Hz 평균 주파수 대역은 군집 1과 2보다 낮게 나타났고, 군집 2의 250 Hz ~ 2.5k Hz 평균 주파수 대역은 군집 2보다는 낮고 군집 1에 비해 높게 나타났다.
Table 4.
Percentage by frequency band [%] (L: Low, M: Mid, H: High).
Table 4는 군집별 주파수 대역(Low, Mid, High) 음압레벨의 비율을 나타낸다. 음압레벨의 비율은 실내음향 측정 시 사용하는 Bass ratio의 개념[26]을 참고하여 분석하였다. 각 평가 지표의 주파수 대역을 저주파(1/1옥타브 밴드: 31.5 Hz, 63 Hz, 125 Hz, 1/3 옥타브 밴드: 20 Hz, 31.5 Hz, 40 Hz, 50 Hz, 63 Hz, 80 Hz, 100 Hz, 125 Hz, 160 Hz), 중주파(1/1 옥타브 밴드: 250 Hz, 500 Hz, 1/3 옥타브 밴드: 200 Hz, 250 Hz, 315 Hz, 400 Hz, 500 Hz, 630 Hz), 고주파 대역(1/1 옥타브 밴드: 1k Hz, 2k Hz, 1/3 옥타브 밴드: 800 Hz, 1k Hz, 1.25k Hz, 1.6k Hz, 2k Hz, 2.5k Hz)으로 나누어 각 주파수 그룹 간의 차이를 조사하였다. 비율은 모든 주파수 대역의 값을 더하여 주파수 대역별로 나눈 값을 계산하였다. 모든 평가지수에서 나타난 군집은 저주파 대역이 높게 나타났으며, 저주파 대역의 음압레벨 비율이 각 군집에 따라 차이가 나타났다. 평가지수별 A1, A2, A3, A4의 군집이 저주파 대역의 음압레벨 비율이 가장 높은 군집으로 나타났다. 또한, 저주파 대역과 고주파 대역의 음압레벨 차이값에 따라 군집이 다르게 나타났다.
3.2.2 시간적 특성 군집화
Table 5는 K-means clustering의 k를 결정하기 위해 사용된 실루엣 계수의 평균과 군집 간의 실루엣 계수 편차를 나타낸다. 시간적 특성을 활용한 2차 군집화 결과, 평가지수 1/1, 1/3 옥타브 밴드별 Leq값을 통해 나타난 군집화 3개(A1, B1, C1, A2, B2, C2)는 각각의 군집에 따라 3개의 시간적 특성 군집으로 구성되어 총 9개의 주거소음원(A1-1, A1-2, A1-3, B1-1, B1-2, B1-3, C1-1, C1-2, C1-3)이 구성되었다. 또한, 평가지수 1/1, 1/3 옥타브 밴드별 Lmax값을 통해 나타난 군집 3개(A3, B3, C3, A4, B4, C4) 중 A3, B3, A4, B4는 3개의 시간적 특성 군집으로 구성되었으며, C3와 C4는 5개의 시간적 특성 군집으로 구성되어 총 11개의 주거소음원(A3-1, A3-2, A3-3, B3-1, B3-2, B3-3, C3-1, C3-2, C3-3, C3-4, C3-5, A4-1, A4-2, A4-3, B4-1, B4-2, B4-3, C4-1, C4-2, C4-3, C4-4, C4-5)이 구성되었다. Fig. 6은 1/1 옥타브 밴드별 Leq값을 통한 주파수 특성과 시간적 특성으로 나타난 총 9개의 주거소음원(A1-1, A1-2, A1-3, B1-1, B1-2, B1-3, C1-1, C1-2, C1-3)을 나타낸다. A1 군집을 시간적 특성으로 나타난 3개의 군집 중 A1-1의 군집은 A1-2 군집보다 변동성과 주기성이 강하게 나타나며, A1-3 군집보다는 충격성, 변동성과 주기성이 약한 음원들이 나타났다. B1 군집을 시간적 특성으로 군집화한 B1-1의 군집은 B1-2와 B1-3의 군집보다 정상음의 특성을 나타내며, 변동성이 낮은 음원들이 군집되었다. C1 군집을 시간적 특성으로 군집화한 군집 중 C1-1의 군집은 C1-2의 군집보다 변동성이 많이 나타났으나, C1-3의 군집이 변동성이 가장 많이 나타났다. Table 6는 1/1 옥타브밴드 별 Leq 값을 통해 주파수 특성으로 군집화된 A1, B1, C1의 군집을 시간적 특성으로 군집화하여 각 군집별 상위 2개의 음원과 군집에 속한 전체 음원의 개수를 나타낸다. A1-1의 군집(총 220개)의 상위 2개의 음원은 성인 달리기와 성인 걷기로 나타났다. A1-2(총 644개)의 군집의 상위 2개의 음원은 성인 걷기와 어린이 제자리 뜀으로 구성되어 있으며, A1-3(총 311개)의 군집은 성인 제자리 뜀과 현관문 여닫기로 나타났다. 또한, B1-1의 군집(총 1,285개)에서는 망치질과 건전지 떨어뜨림 소리가 있으며, B1-2 군집(1,178개)에는 망치질과 도로교통소음 40 km로 나타났다. B1-3 군집(총 422개)의 상위 2개의 음원은 의자 끄는 소리와 현관문 여닫는 소리로 나타났다. C1-1 군집(총 987개)의 음원은 건전지 떨어뜨리는 소리와 숟가락 떨어뜨리는 소리로 구성되었다. C1-2 군집(총 539개)의 상위 2개의 음원은 샤워 소리와 건전지 떨어뜨리는 소리로 나타났으며, C1-3 군집(총 817개)에서는 의자 끄는 소리와 리모컨 떨어뜨리는 소리가 나타났다.
Table 5.
Silhouette coefficient mean and standard deviation.
Table 6.
Most of using temporal characteristic in residential noise (1/1 octave band, Leq).
Fig. 7은 평가지수 1/1옥타브 밴드별 Leq값을 통해 주파수 특성 군집화와 시간적 특성으로 군집화된 군집별 시간에 따른 평균 Leq값을 나타낸다. 또한, Table 7은 주파수 특성과 시간적 특성으로 군집화된 군집별 변동성을 조사하기 위한 L10-L90을 나타낸다. L10-L90[27]은 시간에 따른 Leq값의 상위 10 %에 해당하는 값과 하위 10 %에 해당하는 값의 차이를 계산하여 군집별 시간적 변화를 조사하였다. 평가지수 1/1 옥타브 밴드 Leq값을 통해 나타난 주파수 및 시간적 특성의 군집은 군집별로 L10-L90 값이 다르게 나타났다. 군집 중 A1-3이 L10-L90 값이 크게 나타났으며, C1-2가 값이 가장 낮게 나타났다. Fig. 7과 같이 A1-3의 군집이 시간변화에 따른 변동성이 가장 크고, C1-2 군집이 시간변화에 따른 변동성이 가장 작은 군집이 나타났다. A1-3의 군집은 성인 제자리 뜀과 현관문 여닫음과 같이 충격시간이 짧고 단발성 음원들이 변동성이 가장 큰 군집으로 나타난 것으로 판단된다. 반대로 C1-2 군집은 샤워음과 건전지 떨어뜨림같이 충격시간이 길고 지속성이 있는 정상음의 음원들이 변동성이 가장 작은 군집으로 나타난 것으로 판단된다. 본 연구에서 수집된 건전지 떨어뜨림 소리는 충격력이 약하고 구르는 소리가 포함되었기 때문에 C1-2 군집 중 상위음원으로 나타난 것으로 판단된다. 또한, C1-1과 C1-2의 군집에서 모두 리모컨 떨어뜨림 소리가 상위 2개의 음원에 포함되었다. 이는, 같은 소음원 종류이고 주파수가 같음에도 시간적 특성이 다르면 다른 군집으로 분류가 되었음을 나타낸다. 또한, 주파수 특성을 통한 군집에서도 동일한 소음원 종류의 음원이 다른 군집으로 나타난 경우도 있다. 이러한 결과는 동일한 소음원임에도 충격력이나 충격력 시간 등에 의해서 군집이 다르게 나타날 수 있음을 보여준다.
IV. 주거소음원 분류
4.1 방법
본 연구에서는 주거소음원의 군집화한 결과를 활용하는 방안으로써, 각 주파수와 시간적 특성으로 나타난 군집화 결과를 바탕으로 주거소음원을 분류하였다. 9개와 11개의 주거소음원을 라벨링 하여 Support Vector Machine(SVM), k-Nearest Neighbor(k-NN), 인공신경망(Artificial Neural Network, ANN)을 통해 음원을 분류하고[28,29,30] 분석방법 간의 차이를 조사하였다. 서포트 벡터 머신은 머신러닝 방법 중 하나로 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사용한다. k-최근접 이웃(k-NN) 알고리즘은 패턴 인식 분야에서 분류나 회귀에 사용되는 방법이다. Fig. 8과 같이 인공신경망은 여러 분야에서 사용되는 머신러닝 방법으로 분류와 회귀 등 분석에 사용된다. 각 모델에 사용된 데이터는 주파수 특성, 시간적 특성, 주파수 특성과 시간적 특성이었다. 모든 데이터는 학습 70 %, 검증 30 %로 구성되었으며, 학습 데이터의 30 %는 테스트에 사용되었다. k-NN과 SVM은 scikit-learn에서 제공하는 알고리즘을 사용하였으며, k-fold(n = 10)를 사용하여 검증하였다. k-fold 교차검증은 머신러닝에서 모델의 성능을 측정하고 검증하는 기술 중 하나이다. 데이터 세트를 k개의 부분집합으로 분할하고, 이 중 하나를 검증 데이터로 가용하며, 나머지 k-1개의 부분집합을 학습 데이터로 사용하여 모델 학습을 k번 반복하는 방법이다. k개의 모델을 생성하여 각각의 모델이 다른 검증 데이터로 성능을 측정하여 성능지표를 k번 평균하여 최종 성능지표를 계산한다. ANN은 입력계층과 출력계층 사이에 은닉계층 2개를 사용하여 간단한 모델을 구축했으며, 학습 횟수는 100회, 배치 사이즈는 128로 진행하였다. loss는 cross entropy를 사용했으며, optimizer는 Adam을 사용하였다. 각 머신러닝의 모델의 분류 성능은 accuracy와 F-1 score[31]를 통해 비교 분석하였다.
4.2 결과
Table 8은 각 머신러닝 모델별 accuracy와 F-1 score 결과를 나타낸다. 주파수와 시간적 특성으로 군집화된 주거소 음원을 대상으로 머신러닝 모델의 정확도를 비교하였다. 평가지수 1/3 옥타브 밴드별 Leq값을 통해 군집화된 군집이 주파수 특성, 시간적 특성, 주파수와 시간적 특성을 사용하여 주거소음원을 분류한 결과가 다른 모델에 비해 모두 정확도가 높게 나타났다. 가장 정확도가 높은 모델은 평가지수 1/3옥타브 밴드별 Leq값을 통해 군집화한 주파수와 시간적 특성을 사용하여 ANN 모델을 이용한 경우가 accuracy 93 %와 f1-score 92 %로 가장 높게 나타났다. 또한, 주파수 특성 데이터를 가지고 분류한 모델이 시간적 특성 테이터를 가지고 분류한 모델보다 분류성능 accuracy와 f1-score값이 높게 나타났다(평가지수 1/1 옥타브 밴드별 Lmax의 군집화된 모델 제외). 이는 Fig. 6과 같이 주파수 특성이 다름에도 불구하고 시간적 특성이 동일한 군집으로 나타나는 경우와 연관이 있는 것으로 판단된다. 시간적 특성이 동일한 군집이 나타나기 때문에 시간적 특성 데이터만을 사용했을 때 보다 주파수 특성 데이터를 활용했을 때의 주거소음원 군집화 분류 성능이 높게 나타난 것으로 판단된다.
Table 8.
Performance of machine learning models accuracy and f1-score [%].
V. 결 론
본 연구에서는 주거소음원의 주파수 및 시간적 특성 데이터를 활용하여 머신러닝 기반 주거소음원의 군집화 및 분류를 진행하였다. 주거소음원은 각 평가지수(Leq와 Lmax)별 주파수 특성의 음압레벨에 의해 3개의 군집으로 구분되는 것으로 나타났다. 군집별 주파수 특성은 평가지표별 저주파 대역의 비율이 50 %, 40 %, 30 %인 경우에 따라 군집이 다르게 나타났다. 평가지수별 주파수 특성을 통한 군집화를 진행 후 3개의 군집을 시간적 특성으로 2차 군집화를 진행하였다. 평가지수 1/1, 1/3 옥타브 밴드별 Leq값을 통해 나타난 시간적 특성 군집은 총 9개의 주거소음원이 구성되었다. 또한, 평가지수 1/1, 1/3 옥타브 밴드별 Lmax값을 통해 나타난 시간적 특성 군집은 총 11개의 주거소음원이 구성되었다. 이후, 주거소음원의 군집을 활용하기 위해 본 연구에서 나타난 군집 수로 라벨링하여 주거소음원을 분류하였다. 본 연구에서는 평가지수별로 9개와 11개의 군집이 나타났다. 각 해당하는 평가지수의 라벨링을 통해 주거소음원의 주파수 특성만을 이용한 경우, 시간적 특성만 이용한 경우와 주파수 특성과 시간적 특성을 같이 이용하여 주거소음원을 분류하여 각 평가지수와 분류성능이 높은 모델을 조사하였다. 주거소음원의 분류는 1/3 옥타브 밴드별 Leq값으로 군집화 된 9개의 라벨링을 통해 주파수 특성과 시간적 특성을 사용하여 ANN모델을 이용한 경우가 가장 높은 정확도를 나타냈다.
본 연구는 공동주택에서 발생되는 주거소음으로 인한 민원을 해결하기 위한 기초연구로서 공동주택에서 발생되는 주거소음원 데이터셋을 구축하고, 군집화 및 분류하였다. 주거소음으로 인한 민원을 해결하기 위해서는 거주지에서의 모니터링을 통해 주거소음원을 자동 분류할 필요가 있다. 하지만 자동분류를 하기 위해서는 공동주택에서 발생되는 주거소음원의 데이터셋을 구축할 필요가 있기 때문에 본 연구에서는 주거소음원 데이터셋 구축을 하였다. 그럼에도 불구하고 주거소음원은 건축물에 의해 전달되는 소음으로서 거주지마다 다르게 나타나기 때문에 추가적인 데이터셋 구축이 필요하다. 거주지에서 발생되는 주거소음원은 주파수 및 시간적 특성에 의해 주관적 반응이 다르게 나타나기 때문에, 본 연구에서 조사한 주파수 및 시간적 특성에 의한 군집수를 활용한 모니터링이 필요하다고 판단된다. 본 연구는 실제 거주공간에서 발생되는 주거소음원을 실제 거주공간과 유사하게 시공된 실증주택에서 수집하였다. 실제 거주공간에서의 주거소음원의 녹음은 제한적이며 어려움이 있다. 배경소음이 최소화된 음원을 확보하고자 실증주택에서 녹음을 진행하였지만, 본 연구결과를 활용하기 위해서는 실제 거주공간에서 발생되는 다양한 주거공간에서의 음원 확보가 필요할 것으로 판단된다. 또한, 공기전달음의 경우 옆 세대에 의한 민원이 발생하기 때문에 옆세대에 의한 공기전달음 수집이 추가분석이 필요하다. 본 연구의 주거소음원 군집화 분석방향은 주파수 특성이 음원분류의 활용성 측면에서 더욱 중요하다고 판단하여 먼저 진행하고 시간적 특성을 통한 군집화를 이후에 진행하였는데, 시간적 특성을 통한 군집화를 먼저 진행하고 주파수 특성을 통한 군집화를 분석하여 비교가 필요하다. 본 연구의 군집화 방법은 k-means clustering을 이용하였으나, Gaussian Mixture Model(GMM)과 같은 추가적인 군집화 방법의 분석을 진행하여 군집화 방법간의 비교도 필요할 것으로 판단된다. 활용측면에서 본 연구의 결과는 주파수와 시간적 특성에 따라 나누어진 군집별로 사운드 마스킹을 적용하여 거주자의 심리적 측면에서 민원을 줄일 수 있는 하나의 방안으로 활용될 수 있을 것으로 판단된다. 향후, 주거소음원 분류 성능을 향상시키기 위한 음향적 특징에 대한 연구가 추가적으로 필요하며, 거주지에서 주거소음원을 녹음하기 어렵기 때문에 주거소음원의 데이터셋을 구축하기 위한 방법론이 추가적으로 연구가 필요하다.