Clustering and classification of residential noise sources in apartment buildings based on machine learning using spectral and temporal characteristics

Jeong-hun Kim; Song-mi Lee; Su-hong Kim; Eun-sung Song; Jong-kwan Ryu

doi:10.7776/ASK.2023.42.6.603

Preview

Research Article

The Journal of the Acoustical Society of Korea. 30 November 2023. 603-616
https://doi.org/10.7776/ASK.2023.42.6.603

Clustering and classification of residential noise sources in apartment buildings based on machine learning using spectral and temporal characteristics

주파수 및 시간 특성을 활용한 머신러닝 기반 공동주택 주거소음의 군집화 및 분류

Jeong-hun Kim¹

Song-mi Lee¹

Su-hong Kim¹

Eun-sung Song²

Jong-kwan Ryu³^*

김 정훈¹

이 송미¹

김 수홍¹

송 은성²

류 종관³^*

¹전남대학교 대학원 건축토목공학과

²Ecole Nationale des Travaux Publics de l’Etat, Université de Lyon, France

³전남대학교 건축학부

^{*Corresponding Author}

ABSTRACT

In this study, machine learning-based clustering and classification of residential noise in apartment buildings was conducted using frequency and temporal characteristics. First, a residential noise source dataset was constructed . The residential noise source dataset was consisted of floor impact, airborne, plumbing and equipment noise, environmental, and construction noise. The clustering of residential noise was performed by K-Means clustering method. For frequency characteristics, L_eq and L_max values were derived for 1/1 and 1/3 octave band for each sound source. For temporal characteristics, Leq values were derived at every 6 ms through sound pressure level analysis for 5 s. The number of k in K-Means clustering method was determined through the silhouette coefficient and elbow method. The clustering of residential noise source by frequency characteristic resulted in three clusters for both L_eq and L_max analysis. Temporal characteristic clustered residential noise source into 9 clusters for L_eq and 11 clusters for L_max. Clustering by frequency characteristic clustered according to the proportion of low frequency band. Then, to utilize the clustering results, the residential noise source was classified using three kinds of machine learning. The results of the residential noise classification showed the highest accuracy and f1-score for data labeled with Leq values in 1/3 octave bands, and the highest accuracy and f1-score for classifying residential noise sources with an Artificial Neural Network (ANN) model using both frequency and temporal features, with 93 % accuracy and 92 % f1-score.

Keywords

Residential noise in apartment

Spectral and temporal characteristics

Clustering

Classification

Machine learning

Dataset

본 연구는 주파수 및 시간 특성을 활용하여 머신러닝 기반 공동주택 주거소음의 군집화 및 분류를 진행하였다. 먼저, 공동주택 주거소음의 군집화 및 분류를 진행하기 위하여 주거소음원 데이터셋을 구축하였다. 주거소음원 데이터셋은 바닥충격음, 공기전달음, 급배수 및 설비소음, 환경소음, 공사장 소음으로 구성되었다. 각 음원의 주파수 특성은 1/1과 1/3 옥타브 밴드별 L_eq와 L_max값을 도출하였으며, 시간적 특성은 5 s 동안의 6 ms 간격의 음압레벨 분석을 통해 L_eq값을 도출하였다. 공동주택 주거소음원의 군집화는 K-Means clustering을 통해 진행하였다. K-Means의 k의 개수는 실루엣 계수와 엘보우 방법을 통해 결정하였다. 주파수 특성을 통한 주거소음원 군집화는 모든 평가지수에서 3개로 군집되었다. 주파수 특성 기준으로 분류된 각 군집별 시간적 특성을 통한 주거소음원 군집화는 L_eq평가지수의 경우 9개, L_max 경우는 11개로 군집되었다. 주파수 특성을 통해 군집된 각 군집은 타 주파수 대역 대비 저주파 대역의 음에너지의 비율 또한 조사되었다. 이후, 군집화 결과를 활용하기 위한 방안으로 세 종류의 머신러닝 방법을 이용해 주거소음을 분류하였다. 주거소음 분류 결과, 1/3 옥타브 밴드의 L_eq값으로 라벨링된 데이터에서 가장 높은 정확도와 f1-score가 나타났다. 또한, 주파수 및 시간적 특성을 모두 사용하여 인공신경망(Artificial Neural Network, ANN) 모델로 주거소음원을 분류했을 때 93 %의 정확도와 92 %의 f1-score로 가장 높게 나타났다.

키워드

공동주택 주거소음

주파수와 시간적 특성

군집화

분류

머신러닝

데이터셋

MAIN

I. 서 론
II. 주거소음원 데이터셋
III. 주거소음원 군집화
3.1 방법
3.2 결과
IV. 주거소음원 분류
4.1 방법
4.2 결과
V. 결 론

I. 서 론

우리나라의 대표적인 주거공간인 아파트에서 발생되는 소음관련 민원 중 바닥충격음에 대한 불만이 가장 많이 나타난다.^[1] 환경부 산하 이웃사이센터에서는 민원 상담과 24 h 동안의 측정을 통해 이웃 간의 분쟁해결을 하고자 노력하고 있으나, 바닥충격소음으로 인한 민원 수는 매년 증가하고 있는 추세이다.^[2,3] 이웃사이센터에서는 조사원이 24 h 동안 녹음된 소리를 듣고 음원 유형을 분류하여 층간소음 기준의 초과여부를 판단한다. 이러한 과정은 많은 시간이 소요되며 개인의 주관적인 판단을 수반하기 때문에 자동화가 필요하다. 공동주택에서 발생되는 소음원 중 저주파 대역의 음에너지가 지배적인 음원이 많기 때문에, 사람의 귀로는 정확하게 분류하기 어렵다. 이에 따라, 시간에 따른 주거소음원의 종류와 레벨을 자동분석 하기 위해서는 머신러닝을 활용한 classification이 필요하다.

한편, 환경소음분야에서는 Environmental Sound Classification(ESC)를 위한 데이터셋 구축^[4]과 DCASE challenge^[5]를 통해 Artificial Intelligence(AI)를 활용한 연구들이 진행되고 있다. 이를 통해 음향과 관련된 다양한 task(음향이벤트검출 등)에 대한 성능이 발전되고 있다. 건축물 소음 분야에서도 층간소음 분류를 위한 연구들이 일부 이루어졌으나, 각 연구마다 특정 층간소음 종류만의 데이터셋을 이용한 연구가 진행되었다.^[6,7,8] 그러나, 층간소음 이외에 건축물의 실내공간에서 발생되는 다양한 주거소음원을 분류하는 연구는 미흡한 실정이다. 층간소음을 포함한 실내 주거 소음은 환경소음과는 다르게 건축물의 바닥슬래브와 벽 및 천장 등을 통해 전달되는 소음이다. 이는 건축물의 성능에 따라 전달되는 소음이 다르게 나타남을 의미하기 때문에 주거소음원의 데이터셋을 구축하기 쉽지 않다. 하지만, 주거소음원 민원을 해결하기 위해서는 주거소음원을 분류하기 위한 데이터셋 구축이 필요한 실정이다.

공동주택 건축물의 물리적 개선방안에 대한 많은 연구들이 진행되었다.^{[9,10,11,12,13,14]} 하지만, 건축물의 물리적 개선에도 불구하고 오래전에 건설된 실내 환경에서 발생되는 주거소음원에 대한 불만은 지속적으로 나타나고 있다. 소음에 대한 주관적인 반응은 소음의 주파수 특성과 시간적 특성에 의해 다르게 나타나는 것으로 조사되었다.^[15,16] Kim et al.의 연구^[17]에서는 층간소음의 시간적 특성(충격, 변동, 정상음)에 따라서 주관적 반응이 다르게 나타났다. 따라서, 심리적인 관점에서 주거소음환경 개선을 위해서는 주거소음원의 주파수 및 시간적 특성에 대한 조사가 필요하며, 이러한 음향적 특성이 몇 개의 군집으로 분류되는지 조사할 필요가 있다. 따라서, 본 연구에서는 다양한 주거소음원을 대상으로 구축한 데이터셋을 바탕으로 주파수 특성과 시간적 특성을 통해 주거소음원을 군집화하였다.

본 연구는 공동주택에서 발생되는 주거소음원의 주파수 및 시간 특성을 분석하고, 머신러닝을 통해 주거소음원의 군집 분류를 진행하였다.

실제 거주지에서 발생되는 주거소음원은 거주자가 발생시키는 소음이 아닌 다른 세대로부터 전달되는 소음이 대부분이다. 이에 따라 측정 및 녹음을 통해서 소음원의 종류를 파악하는데 한계점(사람이 직접 소음원을 듣고 판단하는 과정 등)이 있는 것으로 판단된다. 따라서, 본 연구에서는 주거소음원을 분류함에 있어 1차적으로 음향 특성인 주파수와 시간을 기반으로 음원의 종류를 군집화하고자 하였다. 또한, 군집화 결과를 바탕으로 거주지에서 발생되는 주거소음원을 관리하는 하나의 방안으로 주거소음원의 군집 분류를 목적으로 진행하였다.

따라서, 본 연구의 연구 질문은 다음과 같다. 1. 주거소음원은 주파수 특성과 시간적 특성에 의해 몇 개의 군집화가 나타나는가? 2. 주거소음원의 군집을 자동으로 분류하기 위해 어떠한 음원의 파라메타가 적절한가?

II. 주거소음원 데이터셋

본 연구에서 사용된 주거소음원은 환경부 산하 층간소음 이웃사이센터에 접수된 민원 현황을 대상으로 데이터셋을 구성하였다. 2019년도 이웃사이센터 보고서^[18]에 의하면 가장 민원이 많이 발생되는 소리는 어린이 달리기 또는 걷기(69.2 %)였으며, 그 외(12.6 %), 망치질 소리(4.2 %), 가구 끄는 소리(3.5 %) 등의 순으로 민원이 발생되는 것으로 조사되었다. 이를 바탕으로 최종 수집된 주거소음원은 Table 1과 같이 바닥충격음(14종, 528개), 공기전달음(4종, 105개), 급배수(3종, 42개) 및 설비소음(1종, 11개), 환경 소음(4종, 132개), 공사장 소음(20종, 240개)으로 총 46종류로 1,058개 이었다. 최종 수집된 주거소음원의 정보는 길이 30 s, sampling rate 44,100 ms, monoral wav로 구성되었다.

Table 1.

Dataset of residential sound in apartment buildings.

Noise sources		N	Noise sources			N
Floor impact noise	Adult jumping	58	Air- borne noise	Dog bark		33
	Adult running	47		Metal		24
	Adult walking	52		Piano		24
	Children jumping	18		TV		24
	Children running	18	Plumbing and equipment noise	Bath		18
	Chair dropping	46		Shower		4
	Vaccum cleaner	23		Washbowl		10
	Remote dropping	47		Toilet		10
	Entrance close	24		Outdoor		11
	Golf ball dropping	33	Environmental noise	Traffic	40 km	36
					60 km	36
	Hammering	54
					80 km	36
	Indoor close	26
	Remote dropping	41		Aircraft		12
	Spoon dropping	41		Railway		12
Construction noise	Air compressor	12	Construction noise	Excavator stop		12
	Asphalt finisher	12		Forklift		12
	Batch plant	12		Loader		12
	Breaker	12		Payloader		12
	Bulldozer	12		Piledriver		12
	Concrete mixer	12		Road roller		12
	Concrete pumping	12		Stone crush		12
	Concrete vibrator	12		Truck unloading		12
	Earthauger	12		Tunnel ventilation		12
	Excavator loading	12		Vibrating roller		12

본 연구에서는 배경소음이 낮은 곳에서 주거소음원만을 녹음하여 주거소음원의 주파수 및 시간적 특성 분석을 진행하고자 실제 주택과 유사하게 시공된 LH 주택성능 연구개발센터의 실증 주택에서 진행하였다. 실증 주택 중 국내 공동주택에 가장 보편적으로 보급된 뜬바닥 구조(슬라브 두께: 210 mm, 완충재 30 mm, 경량기포콘크리트 40 mm, 마감모르타르 40 mm)와 평천장(석고보드 1장)의 형태를 가진 59 m²과 84 m² 면적의 세대에서 녹음하였다. 수음지점은 ISO10052 간편법^[19]과 Jeong과 Ryu^[20]을 참고하여 가진 세대의 직하층에서 소음계(NL-52, Rion)를 통해 거실의 중앙지점과 거실 내 발코니 쪽의 벽에서 75 cm 이격 한 모서리 지점인 총 2개 지점에서 수음하였다. 수음의 높이는 1.2 m였으며, 30 s 동안 녹음하였다. 본 연구에서 수집된 음원들은 거실공간에서 수음되는 주거소음원을 대상으로 수집되었다. 거실공간에서 수음되는 공기전달음의 경우, 옆 세대에서 발생되는 소리보다 상부세대에서 발생되는 주거소음원의 소리가 크기 때문에 상부세대에서 스피커(SRS-X7, SONY)를 통해 재생하여 녹음되었다. 바닥충격음의 경우 성인(몸무게: 70 kg, 75 kg, 80 kg, 85 kg, 나이: 평균 28세)과 어린이(몸무게: 17 kg, 22 kg, 24 kg, 나이: 평균 7세)가 가진하였다. 제자리 뜀의 경우 가진 층의 중앙에서 가진하였으며, 달리기와 걷기의 경우는 거실의 4개의 모서리와 중앙지점을 반복하여 가진하였다. 리모컨, 골프공, 숟가락 떨어뜨리는 소리는 거실의 중앙지점과 거실 내 발코니 쪽의 벽에서 75 cm 이격 한 모서리 지점에서 가진 높이(20 cm, 100 cm)를 다르게 하여 가진하였다. 망치질은 거실에서 내력벽과 비내력벽에서 모두 가진하였으며, 실내문 여닫는 소리는 거실과 붙어있는 안방문을 대상으로 녹음하였다. 의자끄는소리는 거실의 중앙에서 가진하였으며, 현관문 여닫는 소리는 상부세대의 현관문을 여닫는 소리를 녹음하였다. 공사장 소음, 교통 소음, 환경 소음, 실외기 소음은 공동주택 파사드 차음성능 필터링 값(1/3 옥타브 밴드 50 Hz ~ 5k Hz)^[21]을 적용하였다.

모든 음원의 길이는 5 s로 동일하게 편집하였다. 공동주택에서 발생되는 주거소음원의 음압 레벨^[22]을 참고하여 40 dBA ~ 50 dBA in L_eq(2 dBA 간격)로 조정하였다. 각 음원은 AS-70(Rion) 프로그램을 통해 분석하였다. Fig. 1은 주거소음원이 주파수 특성과 시간적 특성으로 분석되는 과정을 나타낸다. 주파수 특성은 1/1 옥타브 밴드(31.5 Hz ~ 2k Hz)와 1/3 옥타브 밴드(25 Hz ~ 2,500 Hz)의 L_eq와 L_max값을 도출하였다. 시간적 특성은 5 s 동안 매 6 ms의 음압레벨 분석(time weighting: fast with 6 ms step, Integral time: 125 ms)을 통해 L_eq값을 도출하였다. 본 연구에서는 주거소음원을 설명하는데 있어 보다 많은 데이터를 활용하기 위하여 AS-70(Rion) 프로그램에서 분석되는 최솟값(6 ms)을 활용하였다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F1.jpg

Fig. 1.

Examples of analyzing spectral and temporal characteristics features.

III. 주거소음원 군집화

3.1 방법

K-Means clustering은 주어진 데이터 집합을 유사한 데이터 그룹으로 나누는 대표적인 비지도 학습 머신러닝 알고리즘이다. 본 연구에서는 K-Means clustering^[23]을 통해 주거소음원을 주파수 특성과 시간적 특성에 대해 군집화를 진행하였다. K-Means의 k의 개수는 각 군집의 중심점을 의미한다. k의 개수에 따라 군집이 여러 개로 나누어지게 되며, k 값을 결정하는 방법으로 엘보우 방법(Elbow method)과 실루엣 계수(Silhouette coefficient) 방법 등이 있다. 본 연구에서는 k의 개수를 와 엘보우 방법을 통해 선택하였다. 먼저, 각 옥타브 대역별 L_eq와 L_max값을 바탕으로 1차 군집화(주파수 특성에 대한 군집화)를 수행하고 비교하였다. 이후 각 주파수 특성에 기반한 군집의 시간적 특성에 대해 2차 군집화(시간적 특성을 통한 군집화)를 진행하였다. 본 연구에서는 주파수 특성이 음원분류의 활용성 측면에서 더욱 중요하다고 판단하여 먼저 군집화를 진행하고 시간적 특성을 통한 군집하를 이후에 진행하였다.

실루엣 계수^[24]는 Eq. (1)에 의해 계산되며, a(i)는 개별 데이터의 동일 군집 내 다른 데이터들과의 평균 거리이며, b(i)는 가장 가까운 군집과의 평균 거리를 의미한다. 각 데이터에 대해 실루엣 계수를 구한 후 평균을 내어 전체 데이터의 실루엣 계수를 구하여 각 군집별로 평균값의 편차가 크지 않을 때 군집 성능이 좋은 것으로 판단한다.

(1)

s_{(i)} = \frac{b (i) - a (i)}{\max (a (i), b (i))} .

엘보우 방법^[25]은 Eq. (2)와 같이, 군집 내 중심점과 데이터 간의 거리를 제곱하여 합한 값을 계산하여 값이 작은 값을 사용한다. 여기서 k는 군집화 수이고 n는 데이터 수를 말하며, x_i:는 i번째 데이터이고 c_j는 j번째 군집의 중심을 말한다.

(2)

S S E = \sum_{j = 1}^{k} \sum_{n = 1}^{n} ((x_{i}^{j} - c_{j}))^{2} .

3.2 결과

3.2.1 주파수 특성 군집화

Fig. 2는 평가지수 1/1 옥타브 밴드별 L_eq값을 사용하여 군집화하였을 때 k의 계수를 정하기 위한 실루엣 계수와 엘보우 방법을 나타낸다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F2.jpg

Fig. 2.

(Color available online) Example of elbow method and silhouette coefficient.

Table 2는 K-means clustering의 k를 결정하기 위해 사용된 실루엣 계수의 평균과 군집 간의 실루엣 계수 편차를 나타낸다. 본 연구에서는 2개 ~ 5개의 k 중 전체 평균 실루엣 계수 평균값과 개별 군집의 평균값의 편차가 가장 낮은 k 값을 사용하였다. 주파수 특성을 활용한 1차 군집화 결과, 모든 평가지수와 옥타브밴드에 대해 각각 3개의 군집(A, B, C)이 나타났다.

Table 2.

Mean and standard deviation of silhouette coefficient.

Evaluation Index	k	Silhouette coefficient		Cluster
		AVE	STEDV
L_eq (1/1octave band)	3	0.30	0.02	A1
				B1
				C1
L_eq (1/3 octave band)	3	0.31	0.05	A2
				B2
				C2
L_max (1/1 octave band)	3	0.26	0.04	A3
				B3
				C3
L_max (1/3 octave band)	3	0.27	0.05	A4
				B4
				C4

Figs. 3과 4는 1/1과 1/3옥타브 밴드별 평가지수 L_eq 값과 L_max값을 통해 나타난 1차 군집화(주파수 특성 기반) 결과를 나타낸다. 1/1과 1/3 옥타브 밴드별 평가지수 L_eq값을 통해 나타난 군집은 3개인 것으로 나타났다. 3개의 군집별 주파수 특성은 Fig. 3과 4 같이 저주파 대역과 중･저주파 대역 간의 기울기가 비교적 높은 그룹, 중간그룹, 낮은 그룹으로 나타났다. Table 3은 평가지수 1/1 옥타브 밴드 L_eq를 활용해 나타난 각 군집별 상위 5개의 음원을 나타낸다. 군집 1의 상위 5개 음원은 성인 달리기, 성인 제자리 뜀, 성인 걷기, 어린이 제자리 뜀과 어린이 달리기 순으로 나타났으며, 군집 1의 총음원은 1,175개로 나타났다. 군집 2의 총음원은 2,884개로 구성되어 있으며, 상위 5개 음원은 망치질, 도로교통소음 40 km, 의자 끄는 소리, 개 짖는 소리와 도로교통소음 60 km 순으로 나타났다. 군집 3에서의 상위 5개 음원은 건전지 떨어뜨리는 소리, 숟가락 떨어뜨리는 소리, 도로교통소음 80 km, 골프공 떨어뜨리는 소리와 리모컨 떨어뜨리는 소리 순으로 나타났으며, 군집 3의 총음원은 2,343개로 구성되었다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F3.jpg

Fig. 3.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, L_eq.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F4.jpg

Fig. 4.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, L_max.

Table 3.

Most of using spectral characteristic in residential noise (1/1 octave band, Leq).

Cluster	1	2	3
Sound source	Adult running Adult jumping Adult walking Child jumping Child running	Hammering Traffic noise 40 km Chair scrapping Dog barking Traffic noise 60 km	Dry-cell dropping Spoon dropping Traffic noise 80 km Golf-ball dropping Remote dropping
Number	1,175	2,884	2,343

Fig. 5와 Table 4는 주파수 특성으로 나타난 군집별 평균값과 각 평가지수와 주파수 대역별 음압레벨 비율 값을 나타낸다. 주파수 대역별로 평균값과 주파수 음압레벨 비율 값을 통해 군집별 차이를 조사하였다. 평가지수 1/1 옥타브 밴드 L_eq와 L_max값을 통해 나타난 각 평가지수의 평균 주파수 특성은 유사하게 나타났다. 군집 1의 평균 주파수 대역은 군집 2와 군집 3의 31.5 Hz ~ 125 Hz 평균 주파수 대역에서 높게 나타났으며, 250 Hz ~ 2k Hz 평균 주파수 대역에서 낮게 나타났다. 군집 2의 31.5 Hz ~ 125 Hz 평균 주파수 대역은 군집 1의 평균 주파수 대역보다 낮고, 군집 2의 평균 주파수 대역보다 높게 나타났다. 또한, 군집 2의 250 Hz ~ 2k Hz 평균 주파수 대역은 군집 1과 3의 평균 주파수 대역보다 높게 나타났다. 군집 3의 250 Hz ~ 2k Hz 평균 주파수 대역은 군집 1보다 높지만, 군집 2보다는 낮게 나타났다. 또한, 평가지수 1/3 옥타브 밴드 L_eq와 L_max값을 통해 나타난 각 평가지수의 평균 주파수 특성도 유사하게 나타났다. 군집 1의 평균 주파수 대역은 군집 2와 군집 3의 20 Hz ~ 100 Hz 평균 주파수 대역에서 높게 나타났으며, 250 Hz ~ 2.5k Hz 평균 주파수 대역에서 낮게 나타났다. 군집 2의 20 Hz ~ 100 Hz 평균 주파수 대역은 군집 1보다 낮게 나타났고, 군집 3보다 높게 나타났다. 또한, 군집 2의 250 Hz ~ 2.5k Hz 평균 주파수 대역은 군집 1과 3보다 높게 나타났다. 군집 3의 20 Hz ~ 100 Hz 평균 주파수 대역은 군집 1과 2보다 낮게 나타났고, 군집 2의 250 Hz ~ 2.5k Hz 평균 주파수 대역은 군집 2보다는 낮고 군집 1에 비해 높게 나타났다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F5.jpg

Fig. 5.

(Color available online) Spectral characteristics of clustering result – 1/1, 1/3 Octave band, L_max and L_eq.

Table 4.

Percentage by frequency band [%] (L: Low, M: Mid, H: High).

Evaluation Index		L, M, H / (L+M+H) *100			Low-High
Evaluation Index		Low	Mid	High	Low-High
L_eq (1/1 octave band)	A1	52.1	27.1	20.7	31.4
	B1	41.5	31.4	27	14.5
	C1	37.7	32.7	29.4	8.3
L_eq (1/3 octave band)	A2	54.4	27	18.5	35.9
	B2	42.7	31.9	25.3	17.4
	C2	38.2	33.9	27.8	10.4
L_max (1/1 octave band)	A3	51.4	32.6	29.3	22.1
	B3	41.3	31.5	27.1	14.2
	C3	37.9	32.6	29.3	8.6
L_max (1/3 octave band)	A4	52.9	27.6	19.3	33.6
	B4	42	31.5	26.3	15.7
	C4	37.2	33.2	29.5	7.7

Table 4는 군집별 주파수 대역(Low, Mid, High) 음압레벨의 비율을 나타낸다. 음압레벨의 비율은 실내음향 측정 시 사용하는 Bass ratio의 개념^[26]을 참고하여 분석하였다. 각 평가 지표의 주파수 대역을 저주파(1/1옥타브 밴드: 31.5 Hz, 63 Hz, 125 Hz, 1/3 옥타브 밴드: 20 Hz, 31.5 Hz, 40 Hz, 50 Hz, 63 Hz, 80 Hz, 100 Hz, 125 Hz, 160 Hz), 중주파(1/1 옥타브 밴드: 250 Hz, 500 Hz, 1/3 옥타브 밴드: 200 Hz, 250 Hz, 315 Hz, 400 Hz, 500 Hz, 630 Hz), 고주파 대역(1/1 옥타브 밴드: 1k Hz, 2k Hz, 1/3 옥타브 밴드: 800 Hz, 1k Hz, 1.25k Hz, 1.6k Hz, 2k Hz, 2.5k Hz)으로 나누어 각 주파수 그룹 간의 차이를 조사하였다. 비율은 모든 주파수 대역의 값을 더하여 주파수 대역별로 나눈 값을 계산하였다. 모든 평가지수에서 나타난 군집은 저주파 대역이 높게 나타났으며, 저주파 대역의 음압레벨 비율이 각 군집에 따라 차이가 나타났다. 평가지수별 A1, A2, A3, A4의 군집이 저주파 대역의 음압레벨 비율이 가장 높은 군집으로 나타났다. 또한, 저주파 대역과 고주파 대역의 음압레벨 차이값에 따라 군집이 다르게 나타났다.

3.2.2 시간적 특성 군집화

Table 5는 K-means clustering의 k를 결정하기 위해 사용된 실루엣 계수의 평균과 군집 간의 실루엣 계수 편차를 나타낸다. 시간적 특성을 활용한 2차 군집화 결과, 평가지수 1/1, 1/3 옥타브 밴드별 L_eq값을 통해 나타난 군집화 3개(A1, B1, C1, A2, B2, C2)는 각각의 군집에 따라 3개의 시간적 특성 군집으로 구성되어 총 9개의 주거소음원(A1-1, A1-2, A1-3, B1-1, B1-2, B1-3, C1-1, C1-2, C1-3)이 구성되었다. 또한, 평가지수 1/1, 1/3 옥타브 밴드별 L_max값을 통해 나타난 군집 3개(A3, B3, C3, A4, B4, C4) 중 A3, B3, A4, B4는 3개의 시간적 특성 군집으로 구성되었으며, C3와 C4는 5개의 시간적 특성 군집으로 구성되어 총 11개의 주거소음원(A3-1, A3-2, A3-3, B3-1, B3-2, B3-3, C3-1, C3-2, C3-3, C3-4, C3-5, A4-1, A4-2, A4-3, B4-1, B4-2, B4-3, C4-1, C4-2, C4-3, C4-4, C4-5)이 구성되었다. Fig. 6은 1/1 옥타브 밴드별 L_eq값을 통한 주파수 특성과 시간적 특성으로 나타난 총 9개의 주거소음원(A1-1, A1-2, A1-3, B1-1, B1-2, B1-3, C1-1, C1-2, C1-3)을 나타낸다. A1 군집을 시간적 특성으로 나타난 3개의 군집 중 A1-1의 군집은 A1-2 군집보다 변동성과 주기성이 강하게 나타나며, A1-3 군집보다는 충격성, 변동성과 주기성이 약한 음원들이 나타났다. B1 군집을 시간적 특성으로 군집화한 B1-1의 군집은 B1-2와 B1-3의 군집보다 정상음의 특성을 나타내며, 변동성이 낮은 음원들이 군집되었다. C1 군집을 시간적 특성으로 군집화한 군집 중 C1-1의 군집은 C1-2의 군집보다 변동성이 많이 나타났으나, C1-3의 군집이 변동성이 가장 많이 나타났다. Table 6는 1/1 옥타브밴드 별 L_eq 값을 통해 주파수 특성으로 군집화된 A1, B1, C1의 군집을 시간적 특성으로 군집화하여 각 군집별 상위 2개의 음원과 군집에 속한 전체 음원의 개수를 나타낸다. A1-1의 군집(총 220개)의 상위 2개의 음원은 성인 달리기와 성인 걷기로 나타났다. A1-2(총 644개)의 군집의 상위 2개의 음원은 성인 걷기와 어린이 제자리 뜀으로 구성되어 있으며, A1-3(총 311개)의 군집은 성인 제자리 뜀과 현관문 여닫기로 나타났다. 또한, B1-1의 군집(총 1,285개)에서는 망치질과 건전지 떨어뜨림 소리가 있으며, B1-2 군집(1,178개)에는 망치질과 도로교통소음 40 km로 나타났다. B1-3 군집(총 422개)의 상위 2개의 음원은 의자 끄는 소리와 현관문 여닫는 소리로 나타났다. C1-1 군집(총 987개)의 음원은 건전지 떨어뜨리는 소리와 숟가락 떨어뜨리는 소리로 구성되었다. C1-2 군집(총 539개)의 상위 2개의 음원은 샤워 소리와 건전지 떨어뜨리는 소리로 나타났으며, C1-3 군집(총 817개)에서는 의자 끄는 소리와 리모컨 떨어뜨리는 소리가 나타났다.

Table 5.

Silhouette coefficient mean and standard deviation.

Temporal characteristics					Cluster
Cluster by spectrum		k	AVE	STEDV
L_eq (1/1 octave band)	A1	3	0.25	0.12	A1-1
					A1-2
					A1-3
	B1	3	0.23	0.22	B1-1
					B1-2
					B1-3
	C1	3	0.25	0.06	C1-1
					C1-2
					C1-3
L_eq (1/3 octave band)	A2	3	0.25	0.14	A2-1
					A2-2
					A2-3
	B2	3	0.25	0.06	B2-1
					B2-2
					B2-3
	C2	3	0.22	0.23	C2-1
					C2-2
					C2-3
L_max (1/1 octave band)	A3	3	0.25	0.07	A3-1
					A3-2
					A3-3
	B3	3	0.22	0.23	B3-1
					B3-2
					B3-3
	C3	5	0.29	0.08	C3-1
					C3-2
					C3-3
					C3-4
					C3-5
L_max (1/3 octave band)	A4	3	0.25	0.07	A4-1
					A4-2
					A4-3
	B4	3	0.22	0.24	B4-1
					B4-2
					B4-3
	C4	5	0.25	0.17	C4-1
					C4-2
					C4-3
					C4-4
					C4-5

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F6.jpg

Fig. 6.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, Leq.

Table 6.

Most of using temporal characteristic in residential noise (1/1 octave band, Leq).

Cluster	A1-1	A1-2	A1-3
Sound source	Adult running Adult walking	Adult walking Child jumping	Adult jumping Entrance close
Number	220	644	311
Cluster	B1-1	B1-2	B1-3
Sound source	Hammering Dry-cell dropping	Hammering Traffic noise 40km	Chair scraping Entrance close
Number	1,285	1,178	421
Cluster	C1-1	C1-2	C1-3
Sound source	Dry-cell dropping Spoon dropping	Bath Dry-cell dropping	Chair scrapping Remote dropping
Number	987	539	817

Fig. 7은 평가지수 1/1옥타브 밴드별 L_eq값을 통해 주파수 특성 군집화와 시간적 특성으로 군집화된 군집별 시간에 따른 평균 L_eq값을 나타낸다. 또한, Table 7은 주파수 특성과 시간적 특성으로 군집화된 군집별 변동성을 조사하기 위한 L₁₀-L₉₀을 나타낸다. L₁₀-L₉₀^[27]은 시간에 따른 L_eq값의 상위 10 %에 해당하는 값과 하위 10 %에 해당하는 값의 차이를 계산하여 군집별 시간적 변화를 조사하였다. 평가지수 1/1 옥타브 밴드 L_eq값을 통해 나타난 주파수 및 시간적 특성의 군집은 군집별로 L₁₀-L₉₀ 값이 다르게 나타났다. 군집 중 A1-3이 L₁₀-L₉₀ 값이 크게 나타났으며, C1-2가 값이 가장 낮게 나타났다. Fig. 7과 같이 A1-3의 군집이 시간변화에 따른 변동성이 가장 크고, C1-2 군집이 시간변화에 따른 변동성이 가장 작은 군집이 나타났다. A1-3의 군집은 성인 제자리 뜀과 현관문 여닫음과 같이 충격시간이 짧고 단발성 음원들이 변동성이 가장 큰 군집으로 나타난 것으로 판단된다. 반대로 C1-2 군집은 샤워음과 건전지 떨어뜨림같이 충격시간이 길고 지속성이 있는 정상음의 음원들이 변동성이 가장 작은 군집으로 나타난 것으로 판단된다. 본 연구에서 수집된 건전지 떨어뜨림 소리는 충격력이 약하고 구르는 소리가 포함되었기 때문에 C1-2 군집 중 상위음원으로 나타난 것으로 판단된다. 또한, C1-1과 C1-2의 군집에서 모두 리모컨 떨어뜨림 소리가 상위 2개의 음원에 포함되었다. 이는, 같은 소음원 종류이고 주파수가 같음에도 시간적 특성이 다르면 다른 군집으로 분류가 되었음을 나타낸다. 또한, 주파수 특성을 통한 군집에서도 동일한 소음원 종류의 음원이 다른 군집으로 나타난 경우도 있다. 이러한 결과는 동일한 소음원임에도 충격력이나 충격력 시간 등에 의해서 군집이 다르게 나타날 수 있음을 보여준다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F7.jpg

Fig. 7.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, L_eq.

Table 7.

Clustering by spectral and temporal characteristics L₁₀-L₉₀ by clusters.

Evaluation Index		L₁₀-L₉₀
Leq (1/1, oct)	A1-1	26.06
	A1-2	15.62
	A1-3	28.10
	B1-1	5.13
	B1-2	6.86
	B1-3	15.01
	C1-1	4.78
	C1-2	4.32
	C1-3	7.10

IV. 주거소음원 분류

4.1 방법

본 연구에서는 주거소음원의 군집화한 결과를 활용하는 방안으로써, 각 주파수와 시간적 특성으로 나타난 군집화 결과를 바탕으로 주거소음원을 분류하였다. 9개와 11개의 주거소음원을 라벨링 하여 Support Vector Machine(SVM), k-Nearest Neighbor(k-NN), 인공신경망(Artificial Neural Network, ANN)을 통해 음원을 분류하고^[28,29,30] 분석방법 간의 차이를 조사하였다. 서포트 벡터 머신은 머신러닝 방법 중 하나로 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사용한다. k-최근접 이웃(k-NN) 알고리즘은 패턴 인식 분야에서 분류나 회귀에 사용되는 방법이다. Fig. 8과 같이 인공신경망은 여러 분야에서 사용되는 머신러닝 방법으로 분류와 회귀 등 분석에 사용된다. 각 모델에 사용된 데이터는 주파수 특성, 시간적 특성, 주파수 특성과 시간적 특성이었다. 모든 데이터는 학습 70 %, 검증 30 %로 구성되었으며, 학습 데이터의 30 %는 테스트에 사용되었다. k-NN과 SVM은 scikit-learn에서 제공하는 알고리즘을 사용하였으며, k-fold(n = 10)를 사용하여 검증하였다. k-fold 교차검증은 머신러닝에서 모델의 성능을 측정하고 검증하는 기술 중 하나이다. 데이터 세트를 k개의 부분집합으로 분할하고, 이 중 하나를 검증 데이터로 가용하며, 나머지 k-1개의 부분집합을 학습 데이터로 사용하여 모델 학습을 k번 반복하는 방법이다. k개의 모델을 생성하여 각각의 모델이 다른 검증 데이터로 성능을 측정하여 성능지표를 k번 평균하여 최종 성능지표를 계산한다. ANN은 입력계층과 출력계층 사이에 은닉계층 2개를 사용하여 간단한 모델을 구축했으며, 학습 횟수는 100회, 배치 사이즈는 128로 진행하였다. loss는 cross entropy를 사용했으며, optimizer는 Adam을 사용하였다. 각 머신러닝의 모델의 분류 성능은 accuracy와 F-1 score^[31]를 통해 비교 분석하였다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F8.jpg

Fig. 8.

Examples of simple ANN model architecture.

4.2 결과

Table 8은 각 머신러닝 모델별 accuracy와 F-1 score 결과를 나타낸다. 주파수와 시간적 특성으로 군집화된 주거소 음원을 대상으로 머신러닝 모델의 정확도를 비교하였다. 평가지수 1/3 옥타브 밴드별 L_eq값을 통해 군집화된 군집이 주파수 특성, 시간적 특성, 주파수와 시간적 특성을 사용하여 주거소음원을 분류한 결과가 다른 모델에 비해 모두 정확도가 높게 나타났다. 가장 정확도가 높은 모델은 평가지수 1/3옥타브 밴드별 L_eq값을 통해 군집화한 주파수와 시간적 특성을 사용하여 ANN 모델을 이용한 경우가 accuracy 93 %와 f1-score 92 %로 가장 높게 나타났다. 또한, 주파수 특성 데이터를 가지고 분류한 모델이 시간적 특성 테이터를 가지고 분류한 모델보다 분류성능 accuracy와 f1-score값이 높게 나타났다(평가지수 1/1 옥타브 밴드별 L_max의 군집화된 모델 제외). 이는 Fig. 6과 같이 주파수 특성이 다름에도 불구하고 시간적 특성이 동일한 군집으로 나타나는 경우와 연관이 있는 것으로 판단된다. 시간적 특성이 동일한 군집이 나타나기 때문에 시간적 특성 데이터만을 사용했을 때 보다 주파수 특성 데이터를 활용했을 때의 주거소음원 군집화 분류 성능이 높게 나타난 것으로 판단된다.

Table 8.

Performance of machine learning models accuracy and f1-score [%].

Using temporal characteristic
Index	Band width	Model evaluation	ANN	SVM	KNN
L_eq	1/1 OCT	Accuracy	77	71	69
	1/1 OCT	F-1 score	76	66	70
	1/3 OCT	Accuracy	77	71	67
	1/3 OCT	F-1 score	78	66	71
L_max	1/1 OCT	Accuracy	76	62	61
	1/1 OCT	F-1 score	76	66	66
	1/3 OCT	Accuracy	76	64	65
	1/3 OCT	F-1 score	72	59	64
Using spectral characteristic
Index	Band width	Model evaluation	ANN	SVM	KNN
L_eq	1/1 OCT	Accuracy	87	77	84
	1/1 OCT	F-1 score	86	75	83
	1/3 OCT	Accuracy	90	78	82
	1/3 OCT	F-1 score	88	75	82
L_max	1/1 OCT	Accuracy	85	74	80
	1/1 OCT	F-1 score	76	62	74
	1/3 OCT	Accuracy	88	77	80
	1/3 OCT	F-1 score	80	69	73
Using spectral and temporal characteristic
Index	Band width	Model evaluation	ANN	SVM	KNN
L_eq	1/1 OCT	Accuracy	90	75	77
	1/1 OCT	F-1 score	88	72	77
	1/3 OCT	Accuracy	93	76	77
	1/3 OCT	F-1 score	92	76	80
L_max	1/1 OCT	Accuracy	91	69	72
	1/1 OCT	F-1 score	89	71	75
	1/3 OCT	Accuracy	91	69	78
	1/3 OCT	F-1 score	84	70	72

V. 결 론

본 연구에서는 주거소음원의 주파수 및 시간적 특성 데이터를 활용하여 머신러닝 기반 주거소음원의 군집화 및 분류를 진행하였다. 주거소음원은 각 평가지수(L_eq와 L_max)별 주파수 특성의 음압레벨에 의해 3개의 군집으로 구분되는 것으로 나타났다. 군집별 주파수 특성은 평가지표별 저주파 대역의 비율이 50 %, 40 %, 30 %인 경우에 따라 군집이 다르게 나타났다. 평가지수별 주파수 특성을 통한 군집화를 진행 후 3개의 군집을 시간적 특성으로 2차 군집화를 진행하였다. 평가지수 1/1, 1/3 옥타브 밴드별 L_eq값을 통해 나타난 시간적 특성 군집은 총 9개의 주거소음원이 구성되었다. 또한, 평가지수 1/1, 1/3 옥타브 밴드별 L_max값을 통해 나타난 시간적 특성 군집은 총 11개의 주거소음원이 구성되었다. 이후, 주거소음원의 군집을 활용하기 위해 본 연구에서 나타난 군집 수로 라벨링하여 주거소음원을 분류하였다. 본 연구에서는 평가지수별로 9개와 11개의 군집이 나타났다. 각 해당하는 평가지수의 라벨링을 통해 주거소음원의 주파수 특성만을 이용한 경우, 시간적 특성만 이용한 경우와 주파수 특성과 시간적 특성을 같이 이용하여 주거소음원을 분류하여 각 평가지수와 분류성능이 높은 모델을 조사하였다. 주거소음원의 분류는 1/3 옥타브 밴드별 L_eq값으로 군집화 된 9개의 라벨링을 통해 주파수 특성과 시간적 특성을 사용하여 ANN모델을 이용한 경우가 가장 높은 정확도를 나타냈다.

본 연구는 공동주택에서 발생되는 주거소음으로 인한 민원을 해결하기 위한 기초연구로서 공동주택에서 발생되는 주거소음원 데이터셋을 구축하고, 군집화 및 분류하였다. 주거소음으로 인한 민원을 해결하기 위해서는 거주지에서의 모니터링을 통해 주거소음원을 자동 분류할 필요가 있다. 하지만 자동분류를 하기 위해서는 공동주택에서 발생되는 주거소음원의 데이터셋을 구축할 필요가 있기 때문에 본 연구에서는 주거소음원 데이터셋 구축을 하였다. 그럼에도 불구하고 주거소음원은 건축물에 의해 전달되는 소음으로서 거주지마다 다르게 나타나기 때문에 추가적인 데이터셋 구축이 필요하다. 거주지에서 발생되는 주거소음원은 주파수 및 시간적 특성에 의해 주관적 반응이 다르게 나타나기 때문에, 본 연구에서 조사한 주파수 및 시간적 특성에 의한 군집수를 활용한 모니터링이 필요하다고 판단된다. 본 연구는 실제 거주공간에서 발생되는 주거소음원을 실제 거주공간과 유사하게 시공된 실증주택에서 수집하였다. 실제 거주공간에서의 주거소음원의 녹음은 제한적이며 어려움이 있다. 배경소음이 최소화된 음원을 확보하고자 실증주택에서 녹음을 진행하였지만, 본 연구결과를 활용하기 위해서는 실제 거주공간에서 발생되는 다양한 주거공간에서의 음원 확보가 필요할 것으로 판단된다. 또한, 공기전달음의 경우 옆 세대에 의한 민원이 발생하기 때문에 옆세대에 의한 공기전달음 수집이 추가분석이 필요하다. 본 연구의 주거소음원 군집화 분석방향은 주파수 특성이 음원분류의 활용성 측면에서 더욱 중요하다고 판단하여 먼저 진행하고 시간적 특성을 통한 군집화를 이후에 진행하였는데, 시간적 특성을 통한 군집화를 먼저 진행하고 주파수 특성을 통한 군집화를 분석하여 비교가 필요하다. 본 연구의 군집화 방법은 k-means clustering을 이용하였으나, Gaussian Mixture Model(GMM)과 같은 추가적인 군집화 방법의 분석을 진행하여 군집화 방법간의 비교도 필요할 것으로 판단된다. 활용측면에서 본 연구의 결과는 주파수와 시간적 특성에 따라 나누어진 군집별로 사운드 마스킹을 적용하여 거주자의 심리적 측면에서 민원을 줄일 수 있는 하나의 방안으로 활용될 수 있을 것으로 판단된다. 향후, 주거소음원 분류 성능을 향상시키기 위한 음향적 특징에 대한 연구가 추가적으로 필요하며, 거주지에서 주거소음원을 녹음하기 어렵기 때문에 주거소음원의 데이터셋을 구축하기 위한 방법론이 추가적으로 연구가 필요하다.

Acknowledgements

본 연구는 국토교통부/국토교통과학기술진흥원(과제번호 RS-2022-00144050), 산업통상자원부 및 산업기술평가관리원(과제번호 20023556)과 전남대학교 연구년교수 연구비(과제번호: 2021-3907)의 지원으로 수행되었음

References

Gwanghwamun Ilbunga, http://19gwanghwamoon1st.pa.go.kr/, (Last viewed November 24, 2023).

Korea Environment Corporation, "Casebook of complaints from neighboring," in Ministry of Environment, edited by Floor Noise, Management Centre, Case book, 2018.

Joint housing management dispute mediation central committee, "Infrastructure and transport, central committee for management dispute mediation of multi-unit dwelling: Guidebook of noise prevention and management," Ministry of Land, Guide book, 2020.

K. J. Piczak, "ESC: Dataset for environmental sound classification," Proc. ACM Int. Conf. Multimed. 1015-1018 (2015). 10.1145/2733373.2806390

D. Stowell, D. Giannoulis, E. Benetos, and M. D. Plumbley, "Detection and classification of acoustic scenes and events," Proc. DCASE, 1733-1746 (2023). 10.1109/TMM.2015.2428998

H. K. Shin, S. H. Park, and K. W. Kim, "Inter-floor noise classification using convolutional neural network," Plos One, 15, e0243758 (2020). 10.1371/journal.pone.024375833351829PMC7755197

H. Choi, H. Yang, S. Lee, and W. Seong, "Classification of inter-floor noise type/position via convolutional neural network-based supervised learning," Appl. Sci. 9, 3735 (2019). 10.3390/app9183735

H. Choi, W. Seong, and H. Yang, "Source type classification and localization of inter-floor noise with a single sensor and knowledge transfer between reinforced concrete buildings," Appl. Sci. 11, 5399 (2021). 10.3390/app11125399

H. G. Park, G. O. Baek, and D. H. Moon, "Modal Parameter of floor and walls in residual building" (in Korean), Proc. KSNVE Annual Spring Conf. 682-685 (2015).

J. K. Ryu, I. H. Kim, and J. C. Go, "Heavy-weight floor impact sound and vibration with structure types in apartment building" (in Korean), J. Acoust. Soc. Kr. Suppl. 1(s) 34, 212 (2015).

M. J. Kim, J. Y. Sohn, and H. S. Kim, "Contribution ratio of each surface of receiving room for floor impact sound transmission by using sound intensity method" (in Korean), Proc. Spring Annual Conf. AIK, 311-313 (1998).

K. W. Kim, J. S. Kang, S. E. Lee, and K. S. Yang, "Floor impact sound isolation performance by composition of ceiling and wall" (in Korean), Trans. Korean Soc. Noise Vib. Eng. 15, 465-473 (2005). 10.5050/KSNVN.2005.15.4.465

S. Lee, D. Hwang, J. Park, and J. Y. Jeon, "Cause and perception of amplitude modulation of heavy-weight impact sound in concrete wall structure," Build. Environ. 94, 785-792 (2015). 10.1016/j.buildenv.2015.04.020

Y. Kwak, S. Lee, J. Park, D. Hwang, J. Y. Jeon, and J. Park, "Effect of the static compressive load on vibration propagation in multistory buildings and resulting heavyweight floor impact sounds," J. Acoust. Soc. Am. 142, 308-316 (2017). 10.1121/1.499429028764414

J. Y. Jeon, "Subjective evaluation of floor impact noise based on the model of ACF/IACF," J. sound Vib. 241, 147-155 (2001). 10.1006/jsvi.2000.3286

J. Ryu, H. Sato, K. Kurakata, A. Hiramitsu, M. Tanaka, and T. Hirota, "Relation between annoyance and single-number quantities for rating heavy-weight floor impact sound insulation in wooden houses," J. Acoust. Soc. Am. 129, 3047-3055 (2011). 10.1121/1.356166021568408

S. Kim, J. Kim, S. Lee, H. Song, M. Song, and J. Ryu, "Effect of temporal pattern of impact sound on annoyance: Children's impact sounds on the floor," Build. Environ. 208, 108609 (2022). 10.1016/j.buildenv.2021.108609

Floor Noise, Management Centre, "Interfloor noise neighbor center 2019 civil complaint statistics status," Mon. Rep., Korea Environment Corporation, 2019.

ISO 10052, Acoustics - Field Measurements of Airborne and Impact Sound Insulation and of Service Equipment Sound - Survey Method (2021).

J. Jeong and J. Ryu, "Survey method for field measurement of rubber ball impact sound in reinforced concrete apartment houses," Acta Acust. 7, 1-12 (2023). 10.1051/aacus/2023023

J. Ryu and H. Song, "Effect of building facade on indoor transportation noise annoyance in terms of frequency spectrum and expectation for sound insulation," Appl. Acoust. 152, 21-30 (2019). 10.1016/j.apacoust.2019.03.020

S. H. Park, P. J. Lee, and B. K. Lee, "Levels and sources of neighbour noise in heavyweight residential buildings in Korea," Appl. Acoust. 120, 148-157 (2017). 10.1016/j.apacoust.2017.01.012

G. Hamerly and C. Elkan, "Learning the k in k-means," Proc. NIPS, 281-288 (2003).

P. J. Rousseeuw, "A graphical aid to the interpretation and validation of cluster analysis," J. Comput. Appl. Math. 20, 53-65 (1987). 10.1016/0377-0427(87)90125-7

C. Shi, B. Wei, S. Wei, W. Wang, H. Liu, and J. Liu, "A quantitative discriminant method of elbow point for the optimal number of clusters in clustering algorithm," EURASIP J. Wirel. Commun. Netw. 2021, 1-16 (2020). 10.1186/s13638-021-01910-w

L. Beranek, Concert Halls and Opera Houses: Music, Acoustics, and Architecture (Springer, New York, 2004), pp. 662. 10.1007/978-0-387-21636-2PMC522193

M. E. Nilsson, "A-weighted sound pressure level as an indicator of perceived loudness and annoyance of road-traffic sound," J. Sound Vib. 302, 197-207 (2007). 10.1016/j.jsv.2006.11.010

W. S. Noble, "What is a support vector machine?," Nat. biotechnolo. 24, 1565-1567 (2006). 10.1038/nbt1206-156517160063

L. E. Peterson, "K-nearest neighbor," Scholarpedia, 4, 1883 (2009). 10.4249/scholarpedia.1883

A. K. Jain, J. Mao, and K. M. Mohiuddin, "Artificial neural networks: A tutorial," Computer, 29, 31-44 (1996). 10.1109/2.485891

C. Goutte and E. Gaussier, "A probabilistic interpretation of precision, recall and F-score, with implication for evaluation," Proc. LNISA, 345-359 (2005). 10.1007/978-3-540-31865-1_25

The Journal of the Acoustical Society of KoreaISSN:1225-4428(Print) 2287-3775(Online)한국음향학회

Preview

Clustering and classification of residential noise sources in apartment buildings based on machine learning using spectral and temporal characteristics

ABSTRACT

MAIN

Table 1.

Dataset of residential sound in apartment buildings.

Fig. 1.

Examples of analyzing spectral and temporal characteristics features.

(1)

(2)

Fig. 2.

(Color available online) Example of elbow method and silhouette coefficient.

Table 2.

Mean and standard deviation of silhouette coefficient.

Fig. 3.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, Leq.

Fig. 4.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, Lmax.

Table 3.

Most of using spectral characteristic in residential noise (1/1 octave band, Leq).

Fig. 5.

(Color available online) Spectral characteristics of clustering result – 1/1, 1/3 Octave band, Lmax and Leq.

Table 4.

Percentage by frequency band [%] (L: Low, M: Mid, H: High).

Table 5.

Silhouette coefficient mean and standard deviation.

Fig. 6.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, Leq.

Table 6.

Most of using temporal characteristic in residential noise (1/1 octave band, Leq).

Fig. 7.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, Leq.

Table 7.

Clustering by spectral and temporal characteristics L10-L90 by clusters.

Fig. 8.

Examples of simple ANN model architecture.

Table 8.

Performance of machine learning models accuracy and f1-score [%].

Acknowledgements

References

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, L_eq.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, L_max.

(Color available online) Spectral characteristics of clustering result – 1/1, 1/3 Octave band, L_max and L_eq.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, L_eq.

Clustering by spectral and temporal characteristics L₁₀-L₉₀ by clusters.