Research Article

The Journal of the Acoustical Society of Korea. November 2020. 615-621
https://doi.org/10.7776/ASK.2020.39.6.615

ABSTRACT


MAIN

  • I. 서 론

  • II. 분류 모델

  •   2.1 전처리 및 입력 변환 과정

  •   2.2 합성곱 신경망

  •   2.3 그래프 합성곱 신경망

  •   2.4 분류기

  •   2.5 학습 과정

  • III. 실험 결과

  •   3.1 학습 데이터

  •   3.2 성능 측정 지표

  •   3.3 모델 구조에 따른 실험 결과

  •   3.4 관측소 개수에 따른 실험 결과

  •   3.5 입력값 길이에 따른 실험 결과

  • IV. 결 론

I. 서 론

지진 이벤트 분류는 지진 조기 경보 및 지진 종합정보 시스템 효과적인 지진 분석, 모니터링에 필수적인 기술이다. 지진 관측소에서 진동이 관측되었을 때 해당 신호가 지진에서 발생하였는지 여부, 자연적인 요소/인위적인 요소에서 발생하였는지 여부를 신속하게 감지/분석하는 것은 지진으로 인한 피해를 최소화할 수 있게 해준다. 정확도가 높고 오분류가 적은 지진 이벤트 분류 알고리즘은 필수적인 요소가 된다.

기존 지진 이벤트 분류 방법들은 신호의 특징을 분석하여 지진 이벤트 분류를 수행한다. Short Time Average-Long Time Average(STA-LTA)[1]는 단주기 신호와 장주기 신호의 진폭과 그 변화량을 이용하여 지진 이벤트를 분류한다. Saragiotis et al.[2]와 Baillard et al.[3]는 첨도나 비대칭도와 같은 확률적 분석값들을 이용하여 지진의 파형을 분류하였다. Fingerprint And Similarity Thresholding (FAST)[4]는 신호의 유사도를 이용하여 안정적인 분류 성능을 도출하였다. 최근에는 딥러닝을 활용하여 지진 이벤트 분류를 수행하는 알고리즘들이 보고되고 있다. Perol et al.[5]은 단일 관측소에서 관측된 3채널 지진 파형 신호와 합성곱 신경망을(Convolutional Neural Network, CNN) 활용하여 지진 이벤트 분류를 수행하였으며 기존의 FAST 방식보다 연산량 및 성능 측면에서 우수한 모습을 보였다. Kim et al.[6]은 관측된 3채널 지진 파형 신호를 다양한 이미지 형태의 특징으로 변환하여 딥러닝 모델을 학습시켜 분류 성능을 향상시켰다. 기존의 딥러닝 이용한 분류 모델들은 주로 단일 관측소를 기반으로 한 접근 방법을 선택하였다. 그러나 지진이 발생하게 되면 지진 관측망에서는 단일 관측소가 아닌 다수의 관측소가 지진을 관측하게 된다. 즉 지진 이벤트 분류 모델 구성에서 단일 관측소의 정보만을 이용하는 것보다 다중 관측소의 정보를 이용하여 지진 이벤트 분류를 하는 접근 방법은 실제 환경에서 더욱 안정적이고 실용적일 수 있다.

본 논문에서는 그래프 합성곱 신경망[7]을 이용한 다중 관측소 기반 지진 이벤트 분류 방법을 제안한다. 모델은 크게 3가지 단계로 구성된다. 첫 번째는 단일 관측소의 주파수-시간 공간 특징을 학습하는 가중치 공유 합성곱 신경망[8] 단계이고, 두 번째는 다중 관측소를 융합한 특징을 학습하는 그래프 합성곱 신경망 단계, 마지막은 분류를 위한 완전 연결 신경망 단계이다. 모든 모델은 하나의 손실 함수로 동시에 학습되며 가중치 공유를 활용하여 다중 관측소에 대한 일반화 성능 향상 및 적은 컴퓨터 자원 소모를 도모한다. 제안하는 모델의 유용성을 확인하기 위해 2016년~2019년 대한민국에서 발생한 지진 이벤트 데이터를 활용하여 모델을 학습 및 테스트하였다. 단일 관측소 기반 최신 지진 이벤트 분류 모델과의 성능 비교를 통해 제안된 모델의 우수성 및 효용성을 검증한다.

본 논문의 구성은 다음과 같다. 2장에서는 제안된 그래프 합성곱 신경망을 이용한 다중 관측소 기반 지진 이벤트 분류 기법을 제시하였으며 3장에서는 학습 및 테스트에 이용하는 지진 데이터의 수집 및 제안된 알고리즘의 성능 평가를 다루며, 4장에서 결론을 맺는다.

II. 분류 모델

본 논문에서 제안하는 딥러닝 모델 구조는 Fig. 1과 같다. 먼저, 다중 관측소에서 측정된 파형 신호들에 Short Time Fourier Transform(STFT)을 사용하여 주파수-시간 공간의 특징 입력으로 변환된다. 변환된 단일 관측소 입력은 합성곱 신경망을 통해 임베딩 특징을 추출하며, 각각의 관측소에서 추출된 임베딩 특징들은 그래프 합성곱 신경망을 통해 융합하는 과정을 거친다. 마지막으로, 다중 관측소로부터 얻은 특징을 완전 연결 신경망에 통과하여 최종 이벤트 분류 결과를 도출한다.

/media/sites/ask/2020-039-06/N0660390614/images/ASK_39_06_14_F1.jpg
Fig. 1

The proposed network architecture for the multi-site earthquake event classification.

2.1 전처리 및 입력 변환 과정

딥러닝에 적합한 특징을 추출하기 위해 원시 지진 신호에 전처리를 적용한다. 윈도우를 통해 추출된 1차원 형태의 지진 시계 데이터를 x라 했을 때, Eq. (1) 와 같은 중심화 과정을 통해 편향된 측정 데이터의 중심점을 영으로 조정해주게 된다.

(1)
yj=xj-1Li=1Lxi,

여기서 L은 데이터 x의 샘플 개수, y는 정규화된 신호를 의미한다. 원시 지진 신호의 샘플링 주파수는 100 Hz이고, L = 3000으로 설정하여 30 s 길이의 원시 지진 신호를 사용하였다.

전처리 과정을 거친 1차원 지진 시계열 데이터는 STFT를 통해 2차원 데이터로 변환된다. STFT는 1차원 시계열 데이터를 시간-주파수 영역 특징으로 변환해 주는 방법으로, STFT 과정은 Eq. (2)와 같이 표현된다.

(2)
STFT(τ,f)=-y(t)g(τ-t)e-j2πftdt,

여기서 τ는 스펙트로그램의 시간 축을 의미하고, f는 스펙트로그램의 주파수 축을 의미한다. g(*)는 윈도우 함수를 뜻한다. 스펙트로그램은 크기와 위상 정보를 가지고 있으나 본 논문에서는 크기 스펙트로그램 데이터만을 사용한다. 스펙트로그램 데이터를 딥러닝 모델의 입력값으로 사용하기 위해 일반적으로 정규화하는 과정을 거친다. 스펙트로그램은 신호의 주파수 특성에 따라 다양한 범위의 값을 가지게 되므로 스펙트로그램 프레임 전체의 최대값으로 나누어 주는 과정을 통해 스펙트로그램 데이터의 범위를 제한하게 된다. 본 논문에서는 스펙트로그램의 푸리에 변환 nfft를 256으로 설정하였으며, 윈도우 함수 크기를 100 ms로 설정하고 50 ms만큼 이동하며 주파수 변환을 수행한 다음 크기 스펙트로그램을 입력 특징으로 사용하였다.

2.2 합성곱 신경망

개별 관측소의 임베딩 특징을 추출하기 위해 본 논문에서는 Fig. 2와 같은 합성곱 신경망 모델 구조를 제안한다. 합성곱 신경망의 입력 특징은 하나의 관측소에서 측정된 129×119×3 크기의 정규화된 스펙트로그램이다. 제안하는 합성곱 신경망 모델 구조는 총 8개의 합성곱 층으로 이루어져 있다. 각각의 층은 3×3 크기의 커널과 64채널, Rectified Linear Unit(ReLU) 활성화 함수를 사용하였다. 합성곱 1~3층은 간격을 2로 설정하여 특징의 차원을 줄여 합성곱 가중치들의 수용 가능 영역을 확장했다. 따라서, 앞 3개의 층의 합성곱 신경망 특징 차원은 각각 65×60×64, 33×30×64.17×15×64크기의 차원을 가지고, 뒤 5개 층의 신경망 차원은 모두 17×15×64크기의 차원을 가진다. 마지막 합성곱 층의 출력값에 평탄화 작업을 진행하여 특징을 16320차원의 벡터 형태로 변환한다. 제안하는 모델에서 합성곱 신경망은 단일 관측소에서의 임베딩 특징을 추출하는 것이 목적이기 때문에, 입력 관측소의 순서에 상관없이 같은 가중치를 이용하는 것이 모델의 일반화에 유리하다. 따라서, 가중치 공유를 사용하는 구조를 적용하였다.

/media/sites/ask/2020-039-06/N0660390614/images/ASK_39_06_14_F2.jpg
Fig. 2

Convolution neural networks model structure.

2.3 그래프 합성곱 신경망

그래프 합성곱 신경망(Graph Convolution Network, GCN)[7]은 그래프 형태의 입력값을 학습시키는 데 적합한 딥러닝 모델 구조이다. 그래프의 모든 노드가 같은 차원의 특징 벡터를 가지고 있고, 임의의 간선으로 연결되어 있다고 가정한다. 이제 l번째 층의 1번 노드의 입력 특징 벡터를 h1l라 정의하고, 2, 3, 5번 노드가 1번 노드와 간선으로 연결되었다고 한다면, l번째 층의 1번 노드의 출력 특징 벡터는 다음과 같이 계산된다.

(3)
h1l+1=σ(h1lWl+h2lWl+h3lWl+h5lWl+bl),

여기서 b는 편향치, σ는 활성화 함수를 의미한다. 그래프 합성곱 신경망은 자신의 입력 특징 벡터뿐 아니라 간선으로 연결된 노드의 입력 특징 벡터와도 가중치를 계산하여 특징을 학습하기 때문에, 다중 관측소의 정보 융합에 적합하다. 제안하는 모델에서는 5개의 그래프 합성곱 층을 사용했다. 단일 관측소에서 각각 합성곱 신경망을 통과한 벡터 형태의 특징들을 관측소 노드의 특징 벡터로 설정하고, 모든 노드가 간선으로 연결된 그래프를 생성하였다. 간선으로 연결된 노드끼리 정보 공유가 일어나기 때문에 최대한 많은 간선으로 연결하여 다중 관측소의 특징을 융합하는 것에 초점을 두고 모델을 구성하였다. 첫 번째 그래프 합성곱 층의 입력 특징 벡터 크기는 합성곱 신경망의 출력 크기에 의존하며 모든 은닉층 특징 벡터 크기는 64로 설정하였다. 그래프 합성곱 신경망의 출력값을 완전 연결 층으로 전달하기 위해서 각각의 노드에 저장된 특징들의 평균을 그래프 합성곱 신경망의 출력 벡터로 계산한다. 그래프 합성곱 신경망의 하나의 층 구조를 Fig. 3에 설명한다.

/media/sites/ask/2020-039-06/N0660390614/images/ASK_39_06_14_F3.jpg
Fig. 3

Graph convolution networks.

2.4 분류기

분류기에서는 완전 연결 층을 이용하여 그래프 합성곱 신경망으로부터 얻은 다중 관측소에 대한 특징 벡터에서 지진 이벤트 범주를 예측한다. 제안하는 모델에서는 총 3개의 완전 연결 층을 사용하였고, 각각 128차원, 64차원, 3차원의 크기를 가지며, 마지막 층을 제외하고 ReLU 활성화 함수를 사용하였다.

2.5 학습 과정

모델의 모든 가중치는 end-to-end 방식으로 학습된다. 모델의 손실 함수는 정답 범주와 예측 범주 사이의 Cross-Entropy 손실 함수로 계산된다. 또한, 손실 함수에 L2 정규화를 적용하여 모델의 일반화 성능 향상을 도모했다. L2 정규화 상수는 λ=0.00001로 설정하였다. 학습은 Adam optimizer을 이용하였고, 학습률은 0.0001로 설정하였다. 모든 모델은 100 epoch 학습시켜 가장 좋은 성능을 도출한 모델을 테스트 모델로 사용하였다.

III. 실험 결과

제안한 모델의 우수성 및 효용성을 검증하기 위해 본 논문에서는 아래와 같은 실험 데이터 및 성능 측정 지표를 구성하였으며 기존 방법과의 비교 분석을 수행하였다.

3.1 학습 데이터

모델 학습과 테스트를 위해 대한민국 전역에서 발생한 2016년 01월 ~ 2019년 12월 지진 이벤트 데이터를 사용하였다. 지진 관측망의 관측소 분포는 Fig. 4.에 표현하였다. 이벤트 데이터는 기상청에서 제공한 지진 이벤트 분석 파일을 활용하여 자연지진과 인공지진으로 데이터를 구성하였다. Fig. 5와 같이 지진 이벤트가 발생하면 전문가의 분석을 통해 지진 신호가 잘 측정된 관측소들을 모은 지진 관측소 목록을 구성한다. 생성된 지진 관측소 목록에서 N개의 관측소를 시간 순서대로 선택하여 다중 관측소 지진 데이터를 구성하였다. 잡음 데이터는 지진이 없는 날짜를 선택하여 해당 날짜에 측정된 신호를 무작위로 잘라서 구성하였다. 이벤트 데이터의 경우 신호를 자르는 시점을 결정해줘야 하는데, 본 논문에서는 Fig. 5와 같이 가장 먼저 지진 신호가 관측된 관측소의 P파 도착 시간을 기준으로 이벤트 데이터를 잘랐다.

/media/sites/ask/2020-039-06/N0660390614/images/ASK_39_06_14_F4.jpg
Fig. 4

Location of the stations on the seismic observation network.

/media/sites/ask/2020-039-06/N0660390614/images/ASK_39_06_14_F5.jpg
Fig. 5

Data acquisition.

2016년, 2017년, 2019년 데이터는 학습 데이터로 활용했으며, 2018년 데이터는 테스트 데이터로 사용하여 학습 데이터와 테스트 데이터가 중복되지 않도록 구분하였다. 연도별 데이터 개수는 Table 1에서 설명하고, Fig. 6에서 지진, 인공지진, 잡음 신호의 예시를 표현하였다.

Table 1.

The number of data.

Year Earthquake ArtificialEarthquake Noise
2016 3342 230 1000
2017 3058 245 1000
2018 1595 235 1000
2019 4013 664 1000

/media/sites/ask/2020-039-06/N0660390614/images/ASK_39_06_14_F6.jpg
Fig. 6

Data sample.

3.2 성능 측정 지표

모델의 성능을 측정하기 위한 지표로 정확도와 이벤트에 대한 재현율을 이용했다. 잡음을 포함한 전체적인 이벤트 분류 성능을 정확도를 사용하여 측정하였고, 지진이 발생했을 때 해당 지진을 정확하게 분류했는지 확인하기 위해 이벤트에 대한 재현율을 사용해 측정하였다. 각 지표의 계산법은 아래와 같다.

(4)
Accuracy=TP+TNTP+TN+FP+FN.
(5)
Recall=TPTP+FN.

이 때, TP는 True-positive, TN은 True-Negative, FP는 False-Positive, FN은 False-Negative를 의미한다.

3.3 모델 구조에 따른 실험 결과

먼저, 모델 구조에 따른 실험 결과를 Table 2에 정리하였다. Perol et al.[5] 모델은 지진 파형을 입력값으로 하는 단일 관측소 기반 모델이고, concat 모델은 제안하는 모델에서 그래프 합성곱 층을 제거하고 합성곱 신경망 특징 벡터들을 연결하여 분류하는 모델 구조이다. GCN 모델은 본 논문에서 제안하는 모델이다. 단일 관측소 기반 모델(Perol et al.[5])은 관측소 개수 N = 1이고, 다중 관측소 기반 모델(Concat, GCN)의 관측소 개수는 N = 3이다. 실험 결과를 통해 단일 관측소 기반 모델보다 다중 관측소 기반 모델의 분류 정확도가 15 % 이상 향상되었고, 그래프 합성곱 층을 추가함으로써 2 % 정도의 정확도 향상을 보였다.

Table 2.

Performance comparison (w.r.t model structure).

Model Accuracy Recall (Earthquake) Recall (Artificial Earthquake)
Perol et al.[5] 78.27 % 79.79 % 47.51 %
Concat 94.43 % 98.68 % 72.30 %
GCN 96.49 % 98.60 % 84.90 %

3.4 관측소 개수에 따른 실험 결과

다음으로, 관측소 개수(N)에 따른 실험 결과를 Table 3에 정리하였다. 정확도는 관측소 개수가 증가함에 따라 같이 증가하는 경향을 보인다. 자연지진에 대한 재현율은 N = 5에서 조금 감소했지만 모든 경우에서 96 % 이상의 성능을 보이고, 인공지진에 대한 재현율은 N = 5에서 96.5 %로 가장 좋은 성능을 도출하였다. 관측소 개수가 증가함에 따라 입력 데이터가 더 많은 정보를 포함하고 있어 전체적인 정확도는 올라가지만, 특정 범주에 대한 데이터 분류 성능을 악화시킬 수 있는 이상 데이터가 포함되어 N = 5에서의 재현율 성능이 하락한 것으로 분석된다.

Table 3.

Performance comparison of GCN model (w.r.t the number of stations).

# of stations Accuracy Recall (Earthquake) Recall (Artificial Earthquake)
N = 2 96.07 % 98.84 % 80.50 %
N = 3 96.49 % 98.60 % 84.90 %
N = 4 96.89 % 98.57 % 86.53 %
N = 5 97.50 % 96.53 % 96.53 %

3.5 입력값 길이에 따른 실험 결과

마지막으로, 입력값의 길이에 따른 실험 결과를 Table 4에 정리하였다. 관측소 개수가 3개일 때 입력값의 길이를 5 s, 10 s, 30 s로 변화시켜가며 실험을 진행하였다. 실험 결과를 통해 입력값의 길이가 증가할수록 정확도와 재현율 모두 향상되는 것을 확인하였다.

Table 4.

Performance comparison of GCN model (w.r.t input length).

Input Length Accuracy Recall (Earthquake) Recall (Artificial Earthquake)
5 s 94.76 % 97.92 % 76.59 %
10 s 95.38 % 98.40 % 78.53 %
30 s 96.49 % 98.60 % 84.90 %

IV. 결 론

본 논문에서는 그래프 합성곱 신경망을 이용한 다중 관측소 기반 지진 이벤트 분류 모델을 제안하였다. 단일 관측소에서 분류에 적합한 특징을 추출하기 위해 합성곱 신경망을 이용하였고, 다중 관측소의 특징들을 융합하기 위해 그래프 합성곱 신경망을 이용하였다. 제안하는 모델이 여러 관측소의 정보를 효과적으로 다룰 수 있는지 확인하기 위해 모델 구조와 관측소 개수, 입력값의 시간을 변화시켜가며 실험을 진행하였다. 그 결과, 같은 양의 정보가 들어왔을 때 다른 모델에 비해 2 % 이상의 분류 성능 향상을 보였으며, 더 많은 정보가 들어왔을 때 더 좋은 분류 성능을 도출하는 것을 확인하여 모델의 타당성을 입증하였다. 본 연구에서 제시한 모델은 지진 관측망의 다중 관측소를 이용한 지진 이벤트 분류뿐 아니라, 다중 관측소를 이용한 진원 위치 추정, 진도 예측 등 다중 관측소를 활용한 지진관측의 여러 분야에서 활용될 수 있을 것으로 기대한다.

Acknowledgements

본 논문은 기상청 기상/지진 See-At 기술개발연구 사업 “인공지능 기술 활용 지진감지업무 적용 기술 연구”의 지원을 받아 수행되었습니다(KMI2018-09610).

References

1
R. V. Allen, "Automatic earthquake recognition and timing from single traces," Bulletin of the Seismological Society of America, 68, 1521-1532(1978).
2
C. D. Saragiotis, L. J. Hadjileontiadis, and S. M. Panas, "PAI-S/K: A robust automatic seismic P phase arrival identification scheme," IEEE Transactions on Geoscience and Remote Sensing, 40, 1395-1404 (2002). 10.1109/TGRS.2002.800438
3
C. Baillard, W. C. Crawford, V. Ballu, l. Hibert, and A. Mangeney, "An automatic kurtosis‐based P‐and S‐phase picker designed for local seismic networks," Bulletin of the Seismological Society of America, 104, 394-409 (2014). 10.1785/0120120347
4
C. E. Yoon, O. O'Reilly, K. J. Bergen, and G. C. Beroza, "Earthquake detection through computationally efficient similarity search," Science advances, 1, e1501057 (2015). 10.1126/sciadv.150105726665176PMC4672764
5
T. Perol, G. Michaël, and M. Denolle, "Convolutional neural network for earthquake detection and location," Science Advances, 4, e1700578 (2018). 10.1126/sciadv.170057829487899PMC5817932
6
G. Kim, B. Ku, and H. Ko, "Multifeature fusion-based earthquake event classification using transfer learning," IEEE Geoscience and Remote Sensing Letters, 1-5 (2020). 10.1109/LGRS.2020.2993302
7
T. N. Kipf and M. Welling, "Semi-supervised classification with graph convolutional networks," arXiv preprint arXiv:1609.02907 (2016).
8
A. Krizhevsky, I. Sutskever, and G. E. Hinton, "Imagenet classification with deep convolutional neural networks," Advances in neural information processing systems, 1-9 (2012).
페이지 상단으로 이동하기