[국제 저널 논문 요약] Gated Spatial-Temporal Graph Neural Network Based Short-Term Load Forecasting for Wide-Area Multiple Buses

0. Paper Information

  • Title: Gated spatial-temporal graph neural network based short-term load forecasting for wide-area multiple buses
  • Authors: Nantian Huang, Shengyuan Wang, Rijun Wang, Guowei Cai, Yang Liu, Qianbin Dai
  • Publication: International Journal of Electrical Power & Energy Systems
  • Published Year: 2023

 

1. Introduction

Background

  • 현대 전력 시스템은 지능, 유연성, 네트워킹을 포함하여 다양성, 유연성, 상관관계의 복잡한 형태를 가짐
  • 버스 부하 예측(Bus Load Forecasting)은 그리드 디스패치 작업(Grid Dispatch Operation)의 안전성과 온라인 분석 결정(Online Analysis Decision)의 정확성에 매우 중요함
  • 버스 부하는 시스템 부하보다 작으며, 기상 요소와 전력 공급 지역의 사용자 행동의 영향으로 변동성이 크고 무작위적이며, 변화 추세가 명확하지 않아 정확한 예측이 어려움
  • 전력 소비 행동의 차이 등으로 인해 버스 부하 간에 큰 차이가 있어 통일된 예측 모델을 사용하여 여러 버스 부하를 예측하는 것이 어려움

 

Previous Research

  • 단기 부하 예측 방법은 통계적 방법과 머신 러닝 방법으로 나뉘며, 예를 들어 ARIMA, LSTM, GAN, CNN 등이 있음
    • 통계적 학습에 비해 머신 러닝 기반 부하 예측 방법은 복잡한 비선형 데이터 특징을 더 효과적으로 포착할 수 있음
  • 서로 다른 전력 공급 지역의 고객 유형이 비슷하다면 유사한 전력 소비 패턴이 존재할 수 있음
    • 시공간적 결합 상관관계를 고려하여 부하를 예측하는 것이 더 정확하고 실현 가능함
  • 기존 전력수요 예측 연구는 데이터를 순차적으로 입력 받고 각각의 데이터를 독립적으로 처리하므로 데이터의 시공간 상관관계를 고려하지 못함
    • 비유클리드 도메인에서 여러 버스 부하를 분석 및 특징을 추출하는 것은 유클리드 공간에서 데이터의 순차적 입력에 제한되지 않으며, 부하 간의 시공간적 결합 상관관계에 직접적으로 대응할 수 있음
    • 비지리적 거리(Non-Geographic Distance) 및 비격자 토폴로지 제약(Non-Grid Topology-Constrained)이 있는 버스 부하 사이의 관계를 유사 가중치 시공간 그래프에 매핑하면 넓은 지역의 다중 버스 부하 간의 복잡한 시공간 상관관계를 정확하게 설명할 수 있음
  • 유사 가중 시공간 그래프의 각 노드에 대한 이웃 노드 수가 다르므로, 유클리드 도메인 데이터를 기반으로 한 기존 방법으로 예측 모델을 구축하기 어려움
    • GCN은 CNN 및 그래프 임베딩과 같은 아이디어에서 영감을 받아 연구의 기초로 불변점 이론을 사용하며, 전력 시스템 내 데이터의 다양한 표현 및 특징 추출 가능

 

Proposed Model

  • ST-GCN 기반 광역 다중 버스 단기 부하 예측 기법을 제안함
    • 원래 모델을 기반으로 다중 노드 특징 집합을 구성하고 유사 가중 시공간 그래프에서 노드 특징 유형을 확장하여 최악의 평가 지표 정확도를 개선함
    • 유사 가중 시공간 그래프는 버스 간의 공간 결합 및 상관 정도를 직접 반영할 수 있어 모델의 해석 가능성을 더욱 높임
    • RapidMIC 값을 엣지 특징으로 사용하여 유사 가중 시공간 그래프를 가중치로 구축함
  • ST-GCN 기반 광역 다중 버스 단기 부하 예측 기법 프로세스
    • 버스 부하 간의 RapidMIC 값을 엣지 특징으로 사용하고, 다중 노드 특징 집합을 결합하여 유사 가중 시공간 그래프를 구성함
    • 그런 다음, SCL을 구성하여 유사 가중 시공간 그래프에서 이웃 노드의 고차원 특징을 추출하고, 공간 집합 특징을 생성하여 전체 도메인 노드 특징 향상을 달성함
    • 마지막으로, 다양한 순간의 공간 집합 특징을 시계열로 구성하고 GRUL에 입력하여 시간 도메인 특징을 추출함

 

Contribution

  • 제안된 유사 가중 시공간 그래프는 각 버스의 부하 간 결합 관계를 직접 반영할 수 있으며, 일정한 해석 가능성을 가짐
  • SCL을 통해 특정 버스 부하 간의 결합 연관성을 추출하고, 공간 집합 특징을 생성하여 전체 도메인 노드 특징을 향상함
  • 집합된 특징을 시계열로 구성하고 GRUL에 입력하여 시간 도메인 특징을 추출함
  • 비교 실험 결과, 제안된 방법은 최악의 부하 예측 평가 지표를 크게 줄였으며, 비정상 부하 데이터를 포함할 때 더 강건함을 보여줌

 

2. Methodology

Overall Structure

  • 제안 기법 전체 구조

 

RapidMIC(Rapid computation of the Maximal Information Coefficient)

  • RapidMIC는 두 변수 간의 선형 및 비선형 관계를 측정하는 지표인 최대 정보 계수(MIC)를 빠르고 효율적으로 계산하기 위한 알고리즘
  • RapidMIC 프로세스
    • 격자 분할 최적화 → 동적 프로그래밍 → 히스토그램 근사법 →병렬 처리
    • 격자 분할 최적화: 데이터의 분포를 분석하여 중요한 격자 분할을 선택
    • 동적 프로그래밍: 상호 정보량 계산 시, 이전 계산 결과를 저장하고 재사용
    • 히스토그램 근사법: 데이터 분포를 히스토그램으로 근사화하여 각 격자 셀의 빈도 계산
    • 병렬 처리: 여러 격자 분할의 계산을 동시에 수행

 

ST-GCN(Spatial Temporal Graph Convolutional Network)

  • ST-GCN은 그래프 데이터를 분석하기 위하여 설계된 딥러닝 모델로, 시간적 및 공간적 패턴을 동시에 학습하는 데 강점을 지님
    • SGCN(Spatial Graph Convolutional Network)와 TCN(Temporal Convolutional Network)으로 구성됨
  • SGCN
    • 입력 데이터를 노드와 엣지로 표현한 그래프로 변환
    • 인접 노드들의 특징을 집계하여 각 노드의 새로운 특징을 생성
  • TCN
    • 시계열 데이터를 통해 시간 축을 따라 변화하는 패턴을 학습
    • 1D 컨볼루션을 이용하여 각 시간 단계에서의 특징을 학습하고, 이전 단계의 정보 반영

 

3. Experimental Result

Dataset

  • 중국 북동부 지역의 15개 버스바(Busbar)에서 수집된 부하 데이터를 사용
    • 2018년에 15분 단위로 수집된 데이터
    • 기상 데이터가 포함되어 있음
    • 높은 변동성 및 무작위성을 가진 데이터로, 1년 내내 급격하게 변동하는 특징을 보유하고 있음
  • 훈련 데이터와 테스트 데이터는 9:1의 비율로 나눈 후 실험에 사용

 

Evaluation Metric

  • SMAPE(Symmetric Mean Absolute Percentage Error)와 MAE(Mean Absolute Error)를 평가지표로 사용
    • SMAPE는 MAPE의 보정 지표로, 실제 값이 너무 작아 MAPE가 정확하게 예측 정확도를 반영하기 어려운 상황을 개선할 수 있음
    • MAE는 오류 값의 관점에서 예측 결과를 평가할 수 있음

 

Result

  • 부하 데이터와 기상 데이터 사이의 RapidMIC 분석
    • 온도 데이터가 부하 데이터와 가장 높은 상관관계를 가지며 RapidMIC는 0.51
    • 다른 기상 데이터들은 부하 데이터와 약한 상관관계를 가짐

 

  • 날짜, 기상 데이터가 각 버스의 주는 영향 분석
    • 버스 4가 날짜와 기상의 영향을 가장 적게 받음
      • 날짜와 기상 데이터를 사용하지 않았을 때 대비 0.97% 성능이 향상
    • 버스 15가 영향을 가장 크게 받음
      • 날짜와 기상 데이터를 사용하지 않았을 때 대비 17.4% 성능이 향상

 

  • 예측 성능 비교 (1)
    • 예측 결과의 분포를 Box-Line Diagram으로 나타냄
      • 각각의 Box는 15개의 버스 부하에 대하여 32일간 예측한 결과가 포함되어 있음 (480개 결과)
      • ST-GCN 기법이 다른 기법들 보다 작은 SMAPE 값을 가짐
      • ST-GCN 기법이 다른 기법들보다 적은 이상치를 보임

 

  • 예측 성능 비교 (2)
    • 최대 이상치 SMAPE 결과가 나온 버스 데이터를 보다 상세하게 분석
      • 가장 안 좋은 SMAPE 결과를 비교한 결과 ST-GCN은 최소 1.82%에서 최대 5.94% 성능이 향상됨을 확인

 

  • 예측 성능 비교 (3)
    • 각 예측 기법에 대하여 각 버스 데이터의 성능을 비교함
      • SMAPE는 최소 0.25%에서 최대 0.64% 감소, MAE는 최소 0.5MW에서 최대 1.05MW 감소

 

  • 비정상 로드 데이터에서의 예측 성능 비교
    • 이상치 비율을 0%에서 30%까지 변경하면서 성능을 측정함
      • 다른 기법들 대비 최소 0.1%에서 최대 0.75% 성능이 향상됨 
      • ST-GCN 기법이 비정상적인 부하가 포함된 데이터에 대해 제일 강력함을 확인

 

4. Conclusion

  • 해당 논문에서는 GCN을 사용하여 광역 다중 버스의 단기 부하를 예측함
    • 유사 가중치를 가진 시공간 그래프를 구성하여 지리적 제한 없이 버스 연결 관계를 재구성
    • 예측 과정에서 버스 부하 데이터 간의 공간적 및 시간적 상관관계를 고려함
  • 비교 실험을 통하여 제안하는 방법의 예측 결과가 더 신뢰할 수 있음을 알 수 있음
    • SMAPE와 MAE는 각각 3.19% ~ 5.89%, 1.83MW ~ 8MW가 나옴
    • 다른 방법의 SMAPE와 비교하였을 때, 테스트 데이터 중 가장 안 좋은 케이스에서 성능이 1.82% ~ 5.94%가 향상됨
    • 비정상적인 부하 데이터가 있는 상황에서도 강건함을 보임