0. Paper Information
- Title: Gated spatial-temporal graph neural network based short-term load forecasting for wide-area multiple buses
- Authors: Nantian Huang, Shengyuan Wang, Rijun Wang, Guowei Cai, Yang Liu, Qianbin Dai
- Publication: International Journal of Electrical Power & Energy Systems
- Published Year: 2023
1. Introduction
Background
- 현대 전력 시스템은 지능, 유연성, 네트워킹을 포함하여 다양성, 유연성, 상관관계의 복잡한 형태를 가짐
- 버스 부하 예측(Bus Load Forecasting)은 그리드 디스패치 작업(Grid Dispatch Operation)의 안전성과 온라인 분석 결정(Online Analysis Decision)의 정확성에 매우 중요함
- 버스 부하는 시스템 부하보다 작으며, 기상 요소와 전력 공급 지역의 사용자 행동의 영향으로 변동성이 크고 무작위적이며, 변화 추세가 명확하지 않아 정확한 예측이 어려움
- 전력 소비 행동의 차이 등으로 인해 버스 부하 간에 큰 차이가 있어 통일된 예측 모델을 사용하여 여러 버스 부하를 예측하는 것이 어려움
Previous Research
- 단기 부하 예측 방법은 통계적 방법과 머신 러닝 방법으로 나뉘며, 예를 들어 ARIMA, LSTM, GAN, CNN 등이 있음
- 통계적 학습에 비해 머신 러닝 기반 부하 예측 방법은 복잡한 비선형 데이터 특징을 더 효과적으로 포착할 수 있음
- 서로 다른 전력 공급 지역의 고객 유형이 비슷하다면 유사한 전력 소비 패턴이 존재할 수 있음
- 시공간적 결합 상관관계를 고려하여 부하를 예측하는 것이 더 정확하고 실현 가능함
- 기존 전력수요 예측 연구는 데이터를 순차적으로 입력 받고 각각의 데이터를 독립적으로 처리하므로 데이터의 시공간 상관관계를 고려하지 못함
- 비유클리드 도메인에서 여러 버스 부하를 분석 및 특징을 추출하는 것은 유클리드 공간에서 데이터의 순차적 입력에 제한되지 않으며, 부하 간의 시공간적 결합 상관관계에 직접적으로 대응할 수 있음
- 비지리적 거리(Non-Geographic Distance) 및 비격자 토폴로지 제약(Non-Grid Topology-Constrained)이 있는 버스 부하 사이의 관계를 유사 가중치 시공간 그래프에 매핑하면 넓은 지역의 다중 버스 부하 간의 복잡한 시공간 상관관계를 정확하게 설명할 수 있음
- 유사 가중 시공간 그래프의 각 노드에 대한 이웃 노드 수가 다르므로, 유클리드 도메인 데이터를 기반으로 한 기존 방법으로 예측 모델을 구축하기 어려움
- GCN은 CNN 및 그래프 임베딩과 같은 아이디어에서 영감을 받아 연구의 기초로 불변점 이론을 사용하며, 전력 시스템 내 데이터의 다양한 표현 및 특징 추출 가능
Proposed Model
- ST-GCN 기반 광역 다중 버스 단기 부하 예측 기법을 제안함
- 원래 모델을 기반으로 다중 노드 특징 집합을 구성하고 유사 가중 시공간 그래프에서 노드 특징 유형을 확장하여 최악의 평가 지표 정확도를 개선함
- 유사 가중 시공간 그래프는 버스 간의 공간 결합 및 상관 정도를 직접 반영할 수 있어 모델의 해석 가능성을 더욱 높임
- RapidMIC 값을 엣지 특징으로 사용하여 유사 가중 시공간 그래프를 가중치로 구축함
- ST-GCN 기반 광역 다중 버스 단기 부하 예측 기법 프로세스
- 버스 부하 간의 RapidMIC 값을 엣지 특징으로 사용하고, 다중 노드 특징 집합을 결합하여 유사 가중 시공간 그래프를 구성함
- 그런 다음, SCL을 구성하여 유사 가중 시공간 그래프에서 이웃 노드의 고차원 특징을 추출하고, 공간 집합 특징을 생성하여 전체 도메인 노드 특징 향상을 달성함
- 마지막으로, 다양한 순간의 공간 집합 특징을 시계열로 구성하고 GRUL에 입력하여 시간 도메인 특징을 추출함
Contribution
- 제안된 유사 가중 시공간 그래프는 각 버스의 부하 간 결합 관계를 직접 반영할 수 있으며, 일정한 해석 가능성을 가짐
- SCL을 통해 특정 버스 부하 간의 결합 연관성을 추출하고, 공간 집합 특징을 생성하여 전체 도메인 노드 특징을 향상함
- 집합된 특징을 시계열로 구성하고 GRUL에 입력하여 시간 도메인 특징을 추출함
- 비교 실험 결과, 제안된 방법은 최악의 부하 예측 평가 지표를 크게 줄였으며, 비정상 부하 데이터를 포함할 때 더 강건함을 보여줌
2. Methodology
Overall Structure
- 제안 기법 전체 구조
RapidMIC(Rapid computation of the Maximal Information Coefficient)
- RapidMIC는 두 변수 간의 선형 및 비선형 관계를 측정하는 지표인 최대 정보 계수(MIC)를 빠르고 효율적으로 계산하기 위한 알고리즘
- RapidMIC 프로세스
- 격자 분할 최적화 → 동적 프로그래밍 → 히스토그램 근사법 →병렬 처리
- 격자 분할 최적화: 데이터의 분포를 분석하여 중요한 격자 분할을 선택
- 동적 프로그래밍: 상호 정보량 계산 시, 이전 계산 결과를 저장하고 재사용
- 히스토그램 근사법: 데이터 분포를 히스토그램으로 근사화하여 각 격자 셀의 빈도 계산
- 병렬 처리: 여러 격자 분할의 계산을 동시에 수행
ST-GCN(Spatial Temporal Graph Convolutional Network)
- ST-GCN은 그래프 데이터를 분석하기 위하여 설계된 딥러닝 모델로, 시간적 및 공간적 패턴을 동시에 학습하는 데 강점을 지님
- SGCN(Spatial Graph Convolutional Network)와 TCN(Temporal Convolutional Network)으로 구성됨
- SGCN
- 입력 데이터를 노드와 엣지로 표현한 그래프로 변환
- 인접 노드들의 특징을 집계하여 각 노드의 새로운 특징을 생성
- TCN
- 시계열 데이터를 통해 시간 축을 따라 변화하는 패턴을 학습
- 1D 컨볼루션을 이용하여 각 시간 단계에서의 특징을 학습하고, 이전 단계의 정보 반영
3. Experimental Result
Dataset
- 중국 북동부 지역의 15개 버스바(Busbar)에서 수집된 부하 데이터를 사용
- 2018년에 15분 단위로 수집된 데이터
- 기상 데이터가 포함되어 있음
- 높은 변동성 및 무작위성을 가진 데이터로, 1년 내내 급격하게 변동하는 특징을 보유하고 있음
- 훈련 데이터와 테스트 데이터는 9:1의 비율로 나눈 후 실험에 사용
Evaluation Metric
- SMAPE(Symmetric Mean Absolute Percentage Error)와 MAE(Mean Absolute Error)를 평가지표로 사용
- SMAPE는 MAPE의 보정 지표로, 실제 값이 너무 작아 MAPE가 정확하게 예측 정확도를 반영하기 어려운 상황을 개선할 수 있음
- MAE는 오류 값의 관점에서 예측 결과를 평가할 수 있음
Result
- 부하 데이터와 기상 데이터 사이의 RapidMIC 분석
- 온도 데이터가 부하 데이터와 가장 높은 상관관계를 가지며 RapidMIC는 0.51
- 다른 기상 데이터들은 부하 데이터와 약한 상관관계를 가짐
- 날짜, 기상 데이터가 각 버스의 주는 영향 분석
- 버스 4가 날짜와 기상의 영향을 가장 적게 받음
- 날짜와 기상 데이터를 사용하지 않았을 때 대비 0.97% 성능이 향상
- 버스 15가 영향을 가장 크게 받음
- 날짜와 기상 데이터를 사용하지 않았을 때 대비 17.4% 성능이 향상
- 버스 4가 날짜와 기상의 영향을 가장 적게 받음
- 예측 성능 비교 (1)
- 예측 결과의 분포를 Box-Line Diagram으로 나타냄
- 각각의 Box는 15개의 버스 부하에 대하여 32일간 예측한 결과가 포함되어 있음 (480개 결과)
- ST-GCN 기법이 다른 기법들 보다 작은 SMAPE 값을 가짐
- ST-GCN 기법이 다른 기법들보다 적은 이상치를 보임
- 예측 결과의 분포를 Box-Line Diagram으로 나타냄
- 예측 성능 비교 (2)
- 최대 이상치 SMAPE 결과가 나온 버스 데이터를 보다 상세하게 분석
- 가장 안 좋은 SMAPE 결과를 비교한 결과 ST-GCN은 최소 1.82%에서 최대 5.94% 성능이 향상됨을 확인
- 최대 이상치 SMAPE 결과가 나온 버스 데이터를 보다 상세하게 분석
- 예측 성능 비교 (3)
- 각 예측 기법에 대하여 각 버스 데이터의 성능을 비교함
- SMAPE는 최소 0.25%에서 최대 0.64% 감소, MAE는 최소 0.5MW에서 최대 1.05MW 감소
- 각 예측 기법에 대하여 각 버스 데이터의 성능을 비교함
- 비정상 로드 데이터에서의 예측 성능 비교
- 이상치 비율을 0%에서 30%까지 변경하면서 성능을 측정함
- 다른 기법들 대비 최소 0.1%에서 최대 0.75% 성능이 향상됨
- ST-GCN 기법이 비정상적인 부하가 포함된 데이터에 대해 제일 강력함을 확인
- 이상치 비율을 0%에서 30%까지 변경하면서 성능을 측정함
4. Conclusion
- 해당 논문에서는 GCN을 사용하여 광역 다중 버스의 단기 부하를 예측함
- 유사 가중치를 가진 시공간 그래프를 구성하여 지리적 제한 없이 버스 연결 관계를 재구성
- 예측 과정에서 버스 부하 데이터 간의 공간적 및 시간적 상관관계를 고려함
- 비교 실험을 통하여 제안하는 방법의 예측 결과가 더 신뢰할 수 있음을 알 수 있음
- SMAPE와 MAE는 각각 3.19% ~ 5.89%, 1.83MW ~ 8MW가 나옴
- 다른 방법의 SMAPE와 비교하였을 때, 테스트 데이터 중 가장 안 좋은 케이스에서 성능이 1.82% ~ 5.94%가 향상됨
- 비정상적인 부하 데이터가 있는 상황에서도 강건함을 보임