[국제 저널 논문 요약] Animal Movement Prediction Based on Predictive Recurrent Neural Network

0. Paper Information

  • Title: Animal Movement Prediction Based on Predictive Recurrent Neural Network
  • Authors: Jehyeok Rew, Sungwoo Park, Yongjang Cho, Seungwon Jung, Eenjun Hwang
  • Publication: Sensors
  • Published Year: 2019

 

1. Introduction

Background

  • 동물 이동 분석은 생태계를 이해하기 위한 첫 단계
    • 동물의 이동은 서식지 선택, 개체군 동태, 집단 행동과 같은 주제에 대한 생태학적 통찰을 제공할 수 있음
    • 이러한 중요성을 인식한 많은 연구가 수십 년 동안 수행됨
  • Global Positioning System(GPS)와 Advanced Research and Global Observation Satellite(ARGOS) 과 같은 원격 측정 기술의 발전으로 동물 이동 모델링이 가속화
    • 원격 감지 기술의 발전으로 다양한 기상 및 지리적 데이터를 지속적으로 획득할 수 있게 되었으며, 이를 통해 합리적인 모델링을 수행할 수 있는 충분한 양의 데이터가 확보됨

 

Previous Research

  • 동물 이동을 이해하고 관련 요인을 분석하기 위한 모델링의 필요성이 강조되어 왔음
    • 다양한 분야에서 기계 학습이 좋은 성능을 보이면서, 기계 학습을 사용하여 동물 이동을 모델링하기 위한 많은 노력이 이루어짐
    • 최근에는 심층 신경망(DNN)이 동물 이동 모델링의 주요 도구가 되었음
  • GPS, ARGOS와 같은 지리 기록을 사용하여 동물 이동 모델을 구축하기 위한 많은 노력에도 불구하고, 결과는 동물 이동 상태의 식별 또는 환경 조건과의 상관 분석에 한정되었음
    • 모델에서 구현해야 할 핵심 기능은 다양한 시공간 요인의 변화에 따라 동물 이동을 예측하는 것
      • 이를 통해 동물 행동을 이해하거나 동물 서식지를 보호하는 등 다양한 목적으로 사용할 수 있음
      • 이와 관련된 연구는 거의 없음

 

Proposed Model

  • Recurrent Neural Network(RNN)을 기반으로 한 동물 이동 예측 방식을 제안함

 

Contribution

  • 관측 격차를 메우기 위해, 날씨 정보 및 이동 관련 벡터를 고려한 최적화된 랜덤 포레스트 기반 보간 방식을 제안
    • 현실적인 조건을 고려할 때 동물 경로를 보간하는 것은 매우 중요한 작업
  • 커널 밀도 추정(KDE) 알고리즘을 사용하여 대표적인 동물 이동의 이미지 시퀀스를 구성하는 방법을 제안
    • 생성된 이미지 시퀀스는 동물의 합리적인 이동 범위를 나타냄
  • 이동 예측을 위한 예측 RNN 모델을 구축하고 그 성능을 평가함

 

2. Methodology

Overall Structure

  • 제안하는 방법론 전체 흐름도

 

Random Forest (RF)

  • RF는 여러 개의 결정 트리를 결합하여 예측 성능을 향상시키는 앙상블 학습 기법
    • 분류 및 회귀 문제에서 높은 정확도와 견고성을 제공하여, 다양한 분야에서 널리 사용됨
    • 부트스트랩 방식으로 원본 데이터에서 여러 샘플을 무작위로 선택하여 각각의 트리에 사용할 훈련 데이터셋을 생성하여, 모델의 다양성과 일반화 성능을 향상
    • 개별 트리의 예측을 평균화하거나 다수결 투표로 최종 예측을 생성
    • 과적합(overfitting)을 방지하면서도 높은 예측 성능을 제공하며, 복잡한 데이터셋에서도 잘 작동

 

Kernel Density Estimation (KDE)

  • KDE는 비모수적 방법을 사용하여 데이터의 확률 밀도 함수를 추정하는 기법
    • 주어진 데이터 포인트를 기반으로 전체 분포를 매끄럽게 추정하여, 데이터의 분포를 시각화하고 분석하는 데 유용
    • 데이터의 분포를 특정한 형태(예: 정규 분포)로 가정하지 않고, 데이터 자체로부터 밀도를 추정
    • 각 데이터 포인트 주위에 커널 함수를 적용하여, 전체 밀도 함수를 구성하며, 주로 가우시안(Gaussian) 커널이 사용
    • 밴드위스를 설정하여 커널 함수의 너비를 결정하며, 밴드위스가 크면 밀도가 매끄럽고, 작으면 세부적인 변동을 더 많이 반영

 

Recurrent Neural Network (RNN)

  • RNN은 순차적 데이터 또는 시계열 데이터를 처리하는 데 사용되는 신경망 모델
    • 이전 상태의 정보를 현재 상태에 전달하여, 데이터의 시간적 의존성을 학습할 수 있음
      • 이전 시간 단계의 정보를 기억하여, 장기 의존성(long-term dependencies)을 학습할 수 있음
    • 입력과 이전 상태의 출력을 함께 사용하여 현재 출력을 생성하는 순환 구조를 가지고 있으며 이를 통해 시계열 데이터의 시간적 패턴을 효과적으로 학습
    • 시간적 순서가 중요한 데이터에 적합하며, 자연어 처리, 음성 인식 등에서 뛰어난 성능을 발휘

 

3. Experimental Result

Dataset

  • 동물 이동경로 데이터
    • Movebank에서 수집한 동물 위치 기록 데이터 사용
    • Long-billed curlew 이동 데이터를 사용
      • Long-billed curlew 64마리의 이동 경로가 포함되어 있음
      • 2013년부터 2019년까지 6년 동안 수집
      • ARGOS 위도, ARGOS 경도, 타임스탬프, 태그 로컬 식별자로 구성
      • 148,983개의 위치정보가 존재하고, 이상치는 없음

 

Evaluation Metric

  • 결측치 보간법의 성능을 평가하기 위해 Mean Absolute Percentage Error (MAPE)와 Root Mean Squared Error (RMSE)를 사용
  • 동물 이동 예측 성능을 평가하기 위해 Mean Squared Error (MSE), Structural Similarity Index Measure (SSIM), Gaussian Mixture Centroid Distance를 사용
    • MSE: 실제 이미지와 예측 이미지 간의 평균 제곱 차이를 측정
    • SSIM: 두 이미지 간의 유사성을 측정
    • Gaussian Mixture Centroid Distance: 예측된 이동의 중심을 계산하여 실제 이동과의 거리를 측정

 

Result

  • 결측치 보간법 성능 비교
    • 랜덤 포레스트 방법은 대부분의 경우에서 우수한 성능을 보였으며, 평균 정확도가 가장 높았음

 

  • 동물 이동 예측 성능 분석
    • 예측 모델은 대부분의 경우에서 우수한 성능을 보임

 

  • 벡터 자기 회귀 모델(VAR)과의 성능 비교
    • 대부분의 경우에서 VAR보다 뛰어난 성능을 보임
    • 단기 관찰 기간의 이동 패턴을 사용하여 훈련된 모델이 더 나은 성능을 보임
    • 제안 모델은 장기 및 단기 예측을 모두 커버할 수 있으며, 이주와 같은 계절적 이동 뿐만 아니라 포식 및 방황과 같은 일반적인 이동도 예측할 수 있음

 

  • 동물 이동 예측 성능 분석
    • 동물들이 정적인 이동을 보일 때, 모델은 90km 이하의 오차 범위 내에서 안정적인 예측 성능을 보임

 

4. Conclusion

  • 해당 논문에서는 RNN을 사용하여 동물 이동을 예측하는 새로운 접근 방식을 제안함
    • 랜덤 포레스트를 사용하여 누락된 데이터를 보간
      • 지형과 날씨 같은 환경적 특징 및 동물의 이동 특징을 기반으로 함
    • 다양한 단위로 데이터를 그룹화하고 동물의 이동 경향을 나타내는 이동 밀도 이미지 시퀀스를 생성하고 이를 사용하여 RNN을 학습
    • 다양한 실험을 통하여 모델의 성능을 평가하였으며, 제안하는 모델이 동물 이동 예측에 매우 효과적임을 확인