Community

[ '설마' 하는 것들이 발생할 확률 ] 보험에서는 손해를 측정할 때 빈도와 심도로 나눈다. 얼마나 자주 발생할지, 그리고 발생하면 얼마나 큰 피해를 줄지. 자동차 사고와 같이 주기적으로 발생해서

[ '설마' 하는 것들이 발생할 확률 ] 보험에서는 손해를 측정할 때 빈도와 심도로 나눈다. 얼마나 자주 발생할지, 그리고 발생하면 얼마나 큰 피해를 줄지. 자동차 사고와 같이 주기적으로 발생해서 손해의 추이가 일정한 대상은 관리하기 쉽다. 하지만 대규모 홍수나 지진이 난다면? 만약 그렇다면 피해가 얼마나 크게 나고, 발생 확률은 어느정도인가? 이런 것을 모델링 하기 위한 방법이 extremes statistics, 즉 극단치 이론이다. 홍수의 return period, 대공황 발생 확률 등 '익스트림'한 경우의 확률을 계산할 때 활용된다. - 극단치 이론이란? Value At Risk 모형 중 하나로, 정규분포에서는 캡쳐하기 힘든 양 극단에 위치한 확률을 모델링 하기 위한 방법이다. 모든 데이터를 다 활용하지 않고 극단의 것들만 필터하여 사용한다. - 극단에 있는 데이터 필터링하기 '극단'이라는 것을 정의하기 위해서는 기준이 필요하다. 극단에 있는 데이터를 필터하기 위한 방법에는 크게 두 가지가 있다. 1. Block maxima 데이터를 일정 주기로 구분짓고 각 기간 내에 있는 데이터 포인트 중 max만을 선택. 예를 들어 매년 최고 강수량만 고려할 수도 있다. 2. Peaks over threshold 말 그대로 임계치를 정해서 해당 임계치 이상 넘어가는 데이터만을 모델링 한다. - 그 이외의 특징들 극단치 이론은 매우 적은 양의 데이터를 갖고 모델링하기 때문에 임계치나 분포의 파라미터를 어떻게 설정하는지에 따라 결과 값이 매우 달라진다. 따라서 loss function을 이용한 최적화는 물론, back-testing을 통한 검증 과정이 필수. https://hooman34.github.io/Notes/extreme%20value%20statistics/peaks%20over%20threshold/statistics/2022/01/28/Modeling_extreme_cases_with_peaks_over_threshold.html

알림

알림이 없습니다