Ergodicity란 무엇인가?

Ergodicity를 이해하기 위해서는 우선 앙상블(ensemble)을 이해해야 한다. 관련글은 블로그의 이전 글을 참고하기 바란다['Statistical Ensemble이란 무엇인가?']. Ergodicity의 개념은 간단한 것일지라도, 이 문제는 통계적 분석을 할 때 우선적으로 고려돼야하는 아주 중요한 개념이다.

복잡한 설명 없이, 간단한 예를 통해 ergodictiy를 이해해보자. 우리가 최근 10년간 한국에서 제일 잘팔린 치킨 브랜드를 알고 싶어한다고 치자. 우리가 활용할 수 있는 데이터는 다음의 두 가지가 있다. 첫번째, 영희네 가족이 지난 10년간 쌓아온 5000회의 주문내역. 두번째, 10년 간 한국 국민들이 주문한 내역 중 임의로 샘플링된  5000개. 둘 중 어떤 것을 골라 분석해야 모집단 전체의 통계치에 근접한 추측이 가능할까?

통계를 전혀 모르는 초등학생에게 물어보더라도, 그 사람이 정상적인 지능을 가진 인간이라면 두번째 데이터셋을 고를 것이다. 이유에 대해서는 굳이 설명 않겠다. 대신에 우리는 두 가지 데이터셋이 어떻게 다른지를 살펴볼 것이다. 우선, 두가지 경우 모두 시행 횟수는 오천번으로 동일하다. 하지만 첫번째의 경우는 한사람이 주문한 내역인 반면, 두번째의 경우는 임의로 선택된 오천명이 주문한 정보이다.

위의 상황을 통계학적인 용어로 바뀌 말하자면, 첫번째 경우는 단일 시스템에 대한 시간평균(time-averaged) 거동을 살펴볼 수 있는 자료며(= '영희내 집 치킨 주문 행태, 그 10년간의 기록'), 두번째 경우는 치킨 구매자 앙상블의 다양한 정보를 활용해 앙상블평균(ensemble-averaged) 거동을 살펴볼 수 있는 자료라고 할 수 있다.

내가 예로 든 위의 경우는 앞서 언급 했다시피 두가지 분석 결과가 서로 다를 가능성이 짙다. 분석하려는 대상이 앙상블평균거동에 훨씬 가깝고, 시간평균거동으로 분석하면 특정 앙상블 멤버의 예외성이 두드러지게 발현되기 때문이다. 하지만, 개 중에는 시간평균거동과 앙상블평균거동이 동일한 양상을 나타내는 경우도 있다. 다음의 예를 살펴보자.

어떤 소설가가 있다. 이 사람은 동시에 여려가지 작품을 집필한다. 이 사람과 만나 현재 집필 중인 소설들의 내용에 대해 인터뷰를 했더니, 네 가지 소설 모두 한국 근대사를 배경으로 하는 역사소설이었다. 만약, 내가 이러한 정보를 근거로 해당 소설가가 (현재 집필중인 작품들을 제외하고) 앞으로 출판할 20권의 책 중 대다수가 역사물 일 것(혹은, 10년 뒤에 이 사람이 작업중인 네 개 소설도 역사소설 인 것)이라고 추측한다면, 이러한 추측은 꽤 타당하지 않을까?

이와 같이 어떠한 시스템의 시간평균과 앙상블평균(혹은 공간 평균)이 동일한 양상을 보일 때, 우리는 그 시스템의 갖는 어떠한 변환과정이  'ergodic 하다'라거나 'ergodic process 이다'라고 일컬는다.

통계역학에서 이러한 성질은 아주 큰 이점을 가져다 준다. 통계역학은 대부분 매우 큰 계에 대해 다루게 되는데, 이 경우 전체를 앙상블 평균을 내지 않고 시간 평균을 내 그 평균값이 충분히 수렴 했을 때 그 값을 이용할 수 있다.

Comments

Popular posts from this blog

비리얼(virial)이란 무엇인가?

분자동역학(Molecular Dynamics)에서 Time Integration의 개념.

Reciprocal lattice란 무엇인가?