Processing math: 100%
본문 바로가기
수학

Mathematics | 왜 하필 Borel Set일까?

by 하우론 2019. 3. 21.

 

Reference

https://jjycjnmath.tistory.com/150

https://www.slideshare.net/ssuser7e10e4/wasserstein-gan-i

http://iseulbee.tistory.com/attachment/cfile21.uf@213DA24658C01012058757.pdf

https://en.wikipedia.org/wiki/Countable_set

 

WGAN에서 확률 분포 간의 거리를 정의하는 부분에서 Borel Set이라는게 나온다. "확률을 계산할 수 있는 집합" 정도로만 이해하고 논문을 읽어도 문제는 없지만 임성빈 박사님의 슬라이드를 보고 이 부분이 좀 재밌을 것 같아서 파봤다. 생각보다 어려운 부분이 많아서 잊어버리기 전에 글로 기록해 놔야 겠다.

 


열린집합(open set)

 

<우리가 가야할 길>

 

Borel Set을 이해하려면 열린집합(open set)을 이해해야 하고 열린집합을 이해하려면 위상공간(topological space)를 이해해야 한다. 열린집합이라 하면 실수 위의 열린구간 정도를 생각할 수 있겠지만 이건 좁은 의미의 열린집합이다. 정확한 열린집합의 정의에 의하면 열린구간도 열린집합이 아닐 수 있고 닫힌구간도 열린집합일 수 있다. 심지어 열린닫힌집합(clopen set)일 수도 있다! 왜 "열린"집합일까? 왜 열린집합으로 정의를 시작할까?에 대한 답변은

 

정주영님의 블로그

 

에 잘 쓰여 있다. 열린집합, 위상공간의 정의를 위상수학의 역사와 함께 잘 설명해주셨다. 이 분 보다 잘 설명한 글이 없다. 열린집합의 정의가 제대로 잡히지 않았다면 한 번 보고 오길 추천한다.

요약을 살짝 해보면

한 줄 요약: 실수 선 위에서 연속을 정의할 때 열린 구간이 사용 되는데, 정의역/공역이 실수가 아니라 임의의 집합이면 열린 구간에 상응하는 개념이 필요함!

 

어떤 집합 X가 있을 때 다음 공리를 이용해 위상공간 (X,T)를 정의할 수 있고 여기서 T를 위상이라 하며 X의 부분집합들의 집합이다. 여기서 T의 원소들이 열린집합이 된다.

1. ,XT

2. A1,A2,T이면 i=1AiT

3. A1,A2,,AnT이면 ni=1AiT

 

정의는 알았지만 왜 굳이 이렇게 정의를 했는가에 대한 의문점이 생기는데 글에서는 이를 위상수학의 발달 과정으로써 설명을 한다.

 

길이(distance) → 거리(metric) → 거리공간(metric space) → 위상공간(topological space)

1.  태초에는 두 점 사이의 "길이(distance)"부터 시작했다. 하지만 두 점 뿐만 아니라, 분포, 집합 등등의 길이도 정의할 필요성이 생겼다.

2. "길이"의 상위 개념으로 길이의 원초적인 성질을 모아 "거리(metric)"이라는 것을 정의한다.

3. 이제 어떤 집합의 원소들을 다양한 "거리"를 이용해 멀고 가까움을 측정할 수 있게 되었다. 특정 거리(metric)로 측정 가능한 공간을 "거리공간(metric space)"로 정의한다.

4. 거리공간에서 이제 우리가 아는 열린집합을 정의할 수 있게 되었다. (단순히 경계를 포함하지 않는 집합)

5. 하지만 어떤 공간에서도 성립하는 불변량을 사용하려면 "거리가 없는 공간"에서도 성질을 유지해야 할 것이다.

6. 그래서 만들어진 공간이 "위상공간(topological space)"이며 거리공간의 열린집합들의 성질을 모아 위상공간에서의 열린집합들을 정의하게 된다. 

 

참고로 임의의 열린집합의 역상이 열린집합인 함수는 연속함수이다. 이는 거리공간에서 ϵδ 논법을 이용한 정의와 동치이지만 거리함수의 정의가 필요없다는 특징이 있다. 수학 초심자임에도 감히 예상해보건데, 위상수학은 거리함수가 없는 곳에서도 함수의 연속성을 논하기 위해 만들어진 학문이 아닌가 싶다.

가장 이해가 안 됐던게

같은 집합이어도 정의한 위상에 따라 열린집합인지 닫힌집합인지 달라진다는 것이다. 거리공간에서 생각해보면

반열린구간 [0,6)은 전체집합이 R일 때에는 열린집합도 닫힌집합도 아니지만 전체집합이 [0,6)이 되면 열린닫힌집합이 된다.

이거 이해하느라 시간을 가장 많이 쓴 것 같다. 이해하니 마음이 편해졌다.

 


σ-field

 

σ-field를 이해하기 전에 집합의 크기 먼저 짚고 가자.

 

집합은 개수의 유무한에 따라 유한/무한으로 나눌 수 있고 셀 수 있냐/없냐에 따라 가산/비가산으로 나눌 수 있다. 여기서 집합이 셀 수 있다는 것은 자연수 집합 N과 일대일 대응이 된다는 뜻이다 자연수 집합 N으로 보내는(map) 일대일대응 함수가 존재한다는 뜻이다. 예를 들어 N,Z,Q는 가산집합이며, R,C,I는 비가산 집합이다. 증명은 구글에 조금만 검색하면 찾을 수 있으니 생략하도록 하겠다.

 

표로 정리하면 대략 아래와 같다.

 유한(finite)  무한(infinite)
 가산이하(at most countable) 가산무한(countable infinite)
가부번(denumerable)
비가산(uncountable) 

field/algebra

σ-field를 정의하기에 앞서 field를 먼저 알아야 한다.

 

어떤 집합 X에 대하여 field 또는 algebra F(P(P(X)){}; X의 부분집합의 모임)는 다음의 세 가지 성질을 만족해야 한다.

1. ,XF

2. AXA에 대해 AF이면 XAF

3. A1,A2,,AnF이면 ni=1AiF

여기서 P()멱집합(power set)이다. 그리고 3의 조건은 

 

그리고 다음을 만족하는 것과 필요충분조건이다. 밑의 조건들이 더 간단하다. 고등학교 때 집합 문제 풀면서 많이 본 것 같다.

1. XF

2. AF이면 ACF

3. A,BF이면 ABF

예를 들면, 집합 R이 있을 때 {,R}은 field이다. 하지만 {,{1},R}R{1}F이므로 field가 아니다.

σ-field/algebra

σ-field는 위의 field의 조건 중 3번을 가산 번의 합집합으로 수정하면 된다.

1. ,XF

2. AXA에 대해 AF이면 XAF

3. A1,A2,F이면 i=1AiF

참고로 가산 번의 합집합은 다음과 같이 임의의 닫힌 구간으로 열린 구간을 만들 수 있게 해준다.

n=1(0,11n]=(0,1)

위키에 나온 σ-field의 정의는 아예 이해할 수가 없다. (σ-field를 한 번만 직접 만들어보면 어느정도 이해가 간다.) 여기서 만족하자. 이렇게 정의된 σ-field 위에서 확률 등의 measure들이 정의될 수 있게 된다. 왜 굳이 여기서 정의를 하는지 되게 궁금했었는데 확률의 덧셈법칙, 여사건의 확률 등을 생각해보면 어느 정도 이해가 되긴 한다.

 

+) 왜 무한 번이 아니고 가산 번인가? 비가산 번의 합집합까지 허용한다면 합집합을 이용하여 R=xR{x}을 구성할 수 있고, 리만 적분 불가능한 함수를 적분하기 위한 르베그 적분의 토대가 무너지게 된다. 1R=0이 되는 등, 의미 없는 수 체계가 되어 버린다.

 

위상공간의 정의를 다시 한 번 보자.

1. ,XT

2. A1,A2,T이면 i=1AiT

3. A1,A2,,AnT이면 ni=1AiT

 

 

 

 

 

 

1, 2번 조건이 σ-field의 1, 3번 조건과 비슷한 것을 볼 수 있다. 이를 머릿속에 넣어 놓고 다음으로 넘어가자.

 


 

 

 

 

 

 

 

Borel Set

대망의 borel set이다. 열린집합과 σ-field의 개념을 섞으면 된다. 위상공간(열린집합들을 모두 포함)에서 measure를 정의(σ-field의 목적)할 수 있게 해준다.

위상공간 (X,T) 위의 열린집합(닫힌집합이라고 해도 된다.)들을 포함하는 가장 작은 σ-field를 Borel-algebra라고 하며, 이 집합의 원소를 Borel set이라 한다.

"가장 작은"이라면 "크기(cardinality)가 가장 작은"을 의미할 것이다.

 

예를 하나만 들어보자. 위상공간 (X,T)가 다음과 같이 주어졌을 때, Borel-algebra B는 다음과 같다.

 

X={1,2,3,4}T={,{1},{1,2},{1,2,3,4}}B={,{1},{2},{1,2},{3,4},{1,3,4},{2,3,4},{1,2,3,4}}

 

BT의 원소를 다 포함하면서 가산 번의 합집합과 여집합에 닫혀 있어야 한다.

1. {1},{1,2}의 여집합인 {3,4},{2,3,4}가 들어갔다.

2. {1}{3,4}의 합집합인 {1,3,4}가 들어갔다.

3. {1,3,4}의 여집합인 {2}가 들어갔다.

4. 이 집합은 가산 번의 합집합과 여집합에 닫혀 있고 위상의 원소들을 모두 포함하는 집합 중 가장 작은 집합이다. 따라서 이 집합은 Borel Set이 된다.

이로서 위상공간에서 measure를 정의할 수 있게 됐다.