본문 바로가기
[수학]/잡다구리

Mathematics | 왜 하필 Borel Set일까?

by 하우론 2019. 3. 21.

 

Reference

https://jjycjnmath.tistory.com/150

https://www.slideshare.net/ssuser7e10e4/wasserstein-gan-i

http://iseulbee.tistory.com/attachment/cfile21.uf@213DA24658C01012058757.pdf

https://en.wikipedia.org/wiki/Countable_set

 

WGAN에서 확률 분포 간의 거리를 정의하는 부분에서 Borel Set이라는게 나온다. "확률을 계산할 수 있는 집합" 정도로만 이해하고 논문을 읽어도 문제는 없지만 임성빈 박사님의 슬라이드를 보고 이 부분이 좀 재밌을 것 같아서 파봤다. 생각보다 어려운 부분이 많아서 잊어버리기 전에 글로 기록해 놔야 겠다.

 


열린집합(open set)

 

<우리가 가야할 길>

 

Borel Set을 이해하려면 열린집합(open set)을 이해해야 하고 열린집합을 이해하려면 위상공간(topological space)를 이해해야 한다. 열린집합이라 하면 실수 위의 열린구간 정도를 생각할 수 있겠지만 이건 좁은 의미의 열린집합이다. 정확한 열린집합의 정의에 의하면 열린구간도 열린집합이 아닐 수 있고 닫힌구간도 열린집합일 수 있다. 심지어 열린닫힌집합(clopen set)일 수도 있다! 왜 "열린"집합일까? 왜 열린집합으로 정의를 시작할까?에 대한 답변은

 

정주영님의 블로그

 

에 잘 쓰여 있다. 열린집합, 위상공간의 정의를 위상수학의 역사와 함께 잘 설명해주셨다. 이 분 보다 잘 설명한 글이 없다. 열린집합의 정의가 제대로 잡히지 않았다면 한 번 보고 오길 추천한다.

요약을 살짝 해보면

한 줄 요약: 실수 선 위에서 연속을 정의할 때 열린 구간이 사용 되는데, 정의역/공역이 실수가 아니라 임의의 집합이면 열린 구간에 상응하는 개념이 필요함!

 

어떤 집합 $X$가 있을 때 다음 공리를 이용해 위상공간 $(X, \mathscr{T})$를 정의할 수 있고 여기서 $\mathscr{T}$를 위상이라 하며 $X$의 부분집합들의 집합이다. 여기서 $\mathscr{T}$의 원소들이 열린집합이 된다.

1. $\emptyset, X \in \mathscr{T}$

2. $A_1, A_2, \cdots \in \mathscr{T}$이면 $\bigcup\limits_{i=1}^{\infty} A_i \in \mathscr{T}$

3. $A_1, A_2, \cdots, A_n \in \mathscr{T}$이면 $\bigcap\limits_{i=1}^{n} A_i \in \mathscr{T}$

 

정의는 알았지만 왜 굳이 이렇게 정의를 했는가에 대한 의문점이 생기는데 글에서는 이를 위상수학의 발달 과정으로써 설명을 한다.

 

길이(distance) → 거리(metric) → 거리공간(metric space) → 위상공간(topological space)

1.  태초에는 두 점 사이의 "길이(distance)"부터 시작했다. 하지만 두 점 뿐만 아니라, 분포, 집합 등등의 길이도 정의할 필요성이 생겼다.

2. "길이"의 상위 개념으로 길이의 원초적인 성질을 모아 "거리(metric)"이라는 것을 정의한다.

3. 이제 어떤 집합의 원소들을 다양한 "거리"를 이용해 멀고 가까움을 측정할 수 있게 되었다. 특정 거리(metric)로 측정 가능한 공간을 "거리공간(metric space)"로 정의한다.

4. 거리공간에서 이제 우리가 아는 열린집합을 정의할 수 있게 되었다. (단순히 경계를 포함하지 않는 집합)

5. 하지만 어떤 공간에서도 성립하는 불변량을 사용하려면 "거리가 없는 공간"에서도 성질을 유지해야 할 것이다.

6. 그래서 만들어진 공간이 "위상공간(topological space)"이며 거리공간의 열린집합들의 성질을 모아 위상공간에서의 열린집합들을 정의하게 된다. 

 

참고로 임의의 열린집합의 역상이 열린집합인 함수는 연속함수이다. 이는 거리공간에서 $\epsilon-\delta$ 논법을 이용한 정의와 동치이지만 거리함수의 정의가 필요없다는 특징이 있다. 수학 초심자임에도 감히 예상해보건데, 위상수학은 거리함수가 없는 곳에서도 함수의 연속성을 논하기 위해 만들어진 학문이 아닌가 싶다.

가장 이해가 안 됐던게

같은 집합이어도 정의한 위상에 따라 열린집합인지 닫힌집합인지 달라진다는 것이다. 거리공간에서 생각해보면

반열린구간 $[0, 6)$은 전체집합이 $\mathbb{R}$일 때에는 열린집합도 닫힌집합도 아니지만 전체집합이 $[0, 6)$이 되면 열린닫힌집합이 된다.

이거 이해하느라 시간을 가장 많이 쓴 것 같다. 이해하니 마음이 편해졌다.

 


$\sigma$-field

 

$\sigma$-field를 이해하기 전에 집합의 크기 먼저 짚고 가자.

 

집합은 개수의 유무한에 따라 유한/무한으로 나눌 수 있고 셀 수 있냐/없냐에 따라 가산/비가산으로 나눌 수 있다. 여기서 집합이 셀 수 있다는 것은 자연수 집합 $\mathbb{N}$과 일대일 대응이 된다는 뜻이다 자연수 집합 $\mathbb{N}$으로 보내는(map) 일대일대응 함수가 존재한다는 뜻이다. 예를 들어 $\mathbb{N, Z, Q}$는 가산집합이며, $\mathbb{R, C, I}$는 비가산 집합이다. 증명은 구글에 조금만 검색하면 찾을 수 있으니 생략하도록 하겠다.

 

표로 정리하면 대략 아래와 같다.

 유한(finite)  무한(infinite)
 가산이하(at most countable) 가산무한(countable infinite)
가부번(denumerable)
비가산(uncountable) 

field/algebra

$\sigma$-field를 정의하기에 앞서 field를 먼저 알아야 한다.

 

어떤 집합 $X$에 대하여 field 또는 algebra $\mathcal{F}$($\in \mathcal{P(P(}X))\backslash \{\emptyset\}$; $X$의 부분집합의 모임)는 다음의 세 가지 성질을 만족해야 한다.

1. $\emptyset, X \in \mathcal{F}$

2. $A \subseteq X$인 $A$에 대해 $A \in \mathcal{F}$이면 $X-A \in \mathcal{F}$

3. $A_1, A_2, \cdots, A_n \in \mathcal{F}$이면 $\bigcup\limits_{i=1}^{n} A_i \in \mathcal{F}$

여기서 $\mathcal{P} (\cdot)$는 멱집합(power set)이다. 그리고 3의 조건은 

 

그리고 다음을 만족하는 것과 필요충분조건이다. 밑의 조건들이 더 간단하다. 고등학교 때 집합 문제 풀면서 많이 본 것 같다.

1. $X \in \mathcal{F}$

2. $A \in \mathcal{F}$이면 $A^C \in \mathcal{F}$

3. $A, B \in \mathcal{F}$이면 $A \cup B \in \mathcal{F}$

예를 들면, 집합 $\mathbb{R}$이 있을 때 $\{ \emptyset, \mathbb{R} \}$은 field이다. 하지만 $\{ \emptyset, \{ 1\}, \mathbb{R} \}$은 $\mathbb{R} - \{ 1\} \notin \mathcal{F}$이므로 field가 아니다.

$\sigma$-field/algebra

$\sigma$-field는 위의 field의 조건 중 3번을 가산 번의 합집합으로 수정하면 된다.

1. $\emptyset, X \in \mathcal{F}$

2. $A \subseteq X$인 $A$에 대해 $A \in \mathcal{F}$이면 $X-A \in \mathcal{F}$

3. $A_1, A_2, \cdots \in \mathcal{F}$이면 $\bigcup\limits_{i=1}^{\color{\red} \infty} A_i \in \mathcal{F}$

참고로 가산 번의 합집합은 다음과 같이 임의의 닫힌 구간으로 열린 구간을 만들 수 있게 해준다.

$$\bigcup_{n=1}^{\infty} \left(0, 1-{1 \over n} \right] = (0, 1)$$

위키에 나온 $\sigma$-field의 정의는 아예 이해할 수가 없다. ($\sigma$-field를 한 번만 직접 만들어보면 어느정도 이해가 간다.) 여기서 만족하자. 이렇게 정의된 $\sigma$-field 위에서 확률 등의 measure들이 정의될 수 있게 된다. 왜 굳이 여기서 정의를 하는지 되게 궁금했었는데 확률의 덧셈법칙, 여사건의 확률 등을 생각해보면 어느 정도 이해가 되긴 한다.

 

+) 왜 무한 번이 아니고 가산 번인가? 비가산 번의 합집합까지 허용한다면 합집합을 이용하여 $\mathbb{R} = \bigcup_{x\in\mathbb{R}} \{x\}$을 구성할 수 있고, 리만 적분 불가능한 함수를 적분하기 위한 르베그 적분의 토대가 무너지게 된다. $\int \mathbb{1}_\mathbb{R} = 0$이 되는 등, 의미 없는 수 체계가 되어 버린다.

 

위상공간의 정의를 다시 한 번 보자.

1. $\emptyset, X \in \mathscr{T}$

2. $A_1, A_2, \cdots \in \mathscr{T}$이면 $\bigcup\limits_{i=1}^{\infty} A_i \in \mathscr{T}$

3. $A_1, A_2, \cdots, A_n \in \mathscr{T}$이면 $\bigcap\limits_{i=1}^{n} A_i \in \mathscr{T}$

 

 

 

 

 

 

1, 2번 조건이 $\sigma$-field의 1, 3번 조건과 비슷한 것을 볼 수 있다. 이를 머릿속에 넣어 놓고 다음으로 넘어가자.

 


 

 

 

 

 

 

 

Borel Set

대망의 borel set이다. 열린집합과 $\sigma$-field의 개념을 섞으면 된다. 위상공간(열린집합들을 모두 포함)에서 measure를 정의($\sigma$-field의 목적)할 수 있게 해준다.

위상공간 $(X, \mathscr{T})$ 위의 열린집합(닫힌집합이라고 해도 된다.)들을 포함하는 가장 작은 $\sigma$-field를 Borel-algebra라고 하며, 이 집합의 원소를 Borel set이라 한다.

"가장 작은"이라면 "크기(cardinality)가 가장 작은"을 의미할 것이다.

 

예를 하나만 들어보자. 위상공간 $(X, \mathscr{T})$가 다음과 같이 주어졌을 때, Borel-algebra $\mathscr{B}$는 다음과 같다.

 

$$X = \{ 1, 2, 3, 4 \} \\ \mathscr{T} = \{ \emptyset, \{ 1 \}, \{ 1, 2 \}, \{ 1, 2, 3, 4 \} \} \\ \mathscr{B} = \{ \emptyset, \{ 1 \}, \{ 2 \}, \{ 1, 2 \}, \{ 3, 4 \}, \{ 1, 3, 4 \}, \{ 2, 3, 4 \}, \{ 1, 2, 3, 4 \} \}$$

 

$\mathscr{B}$는 $\mathscr{T}$의 원소를 다 포함하면서 가산 번의 합집합과 여집합에 닫혀 있어야 한다.

1. $\{ 1 \}, \{ 1, 2 \}$의 여집합인 $\{ 3, 4 \}, \{ 2, 3, 4 \}$가 들어갔다.

2. $\{ 1 \}$과 $\{ 3, 4 \}$의 합집합인 $\{ 1, 3, 4 \}$가 들어갔다.

3. $\{ 1, 3, 4 \}$의 여집합인 $\{ 2 \}$가 들어갔다.

4. 이 집합은 가산 번의 합집합과 여집합에 닫혀 있고 위상의 원소들을 모두 포함하는 집합 중 가장 작은 집합이다. 따라서 이 집합은 Borel Set이 된다.

이로서 위상공간에서 measure를 정의할 수 있게 됐다.