본문 바로가기

AI/머신러닝&딥러닝

기본 확률 통계

Random Variable(랜덤 변수) 와 Probability Distribution(확률 분포)

Random Variable(랜덤 변수)

- 어떤 변수 x 가 x라는 값을 가질 확률

 

Probability Distribution(확률 분포)

- 입력: 확률 변수 x

- 출력: x가 각 값에 해당 될 때에 대한 확률 값

- 확률 분포에는 두가지 종류가 있는데 이산적인 값을 갖는 확률 분포(Discreate Probability Distribution)와 연속적인 값을 갖는 확률 분포(Continuous Probability Distribution)가 있다.

 


Discreate Probability Distribution

이산적인 값을 갖는 확률 분포

- 확률 값의 총 합은 1

  예) 주사위의 경우 던지면 6개 중의 숫자 중 하나가 나오고, 6가지 각 숫자가 나올 확율의 합은 1이 된다.

각 확율 값은 0~1 사이가 된다.

 

Probability Mass Function(확률 질량 함수, PMF)

3이 나올 확율 값은 6분의 1 이란 것을 알 수 있음

 


Continuous Probability Distribution

연속적인 값을 갖는 확률 분포

 

Probability Density Function(확률 밀도 함수, PDF)

- 주사위가 정육면체가 아닌 원이라 가정한다면

- 면적의 합은 1

- 함수 값은 1보다 클 수 있다. 다만 0보다 작을 수는 없다.

주사위가 원이라 가정한다면 거의 무한한 연속적인 값이 나올 수 있다.

 

 

- 연속 확률 변수의 경우, 어떤 샘플이 주어졌을 때 확율 값을 알 수 없다.

  (넓이가 확율이기 때문에, 넓이를 계산할 수 있는 범위가 주어져야 함)

원인 주사위의 값이 몇부터 몇까지 나올 확율 밀도를 알 수 있다.

 


Joint Probability

- 결합 분포

- 두개 이상의 랜덤 변수가 결합이 되었을 때 확율 분포

 

좌표 가운데의 점들이 모여있는 공간이 결합 분포


Conditional Probability

- 조건부 확률 분포

- x가 주어졌을 때 y의 확율 값

- x라는 데이터가 주어졌을 때 y의 확율은? 

- MNIST 분류에서 x라는 이미지가 주어졌을 때 y는 어떤 클래스(라벨값)인가?

두 수식은 같음

 


Bayes Theorem (베이즈 정리)

- 데이터 D가 주어졌을 때, 가설 h의 확률

- 가설이 있을 때 데이터의 확율로 뒤집어서 생각할 수 있다.

 


Marginal Distribution

- 결합 분포에서 한 변수를 적분한 형태

 

 


Expectation and Sampling (기대값)

- f(x)라는 함수가 있을 때 P(x)라는 분포를 가진 샘플링 Ex를 넣었을 때 기대 값

- P(x)에서 샘플링한 x를 가지고 f(x)를 구해서 평균 낸 것

- 확률 값으로 가중평균을 낸 것

 

이를 펼치면

 

- 주사위에 대한 기대값은?

주사위의 기대값은 3.5로 나온다.

 

 


김기현 님의 딥러닝 강의를 수강하며 정리한 내용입니다.

출처: fastcampus

반응형

'AI > 머신러닝&딥러닝' 카테고리의 다른 글

Hidden Representations  (0) 2022.06.21
AutoEncoder  (0) 2022.06.20
One-hot Encoding  (0) 2022.06.20
feature  (0) 2022.06.20
EDA: Exploratory Data Analysis  (0) 2022.05.31