1 life 2 live

[통계 공부] 메타코드M - 데이터 분석 (통계 기초의 모든것) 3장-2 본문

빅데이터

[통계 공부] 메타코드M - 데이터 분석 (통계 기초의 모든것) 3장-2

대희투 2024. 1. 25. 10:32

3 - 확률과 확률변수

4. 확률과 확률변수: 확률변수

1. 확률변수(random variable)

- 표본공간에서 정의된 실수값 함수

- 실수가 아니면 확률분포함수 정의할 수 없음

- 일정 확률을 가지고 발생하는 사건에 수치를 부여한 것

- 변수가 어떤 값을 취하는 지가 확률적으로 결정된다

- 통계적 규칙성은 있다고 봄

 

2. 확률 분포

확률변수의 값과, 확률을 대응시켜 표, 그래프, 함수로 표현한 것

 

4. 확률과 확률변수: 이산/연속확률변수

 

1. 이산확률변수

- 이산표본공간에서 정의된 확률변수의 값이 유한 혹은 countably infinite

- 확률질량함수

: 이산확률변수 X의 값 x1, , xn의 각 확률을 대응

ex) 동전 던지기

 

2. 연속확률변수

- 특정 구간 내의 모든 값을 취하는 확률변수

- 확률변수의 값이 무한개이며 셀 수 없음

- 확률밀도함수(Probability density function)

: 확률변수 X가 어떤 구간 [l, u]의 모든 값을 취하고 이 구간에서의 함수 f(x)

확률: 구간을 적분한 넓이

cf) 누적 분포 함수(cumulative distribution function, CDF)

CDF를 미분한 것이 확률밀도함수이다.(정규분포 가정)

확률밀도함수에서 확률로 접근하기 위해서는 확률을 y축에 가지고 있는 CDF에서 구해야 한다.

확률밀도함수의 값이 확률은 아니더라도, 데이터의 분포를 보기 편리하기 때문에 사용.

 

 


아래 사이트에서 동영상을 보고 공부 중이다.

https://mcode.co.kr/

 

 

728x90
반응형
Comments