본문 바로가기
빅데이터 & 통계공부

통계 기초 상식 4 - 확률을 이해해보자

by 규딩코딩 2023. 8. 13.

4강. 확률을 이해해보자

확률이란

: 불확실한 것을 재는 것으로, 0에서 1까지의 값을 가지는데 그 값이 커질수록 일어날 가능성이 높아진다.

확률의 종류

1. 선험적 확률

: 미리 경험하기 전에 알 수 있는 확률(ex : 동전을 던졌을 때, 앞면이 나올 확률)

  • 미리 알 수 있는 확률실제로 일어난 확률 이 다르면 문제 및 차이가 나는 원인을 해석하여 문제를 해결해야한다.

2. 경험적 확률

: 오랜 기간에 걸쳐서 동일한 상황이나 조건하에서 어떤 사건이 일어나는 상대적인 비율로서 확률을 해석하는 것 (ex : 실제 햇무리나 달무리가 졌을 때 강수 확률은 70 %)

  • 조사한 자료가 많을수록 경험적 확률의 신뢰성이 높아짐.

* 벤포드 법칙

: 주어진 데이터 집합에서 숫자의 첫 자리 숫자(1부터 9까지의 숫자)들의 분포는 특정한 패턴을 따른다. 특히, 작은 숫자(1, 2, 3)로 시작하는 숫자가 큰 숫자(7, 8, 9)로 시작하는 숫자보다 더 많이 나타날 가능성이 높다.
이러한 법칙은 자연 현상이나 여러 종류의 데이터 집합에서 발견되며, 재정 회계, 과학 연구, 경제 분석 등 다양한 분야에서 활용될 수 있습니다. 예를 들어, 회계 데이터나 센서 측정치 등에서도 벤포드 법칙이 적용되는 경우가 많습니다. 이런 이유로 벤포드 법칙은 데이터 조작이나 이상치 탐지 등에도 사용될 수 있는 유용한 도구로 간주됩니다. (출처 : chatGPT, 230813)

3. 주관적 확률

: 한 개인이 어떤 사건이 일어날 것이라고 믿는 정도가 곧 그 사건의 확률이 되는 것

  • 주관적 확률에 의해 정의된 확률은 대상이 다양하므로 확률을 해석하는 데 있어서 주의가 필요함

확률 상식

대수의 법칙(Law of Large Numbers)

: 반복되는 독립적인 실험 또는 시행의 결과가 많아질수록, 그 결과의 평균이 확률적으로 특정 값에 가까워지는 원리를 설명하는 개념
약한 LLN: 약한 LLN은 평균의 수렴에 관한 원리입니다. 독립적인 확률 변수들의 평균이 같은 확률 분포를 따르는 경우, 실험을 반복할수록 평균은 전체 확률 분포의 평균에 점점 가까워집니다. 수학적으로는, 확률 변수들의 평균이 μ이고 실험 횟수가 무한대에 가까워질 때, 평균의 분포는 μ에 수렴합니다.
강한 LLN: 강한 LLN은 표본 평균의 수렴에 관한 원리로, 독립적인 확률 변수들의 표본 평균이 거의 확실히 한 점으로 수렴한다는 원리를 나타냅니다. 즉, 확률 1로 표본 평균이 특정 값으로 수렴하는 것을 의미합니다. 이는 실제 실험에서 관측되는 평균이 이론적인 평균에 매우 가깝다는 것을 나타냅니다.
(출처 : chatGPT, 230813)

반응형